Maison > Nouvelles > Deepseek IA Development coûte 1,6 milliard de dollars, démystifiant le mythe

Deepseek IA Development coûte 1,6 milliard de dollars, démystifiant le mythe

Auteur:Kristen Mise à jour:Apr 25,2025

Le nouveau chatbot de Deepseek s'est rapidement imposé comme un acteur formidable sur le marché de l'IA, ce qui a un impact sur le cours des actions de Nvidia avec son approche innovante. Introduit avec le slogan intrigant, "Salut, j'ai été créé pour que vous puissiez demander n'importe quoi et obtenir une réponse qui pourrait même vous surprendre", "Le modèle AI de Deepseek exploite les technologies de pointe pour se démarquer de la compétition.

L'une des principales caractéristiques de l'architecture de Deepseek est la prédiction multi-token (MTP) , qui permet au modèle de prédire plusieurs mots à la fois, améliorant à la fois sa précision et son efficacité. De plus, l'approche du mélange d'experts (MOE) utilise 256 réseaux neuronaux, activant huit pour chaque tâche de traitement des jetons, qui accélère la formation AI et améliore les performances. Le mécanisme d'attention latent (MLA) multiples affine en outre la capacité du modèle à se concentrer sur les parties cruciales d'une phrase, garantissant que les nuances importantes ne sont pas négligées.

Malgré la prétention de Deepseek de former leur puissant modèle Deepseek V3 pour seulement 6 millions de dollars en utilisant 2048 processeurs graphiques, une enquête plus approfondie de la semianalyse a révélé un investissement plus substantiel. Deepseek exploite une vaste infrastructure de calcul avec environ 50 000 GPU Nvidia Hopper, répartis sur plusieurs centres de données. Cette infrastructure, évaluée à environ 1,6 milliard de dollars, avec des dépenses opérationnelles de 944 millions de dollars, souligne les ressources importantes des opérations de Deepseek.

En tant que filiale du Haid Flyer chinois, Deepseek bénéficie d'être une entité autofinancée avec ses propres centres de données, ce qui permet un plus grand contrôle sur l'optimisation du modèle d'IA et l'innovation plus rapide. La capacité de l'entreprise à attirer les meilleurs talents, certains chercheurs gagnant plus de 1,3 million de dollars par an, renforcent davantage son avantage concurrentiel.

Alors que la réclamation de Deepseek d'un coût de formation de 6 millions de dollars pour Deepseek V3 semble irréaliste si l'on considère les dépenses plus larges impliquées, l'investissement total de la société dans le développement de l'IA dépasse 500 millions de dollars. Cet investissement, combiné à une structure organisationnelle agile, permet à Deepseek de mettre en œuvre efficacement les innovations d'IA.

L'exemple de Deepseek souligne comment une entreprise d'IA indépendante bien financée peut défier les leaders de l'industrie. Cependant, les experts notent que le succès de l'entreprise est motivé par des investissements substantiels, des percées techniques et une équipe solide, plutôt que par un "budget révolutionnaire" pour le développement de l'IA. Néanmoins, les coûts de Deepseek restent nettement inférieurs à ceux de ses concurrents, tels que les 100 millions de dollars dépensés pour la formation de Chatgpt4o par rapport aux 5 millions de dollars de Deepseek pour R1.

Test de profondeur Image: esigame.com

Deepseek v3 Image: esigame.com

En profondeur Image: esigame.com

En profondeur Image: esigame.com