Hogar > Noticias > Deepseek AI Development cuesta $ 1.6 mil millones, desacreditando el mito de la asequibilidad

Deepseek AI Development cuesta $ 1.6 mil millones, desacreditando el mito de la asequibilidad

Autor:Kristen Actualizar:Apr 25,2025

El nuevo chatbot de Deepseek se ha establecido rápidamente como un jugador formidable en el mercado de IA, especialmente impactando el precio de las acciones de Nvidia con su enfoque innovador. Introducido con el intrigante eslogan, "Hola, fui creado para que pueda preguntar cualquier cosa y obtener una respuesta que pueda sorprenderlo", el modelo de IA de Deepseek aprovecha las tecnologías de vanguardia para destacarse de la competencia.

Una de las características clave de la arquitectura de Deepseek es la predicción de múltiples token (MTP) , lo que permite que el modelo predice múltiples palabras a la vez, mejorando tanto su precisión como su eficiencia. Además, el enfoque de la mezcla de expertos (MOE) utiliza 256 redes neuronales, activando ocho para cada tarea de procesamiento de tokens, lo que acelera la capacitación de IA y mejora el rendimiento. El mecanismo de atención latente de múltiples cabezas (MLA) refina aún más la capacidad del modelo para centrarse en partes cruciales de una oración, asegurando que no se pasen por alto los matices importantes.

A pesar de la afirmación de Deepseek de capacitar a su poderoso modelo Deepseek V3 por solo $ 6 millones utilizando 2048 procesadores gráficos, una investigación más profunda por semianálisis reveló una inversión más sustancial. Deepseek opera una vasta infraestructura computacional con aproximadamente 50,000 GPU de Hopper Nvidia, extendida en múltiples centros de datos. Esta infraestructura, valorada en alrededor de $ 1.6 mil millones, con gastos operativos de $ 944 millones, subraya los recursos significativos detrás de las operaciones de Deepseek.

Como subsidiaria del Fondo de cobertura chino High-Flyer, Deepseek se beneficia de ser una entidad autofinanciada con sus propios centros de datos, lo que permite un mayor control sobre la optimización del modelo de IA y la innovación más rápida. La capacidad de la compañía para atraer al máximo talento, con algunos investigadores ganando más de $ 1.3 millones anuales, refuerza aún más su ventaja competitiva.

Si bien el reclamo de Deepseek de un costo de capacitación de $ 6 millones para Deepseek V3 parece poco realista cuando se consideran los gastos más amplios involucrados, la inversión total de la compañía en el desarrollo de IA supera los $ 500 millones. Esta inversión, combinada con una estructura organizacional ágil, permite a Deepseek implementar innovaciones de IA de manera efectiva.

El ejemplo de Deepseek destaca cómo una compañía de IA independiente bien financiada puede desafiar a los líderes de la industria. Sin embargo, los expertos señalan que el éxito de la compañía está impulsado por inversiones sustanciales, avances técnicos y un equipo fuerte, en lugar de un "presupuesto revolucionario" para el desarrollo de la IA. No obstante, los costos de Deepseek siguen siendo significativamente más bajos que los de sus competidores, como los $ 100 millones gastados en capacitación de chatgpt4o en comparación con los $ 5 millones de Deepseek para R1.

Prueba de Speeek Imagen: ensigame.com

Deepseek v3 Imagen: ensigame.com

Veterano Imagen: ensigame.com

Veterano Imagen: ensigame.com