Lar > Notícias > Deepseek IA Development custa US $ 1,6 bilhão, desmistrvando mito de acessibilidade

Deepseek IA Development custa US $ 1,6 bilhão, desmistrvando mito de acessibilidade

Autor:Kristen Atualizar:Apr 25,2025

O novo chatbot da Deepseek se estabeleceu rapidamente como um participante formidável no mercado de IA, impactando principalmente o preço das ações da Nvidia com sua abordagem inovadora. Introduzido com o slogan intrigante: "Olá, fui criado para que você possa perguntar qualquer coisa e obter uma resposta que possa até surpreendê-lo", o modelo de AI da Deepseek aproveita as tecnologias de ponta para se destacar da competição.

Um dos principais recursos da arquitetura da Deepseek é a previsão de vários toques (MTP) , que permite que o modelo preveja várias palavras de uma só vez, aumentando sua precisão e eficiência. Além disso, a abordagem da mistura de especialistas (MOE) utiliza 256 redes neurais, ativando oito para cada tarefa de processamento de token, que acelera o treinamento de IA e melhora o desempenho. O mecanismo de atenção latente de várias cabeças (MLA) refina ainda mais a capacidade do modelo de se concentrar nas partes cruciais de uma frase, garantindo que nuances importantes não sejam esquecidas.

Apesar da alegação de Deepseek de treinar seu poderoso modelo Deepseek V3 por apenas US $ 6 milhões usando os processadores gráficos de 2048, uma investigação mais profunda por semiânica revelou um investimento mais substancial. A Deepseek opera uma vasta infraestrutura computacional com aproximadamente 50.000 GPUs NVIDIA Hopper, espalhadas por vários data centers. Essa infraestrutura, avaliada em cerca de US $ 1,6 bilhão, com despesas operacionais de US $ 944 milhões, ressalta os recursos significativos das operações da Deepseek.

Como subsidiária do fundo de hedge chinês, o DeepSeek se beneficia de ser uma entidade autofinanciada com seus próprios data centers, permitindo um maior controle sobre a otimização do modelo de IA e inovação mais rápida. A capacidade da empresa de atrair os melhores talentos, com alguns pesquisadores ganhando mais de US $ 1,3 milhão anualmente, reforça ainda mais sua vantagem competitiva.

Embora a reivindicação de Deepseek de um custo de treinamento de US $ 6 milhões para o DeepSeek V3 pareça irrealista ao considerar as despesas mais amplas envolvidas, o investimento total da empresa no desenvolvimento da IA ​​excede US $ 500 milhões. Esse investimento, combinado com uma estrutura organizacional ágil, permite que a DeepSeek implemente a IA inovações de maneira eficaz.

O exemplo da Deepseek destaca como uma empresa independente de IA bem financiada pode desafiar os líderes do setor. No entanto, os especialistas observam que o sucesso da empresa é impulsionado por investimentos substanciais, avanços técnicos e uma equipe forte, em vez de um "orçamento revolucionário" para o desenvolvimento da IA. No entanto, os custos da Deepseek permanecem significativamente menores do que os de seus concorrentes, como os US $ 100 milhões gastos no treinamento de ChatGPT4O em comparação com os US $ 5 milhões da Deepseek em R1.

Teste Deepseek Imagem: Ensigame.com

Deepseek v3 Imagem: Ensigame.com

Deepseek Imagem: Ensigame.com

Deepseek Imagem: Ensigame.com