Home > Balita > Ang development ng Deepseek AI ay nagkakahalaga ng $ 1.6 bilyon, ang pag -debunk ng mitolohiya ng kakayahang magamit

Ang development ng Deepseek AI ay nagkakahalaga ng $ 1.6 bilyon, ang pag -debunk ng mitolohiya ng kakayahang magamit

May -akda：Kristen I -update：Apr 25,2025

Ang bagong chatbot mula sa Deepseek ay mabilis na itinatag ang sarili bilang isang mabigat na manlalaro sa merkado ng AI, lalo na na nakakaapekto sa presyo ng stock ni Nvidia na may makabagong diskarte. Ipinakilala sa nakakaintriga na tagline, "Kumusta, nilikha ako upang maaari kang magtanong ng anuman at makakuha ng isang sagot na maaaring sorpresa ka," Ang modelo ng AI ng Deepseek ay gumagamit ng mga teknolohiyang paggupit sa pagputol upang tumayo mula sa kumpetisyon.

Ang isa sa mga pangunahing tampok ng arkitektura ng Deepseek ay ang Multi-Token Prediction (MTP) , na nagpapahintulot sa modelo na mahulaan ang maraming mga salita nang sabay-sabay, pagpapahusay ng parehong katumpakan at kahusayan nito. Bilang karagdagan, ang halo ng diskarte ng mga eksperto (MOE) ay gumagamit ng 256 na mga network ng neural, na nag -activate ng walong para sa bawat gawain sa pagproseso ng token, na nagpapabilis sa pagsasanay sa AI at nagpapabuti sa pagganap. Ang mekanismo ng multi-head latent attention (MLA) ay higit na pinino ang kakayahan ng modelo na tumuon sa mga mahahalagang bahagi ng isang pangungusap, tinitiyak na ang mga mahahalagang nuances ay hindi napapansin.

Sa kabila ng pag -angkin ng Deepseek ng pagsasanay sa kanilang malakas na modelo ng Deepseek V3 para sa $ 6 milyon lamang gamit ang 2048 graphics processors, isang mas malalim na pagsisiyasat ng semianalysis ay nagsiwalat ng isang mas malaking pamumuhunan. Ang Deepseek ay nagpapatakbo ng isang malawak na imprastraktura ng computational na may humigit -kumulang na 50,000 NVIDIA HOPPER GPU, kumalat sa maraming mga sentro ng data. Ang imprastraktura na ito, na nagkakahalaga ng halos $ 1.6 bilyon, na may mga gastos sa pagpapatakbo na $ 944 milyon, ay binibigyang diin ang mga makabuluhang mapagkukunan sa likod ng mga operasyon ng Deepseek.

Bilang isang subsidiary ng Chinese Hedge Fund High-flyer, ang Deepseek ay nakikinabang mula sa pagiging isang nilalang na pinondohan ng sarili na may sariling mga sentro ng data, na nagpapahintulot sa higit na kontrol sa pag-optimize ng modelo ng AI at mas mabilis na pagbabago. Ang kakayahan ng kumpanya upang maakit ang nangungunang talento, kasama ang ilang mga mananaliksik na kumikita ng higit sa $ 1.3 milyon taun -taon, karagdagang bolsters ang mapagkumpitensyang gilid nito.

Habang ang pag -angkin ng Deepseek ng isang $ 6 milyong gastos sa pagsasanay para sa Deepseek V3 ay tila hindi makatotohanang kapag isinasaalang -alang ang mas malawak na mga gastos na kasangkot, ang kabuuang pamumuhunan ng kumpanya sa pag -unlad ng AI ay lumampas sa $ 500 milyon. Ang pamumuhunan na ito, na sinamahan ng isang nimble na istraktura ng organisasyon, ay nagbibigay -daan sa Deepseek na maipatupad nang epektibo ang mga makabagong AI.

Ang halimbawa ng Deepseek ay nagtatampok kung paano ang isang mahusay na pinondohan na independiyenteng kumpanya ng AI ay maaaring hamunin ang mga pinuno ng industriya. Gayunpaman, tandaan ng mga eksperto na ang tagumpay ng kumpanya ay hinihimok ng malaking pamumuhunan, teknikal na mga pambihirang tagumpay, at isang malakas na koponan, sa halip na isang "rebolusyonaryong badyet" para sa pag -unlad ng AI. Gayunpaman, ang mga gastos sa Deepseek ay nananatiling mas mababa kaysa sa mga katunggali nito, tulad ng $ 100 milyon na ginugol sa pagsasanay sa Chatgpt4O kumpara sa $ 5 milyon ng Deepseek para sa R1.

Pagsubok sa Deepseek Larawan: ensigame.com