Rumah > Berita > Pembangunan DeepSeek AI berharga $ 1.6 bilion, membatalkan mitos kemampuan

Pembangunan DeepSeek AI berharga $ 1.6 bilion, membatalkan mitos kemampuan

Pengarang：Kristen Kemas kini：Apr 25,2025

Chatbot baru dari Deepseek dengan cepat menubuhkan dirinya sebagai pemain yang hebat di pasaran AI, terutamanya memberi kesan kepada harga saham Nvidia dengan pendekatan inovatifnya. Diperkenalkan dengan tagline yang menarik, "Hai, saya dicipta supaya anda boleh meminta apa-apa dan mendapatkan jawapan yang mungkin mengejutkan anda," Model AI Deepseek memanfaatkan teknologi canggih untuk menonjol dari persaingan.

Salah satu ciri utama seni bina DeepSeek ialah Ramalan Multi-Token (MTP) , yang membolehkan model meramalkan beberapa perkataan sekaligus, meningkatkan ketepatan dan kecekapannya. Di samping itu, pendekatan campuran pakar (MOE) menggunakan 256 rangkaian saraf, mengaktifkan lapan untuk setiap tugas pemprosesan token, yang mempercepat latihan AI dan meningkatkan prestasi. Mekanisme Perhatian Laten Multi-Head (MLA) selanjutnya menapis keupayaan model untuk memberi tumpuan kepada bahagian-bahagian penting dalam suatu ayat, memastikan bahawa nuansa penting tidak diabaikan.

Walaupun tuntutan DeepSeek untuk melatih model DeepSeek V3 mereka yang kuat untuk hanya $ 6 juta menggunakan pemproses grafik 2048, siasatan yang lebih mendalam oleh semianalisis mendedahkan pelaburan yang lebih besar. DeepSeek mengendalikan infrastruktur pengiraan yang luas dengan kira -kira 50,000 GPU NVIDIA Hopper, tersebar di pelbagai pusat data. Infrastruktur ini, bernilai sekitar $ 1.6 bilion, dengan perbelanjaan operasi $ 944 juta, menggariskan sumber -sumber penting di sebalik operasi Deepseek.

Sebagai anak syarikat dana lindung nilai Cina yang tinggi, manfaat DeepSeek dari menjadi entiti yang dibiayai sendiri dengan pusat datanya sendiri, yang membolehkan kawalan yang lebih besar terhadap pengoptimuman model AI dan inovasi yang lebih cepat. Keupayaan syarikat untuk menarik bakat teratas, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setiap tahun, seterusnya meningkatkan kelebihan daya saingnya.

Walaupun tuntutan DeepSeek mengenai kos latihan $ 6 juta untuk DeepSeek V3 nampaknya tidak realistik apabila mempertimbangkan perbelanjaan yang lebih luas yang terlibat, jumlah pelaburan syarikat dalam pembangunan AI melebihi $ 500 juta. Pelaburan ini, digabungkan dengan struktur organisasi yang lincah, membolehkan DeepSeek melaksanakan inovasi AI dengan berkesan.

Contoh DeepSeek menyoroti bagaimana syarikat AI bebas yang dibiayai dengan baik dapat mencabar pemimpin industri. Walau bagaimanapun, para pakar perhatikan bahawa kejayaan syarikat didorong oleh pelaburan yang besar, kejayaan teknikal, dan pasukan yang kuat, bukannya "anggaran revolusioner" untuk pembangunan AI. Walau bagaimanapun, kos DeepSeek kekal jauh lebih rendah daripada pesaingnya, seperti $ 100 juta yang dibelanjakan untuk latihan chatgpt4o berbanding $ 5 juta DeepSeek untuk R1.

Ujian DeepSeek Imej: ensigame.com