Trang chủ > Tin tức > DeepSeek AI Develop

DeepSeek AI Develop

Tác giả:Kristen Cập nhật:Apr 25,2025

Chatbot mới từ Deepseek đã nhanh chóng trở thành một người chơi đáng gờm trong thị trường AI, đáng chú ý là ảnh hưởng đến giá cổ phiếu của Nvidia với cách tiếp cận sáng tạo. Được giới thiệu với khẩu hiệu hấp dẫn, "Xin chào, tôi được tạo ra để bạn có thể hỏi bất cứ điều gì và nhận được câu trả lời thậm chí có thể làm bạn ngạc nhiên", mô hình AI của Deepseek tận dụng các công nghệ tiên tiến để nổi bật so với cuộc thi.

Một trong những tính năng chính của kiến ​​trúc của Deepseek là dự đoán đa điểm (MTP) , cho phép mô hình dự đoán nhiều từ cùng một lúc, tăng cường cả độ chính xác và hiệu quả của nó. Ngoài ra, phương pháp hỗn hợp của các chuyên gia (MOE) sử dụng 256 mạng thần kinh, kích hoạt tám mạng cho mỗi nhiệm vụ xử lý mã thông báo, giúp tăng tốc đào tạo AI và cải thiện hiệu suất. Cơ chế chú ý tiềm ẩn (MLA) đa đầu (MLA) tiếp tục tinh chỉnh khả năng của mô hình để tập trung vào các phần quan trọng của một câu, đảm bảo rằng các sắc thái quan trọng không bị bỏ qua.

Mặc dù yêu cầu đào tạo mô hình Deepseek V3 mạnh mẽ của họ chỉ với 6 triệu đô la sử dụng 2048 bộ xử lý đồ họa, một cuộc điều tra sâu sắc hơn bằng cách semianalysis cho thấy một khoản đầu tư đáng kể hơn. Deepseek vận hành một cơ sở hạ tầng tính toán rộng lớn với khoảng 50.000 GPU phễu NVIDIA, trải rộng trên nhiều trung tâm dữ liệu. Cơ sở hạ tầng này, trị giá khoảng 1,6 tỷ đô la, với chi phí hoạt động là 944 triệu đô la, nhấn mạnh các nguồn lực quan trọng đằng sau hoạt động của Deepseek.

Là một công ty con của Quỹ phòng hộ Trung Quốc, Deepseek được hưởng lợi từ việc trở thành một thực thể tự tài trợ với các trung tâm dữ liệu của riêng mình, cho phép kiểm soát nhiều hơn đối với tối ưu hóa mô hình AI và đổi mới nhanh hơn. Khả năng thu hút nhân tài hàng đầu của công ty, với một số nhà nghiên cứu kiếm được hơn 1,3 triệu đô la hàng năm, tiếp tục tăng cường lợi thế cạnh tranh của mình.

Trong khi yêu cầu đào tạo 6 triệu đô la của Deepseek cho Deepseek V3 có vẻ không thực tế khi xem xét các chi phí rộng hơn liên quan, thì tổng đầu tư của công ty vào phát triển AI vượt quá 500 triệu đô la. Khoản đầu tư này, kết hợp với một cấu trúc tổ chức nhanh nhẹn, cho phép Deepseek thực hiện các đổi mới AI một cách hiệu quả.

Ví dụ của Deepseek nêu bật cách một công ty AI độc lập được tài trợ tốt có thể thách thức các nhà lãnh đạo trong ngành. Tuy nhiên, các chuyên gia lưu ý rằng thành công của công ty được thúc đẩy bởi các khoản đầu tư đáng kể, đột phá kỹ thuật và một nhóm mạnh mẽ, thay vì "ngân sách cách mạng" để phát triển AI. Tuy nhiên, chi phí của Deepseek vẫn thấp hơn đáng kể so với các đối thủ cạnh tranh, chẳng hạn như 100 triệu đô la chi cho việc đào tạo ChATGPT4O so với 5 triệu đô la của Deepseek cho R1.

DeepSeek Test Hình ảnh: Ensigame.com

Deepseek v3 Hình ảnh: Ensigame.com

Deepseek Hình ảnh: Ensigame.com

Deepseek Hình ảnh: Ensigame.com