Rumah Berita Pembangunan AI DeepSeek: Realiti $ 1.6 bilion, bukan mitos

Pembangunan AI DeepSeek: Realiti $ 1.6 bilion, bukan mitos

Pengarang : Skylar Mar 28,2025

Walau bagaimanapun, ia masih lebih murah daripada pesaingnya.

Chatbot baru dari Deepseek menyambut saya dengan pengenalan yang menarik:

Hai, saya dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda.

Hari ini, AI Deepseek telah muncul sebagai pemain yang hebat di pasaran, terutamanya menyumbang kepada penurunan harga saham terbesar Nvidia.

Ujian DeepSeek Imej: ensigame.com

Apa yang membezakan model ini adalah kaedah seni bina dan latihan yang inovatif, termasuk:

Ramalan Multi-Token (MTP): Teknik ini membolehkan model meramalkan beberapa perkataan secara serentak dengan menganalisis pelbagai bahagian ayat, meningkatkan ketepatan dan kecekapan. Campuran Pakar (MOE): Menggunakan 256 rangkaian saraf, dengan lapan diaktifkan untuk setiap tugas pemprosesan token, seni bina ini mempercepat latihan AI dan meningkatkan prestasi. Perhatian Laten Multi-Head (MLA): Dengan memberi tumpuan kepada bahagian-bahagian yang paling penting dalam kalimat berulang kali, MLA mengurangkan peluang untuk menghadap maklumat penting, dengan itu menangkap nuansa penting dalam data input.

DeepSeek V3 Imej: ensigame.com

Walau bagaimanapun, penganalisis di semianalysis telah mendedahkan bahawa DeepSeek mengendalikan infrastruktur pengiraan yang luas dengan sekitar 50,000 NVIDIA Hopper GPU, termasuk 10,000 H800 unit, 10,000 H100 lagi, dan GPU tambahan H20. Sumber -sumber ini tersebar di pelbagai pusat data, yang digunakan untuk latihan AI, penyelidikan, dan pemodelan kewangan.

Jumlah pelaburan syarikat dalam pelayan berjumlah kira -kira $ 1.6 bilion, dengan kos operasi dianggarkan $ 944 juta.

DeepSeek adalah anak syarikat dana lindung nilai Cina yang tinggi, yang melancarkan permulaan sebagai bahagian yang fokus pada AI pada tahun 2023. Tidak seperti kebanyakan pemula yang menyewa kuasa pengkomputeran dari penyedia awan, DeepSeek memiliki pusat datanya, yang membolehkan kawalan penuh ke atas pengoptimuman model AI dan pelaksanaan inovasi yang lebih cepat. Syarikat itu tetap dibiayai sendiri, yang meningkatkan kelajuan ketangkasan dan keputusannya.

Deepseek Imej: ensigame.com

Selain itu, beberapa penyelidik DeepSeek memperoleh lebih daripada $ 1.3 juta setiap tahun, menarik bakat terkemuka dari universiti -universiti China yang terkemuka (syarikat itu tidak mengupah pakar asing).

Walaupun demikian, tuntutan DeepSeek baru -baru ini melatih model terbarunya untuk hanya $ 6 juta kelihatan tidak realistik. Angka ini hanya menyumbang penggunaan GPU semasa latihan pra-latihan dan tidak termasuk perbelanjaan penyelidikan, penghalusan model, pemprosesan data, dan kos infrastruktur keseluruhan.

Sejak permulaannya, DeepSeek telah melabur lebih daripada $ 500 juta dalam pembangunan AI. Namun, saiznya yang lebih kecil berbanding dengan syarikat birokrasi yang lebih besar dan lebih besar membolehkannya melaksanakan inovasi AI dengan lebih aktif dan berkesan.

Deepseek Imej: ensigame.com

Kes DeepSeek menggambarkan bahawa syarikat AI bebas yang dibiayai dengan baik boleh mencabar gergasi industri. Walau bagaimanapun, pakar menekankan bahawa kejayaan syarikat itu sebahagian besarnya disebabkan oleh pelaburan yang besar, kejayaan teknikal, dan pasukan yang kuat, bukannya "bajet revolusioner" untuk pembangunan model AI.

Namun, kos pesaing kekal lebih tinggi. Sebagai contoh, DeepSeek membelanjakan $ 5 juta pada R1, manakala chatgpt4o berharga $ 100 juta.