首頁 新聞 DeepSeek AI開發:16億美元的現實,而不是神話

DeepSeek AI開發:16億美元的現實,而不是神話

作者 : Skylar Mar 28,2025

但是,它仍然比競爭對手便宜。

DeepSeek的新聊天機器人以有趣的介紹向我致意:

嗨,我是被創建的,所以您可以問任何問題,並得到一個甚至可能讓您感到驚訝的答案。

如今,DeepSeek的AI已成為市場上強大的參與者,尤其是NVIDIA最大的股票價格下跌之一。

DeepSeek測試圖片:ensigame.com

該模型的區別是其創新的體系結構和培訓方法,其中包括:

多語預測(MTP):此技術允許模型通過分析句子的各個部分同時預測多個單詞,從而提高了準確性和效率。專家(MOE)的混合物:利用256個神經網絡,每個令牌處理任務都激活了8個,該體系結構加快了AI訓練並增強了性能。多頭潛在關注(MLA):通過重點關注句子的最重要部分,MLA減少了忽略關鍵信息的機會,從而捕捉了輸入數據中的必不可少的細微差別。 Deepseek,著名的中國初創公司聲稱,他們在最小的成本中開發了一種競爭性的AI模型,他們僅在20億美元上使用了600萬美元的培訓。

DeepSeek V3圖片:ensigame.com

然而,半分析的分析師表明,DeepSeek擁有大量的計算基礎設施,其中約有50,000個NVIDIA HOPPER GPU,其中包括10,000 H800單位,另外10,000 h100s和其他H20 GPU。這些資源分佈在多個數據中心,用於AI培訓,研究和財務建模。

該公司對服務器的總投資約為16億美元,運營成本估計為9.44億美元。

DeepSeek是中國對沖基金High-Flyer的子公司,該基金在2023年推出了該初創公司,該初創公司於2023年以獨立的AI為重點部門。與大多數從雲提供商租用計算能力的初創公司不同,DeepSeek擁有其數據中心,從而使對AI模型優化和快速創新實施完全控制了其數據中心。該公司仍然是自籌資金的,這提高了其敏捷性和決策速度。

DeepSeek圖片:ensigame.com

此外,一些DeepSeek研究人員每年收入超過130萬美元,吸引了領先的中國大學的頂尖人才(該公司不聘請外國專家)。

儘管如此,DeepSeek最近聲稱以600萬美元的價格培訓其最新模式的主張似乎是不現實的。該圖僅說明在預培訓期間使用GPU,並排除了研究費用,改進,數據處理和整體基礎設施成本。

自開始以來,DeepSeek已在AI開發方面投資了超過5億美元。但是,與較大,更官僚的公司相比,其規模較小,使其能夠更積極,有效地實施AI創新。

DeepSeek圖片:ensigame.com

DeepSeek的案子表明,一家資金充足的獨立AI公司可以挑戰行業巨頭。儘管如此,專家們強調,公司的成功很大程度上是由於大量投資,技術突破和強大的團隊,而不是AI模型開發的“革命性預算”。

儘管如此,競爭對手的成本仍然更高。例如,DeepSeek在R1上花費了500萬美元,而Chatgpt4o的售價為1億美元。