ニュース Deepseek AI開発:神話ではなく、16億ドルの現実

Deepseek AI開発:神話ではなく、16億ドルの現実

著者 : Skylar Mar 28,2025

ただし、競合他社よりも安いです。

Deepseekの新しいチャットボットは、興味深い紹介で私を迎えました。

こんにちは、私はあなたが何でも尋ねて、あなたを驚かせるかもしれない答えを得ることができるように作成されました。

今日、DeepseekのAIは市場で恐ろしいプレーヤーとして浮上しており、特にNvidiaの最大の株価の下落の1つに貢献しています。

DeepSeekテスト画像:Ensigame.com

このモデルを区別するのは、次のことを含む革新的なアーキテクチャとトレーニング方法です。

マルチトークン予測(MTP):この手法により、モデルは文のさまざまな部分を分析し、精度と効率の両方を改善することにより、複数の単語を同時に予測できます。専門家(MOE)の混合:256個のニューラルネットワークを利用し、トークン処理タスクごとに8つのアクティブ化されたこのアーキテクチャは、AIトレーニングを高速化し、パフォーマンスを向上させます。マルチヘッド潜在的注意(MLA):文の最も重要な部分に繰り返し焦点を当てることにより、MLAは重要な情報を見落とす可能性を減らし、それによって入力データの本質的なニュアンスをキャプチャします。DeepSeekは、著名な中国のスタートアップであるDeepseekは、最小限のコストで競争力のあるAIモデルを開発したと主張し、Deepsek V3を使用して600万ドルをトレーニングするために600万ドルを費やしました。

Deepseek V3画像:Ensigame.com

しかし、Semianalysisのアナリストは、DeepSeekが10,000 H800ユニット、さらに10,000 H100、追加のH20 GPUを含む約50,000 NVIDIAホッパーGPUを備えた膨大な計算インフラストラクチャを運営していることを明らかにしました。これらのリソースは、AIトレーニング、研究、財務モデリングに使用される複数のデータセンターに広がっています。

同社のサーバーへの総投資は約16億ドルで、運用コストは9億4,400万ドルと推定されています。

Deepseekは、2023年にStartupを別のAIに焦点を当てた部門としてスタートアップを立ち上げた中国のヘッジファンドハイフライヤーの子会社です。クラウドプロバイダーからコンピューティングパワーをリースするほとんどのスタートアップとは異なり、DeepSeekはAIモデルの最適化と迅速なイノベーション実装を完全に制御できます。同社は自己資金のままであり、敏ility性と意思決定速度を向上させます。

deepseek画像:Ensigame.com

さらに、一部のDeepseekの研究者は、年間130万ドル以上を稼ぎ、中国の主要な大学から最高の才能を引き出しています(同社は外国の専門家を雇いません)。

それにもかかわらず、Deepseekの最近の最新モデルでわずか600万ドルでトレーニングするという主張は非現実的であるように見えます。この数字は、トレーニング前のGPUの使用のみを占め、研究費用、モデルの改良、データ処理、および全体的なインフラストラクチャコストを除外します。

開始以来、DeepSeekはAI開発に5億ドル以上を投資してきました。しかし、より大きくて官僚的な企業に比べてその規模が小さいことにより、AIイノベーションをより積極的かつ効果的に実施することができます。

deepseek画像:Ensigame.com

Deepseekのケースは、資金提供された独立したAI会社が業界の巨人に挑戦できることを示しています。それにもかかわらず、専門家は、同社の成功は、AIモデル開発の「革新的な予算」ではなく、実質的な投資、技術的なブレークスルー、および強力なチームによるものであると強調しています。

それでも、競合他社のコストは依然として大幅に高くなっています。たとえば、DeepseekはR1に500万ドルを費やしましたが、ChatGpt4oの費用は1億ドルでした。