Ancak, hala rakiplerinden daha ucuz.
Deepseek'ten yeni sohbet botu beni ilgi çekici bir tanıtımla karşıladı:
Merhaba, yaratıldım, böylece herhangi bir şey sorabilir ve sizi şaşırtabilecek bir cevap alabilirsiniz.
Bugün, Deepseek'in yapay zekası piyasada müthiş bir oyuncu olarak ortaya çıktı ve özellikle Nvidia'nın en büyük hisse senedi fiyat düşüşlerinden birine katkıda bulundu.
Resim: ensigame.com
Bu modeli ayırt eden şey, yenilikçi mimarisi ve eğitim yöntemleridir:
Çoklu Tahmini Tahmin (MTP): Bu teknik, bir cümlenin çeşitli bölümlerini analiz ederek, hem doğruluğu hem de verimliliği artırarak aynı anda birden fazla kelimeyi tahmin etmesini sağlar. Uzmanların Karışımı (MOE): Her bir jeton işleme görevi için sekiz etkinleştirilmiş 256 sinir ağı kullanarak, bu mimari AI eğitimini hızlandırır ve performansı artırır. Çok Başlı Gizli Dikkat (MLA): Bir cümlenin en önemli kısımlarına odaklanarak, MLA, önemli bilgileri gözden geçirme şansını azaltır, böylece girdi verilerinde temel nüansları yakalar.
Resim: ensigame.com
Bununla birlikte, Semianaliz'deki analistler, Deepseek'in 10.000 H800 birim, 10.000 H100'ler ve ek H20 GPU'lar dahil olmak üzere yaklaşık 50.000 NVIDIA Hopper GPU ile geniş bir hesaplama altyapısı işlettiğini ortaya koydu. Bu kaynaklar, AI eğitimi, araştırma ve finansal modelleme için kullanılan birden fazla veri merkezine yayılmıştır.
Şirketin sunuculara toplam yatırımı yaklaşık 1,6 milyar dolar ve operasyonel maliyetlerin 944 milyon dolar olduğu tahmin ediliyor.
Deepseek, 2023 yılında girişimi ayrı bir AI odaklı bölüm olarak başlatan Çin Hedge Fonu High-Flyer'in bir yan kuruluşudur. Bulut sağlayıcılarından bilgi işlem gücünü kiralayan çoğu girişimin aksine, Deepseek veri merkezlerine sahiptir ve AI model optimizasyonu ve daha hızlı inovasyon uygulaması üzerinde tam kontrol sağlıyor. Şirket, çevikliğini ve karar verme hızını artıran kendi kendini finanse ediyor.
Resim: ensigame.com
Ayrıca, bazı DeepSeek araştırmacıları yılda 1.3 milyon doların üzerinde para kazanarak önde gelen Çin üniversitelerinden (şirket yabancı uzmanları işe almıyor) en iyi yetenekler kazanıyor.
Buna rağmen, Deepseek'in son modelini sadece 6 milyon dolarlık eğitme iddiası gerçekçi görünmüyor. Bu rakam yalnızca eğitim öncesi sırasında GPU kullanımını açıklar ve araştırma giderlerini, model arıtımını, veri işleme ve genel altyapı maliyetlerini hariç tutar.
Başından beri Deepseek, AI gelişimine 500 milyon doların üzerinde yatırım yaptı. Bununla birlikte, daha büyük, daha bürokratik şirketlere kıyasla daha küçük boyutu, AI yeniliklerini daha aktif ve etkili bir şekilde uygulamasını sağlar.
Resim: ensigame.com
Deepseek'in davası, iyi finanse edilen bağımsız bir AI şirketinin endüstri devlerine meydan okuyabileceğini göstermektedir. Bununla birlikte, uzmanlar, şirketin başarısının büyük ölçüde AI model gelişimi için "devrimci bir bütçe" yerine önemli yatırımlar, teknik atılımlar ve güçlü bir ekipten kaynaklandığını vurgulamaktadır.
Yine de, rakiplerin maliyetleri önemli ölçüde daha yüksek. Örneğin, Deepseek R1'e 5 milyon dolar harcarken, ChatGpt4o 100 milyon dolara mal oldu.