Casa Notizia DeepSeek AI Sviluppo: una realtà da $ 1,6 miliardi, non un mito

DeepSeek AI Sviluppo: una realtà da $ 1,6 miliardi, non un mito

Autore : Skylar Mar 28,2025

Tuttavia, è ancora più economico dei suoi concorrenti.

Il nuovo chatbot di DeepSeek mi ha salutato con un'introduzione intrigante:

Ciao, sono stato creato in modo da poter chiedere qualsiasi cosa e ottenere una risposta che potrebbe persino sorprenderti.

Oggi, l'intelligenza artificiale di Deepseek è emersa come un formidabile attore sul mercato, contribuendo in particolare a uno dei maggiori calo dei prezzi delle azioni di Nvidia.

Test di DeepSeek Immagine: Ensigame.com

Ciò che distingue questo modello sono i suoi metodi di architettura e formazione innovativi, che includono:

Multi-Token Prediction (MTP): questa tecnica consente al modello di prevedere contemporaneamente più parole analizzando varie parti di una frase, migliorando sia l'accuratezza che l'efficienza. Miscela di esperti (MOE): utilizzando 256 reti neurali, con otto attivate per ogni attività di elaborazione dei token, questa architettura accelera la formazione dell'intelligenza artificiale e migliora le prestazioni. Attenzione latente multi-testa (MLA): concentrandosi ripetutamente sulle parti più significative di una frase, MLA riduce la possibilità di trascurare le informazioni cruciali, catturando così sfumature essenziali nei dati di input. Deepseek, un importante startup cinese, afferma di aver sviluppato un modello di intelligenza artificiale competitivo a un costo minimo, affermando che hanno speso solo $ 6 su una formazione di profondi, usando solo 2048 cure grafiche, solo 2048 cure grafiche, per aver sviluppato un processo grafico.

DeepSeek V3 Immagine: Ensigame.com

Tuttavia, gli analisti di seminalisi hanno rivelato che DeepSeek gestisce una vasta infrastruttura computazionale con circa 50.000 GPU della tramoggia Nvidia, tra cui 10.000 unità H800, altri 10.000 H100 e GPU H20 aggiuntive. Queste risorse sono distribuite su più data center, utilizzati per la formazione, la ricerca e la modellizzazione finanziaria dell'IA.

L'investimento totale della società nei server è di circa $ 1,6 miliardi, con costi operativi stimati a $ 944 milioni.

DeepSeek è una filiale dell'Hedge Fund cinese High-Flyer, che ha lanciato la startup come una divisione separata focalizzata sull'intelligenza artificiale nel 2023. A differenza della maggior parte delle startup che in affitto il potere di calcolo dei fornitori di cloud, Deepseek possiede i suoi data center, consentendo il pieno controllo sull'ottimizzazione del modello di AI e sull'implementazione rapida dell'innovazione. L'azienda rimane autofinanziata, il che migliora la sua velocità di agilità e processo decisionale.

Deep -Week Immagine: Ensigame.com

Inoltre, alcuni ricercatori di Deepseek guadagnano oltre $ 1,3 milioni all'anno, attingendo ai migliori talenti dalle principali università cinesi (la società non assume specialisti stranieri).

Nonostante ciò, la recente affermazione di Deepseek di addestrare il suo ultimo modello per soli $ 6 milioni sembra irrealistica. Questa cifra rappresenta solo l'utilizzo della GPU durante il pre-allenamento ed esclude le spese di ricerca, il perfezionamento del modello, l'elaborazione dei dati e i costi complessivi di infrastruttura.

Fin dall'inizio, Deepseek ha investito oltre $ 500 milioni in sviluppo dell'IA. Tuttavia, le sue dimensioni più piccole rispetto alle aziende più grandi e burocratiche più burocratiche le consentono di implementare innovazioni di intelligenza artificiale in modo più attivato ed efficace.

Deep -Week Immagine: Ensigame.com

Il caso di Deepseek illustra che un'azienda di intelligenza artificiale indipendente ben finanziata può sfidare i giganti del settore. Tuttavia, gli esperti sottolineano che il successo dell'azienda è in gran parte dovuto a investimenti sostanziali, scoperte tecniche e un team forte, piuttosto che un "budget rivoluzionario" per lo sviluppo del modello di intelligenza artificiale.

Tuttavia, i costi dei concorrenti rimangono significativamente più alti. Ad esempio, DeepSeek ha speso $ 5 milioni in R1, mentre Chatgpt4O costa $ 100 milioni.