हालांकि, यह अभी भी अपने प्रतिद्वंद्वियों की तुलना में सस्ता है।
दीपसेक के नए चैटबॉट ने मुझे एक पेचीदा परिचय के साथ बधाई दी:
नमस्ते, मैं बनाया गया था ताकि आप कुछ भी पूछ सकें और एक उत्तर प्राप्त कर सकें जो आपको आश्चर्यचकित भी कर सकता है।
आज, डीपसेक का एआई बाजार में एक दुर्जेय खिलाड़ी के रूप में उभरा है, विशेष रूप से एनवीडिया के सबसे बड़े स्टॉक मूल्य में गिरावट में से एक में योगदान दिया है।
चित्र: ensigame.com
इस मॉडल में क्या अंतर है, इसकी अभिनव वास्तुकला और प्रशिक्षण विधियाँ हैं, जिसमें शामिल हैं:
मल्टी-टोकन प्रेडिक्शन (एमटीपी): यह तकनीक मॉडल को एक वाक्य के विभिन्न हिस्सों का विश्लेषण करके कई शब्दों की भविष्यवाणी करने की अनुमति देती है, सटीकता और दक्षता दोनों में सुधार करती है। विशेषज्ञों का मिश्रण (एमओई): 256 तंत्रिका नेटवर्क का उपयोग करना, प्रत्येक टोकन प्रसंस्करण कार्य के लिए आठ सक्रिय होने के साथ, यह आर्किटेक्चर एआई प्रशिक्षण को गति देता है और प्रदर्शन को बढ़ाता है। मल्टी-हेड लेटेंट ध्यान (एमएलए): बार-बार एक वाक्य के सबसे महत्वपूर्ण हिस्सों पर ध्यान केंद्रित करके, एमएलए महत्वपूर्ण जानकारी के अनदेखी करने की संभावना को कम कर देता है, जिससे इनपुट डेटा में आवश्यक बारीकियों को कैप्चर करना। एक प्रमुख चीनी स्टार्टअप, एक प्रमुख चीनी स्टार्टअप, एक न्यूनतम लागत पर एक प्रतिस्पर्धी एआई मॉडल विकसित करने का दावा करता है।
चित्र: ensigame.com
हालांकि, सेमियनलिसिस के विश्लेषकों ने खुलासा किया है कि डीपसेक लगभग 50,000 एनवीडिया हॉपर जीपीयू के साथ एक विशाल कम्प्यूटेशनल बुनियादी ढांचा संचालित करता है, जिसमें 10,000 एच 800 इकाइयां, एक और 10,000 एच 100 और अतिरिक्त एच 20 जीपीयू शामिल हैं। ये संसाधन कई डेटा केंद्रों में फैले हुए हैं, जिनका उपयोग एआई प्रशिक्षण, अनुसंधान और वित्तीय मॉडलिंग के लिए किया जाता है।
सर्वर में कंपनी का कुल निवेश लगभग 1.6 बिलियन डॉलर है, जिसमें परिचालन लागत $ 944 मिलियन है।
दीपसेक चीनी हेज फंड हाई-फ्लायर की एक सहायक कंपनी है, जिसने 2023 में एक अलग एआई-केंद्रित डिवीजन के रूप में स्टार्टअप को लॉन्च किया था। क्लाउड प्रदाताओं से कंप्यूटिंग पावर को पट्टे पर देने वाले अधिकांश स्टार्टअप्स के विपरीत, डीपसेक अपने डेटा केंद्रों का मालिक है, एआई मॉडल ऑप्टिमाइज़ेशन और क्विक इनोवेशन कार्यान्वयन पर पूर्ण नियंत्रण की अनुमति देता है। कंपनी स्व-वित्त पोषित बनी हुई है, जो इसकी चपलता और निर्णय लेने की गति को बढ़ाती है।
चित्र: ensigame.com
इसके अलावा, कुछ दीपसेक शोधकर्ता सालाना $ 1.3 मिलियन से अधिक कमाते हैं, प्रमुख चीनी विश्वविद्यालयों से शीर्ष प्रतिभाओं को आकर्षित करते हैं (कंपनी विदेशी विशेषज्ञों को नियुक्त नहीं करती है)।
इसके बावजूद, दीपसेक के हालिया $ 6 मिलियन के लिए अपने नवीनतम मॉडल को प्रशिक्षित करने का दावा अवास्तविक प्रतीत होता है। यह आंकड़ा केवल पूर्व-प्रशिक्षण के दौरान जीपीयू उपयोग के लिए खाता है और अनुसंधान व्यय, मॉडल शोधन, डेटा प्रसंस्करण और समग्र बुनियादी ढांचे की लागत को बाहर करता है।
अपनी शुरुआत के बाद से, डीपसेक ने एआई विकास में $ 500 मिलियन से अधिक का निवेश किया है। फिर भी, बड़ी, अधिक नौकरशाही कंपनियों की तुलना में इसका छोटा आकार इसे AI नवाचारों को अधिक सक्रिय और प्रभावी ढंग से लागू करने में सक्षम बनाता है।
चित्र: ensigame.com
दीपसेक का मामला बताता है कि एक अच्छी तरह से वित्त पोषित स्वतंत्र एआई कंपनी उद्योग दिग्गजों को चुनौती दे सकती है। फिर भी, विशेषज्ञों पर जोर दिया गया है कि एआई मॉडल के विकास के लिए "क्रांतिकारी बजट" के बजाय कंपनी की सफलता काफी हद तक पर्याप्त निवेश, तकनीकी सफलताओं और एक मजबूत टीम के कारण है।
फिर भी, प्रतियोगियों की लागत काफी अधिक है। उदाहरण के लिए, दीपसेक ने R1 पर $ 5 मिलियन खर्च किए, जबकि CHATGPT4O की लागत $ 100 मिलियन है।