อย่างไรก็ตามมันยังคงถูกกว่าคู่แข่ง
Chatbot ใหม่จาก Deepseek ทักทายฉันด้วยการแนะนำที่น่าสนใจ:
สวัสดีฉันถูกสร้างขึ้นเพื่อให้คุณสามารถถามอะไรก็ได้และรับคำตอบที่อาจทำให้คุณประหลาดใจ
วันนี้ AI ของ Deepseek ได้กลายเป็นผู้เล่นที่น่าเกรงขามในตลาดโดยเฉพาะอย่างยิ่งมีส่วนทำให้ราคาหุ้นที่ใหญ่ที่สุดของ Nvidia ลดลง
รูปภาพ: Ensigame.com
สิ่งที่แยกความแตกต่างของโมเดลนี้คือสถาปัตยกรรมที่เป็นนวัตกรรมและวิธีการฝึกอบรมซึ่งรวมถึง:
Multi-Token Prediction (MTP): เทคนิคนี้ช่วยให้แบบจำลองสามารถทำนายได้หลายคำพร้อมกันโดยการวิเคราะห์ส่วนต่าง ๆ ของประโยคปรับปรุงทั้งความแม่นยำและประสิทธิภาพ ส่วนผสมของผู้เชี่ยวชาญ (MOE): การใช้เครือข่ายประสาท 256 แห่งโดยมีการเปิดใช้งานแปดครั้งสำหรับงานการประมวลผลโทเค็นแต่ละครั้งสถาปัตยกรรมนี้จะเพิ่มความเร็วในการฝึกอบรม AI และเพิ่มประสิทธิภาพ ความสนใจแฝงแบบหลายหัว (MLA): โดยการมุ่งเน้นไปที่ส่วนที่สำคัญที่สุดของประโยคซ้ำ ๆ MLA จะลดโอกาสในการมองเห็นข้อมูลที่สำคัญดังนั้นการจับภาพความแตกต่างที่สำคัญในข้อมูลอินพุต Deepseek การเริ่มต้นของจีนที่โดดเด่น
รูปภาพ: Ensigame.com
อย่างไรก็ตามนักวิเคราะห์ที่ Semianalysis ได้เปิดเผยว่า Deepseek ดำเนินการโครงสร้างพื้นฐานการคำนวณที่กว้างใหญ่โดยมี GPU ประมาณ 50,000 Nvidia Hopper รวมถึง 10,000 H800 หน่วย, อีก 10,000 H100s และ H20 GPU เพิ่มเติม ทรัพยากรเหล่านี้กระจายไปทั่วศูนย์ข้อมูลหลายแห่งใช้สำหรับการฝึกอบรม AI การวิจัยและการสร้างแบบจำลองทางการเงิน
การลงทุนทั้งหมดของ บริษัท ในเซิร์ฟเวอร์อยู่ที่ประมาณ 1.6 พันล้านดอลลาร์โดยมีต้นทุนการดำเนินงานประมาณ 944 ล้านดอลลาร์
Deepseek เป็น บริษัท ในเครือของกองทุนป้องกันความเสี่ยงของจีนสูง-บินสูงซึ่งเปิดตัวการเริ่มต้นเป็นแผนก AI ที่เน้นการแยกต่างหากในปี 2566 ซึ่งแตกต่างจาก บริษัท สตาร์ทอัพส่วนใหญ่ที่เช่าพลังงานจากผู้ให้บริการคลาวด์ Deepseek เป็นเจ้าของศูนย์ข้อมูล บริษัท ยังคงได้รับเงินสนับสนุนตนเองซึ่งช่วยเพิ่มความคล่องตัวและความเร็วในการตัดสินใจ
รูปภาพ: Ensigame.com
นอกจากนี้นักวิจัย Deepseek บางคนมีรายได้มากกว่า 1.3 ล้านเหรียญสหรัฐต่อปีโดยดึงความสามารถสูงสุดจากมหาวิทยาลัยจีนชั้นนำ (บริษัท ไม่ได้จ้างผู้เชี่ยวชาญต่างประเทศ)
อย่างไรก็ตามเรื่องนี้การเรียกร้องการฝึกอบรมล่าสุดของ Deepseek ในราคาเพียง 6 ล้านเหรียญสหรัฐนั้นไม่สมจริง ตัวเลขนี้มีเพียงบัญชีสำหรับการใช้งาน GPU ในระหว่างการฝึกอบรมก่อนและไม่รวมค่าใช้จ่ายในการวิจัยการปรับแต่งแบบจำลองการประมวลผลข้อมูลและต้นทุนโครงสร้างพื้นฐานโดยรวม
นับตั้งแต่เริ่มต้น Deepseek ได้ลงทุนกว่า 500 ล้านดอลลาร์ในการพัฒนา AI แต่ขนาดที่เล็กกว่าเมื่อเทียบกับ บริษัท ที่มีขนาดใหญ่ขึ้นและมีระบบราชการมากขึ้นช่วยให้สามารถใช้นวัตกรรม AI ได้อย่างแข็งขันและมีประสิทธิภาพมากขึ้น
รูปภาพ: Ensigame.com
กรณีของ Deepseek แสดงให้เห็นว่า บริษัท AI อิสระที่ได้รับการสนับสนุนอย่างดีสามารถท้าทายยักษ์ใหญ่ในอุตสาหกรรม อย่างไรก็ตามผู้เชี่ยวชาญเน้นว่าความสำเร็จของ บริษัท ส่วนใหญ่เกิดจากการลงทุนที่สำคัญการพัฒนาทางเทคนิคและทีมที่แข็งแกร่งแทนที่จะเป็น "งบประมาณปฏิวัติ" สำหรับการพัฒนารูปแบบ AI
ถึงกระนั้นค่าใช้จ่ายของคู่แข่งยังคงสูงขึ้นอย่างมาก ตัวอย่างเช่น Deepseek ใช้จ่าย $ 5 ล้านใน R1 ในขณะที่ CHATGPT4O มีราคา $ 100 ล้าน