Дом Новости DeepSeek AI Development: реальность 1,6 миллиарда долларов, а не миф

DeepSeek AI Development: реальность 1,6 миллиарда долларов, а не миф

Автор : Skylar Mar 28,2025

Тем не менее, это все еще дешевле, чем его конкуренты.

Новый чат -бот из DeepSeek приветствовал меня интригующим введением:

Привет, я был создан, чтобы вы могли спросить что угодно и получить ответ, который может даже удивить вас.

Сегодня ИИ DeepSeek стал грозным игроком на рынке, в частности, в значительной степени способствуя снижению цен на акции Nvidia.

Тест DeepSeek Изображение: Ensigame.com

Что отличает эту модель, так это ее инновационная архитектура и методы обучения, которые включают в себя:

Multi-Token Production (MTP): этот метод позволяет модели одновременно предсказывать несколько слов, анализируя различные части предложения, повышая как точность, так и эффективность. Смесь экспертов (MOE): используя 256 нейронных сетей, с восемью активированными для каждой задачи обработки токенов, эта архитектура ускоряет обучение ИИ и повышает производительность. Многоугольное скрытое внимание (MLA): Млажь неоднократно сосредотачиваясь на наиболее значимых частях предложения, MLA снижает вероятность упущения важной информации, тем самым захватывая необходимые нюансы в входных данных. Deepseek, выдающийся китайский стартап, утверждает, что разработали конкурентоспособную модель ИИ с минимальными затратами, заявив, что они потратили только 6 миллионов долларов на обучающие процессы, использующие только графики.

DeepSeek v3 Изображение: Ensigame.com

Тем не менее, аналитики в полуализации показали, что DeepSeek управляет обширной вычислительной инфраструктурой с около 50 000 графических процессоров Nvidia, включая 10 000 единиц H800, еще 10 000 H100 и дополнительные графические процессоры H20. Эти ресурсы распространяются по нескольким центрам обработки данных, используемые для обучения, исследований и финансового моделирования искусственного интеллекта.

Общие инвестиции компании в серверы составляют около 1,6 млрд. Долл. США, а эксплуатационные расходы оцениваются в 944 млн. Долл. США.

DeepSeek является дочерней компанией китайского хедж-фонда High-Flyer, который запустил стартап в качестве отдельного подразделения, ориентированного на AI в 2023 году. В отличие от большинства стартапов, которые арендуют вычислительную мощность от облачных поставщиков, DeepSeek владеет своими центрами обработки данных, что позволяет полную контроль над оптимизацией модели ИИ и более быструю реализацию инноваций. Компания остается самофинансированной, что повышает его гибкость и скорость принятия решений.

DeepSeek Изображение: Ensigame.com

Кроме того, некоторые исследователи DeepSeek зарабатывают более 1,3 миллиона долларов в год, вызывая лучшие таланты от ведущих китайских университетов (компания не нанимает иностранных специалистов).

Несмотря на это, недавнее утверждение Deepseek о обучении своей последней модели всего за 6 миллионов долларов кажется нереальным. На этом рисунке учитывается только использование графических процессоров во время предварительного обучения и исключает расходы на исследования, уточнение модели, обработку данных и общие затраты на инфраструктуру.

С момента своего начала DeepSeek инвестировал более 500 миллионов долларов в разработку ИИ. Тем не менее, его меньший размер по сравнению с более крупными, более бюрократическими компаниями позволяет им внедрять инновации искусственного интеллекта более активно и эффективно.

DeepSeek Изображение: Ensigame.com

Дело Deepseek иллюстрирует, что хорошо финансируемая независимая компания по искусству может бросить вызов гигантам отрасли. Тем не менее, эксперты подчеркивают, что успех компании в значительной степени связан с существенными инвестициями, техническими прорывами и сильной командой, а не «революционным бюджетом» для разработки модели искусственного интеллекта.

Тем не менее, затраты конкурентов остаются значительно выше. Например, Deepseek потратил 5 миллионов долларов на R1, а Chatgpt4o стоил 100 миллионов долларов.