Тем не менее, это все еще дешевле, чем его конкуренты.
Новый чат -бот из DeepSeek приветствовал меня интригующим введением:
Привет, я был создан, чтобы вы могли спросить что угодно и получить ответ, который может даже удивить вас.
Сегодня ИИ DeepSeek стал грозным игроком на рынке, в частности, в значительной степени способствуя снижению цен на акции Nvidia.
Изображение: Ensigame.com
Что отличает эту модель, так это ее инновационная архитектура и методы обучения, которые включают в себя:
Multi-Token Production (MTP): этот метод позволяет модели одновременно предсказывать несколько слов, анализируя различные части предложения, повышая как точность, так и эффективность. Смесь экспертов (MOE): используя 256 нейронных сетей, с восемью активированными для каждой задачи обработки токенов, эта архитектура ускоряет обучение ИИ и повышает производительность. Многоугольное скрытое внимание (MLA): Млажь неоднократно сосредотачиваясь на наиболее значимых частях предложения, MLA снижает вероятность упущения важной информации, тем самым захватывая необходимые нюансы в входных данных. Deepseek, выдающийся китайский стартап, утверждает, что разработали конкурентоспособную модель ИИ с минимальными затратами, заявив, что они потратили только 6 миллионов долларов на обучающие процессы, использующие только графики.
Изображение: Ensigame.com
Тем не менее, аналитики в полуализации показали, что DeepSeek управляет обширной вычислительной инфраструктурой с около 50 000 графических процессоров Nvidia, включая 10 000 единиц H800, еще 10 000 H100 и дополнительные графические процессоры H20. Эти ресурсы распространяются по нескольким центрам обработки данных, используемые для обучения, исследований и финансового моделирования искусственного интеллекта.
Общие инвестиции компании в серверы составляют около 1,6 млрд. Долл. США, а эксплуатационные расходы оцениваются в 944 млн. Долл. США.
DeepSeek является дочерней компанией китайского хедж-фонда High-Flyer, который запустил стартап в качестве отдельного подразделения, ориентированного на AI в 2023 году. В отличие от большинства стартапов, которые арендуют вычислительную мощность от облачных поставщиков, DeepSeek владеет своими центрами обработки данных, что позволяет полную контроль над оптимизацией модели ИИ и более быструю реализацию инноваций. Компания остается самофинансированной, что повышает его гибкость и скорость принятия решений.
Изображение: Ensigame.com
Кроме того, некоторые исследователи DeepSeek зарабатывают более 1,3 миллиона долларов в год, вызывая лучшие таланты от ведущих китайских университетов (компания не нанимает иностранных специалистов).
Несмотря на это, недавнее утверждение Deepseek о обучении своей последней модели всего за 6 миллионов долларов кажется нереальным. На этом рисунке учитывается только использование графических процессоров во время предварительного обучения и исключает расходы на исследования, уточнение модели, обработку данных и общие затраты на инфраструктуру.
С момента своего начала DeepSeek инвестировал более 500 миллионов долларов в разработку ИИ. Тем не менее, его меньший размер по сравнению с более крупными, более бюрократическими компаниями позволяет им внедрять инновации искусственного интеллекта более активно и эффективно.
Изображение: Ensigame.com
Дело Deepseek иллюстрирует, что хорошо финансируемая независимая компания по искусству может бросить вызов гигантам отрасли. Тем не менее, эксперты подчеркивают, что успех компании в значительной степени связан с существенными инвестициями, техническими прорывами и сильной командой, а не «революционным бюджетом» для разработки модели искусственного интеллекта.
Тем не менее, затраты конкурентов остаются значительно выше. Например, Deepseek потратил 5 миллионов долларов на R1, а Chatgpt4o стоил 100 миллионов долларов.