Meta разгадывает тайны

Искусственный интеллект R1 от DeepSeek мгновенно изменил ландшафт искусственного интеллекта в США. Всего за несколько недель после запуска своей модели DeepSeek обогнал ChatGPT и стал приложением номер один в App Store. Рост популярности DeepSeek вызвал шок в технологической индустрии, что привело к потере рыночной капитализации NVIDIA на 600 миллиардов долларов. Компания также выпустила Janus-Pro 7B, революционную модель генерации изображений, которая превзошла конкурентные модели, такие как DALL-E от OpenAI. Неудивительно, что крупные корпорации хотят знать, как так могло произойти, сообщает 24 Канал со ссылкой на The Information.

Смотрите также Китайский стартап DeepSeek, взволновавший рынок, закрыл доступ к своему ИИ из-за кибератаки

Популярность DeepSeek привлекла внимание Meta, и, как сообщается, чтобы понять успех этого китайского ИИ-стартапа, компания Марка Цукерберга собрала четыре специализированные команды, которые называет "боевыми комнатами". Они состоят из инженеров, которые должны будут понять, как китайский ИИ-стартап смог достичь производительности на уровне или даже выше, чем у ведущих конкурентов, таких как ChatGPT, за меньшие деньги.

Компания DeepSeek утверждает, что инвестировала менее 6 миллионов долларов в обучение своей модели, по сравнению с более чем 100 миллионами долларов, вложенными OpenAI в обучение ChatGPT. В боевых комнатах Meta будет проведен мозговой штурм для поиска путей преодоления потенциальной угрозы, связанной с прорывом DeepSeek.

  • Две из четырех комнат будут посвящены изучению того, как DeepSeek удалось сократить расходы на разработку и запуск моделей R1, с надеждой применить ту же стратегию к собственной модели искусственного интеллекта Llama, разработанной Meta.
  • Еще одна команда будет исследовать учебные данные, которые использовала DeepSeek.
  • Последняя команда сосредоточится на изучении способов перепроектирования архитектуры Llama, чтобы конкурировать с китайскими технологиями искусственного интеллекта.

Хотя компания Meta не комментирует это решение, представитель Meta заявил в интервью изданию The Information: "Мы регулярно оцениваем все конкурентные модели в процессе разработки и делаем это с момента создания генеративного ИИ. Llama сыграла важную роль в создании экосистемы для моделей искусственного интеллекта с открытым исходным кодом, и мы с нетерпением ждем выхода Llama 4, чтобы продолжить это лидерство".

Meta находится в состоянии повышенной готовности, потому что директор инфраструктуры Meta AI Мэтью Олдхэм сообщил коллегам, что новейшая модель DeepSeek может превзойти даже будущий Llama AI, который, как ожидается, будет запущен в начале 2025 года. Даже генеральный директор OpenAI Сэм Альтман отреагировал на рост DeepSeek и назвал его "впечатляющим". NVIDIA, которая является одной из самых больших жертв внезапной популярности DeepSeek, также похвалила китайский ИИ, а также подчеркнула, что в программном обеспечении DeepSeek используются графические процессоры NVIDIA.