Meta разберет на атомы китайский ИИ от DeepSeek, чтобы понять, как он всех превосходит

Meta хочет знать, как DeepSeek достигла успеха, а потому создает для этого 4 команды

Meta / Коллаж 24 Канала

Компания Meta создает четыре команды, чтобы разгадать тайну DeepSeek. Этот китайский искусственный интеллект поставил на уши весь технологический мир, обогнав по результатам самые мощные языковые модели OpenAI, Google и самой Meta. Более того, он делает это за меньшие деньги, что ставит под угрозу существование американских разработок.

Meta разгадывает тайны

Искусственный интеллект R1 от DeepSeek мгновенно изменил ландшафт искусственного интеллекта в США. Всего за несколько недель после запуска своей модели DeepSeek обогнал ChatGPT и стал приложением номер один в App Store. Рост популярности DeepSeek вызвал шок в технологической индустрии, что привело к потере рыночной капитализации NVIDIA на 600 миллиардов долларов. Компания также выпустила Janus-Pro 7B, революционную модель генерации изображений, которая превзошла конкурентные модели, такие как DALL-E от OpenAI. Неудивительно, что крупные корпорации хотят знать, как так могло произойти, сообщает 24 Канал со ссылкой на The Information.

Популярность DeepSeek привлекла внимание Meta, и, как сообщается, чтобы понять успех этого китайского ИИ-стартапа, компания Марка Цукерберга собрала четыре специализированные команды, которые называет "боевыми комнатами". Они состоят из инженеров, которые должны будут понять, как китайский ИИ-стартап смог достичь производительности на уровне или даже выше, чем у ведущих конкурентов, таких как ChatGPT, за меньшие деньги.

Компания DeepSeek утверждает, что инвестировала менее 6 миллионов долларов в обучение своей модели, по сравнению с более чем 100 миллионами долларов, вложенными OpenAI в обучение ChatGPT. В боевых комнатах Meta будет проведен мозговой штурм для поиска путей преодоления потенциальной угрозы, связанной с прорывом DeepSeek.

Две из четырех комнат будут посвящены изучению того, как DeepSeek удалось сократить расходы на разработку и запуск моделей R1, с надеждой применить ту же стратегию к собственной модели искусственного интеллекта Llama, разработанной Meta.
Еще одна команда будет исследовать учебные данные, которые использовала DeepSeek.
Последняя команда сосредоточится на изучении способов перепроектирования архитектуры Llama, чтобы конкурировать с китайскими технологиями искусственного интеллекта.

Хотя компания Meta не комментирует это решение, представитель Meta заявил в интервью изданию The Information: "Мы регулярно оцениваем все конкурентные модели в процессе разработки и делаем это с момента создания генеративного ИИ. Llama сыграла важную роль в создании экосистемы для моделей искусственного интеллекта с открытым исходным кодом, и мы с нетерпением ждем выхода Llama 4, чтобы продолжить это лидерство".

Meta находится в состоянии повышенной готовности, потому что директор инфраструктуры Meta AI Мэтью Олдхэм сообщил коллегам, что новейшая модель DeepSeek может превзойти даже будущий Llama AI, который, как ожидается, будет запущен в начале 2025 года. Даже генеральный директор OpenAI Сэм Альтман отреагировал на рост DeepSeek и назвал его "впечатляющим". NVIDIA, которая является одной из самых больших жертв внезапной популярности DeepSeek, также похвалила китайский ИИ, а также подчеркнула, что в программном обеспечении DeepSeek используются графические процессоры NVIDIA.