Китай против США: как и почему дешевые китайские DeepSeek и Qwen от Alibaba захватывают рынок ИИ

29 января, 17:00

12 мин

Внезапная популярность ИИ-приложения DeepSeek, которое в США опередило ChatGPT в App Store, а в Украине заняло второе место в этом же магазине приложений, – пример того, какие еще технологические неожиданности прячет Китай. На фоне популярности DeepSeek даже подвергся кибератаке и ограничил регистрацию.

Влияние DeepSeek стало заметным моментально. Запуск бесплатной версии сервиса несколько дней подряд снижает цены на акции технологических компаний Азии и Запада. Впоследствии успех DeepSeek побила другая китайская разработка – Qwen от Alibaba.

Что происходит в сфере искусственного интеллекта в Китае и что это означает для западных рынков – читайте в материале 24 Канала.

Темная лошадка DeepSeek

DeepSeek, который обвалил акции европейских, американских и азиатских производителей чипов, – это китайский стартап в сфере ИИ. Его основал в 2023 году Лян Веньфен, соучредитель хедж-фонда High-Flyer, который использует алгоритмы ИИ для прогнозирования колебаний рынка.

Компания утверждает, что ее программное обеспечение на базе ИИ может конкурировать с продуктами американских техногигантов, таких как OpenAI и Google, выполняя различные задачи, но за значительно меньшие затраты на разработку и эксплуатацию.

К теме Что такое DeepSeek или как китайский ИИ обвалил мировые фондовые рынки в США и Японии

В январе DeepSeek опубликовала информацию о технической инфраструктуре, которая лежит в основе ее модели искусственного интеллекта DeepSeek-R1. Компания заявляет об экономии средств благодаря использованию меньшего количества чипов и менее мощных технологий, чем обычно применяется в проектах разработки ИИ.

Интересно! 27 января 500 самых богатых людей мира понесли совокупные потери в размере 108 миллиардов долларов из-за обвала акций, вызванного китайским разработчиком ИИ DeepSeek. Наибольшие потери понесли миллиардеры, чье состояние связано с искусственным интеллектом. Состояние соучредителя Nvidia Дженсена Хуанга упало на 20,1 миллиарда долларов, что составляет 20% его капитала. Несмотря на потери, в Nvidia назвали DeepSeek "замечательным достижением в области ИИ и прекрасным примером Test Time Scaling". Речь идет о методике, которая используется в сфере машинного обучения и искусственного интеллекта для улучшения производительности моделей на этапе тестирования без повторного обучения.

Основатель Oracle Ларри Эллисон потерял 22,6 миллиарда долларов – самую большую сумму в абсолютном измерении, но это лишь 12% его состояния. Основатель Dell Майкл Делл потерял 13 миллиардов долларов, а соучредитель Binance Holdings Чанпен "CZ" Чжао – 12,1 миллиарда долларов.

В целом технологические магнаты потеряли 94 миллиарда долларов – это около 85% от общего падения индекса миллиардеров Bloomberg. На рынке акций Nasdaq Composite снизился на 3,1%, а S&P 500 – на 1,5%.

Успех китайской программы бросает вызов основному тезису американских компаний и политиков – будто для создания лучших моделей искусственного интеллекта нужны чрезвычайно дорогие и мощные полупроводники.

Собственно, из-за этого администрация Байдена и запретила американским компаниям экспортировать мощные чипы ИИ в Китай, чтобы замедлить развитие китайской технологической отрасли.

Интересно! OpenAI заявила, что китайский стартап DeepSeek мог использовать ее собственные модели для тренировки своего конкурента, что может нарушать интеллектуальные права, пишет FT. По данным OpenAI, DeepSeek применял технику "дистилляции", которая позволяет улучшать меньшие модели с помощью результатов более мощных. Хотя эта практика является распространенной, ее использование для создания конкурентного ИИ нарушает условия OpenAI.

Выпуск модели DeepSeek R1 удивил рынок, ведь ее эффективность приблизилась к ведущим американским моделям. Это привело к падению акций Nvidia на 17%, хотя они частично восстановились. В прошлом году OpenAI и Microsoft заблокировали аккаунты DeepSeek, подозреваемые в неправомерном использовании API. DeepSeek пока не прокомментировал эти обвинения.

27 января Дональд Трамп отреагировал на успех DeepSeek, пишет The Washington Post. Президент США заявил, что выпуск DeepSeek должен стать сигналом для пробуждения американских технологических компаний.

Выпуск DeepSeek ИИ от китайской компании должен стать тревожным звонком для нашей индустрии, что нам нужно сосредоточиться на том, чтобы выиграть в этой гонке,
– заявил Трамп во Флориде.

Трамп также отметил, что разработка более дешевого ИИ "может быть очень позитивным развитием", в том числе для американских компаний: "Вместо того, чтобы тратить миллиарды и миллиарды, вы будете тратить меньше и достигнете, надеемся, того же результата".

Интерфейс приложения похож на конкурентов, таких как ChatGPT, позволяя пользователям вводить вопросы или запросы и получать развернутые ответы. Сейчас приложение не генерирует изображений, но доступно бесплатно для iOS и Android, хотя регистрация новых пользователей ограничена.

Модель ИИ, которая лежит в основе приложения DeepSeek, способна обрабатывать огромные объемы данных, чтобы выявлять закономерности, делать прогнозы и решать задачи. Она обучена на данных до июля, поэтому не знает о событиях, произошедших позже, но функция поиска может получать актуальную информацию и заголовки новостей.

Безопасно ли пользоваться DeepSeek

Как и большинство приложений, DeepSeek может собирать и хранить значительное количество личной информации, включая все ваши разговоры, а также технические данные, такие как информация о вашем устройстве и интернет-соединения. Эти данные могут быть доступны китайскому правительству, которое имеет широкие полномочия для вмешательства в деятельность компаний.

Приложение также, вероятно, цензурирует определенную информацию в соответствии со строгими правилами китайского интернета, например упоминания о протестах на площади Тяньаньмэнь в 1989 году. Однако DeepSeek выпустил версию своей модели искусственного интеллекта, которую могут использовать и модифицировать другие разработчики. Это позволяет сторонним специалистам сделать ее как более защищенной, так и менее ограниченной, запустив ее локально на достаточно мощном устройстве.

Неожиданный успех Alibaba

Пока все внимание технологического мира приковано к китайской лаборатории искусственного интеллекта DeepSeek, ее главный конкурент, Alibaba, не сидит сложа руки.

В понедельник команда Qwen, которая работает под эгидой Alibaba, представила новую линейку ИИ-моделей Qwen2.5-VL, способных анализировать текст и изображения. Новые модели могут обрабатывать файлы, понимать видео, подсчитывать объекты на изображениях и даже управлять компьютером – подобно модели, которая используется в недавно представленном OpenAI Operator.

Сравнение моделей ИИ / Инфографика Qwen

Как утверждает команда, по результатам тестирования Qwen флагманская модель Qwen2.5-VL превосходит GPT-4o от OpenAI, Claude 3.5 Sonnet от Anthropic и Gemini 2.0 Flash от Google в таких задачах, как понимание видео, математические вычисления, анализ документов и ответ на вопрос.

Qwen2.5-VL, доступная для тестирования в приложении Qwen Chat от Alibaba и на платформе Hugging Face, способна анализировать графики и диаграммы, извлекать данные из отсканированных накладных и форм, а также обрабатывать многочасовые видео. Модель также может распознавать персонажей из фильмов и сериалов, а также широкий спектр товаров, что намекает на возможное использование авторских материалов в процессе обучения.

Однако, как и другие китайские ИИ-системы, Qwen2.5-VL имеет определенные ограничения. Например, при попытке обсудить тему неудач Си Цзиньпина, китайского лидера, в Qwen Chat появляется сообщение об ошибке. Это связано с требованиями китайского регулятора, который контролирует, чтобы все локальные ИИ соответствовали "основным социалистическим ценностям" и избегали чувствительных тем, таких как независимость Тайваня.

Одной из самых интересных функций Qwen2.5-VL является ее способность взаимодействовать с программным обеспечением на ПК и мобильных устройствах. Например, в видео, опубликованном на X техническим лидером Hugging Face Филиппом Шмидом, демонстрируется, как модель открывает приложение Booking.com на Android и бронирует перелет из Чунцина в Пекин.

Что касается доступности, две меньшие модели Qwen2.5-VL-3B и Qwen2.5-VL-7B распространяются по открытой лицензии. В то же время флагманская Qwen2.5-VL-72B находится под специальной лицензией Alibaba, которая требует от компаний и разработчиков с более 100 миллионами активных пользователей в месяц получить разрешение перед коммерческим использованием.

Запуск Qwen2.5-VL показывает, что китайские технологические гиганты не только догоняют мировых лидеров в сфере ИИ, но и стремятся установить новые стандарты в отрасли.

Китай против США: политика

Китай, как и США, сделал искусственный интеллект национальным приоритетом и заявил о намерении стать мировым лидером в этой области до 2030 года. Государство инвестировало огромные средства в исследования и разработку ИИ, подобно тому, как американские компании в течение последних двух лет вложили миллиарды долларов в центры обработки данных и развитие искусственного интеллекта.

Опасаясь, что Китай может использовать ИИ для достижения паритета с экономической и военной мощью США, администрация Байдена запретила американским компаниям экспортировать в Китай высокотехнологичное оборудование для ИИ. Однако в некоторых случаях китайским компаниям удалось обойти эти ограничения, закупая чипы через третьи страны.

К теме Как ИИ повлиял на сокращение рабочих мест и какова ситуация в украинском IT

В свои последние недели на посту президента Джо Байден ввел еще более строгие меры контроля, ограничив экспорт чипов для ИИ в большинство стран мира, чтобы предотвратить их нелегальную поставку в Китай. Но через неделю после инаугурации Трампа Белый дом обвинил администрацию Байдена в том, что она позволила Китаю приблизиться к США в развитии ИИ. Пока неизвестно, планирует ли Дональд Трамп ввести еще более жесткие ограничения на экспорт технологий ИИ.

В чем преимущество Китая на поле ИИ

Резкий рост стоимости так называемых ИИ-гиперскейлеров, таких как Meta Platforms, Alphabet и Microsoft, создало огромные состояния их владельцам после запуска ChatGPT в ноябре 2022 года, пишет Bloomberg. Эти компании инвестируют миллиарды в разработку ИИ, сосредотачивая ресурсы на современных полупроводниках и энергетических мощностях.

Генеральный директор Meta Марк Цукерберг объявил накануне резкого скачка DeepSeek, что в этом году его компания планирует потратить 60–65 миллиардов долларов на проекты, связанные с искусственным интеллектом. Это значительно превышает ожидания Уолл-стрит. По прогнозам Bloomberg Intelligence, капитальные расходы ведущих технологических компаний могут достичь 200 миллиардов долларов в 2025 году.

Несмотря на ограниченные доходы от таких инвестиций, рынки вознаграждают американские технологические акции рекордными оценками, что привело к историческому росту состояния их владельцев. Nvidia стала крупнейшим победителем благодаря буму ИИ: с начала 2023 года состояние Дженсена Хуанга выросло почти в восемь раз – до 121 миллиарда долларов. Между тем состояние Цукерберга взлетели на 385% до 229 миллиардов долларов, а Джефф Безос заработал еще 133%, достигнув 254 миллиардов долларов.

Возможность DeepSeek создать конкурентоспособную модель ИИ за небольшие средства заставила инвесторов пересмотреть оправданность зависимости Кремниевой долины от массивных капиталовложений.

Китайские компании, включая DeepSeek, вынуждены обходиться без доступа к мощным графическим процессорам (GPU), которые обычно используют западные разработчики, из-за экспортных ограничений США. Однако, по словам Александра Ванга, генерального директора американской ИИ-компании Scale AI, китайские лаборатории могут иметь больше GPU, чем считается.

По его словам, DeepSeek, вероятно, имеет около 50 тысяч H100, хотя официально это не разглашается из-за ограничений экспорта. OpenAI, по оценкам, использует более 32 000 GPU для работы своих флагманских продуктов.

Qwen2.5-Max же использует архитектуру Mixture-of-Experts, что позволяет эффективно распределять нагрузку и достигать высокой производительности при значительно меньших вычислительных затратах. Это может стать новым стандартом в отрасли, меняя представление о том, какие ресурсы нужны для создания передовых ИИ.

Факт того, что китайские компании достигают прорывных результатов без доступа к новейшим американским процессорам, ставит перед индустрией важный вопрос: является ли чрезмерная зависимость от вычислительной мощности единственным путем развития? Если эффективность инженерных решений позволяет получать подобные результаты, другие игроки рынка могут изменить свои стратегии.

Для американских технологических гигантов это создает новый вызов. Они больше не могут полагаться исключительно на аппаратные преимущества, ведь архитектурные инновации могут компенсировать недостаток ресурсов. Это означает, что конкуренция в ИИ выходит на новый уровень – борьбу не только за мощность, но и за эффективность и оптимизацию.

Следующие месяцы станут решающими. Как Китай, так и США продолжают развивать свои технологии, и если китайские компании смогут доказать эффективность своих подходов в реальных применениях, это может радикально изменить баланс сил в глобальной гонке за ИИ-доминирование. Отныне не только мощность, но и креативность в разработке моделей будет определять будущих лидеров отрасли.