Китай проти США: як і чому дешеві китайські DeepSeek і Qwen від Alibaba захоплюють ринок ШІ

29 січня, 17:00

12 хв

Лев Шевченко

Основні тези

DeepSeek, китайський ШІ-застосунок, став популярним у США та Україні, випередивши ChatGPT в App Store, що призвело до кібератак та обмежень на реєстрацію.
Alibaba представила Qwen2.5-VL – модель ШІ, здатну аналізувати текст і зображення, перевершуючи модель GPT-4 від OpenAI; однак Qwen2.5-VL підлягає обмеженням китайського регулятора.
Китайські компанії, як-от DeepSeek, досягають успіхів у створенні конкурентоспроможних ШІ без доступу до потужних американських процесорів, що змушує переглянути стратегії в індустрії.
Адміністрація Байдена обмежила експорт чіпів в Китай, оскільки Китай прагне досягти світового лідерства в ШІ до 2030 року, а успіхи китайських ШІ-компаній викликають занепокоєння в США.

Більше цікавих аудіоновин

Слухати

Слухати цю новину

00:00

01:15

Слухати цю новину

00:00

01:15

Раптова популярність ШІ-застосунку DeepSeek, який в США випередив ChatGPT в App Store, а в Україні посів друге місце у цьому ж магазині програм, – приклад того, які ще технологічні несподіванки ховає Китай. На тлі популярності DeepSeek навіть зазнав кібератаки та обмежив реєстрацію.

Вплив DeepSeek став помітним моментально. Запуск безплатної версії сервісу кілька днів поспіль знижує ціни на акції технологічних компаній Азії та Заходу. Згодом успіх DeepSeek побила інша китайська розробка – Qwen від Alibaba.

Що відбувається у сфері штучного інтелекту в Китаї та що це означає для західних ринків – читайте в матеріалі 24 Каналу.

Темна конячка DeepSeek

DeepSeek, який обвалив акції європейських, американських та азійських виробників чипів, – це китайський стартап у сфері ШІ. Його заснував у 2023 році Лян Веньфен, співзасновник хедж-фонду High-Flyer, який використовує алгоритми ШІ для прогнозування коливань ринку.

Компанія стверджує, що її програмне забезпечення на базі ШІ може конкурувати з продуктами американських техногігантів, як-от OpenAI та Google, виконуючи різноманітні завдання, але за значно менші витрати на розробку та експлуатацію.

До теми Що таке DeepSeek або як китайський ШІ обвалив світові фондові ринки в США та Японії

У січні DeepSeek опублікувала інформацію про технічну інфраструктуру, яка лежить в основі її моделі штучного інтелекту DeepSeek-R1. Компанія заявляє про економію коштів завдяки використанню меншої кількості чіпів і менш потужних технологій, ніж зазвичай застосовується в проєктах розробки ШІ.

Цікаво! 27 січня 500 найбагатших людей світу зазнали сукупних втрат у розмірі 108 мільярдів доларів через обвал акцій, спричинений китайським розробником ШІ DeepSeek. Найбільших втрат зазнали мільярдери, чиї статки пов’язані зі штучним інтелектом. Статки співзасновника Nvidia Дженсена Хуанга впали на 20,1 мільярда доларів, що становить 20% його капіталу. Попри втрати, у Nvidia назвали DeepSeek "чудовим досягненням у галузі ШІ та прекрасним прикладом Test Time Scaling". Мовиться про методику, яка використовується у сфері машинного навчання та штучного інтелекту для покращення продуктивності моделей на етапі тестування без повторного навчання.

Засновник Oracle Ларрі Еллісон втратив 22,6 мільярда доларів — найбільшу суму в абсолютному вимірі, але це лише 12% його статків. Засновник Dell Майкл Делл втратив 13 мільярдів доларів, а співзасновник Binance Holdings Чанпен "CZ" Чжао – 12,1 мільярда доларів.

Загалом технологічні магнати втратили 94 мільярди доларів – це близько 85% від загального падіння індексу мільярдерів Bloomberg. На ринку акцій Nasdaq Composite знизився на 3,1%, а S&P 500 — на 1,5%.

Успіх китайської програми кидає виклик основній тезі американських компаній та політиків – начебто для створення найкращих моделей штучного інтелекту потрібні надзвичайно дорогі та потужні напівпровідники.

Власне, через це адміністрація Байдена й заборонила американським компаніям експортувати потужні чіпи ШІ до Китаю, щоб уповільнити розвиток китайської технологічної галузі.

Цікаво! OpenAI заявила, що китайський стартап DeepSeek міг використовувати її власні моделі для тренування свого конкурента, що може порушувати інтелектуальні права, пише FT. За даними OpenAI, DeepSeek застосовував техніку "дистиляції", яка дозволяє покращувати менші моделі за допомогою результатів потужніших. Хоча ця практика є поширеною, її використання для створення конкурентного ШІ порушує умови OpenAI.

Випуск моделі DeepSeek R1 здивував ринок, адже її ефективність наблизилася до провідних американських моделей. Це спричинило падіння акцій Nvidia на 17%, хоча вони частково відновилися. Минулого року OpenAI та Microsoft заблокували акаунти DeepSeek, підозрювані у неправомірному використанні API. DeepSeek поки не прокоментував ці звинувачення.

27 січня Дональд Трамп відреагував на успіх DeepSeek, пише The Washington Post. Президент США заявив, що випуск DeepSeek має стати сигналом для пробудження американських технологічних компаній.

Випуск DeepSeek ШІ від китайської компанії повинен стати тривожним дзвінком для нашої індустрії, що нам потрібно зосередитися на тому, щоб виграти в цих перегонах,
– заявив Трамп у Флориді.

Трамп також зазначив, що розробка дешевшого ШІ "може бути дуже позитивним розвитком", зокрема для американських компаній: "Замість того, щоб витрачати мільярди й мільярди, ви витрачатимете менше і досягнете, сподіваємося, того ж результату".

Інтерфейс застосунку схожий на конкурентів, як-от ChatGPT, дозволяючи користувачам вводити запитання чи запити й отримувати розгорнуті відповіді. Наразі додаток не генерує зображень, але доступний безплатно для iOS та Android, хоч реєстрація нових користувачів обмежена.

Модель ШІ, що лежить в основі застосунку DeepSeek, здатна обробляти величезні обсяги даних, щоб виявляти закономірності, робити прогнози та вирішувати завдання. Вона навчена на даних до липня, тому не знає про події, що сталися пізніше, але функція пошуку може отримувати актуальну інформацію та заголовки новин.

Чи безпечно користуватися DeepSeek

Як і більшість застосунків, DeepSeek може збирати та зберігати значну кількість особистої інформації, включаючи всі ваші розмови, а також технічні дані, такі як інформація про ваш пристрій та інтернет-з'єднання. Ці дані можуть бути доступні китайському уряду, який має широкі повноваження для втручання в діяльність компаній.

Застосунок також, імовірно, цензурує певну інформацію відповідно до суворих правил китайського інтернету, наприклад згадки про протести на площі Тяньаньмень у 1989 році. Однак DeepSeek випустив версію своєї моделі штучного інтелекту, яку можуть використовувати й модифікувати інші розробники. Це дозволяє стороннім фахівцям зробити її як більш захищеною, так і менш обмеженою, запустивши її локально на достатньо потужному пристрої.

Несподіваний успіх Alibaba

Поки вся увага технологічного світу прикута до китайської лабораторії штучного інтелекту DeepSeek, її головний конкурент, Alibaba, не сидить склавши руки.

У понеділок команда Qwen, що працює під егідою Alibaba, представила нову лінійку ШІ-моделей Qwen2.5-VL, здатних аналізувати текст і зображення. Нові моделі можуть обробляти файли, розуміти відео, підраховувати об’єкти на зображеннях і навіть керувати комп'ютером – подібно до моделі, яка використовується у нещодавно представленому OpenAI Operator.

Читайте також Трамп і Альтман проти Маска: що за проєкт Stargate на 500 мільярдів і чому Ілон образився

Порівняння моделей ШІ / Інфографіка Qwen

Як стверджує команда, за результатами тестування Qwen флагманська модель Qwen2.5-VL перевершує GPT-4o від OpenAI, Claude 3.5 Sonnet від Anthropic і Gemini 2.0 Flash від Google у таких завданнях, як розуміння відео, математичні обчислення, аналіз документів і відповідь на запитання.

Qwen2.5-VL, доступна для тестування в застосунку Qwen Chat від Alibaba та на платформі Hugging Face, здатна аналізувати графіки та діаграми, витягувати дані з відсканованих накладних і форм, а також обробляти багатогодинні відео. Модель також може розпізнавати персонажів із фільмів і серіалів, а також широкий спектр товарів, що натякає на можливе використання авторських матеріалів у процесі навчання.

Однак, як і інші китайські ШІ-системи, Qwen2.5-VL має певні обмеження. Наприклад, під час спроби обговорити тему невдач Сі Цзіньпіна, китайського лідера, у Qwen Chat з’являється повідомлення про помилку. Це пов'язано з вимогами китайського регулятора, який контролює, щоб усі локальні ШІ відповідали "основним соціалістичним цінностям" і уникали чутливих тем, як-от незалежність Тайваню.

Однією з найцікавіших функцій Qwen2.5-VL є її здатність взаємодіяти із програмним забезпеченням на ПК та мобільних пристроях. Наприклад, у відео, опублікованому на X технічним лідером Hugging Face Філіпом Шмідом, демонструється, як модель відкриває застосунок Booking.com на Android і бронює переліт з Чунціна до Пекіна.

Що стосується доступності, дві менші моделі Qwen2.5-VL-3B та Qwen2.5-VL-7B розповсюджуються за відкритою ліцензією. Водночас флагманська Qwen2.5-VL-72B знаходиться під спеціальною ліцензією Alibaba, яка вимагає від компаній та розробників із понад 100 мільйонами активних користувачів на місяць отримати дозвіл перед комерційним використанням.

Запуск Qwen2.5-VL показує, що китайські технологічні гіганти не лише наздоганяють світових лідерів у сфері ШІ, але й прагнуть встановити нові стандарти у галузі.

Китай проти США: політика

Китай, як і США, зробив штучний інтелект національним пріоритетом та заявив про намір стати світовим лідером у цій галузі до 2030 року. Держава інвестувала величезні кошти в дослідження та розробку ШІ, подібно до того, як американські компанії протягом останніх двох років вклали мільярди доларів у центри обробки даних і розвиток штучного інтелекту.

Побоюючись, що Китай може використати ШІ для досягнення паритету з економічною та військовою потужністю США, адміністрація Байдена заборонила американським компаніям експортувати до Китаю високотехнологічне обладнання для ШІ. Однак у деяких випадках китайським компаніям вдалося обійти ці обмеження, закуповуючи чіпи через треті країни.

До теми Як ШІ вплинув на скорочення робочих місць і яка ситуація в українському IT

У свої останні тижні на посаді президента Джо Байден запровадив ще суворіші заходи контролю, обмеживши експорт чіпів для ШІ до більшості країн світу, щоб запобігти їх нелегальному постачанню до Китаю. Але за тиждень після інавгурації Трампа Білий дім звинуватив адміністрацію Байдена у тому, що вона дозволила Китаю наблизитися до США у розвитку ШІ. Поки невідомо, чи Дональд Трамп планує ввести ще жорсткіші обмеження на експорт технологій ШІ.

В чому перевага Китаю на полі ШІ

Різке зростання вартості так званих ШІ-гіперскейлерів, таких як Meta Platforms, Alphabet та Microsoft, створило величезні статки їх власникам після запуску ChatGPT у листопаді 2022 року, пише Bloomberg. Ці компанії інвестують мільярди у розробку ШІ, зосереджуючи ресурси на сучасних напівпровідниках і енергетичних потужностях.

Генеральний директор Meta Марк Цукерберг оголосив напередодні різкого стрибка DeepSeek, що цьогоріч його компанія планує витратити 60–65 мільярдів доларів на проєкти, пов'язані зі штучним інтелектом. Це значно перевищує очікування Волл-стріт. За прогнозами Bloomberg Intelligence, капітальні витрати провідних технологічних компаній можуть досягти 200 мільярдів доларів у 2025 році.

Попри обмежені доходи від таких інвестицій, ринки винагороджують американські технологічні акції рекордними оцінками, що призвело до історичного зростання статків їхніх власників. Nvidia стала найбільшим переможцем завдяки буму ШІ: від початку 2023 року статки Дженсена Хуанга зросли майже у вісім разів – до 121 мільярда доларів. Тим часом статки Цукерберга злетіли на 385% до 229 мільярдів доларів, а Джефф Безос заробив ще 133%, досягнувши 254 мільярдів доларів.

Можливість DeepSeek створити конкурентоспроможну модель ШІ за невеликі кошти змусила інвесторів переглянути виправданість залежності Кремнієвої долини від масивних капіталовкладень.

Китайські компанії, включаючи DeepSeek, змушені обходитися без доступу до потужних графічних процесорів (GPU), які зазвичай використовують західні розробники, через експортні обмеження США. Однак, за словами Александра Ванга, генерального директора американської ШІ-компанії Scale AI, китайські лабораторії можуть мати більше GPU, ніж вважається.

За його словами, DeepSeek, ймовірно, має близько 50 тисяч H100, хоча офіційно це не розголошується через обмеження експорту. OpenAI, за оцінками, використовує понад 32 000 GPU для роботи своїх флагманських продуктів.

Qwen2.5-Max ж використовує архітектуру Mixture-of-Experts, що дозволяє ефективно розподіляти навантаження і досягати високої продуктивності при значно менших обчислювальних витратах. Це може стати новим стандартом у галузі, змінюючи уявлення про те, які ресурси потрібні для створення передових ШІ.

Факт того, що китайські компанії досягають проривних результатів без доступу до найновіших американських процесорів, ставить перед індустрією важливе питання: чи є надмірна залежність від обчислювальної потужності єдиним шляхом розвитку? Якщо ефективність інженерних рішень дозволяє отримувати подібні результати, інші гравці ринку можуть змінити свої стратегії.

Для американських технологічних гігантів це створює новий виклик. Вони більше не можуть покладатися виключно на апаратні переваги, адже архітектурні інновації можуть компенсувати нестачу ресурсів. Це означає, що конкуренція в ШІ виходить на новий рівень – боротьбу не лише за потужність, а й за ефективність та оптимізацію.

Наступні місяці стануть вирішальними. Як Китай, так і США продовжують розвивати свої технології, і якщо китайські компанії зможуть довести ефективність своїх підходів у реальних застосуваннях, це може радикально змінити баланс сил у глобальних перегонах за ШІ-домінування. Відтепер не лише потужність, а й креативність у розробці моделей визначатиме майбутніх лідерів галузі.