Чому передові китайські чипи виявилися неефективними?

Пекінський стартап DeepSeek планував тренувати свою наступну велику мовну модель, яка мала перевершити попередню версію DeepSeek V2, використовуючи тисячі прискорювачів штучного інтелекту Ascend 910B від Huawei. Цей крок був частиною національної стратегії Китаю, спрямованої на зменшення залежності від іноземних технологій, зокрема від домінуючих на ринку графічних процесорів американської компанії Nvidia, пише 24 Канал з посиланням на ArsTechnica.

Однак під час тренування моделі виникли серйозні проблеми. Чипи Huawei не змогли забезпечити необхідний рівень продуктивності та стабільності для настільки складного завдання. Через це процес навчання нової ШІ-моделі провалився, і компанія була змушена його зупинити.

Щоб продовжити роботу, DeepSeek ухвалила рішення повернутися до використання графічних процесорів Nvidia H800 (однієї з версій флагманського чипа H100, адаптованої спеціально для китайського ринку з урахуванням експортних обмежень США, тобто менш потужної).

Ця невдача стала відчутним ударом як для Huawei, так і для амбіцій Китаю досягти повної самодостатності в галузі апаратного забезпечення для штучного інтелекту. Інцидент чітко продемонстрував, що між китайськими розробками та технологіями Nvidia все ще існує значний розрив у продуктивності. Хоча чипи Huawei вважаються найкращою альтернативою в Китаї, цей випадок доводить, що вони поки не можуть повноцінно замінити американські аналоги для тренування найсучасніших масштабних моделей ШІ.

Затримка означає, що нова модель DeepSeek з'явиться пізніше, ніж планувалося, що може негативно вплинути на її конкурентоспроможність на ринку, який стрімко розвивається.

Представники компанії підтвердили перехід на обладнання Nvidia, але не надали нової дати релізу.