Укр Рус
15 августа, 10:31
2

DeepSeek провалил обучение новой модели ИИ, потому что чипы Huawei были недостаточно хороши

Основні тези
  • DeepSeek сталкивается с проблемами при обучении новой модели ИИ из-за недостаточной производительности чипов Huawei Ascend 910B.
  • Компания перешла на использование графических процессоров Nvidia H800, фактически признав, что китайские чипы не могут полностью заменить американские аналоги для сложных задач.

Китайская компания DeepSeek, которая не так давно захватила внимание пользователей по всему миру, столкнулась с неожиданными трудностями. Выпуск ее новой, более мощной языковой модели откладывается на неопределенный срок из-за проблем с аппаратным обеспечением. Эта ситуация обнажила слабые места в амбициозных планах Китая по технологической независимости в сфере высоких технологий.

Почему передовые китайские чипы оказались неэффективными?

Пекинский стартап DeepSeek планировал тренировать свою следующую большую языковую модель, которая должна была превзойти предыдущую версию DeepSeek V2, используя тысячи ускорителей искусственного интеллекта Ascend 910B от Huawei. Этот шаг был частью национальной стратегии Китая, направленной на уменьшение зависимости от иностранных технологий, в частности от доминирующих на рынке графических процессоров американской компании Nvidia, пишет 24 Канал со ссылкой на ArsTechnica.

Смотрите также DeepSeek использует незаконно полученные чипы NVIDIA для китайских военных операций

Однако во время тренировки модели возникли серьезные проблемы. Чипы Huawei не смогли обеспечить необходимый уровень производительности и стабильности для столь сложной задачи. Из-за этого процесс обучения новой ИИ-модели провалился, и компания была вынуждена его остановить.

Чтобы продолжить работу, DeepSeek приняла решение вернуться к использованию графических процессоров Nvidia H800 (одной из версий флагманского чипа H100, адаптированной специально для китайского рынка с учетом экспортных ограничений США, т.е. менее мощной).

Эта неудача стала ощутимым ударом как для Huawei, так и для амбиций Китая достичь полной самодостаточности в области аппаратного обеспечения для искусственного интеллекта. Инцидент четко продемонстрировал, что между китайскими разработками и технологиями Nvidia все еще существует значительный разрыв в производительности. Хотя чипы Huawei считаются лучшей альтернативой в Китае, этот случай доказывает, что они пока не могут полноценно заменить американские аналоги для тренировки самых современных масштабных моделей ИИ.

Задержка означает, что новая модель DeepSeek появится позже, чем планировалось, что может негативно повлиять на ее конкурентоспособность на стремительно развивающемся рынке.

Представители компании подтвердили переход на оборудование Nvidia, но не предоставили новой даты релиза.