Компанія стверджувала, що витратила лише 6 мільйонів доларів і використала 2 048 графічних процесорів (GPU) для навчання нейромережі DeepSeek V3. Та схоже це не зовсім так, повідомляє 24 Канал з посиланням на дані SemiAnalysis. В ході розслідування виявилося, що реальні масштаби обчислювальної інфраструктури DeepSeek набагато більші, а загальні інвестиції у розвиток компанії перевищують 1,6 мільярда доларів.

Не пропустіть Що таке проєкт Stargate, про який говорить уся сфера штучного інтелекту

За даними SemiAnalysis, DeepSeek управляє величезною обчислювальною інфраструктурою, що налічує близько 50 000 відеокарт Nvidia Hopper. Серед них:

  • 10 000 H800
  • 10 000 H100
  • Додаткові партії H20

Ці ресурси розподілені між кількома дата-центрами та використовуються для навчання ШІ, досліджень і фінансового моделювання.

DeepSeek розпочав свою діяльність як дочірній проєкт китайського хедж-фонду High-Flyer, який у 2023 році виокремив стартап у самостійний бізнес, орієнтований на розвиток ШІ. На відміну від багатьох компаній, що орендують потужності у хмарних провайдерів, DeepSeek має власні дата-центри. Це забезпечує повний контроль над оптимізацією ШІ-моделей та дозволяє швидше впроваджувати інновації.

Кадрова стратегія та високі зарплати

На додаток DeepSeek проводить закриту кадрову політику, набираючи спеціалістів виключно з Китаю. Основну увагу компанія приділяє професійним навичкам і здатності розв’язувати складні задачі, а не формальній освіті.

Зарплати дослідників DeepSeek можуть перевищувати 1,3 мільйона доларів на рік, що дає змогу залучати найкращі таланти з провідних китайських університетів.

Дивіться також У США почали блокувати DeepSeek: Пентагон побоюється за особисті дані своїх працівників

Попри заяви DeepSeek про "революційний бюджет", аналітики SemiAnalysis наголошують, що успіх компанії ґрунтується на багатомільярдних інвестиціях, технологічних проривах і сильній команді. Це ставить під сумнів початкові твердження про створення конкурентного ШІ з мінімальними витратами.