Нові моделі

Моделі, які можна завантажити з платформи для розробки ШІ Hugging Face, є частиною абсолютно нового набору, який DeepSeek називає Janus-Pro. Вони мають від 1 мільярда до 7 мільярдів параметрів. Ці параметри приблизно відповідають навичкам моделі виконувати завдання: моделі з більшою кількістю параметрів працюють краще, ніж варіанти з меншою кількістю. Зазначимо, що нові моделі – це не те саме, що й застосунок DeepSeek, який надає доступ до мовної моделі R1 у вигляді традиційного чат-бота. Він став першим за кількістю завантажень в App Store цими вихідними. Але дуже швидко компанія була змушена призупинити реєстрацію нових користувачів, повідомляє 24 Канал з посиланням на TechCrunch.

Дивіться також Що таке DeepSeek або як китайський ШІ обвалив світові фондові ринки в США та Японії

Janus-Pro має ліцензію Массачусетського технологічного інституту й дозволяє використовувати свої ресурси в комерційних цілях без обмежень.

Компанія каже, що Janus-Pro може як аналізувати, так і створювати нові зображення. За її власними даними, у двох тестах оцінки ШІ (GenEval і DPG-Bench), найбільша модель Janus-Pro під назвою Janus-Pro-7B перевершує DALL-E 3, а також такі моделі, як PixArt-alpha, Emu3-Gen і Stability AI's Stable Diffusion XL.

Варто зазначити, що деякі з цих моделей, з якими DeepSeek порівнює свою розробку, є застарілими. До того ж Janus-Pro може аналізувати лише невеликі зображення з роздільною здатністю до 384x384. Однак це все одно вельми хороша продуктивність, враховуючи компактні розміри (1-7 мільярда параметрів – це насправді досить мало за сучасними мірками).

Janus-Pro перевершує попередню уніфіковану модель і відповідає або перевищує продуктивність моделей для конкретних завдань. Простота, висока гнучкість і ефективність Janus-Pro роблять його сильним кандидатом на створення уніфікованих мультимодальних моделей наступного покоління,
– пише DeepSeek у публікації на Hugging Face.

DeepSeek закриває реєстрацію

Приблизно в цей же час компанія опублікувала повідомлення на своєму сайті, де заявила, що змушена обмежити реєстрацію користувачів після того, як зазнала "масштабних зловмисних атак".

Поточні користувачі можуть заходити як зазвичай,
– зазначили в оголошенні.

Наразі незрозуміло, хто стоїть за цими атаками і якого вони характеру. DeepSeek каже, що "продовжує досліджувати цю проблему".

Дивіться також Китайський ШІ від DeepSeek шокував західний ринок своїми результатами: акції NVIDIA летять униз

Але час, імовірно, невипадковий. Астрономічний ріст популярності додатка, який затьмарив ChatGPT у рейтингу Apple App Store, сколихнув Кремнієву долину та фондовий ринок. Застосунок, який обіцяє всі ті ж, або навіть кращі, можливості при нижчій ціні, ніж у конкурентів, змусив десятки компаній втратити мільярди доларів капіталізації.