Китайский стартап DeepSeek, взволновавший рынок, закрыл доступ к своему ИИ из-за киберинцидента
DeepSeek, компания из Китая, обвалившая акции американских компаний и стремительно набирающая популярность, выпустила семейство моделей искусственного интеллекта. Она говорит, что платформа для генерирования изображений превосходит DALL-E 3 от OpenAI, а независимый эксперт ранее заявил, что в его тестах ИИ от DeepSeek превосходил ChatGPT, Gemini и Meta AI по крайней мере в некоторых случаях.
Новые модели
Модели, которые можно загрузить с платформы для разработки ИИ Hugging Face, являются частью совершенно нового набора, который DeepSeek называет Janus-Pro. Они имеют от 1 миллиарда до 7 миллиардов параметров. Эти параметры примерно соответствуют навыкам модели выполнять задачи: модели с большим количеством параметров работают лучше, чем варианты с меньшим количеством. Отметим, что новые модели – это не то же, что и приложение DeepSeek, которое предоставляет доступ к языковой модели R1 в виде традиционного чат-бота. Оно стало первым по количеству загрузок в App Store в эти выходные. Но очень быстро компания была вынуждена приостановить регистрацию новых пользователей, сообщает 24 Канал со ссылкой на TechCrunch.
Смотрите также Китайский ИИ от DeepSeek шокировал западный рынок своими результатами: акции NVIDIA летят вниз
Janus-Pro имеет лицензию Массачусетского технологического института и позволяет использовать свои ресурсы в коммерческих целях без ограничений.
Компания говорит, что Janus-Pro может как анализировать, так и создавать новые изображения. По ее собственным данным, в двух тестах оценки ИИ (GenEval и DPG-Bench), самая большая модель Janus-Pro под названием Janus-Pro-7B превосходит DALL-E 3, а также такие модели, как PixArt-alpha, Emu3-Gen и Stability AI's Stable Diffusion XL.
Стоит отметить, что некоторые из этих моделей, с которыми DeepSeek сравнивает свою разработку, являются устаревшими. К тому же Janus-Pro может анализировать лишь небольшие изображения с разрешением до 384x384. Однако это все равно весьма хорошая производительность, учитывая компактные размеры (1-7 миллиарда параметров – это на самом деле довольно мало по современным меркам).
Janus-Pro превосходит предыдущую унифицированную модель и соответствует или превышает производительность моделей для конкретных задач. Простота, высокая гибкость и эффективность Janus-Pro делают его сильным кандидатом на создание унифицированных мультимодальных моделей следующего поколения,
– пишет DeepSeek в публикации на Hugging Face.
DeepSeek закрывает регистрацию
Примерно в это же время компания опубликовала сообщение на своем сайте, где заявила, что вынуждена ограничить регистрацию пользователей после того, как подверглась "масштабным злонамеренным атакам".
Текущие пользователи могут заходить как обычно,
– отметили в объявлении.
Пока непонятно, кто стоит за этими атаками и какого они характера. DeepSeek говорит, что "продолжает исследовать эту проблему".
Но время, вероятно, неслучайно. Астрономический рост популярности приложения, который затмил ChatGPT в рейтинге Apple App Store, всколыхнул Кремниевую долину и фондовый рынок. Приложение, которое обещает все те же, или даже лучшие, возможности при более низкой цене, чем у конкурентов, заставило десятки компаний потерять миллиарды долларов капитализации.