Новинки представили в рамках конференции re:Invent во вторник. Работать все, конечно же, в рамках Amazon Web Services (AWS), сервисе облачных вычислений Amazon, который предоставляет услуги серверов компаниям и разработчикам программного обеспечения. Всего есть четыре модели генерации текста: Micro, Lite, Pro и Premier. Кроме того, существует модель генерации изображений Nova Canvas и модель генерации видео Nova Reel, сообщает 24 Канал со ссылкой на TechCrunch.

Смотрите также Новая технология дает искусственному интеллекту возможность чувствовать поверхности

Подробнее о Nova

Модели Nova, генерирующие текст, лучше всего оптимизированы для 15 языков (но прежде всего различных вариантов английского) и имеют различные размеры и возможности. Украинского языка в списке лучше всего поддерживаемых пока нет, но компания отмечает, что ее ИИ в целом понимает более 200 языков. Поэтому вы также сможете попробовать модель на украинском, но не факт, что результат вас устроит.

  • Amazon Nova Micro – исключительно текстовая модель с самой низкой задержкой отклика, то есть она обрабатывает текст и генерирует ответы быстрее. Модель имеет контекстное окно в 128 000 токенов или примерно 100 000 слов на один запрос. Nova Micro предоставляет тонкие настройки, чтобы вы могли получить именно тот ответ, на который ожидаете. Этот вариант доступен уже сегодня.

Что такое контекстное окно?

Контекстное окно означает способность модели обрабатывать запросы определенного размера и просматривать информацию одновременно. Представьте, что запрашиваете ИИ о содержании учебного видеокурса, чтобы не просматривать его самостоятельно. Маленькое контекстное окно позволит нейросети анализировать одновременно, например, одно видео или один документ. Поэтому ответ на вопрос, который вы зададите, будет искаться только в нем. Затем вам нужно будет загрузить следующую порцию данных для поиска в них. Это уменьшает вероятность быстрого нахождения правильного ответа. Но если контекстное окно большое, то ИИ может обработать больше видео или документов – 5, 10, 100 или больше. Чем больше это окно, тем лучше ИИ в ответах на вопросы.
  • Amazon Nova Lite – очень недорогая мультимодальная модель, которая уже может обрабатывать не только текстовые данные, но и изображения и видео, для создания текстового результата. Она поддерживает входные данные длиной до 300 тысяч токенов и может анализировать изображения или видео продолжительностью до 30 минут за один запрос. Модель поддерживает тонкие настройки. Доступно уже сегодня.
  • Amazon Nova Pro – высокопроизводительная мультимодальная модель, которая может обрабатывать до 300 тысяч входящих токенов. Amazon утверждает, что эта новая модель достигает самых современных показателей в ключевых тестах. Контекстные окна Lite и Pro соответствуют примерно 225 000 слов и 15 000 строк компьютерного кода. Доступно также сегодня.
  • Amazon Nova Premier – будущая самая мощная мультимодальная модель Amazon для сложных задач на рассуждение, которая все еще находится на стадии разработки. Ожидается, что она станет общедоступной в начале 2025 года. Как и Lite и Pro, она хорошо подходят для таких задач, как просмотр документов, обобщение диаграмм, встреч и прочее, но делать это значительно эффективнее. Точные возможности пока неизвестны, но эта модель ИИ также подается как "учитель", который может быть инструментом для создания собственных кастомных вариантов Nova Micro и Lite, обученных на ваших собственных наборах данных.
  • Amazon Nova Canvas – модель генерации изображений, которая может создавать изображения из текстового описания или других изображений, предоставленных в запросе. Она также поддерживает редактирование изображений с помощью ввода текста и элементов управления для настройки цветовой схемы и макета. Вы также можете эффективно удалять фон. Доступно сегодня.
  • Amazon Nova Reel – модель генерации видео, которая может создавать высококачественные, но пока очень короткие видео на основе вашего описания. Сейчас продолжительность ограничена лишь 6 секундами, но в 2025 году время увеличится до 2 минут. Nova Reel будет поддерживать возможность управлять визуальным стилем и темпом, включая управление движением камеры с помощью текстовых подсказок – регулировать углы наклона, делать панорамирование, вращать на 360 градусов, масштабировать и тому подобное. Также доступно уже сегодня.

В начале 2025 года контекстные окна некоторых моделей Nova будут расширены для поддержки более 2 миллионов токенов, сообщает компания.

Все вышеупомянутые модели Amazon Nova доступны уже или будут доступны в будущем в рамках услуги Amazon Bedrock, платформы Amazon для разработки искусственного интеллекта, где их можно точно настроить на тексте, изображениях и видео и "дистиллировать" от лишнего багажа для улучшения скорости и повышения эффективности. Отмечается, что модели Nova являются одними из самых быстрых в своем классе и одними из самых дешевых в эксплуатации.

Пока доступность ограничена. Воспользоваться ими могут пользователи в восточном регионе США. Вариации Micro, Lite и Pro также доступны в западном и восточном регионах США. Когда модели распространятся на другие страны, неизвестно.