Представлен DALL-E 3: искусственный интеллект для генерации изображений удивит вас новыми функциями

21 сентября 2023, 16:30
Читати новину українською

Компания OpenAI представила последнюю итерацию своей модели генерации изображений DALL-E 3 и объявила о намерениях интегрировать ее в платформу ChatGPT. Новая версия DALL-E может похвастаться улучшенными возможностями, включая улучшенное понимание запросов и способность генерировать высокодетализированные и точные изображения, превосходя производительность предшественницы DALL-E 2.

Команда разработчиков OpenAI отметила значительный прогресс в способности DALL-E 3 понимать запросы пользователей. 24 Канал. Теперь модель может анализировать сложные инструкции и создавать изображения, точно соответствующие описаниям..

А между тем Сформулировано 7 важных принципов регулирования искусственного интеллекта

Эта разработка имеет целью устранить необходимость для пользователей заниматься сложным оперативным проектированием, чтобы добиться желаемого результата.

Заметные изменения

DALL-E 3 прекрасно обрабатывает мелкие детали, включая сложные позы человеческих рук, часто создававших проблемы для искусственного интеллекта. Примечательно, что даже при одинаковых запросах DALL-E 3 постоянно превосходит версию DALL-E 2, выдавая более точные результаты.

ChatGPT сможет рисовать изображение

Одним из ключевых применений DALL-E 3 будет его интеграция в чат-боты ChatGPT Plus и Enterprise, запланированная на ближайшее будущее Сочетание возможностей обработки языка с расширенными возможностями генерации изображений позволит получать более точные и более кастомизированные результаты.

Важное изменение! Пользователи смогут уточнять свои запросы на изображения, если исходный результат не соответствует их ожиданиям. Раньше эта функция не работала – инструмент каждый раз рисовал изображение с самого начала.

OpenAI объясняет:

При получении запроса ChatGPT автоматически генерирует индивидуальные подробные подсказки DALL-E 3, на основе которых он создаст изображение. Если полученное изображение нравится пользователю, но не точно отображает запрос, его можно изменить, добавив несколько дополнительных уточняющих слов.

Когда DALE-E 3 станет доступным

DALL-E 3 находится на стадии исследовательской предыдущей версии и станет доступной для абонентов ChatGPT Plus и Enterprise в октябре через API.

  • Важно отметить, что использование DALL-E 2 базируется на подписке, а ChatGPT Plus стоит 20 долларов на месяц.
  • Чат-бот Bing Chat AI от Microsoft является единственным большим чат-ботом, который предлагает бесплатный встроенный генератор изображений, работающий на основе языковой модели GPT-4 от OpenAI.
  • OpenAI подтверждает, что, как и в случае с DALL-E2, изображения, созданные с помощью DALL-E3, будут принадлежать пользователю, предоставляя ему право перепечатывать, продавать или распространять их без получения дополнительных разрешений.

Не забыли и о безопасности

OpenAI реализовал определенные меры безопасности в DALL-E 3, чтобы снизить потенциальные злоупотребления.

  • Генератор изображений будет отклонять запросы, содержащие имена публичных лиц или любые "вредные предубеждения", чтобы минимизировать риск распространения пропаганды и дезинформации.
  • Разработчики также тестируют классификатор происхождения – инструмент, предназначенный для определения того, было ли изображение сгенерировано нейронной сетью.
  • Кроме того, DALL-E3 не будет создавать изображения в стиле современных художников и художников, что позволит избежать потенциальных нарушений авторских прав.

Читайте на сайте Искусственный интеллект проектирует города гораздо лучше, чем это делают люди

Поскольку OpenAI продолжает внедрять инновации в области искусственного интеллекта, расширенные возможности генерации изображений DALL-E 3 откроют пользователям новые пути для творческого самовыражения и выполнения задач, а также решат проблемы (по крайней мере, попробуют), связанные со злоупотреблением и нравственными соображениями.