Представлено DALL-E 3: штучний інтелект для генерації зображень здивує вас новими функціями
Компанія OpenAI представила останню ітерацію своєї моделі генерації зображень DALL-E 3 і оголосила про наміри інтегрувати її в платформу ChatGPT. Нова версія DALL-E може похвалитися поліпшеними можливостями, включаючи поліпшене розуміння запитів і здатність генерувати високодеталізовані і точні зображення, перевершуючи продуктивність своєї попередниці, DALL-E 2.
Команда розробників OpenAI наголосила на значному прогресі у здатності DALL-E 3 розуміти запити користувачів, інформує 24 Канал. Тепер модель може аналізувати складні інструкції та створювати зображення, які точно відповідають наданим описам.
А тим часом Сформульовано 7 важливих принципів регулювання штучного інтелекту
Ця розробка має на меті усунути необхідність для користувачів займатися складним оперативним проєктуванням, щоб досягти бажаного результату.
Помітні зміни
DALL-E 3 чудово обробляє дрібні деталі, включаючи складні пози людських рук, які часто створювали проблеми для штучного інтелекту. Примітно, що навіть за однакових запитів DALL-E 3 постійно перевершує версію DALL-E 2, видаючи точніші результати.
ChatGPT зможе малювати зображення
Одним з ключових застосувань DALL-E 3 буде його інтеграція в чат-боти ChatGPT Plus і Enterprise, запланована на найближче майбутнє. Поєднання можливостей обробки мови з розширеними можливостями генерації зображень дасть змогу отримувати точніші та більш кастомізовані результати.
Важлива зміна! Користувачі зможуть уточнювати свої запити до зображень, якщо початковий результат не відповідає їхнім очікуванням. Раніше ця функція не працювала – інструмент кожного разу малював зображення з початку.OpenAI пояснює:
При отриманні запиту ChatGPT автоматично генерує індивідуальні детальні підказки для DALL-E 3, на основі яких він створить зображення. Якщо отримане зображення подобається користувачеві, але не точно відображає запит, його можна змінити, додавши лише кілька додаткових уточнюючих слів.
Коли DALE-E 3 стане доступним
Наразі DALL-E 3 перебуває на стадії дослідницької попередньої версії і стане доступною для абонентів ChatGPT Plus і Enterprise у жовтні через API.
- Важливо відзначити, що використання DALL-E 2 базується на підписці, а ChatGPT Plus коштує 20 доларів на місяць.
- Чат-бот Bing Chat AI від Microsoft наразі є єдиним великим чат-ботом, який пропонує безкоштовний вбудований генератор зображень, що працює на основі мовної моделі GPT-4 від OpenAI.
- OpenAI підтверджує, що, як і у випадку з DALL-E 2, зображення, створені за допомогою DALL-E 3, будуть належати користувачеві, надаючи йому право передруковувати, продавати або поширювати їх без отримання додаткових дозволів.
Не забули і про безпеку
OpenAI реалізував певні заходи безпеки в DALL-E 3, щоб зменшити потенційні зловживання.
- Генератор зображень відхилятиме запити, що містять імена публічних осіб або будь-які "шкідливі упередження", щоб мінімізувати ризик поширення пропаганди та дезінформації.
- Розробники також тестують класифікатор походження – інструмент, призначений для визначення того, чи було зображення згенероване нейронною мережею.
- Крім того, DALL-E 3 не буде створювати зображення в стилі сучасних художників і митців, що дозволить уникнути потенційних порушень авторських прав.
Читайте на сайті Штучний інтелект проєктує міста значно краще, ніж це роблять люди
Оскільки OpenAI продовжує впроваджувати інновації в галузі штучного інтелекту, розширені можливості генерації зображень DALL-E 3 відкриють користувачам нові шляхи для творчого самовираження та виконання завдань, а також вирішать проблеми (принаймні спробують), пов'язані зі зловживанням та етичними міркуваннями.