ChatGPT тепер може побачити вас через камеру: навіщо ШІ отримав таку функцію
Компанія OpenAI оголосила про революційне оновлення свого генеративного чат-бота ChatGPT, що дозволяє йому обробляти відеопотоки зі смартфонів, комп'ютерних камер та екранів пристроїв. Нова функція, доступна в рамках Вдосконаленого голосового режиму, дозволяє ШІ "спостерігати" і реагувати на те, що він бачить, у режимі реального часу.
Вперше про здатність ChatGPT розпізнавати та інтерпретувати візуальне введення компанія OpenAI оголосила в травні 2024 року, але її розгортання зіткнулося з численними затримками, повідомляє 24 Канал з посиланням на TechCrunch.
А тим часом Голосовий режим вашого ChatGPT тепер може звучати як Санта
Спочатку компанія пообіцяла, що користувачі отримають доступ до цієї функції "протягом декількох тижнів", але офіційно вона стала доступною лише 12 грудня 2024 року. Наразі доступ до неї отримали лише платні підписники планів ChatGPT Plus, Team і Pro.
Користувачам ChatGPT Enterprise і Edu доведеться почекати до січня 2025 року.
Що дає нова функція?
Нова функція була нещодавно продемонстрована в програмі CNN "60 хвилин ". Під час ефіру президент OpenAI Грег Брокман протестував технологію з телеведучим Андерсоном Купером. Купер намалював на дошці анатомічні частини тіла, які ChatGPT успішно розпізнала.
Однак, коли перед ним постала геометрична задача, ChatGPT зробив помилку, продемонструвавши свою схильність до галюцинацій – відоме обмеження моделей штучного інтелекту.
Розгортання можливостей візуального розпізнавання ChatGPT розглядається як конкурентний крок проти Google і Meta, які працюють над аналогічними функціями для своїх чат-ботів.
Цього тижня Google оголосив про випуск Project Astra, інструменту ШІ, здатного аналізувати відеопотоки в реальному часі, який наразі доступний для обраної групи довірених тестувальників на Android.
Дивіться також iOS 18․2 з функціями Apple Intelligence нарешті вийшла: як зміниться ваш iPhone
Для OpenAI надати можливість "бачити" своєму інструменту означає значний розвиток інтерактивності ChatGPT, виводячи його за рамки текстового та голосового спілкування в простір, де він може взаємодіяти з користувачами візуально.
Ця функція може відкрити нові можливості для інтерактивного навчання, творчої допомоги та завдань підтримки, хоча помилки, що трапляються в ній, підкреслюють постійні виклики в розвитку ШІ.