OpenAI офіційно розсекретила свою найновішу мовну модель GPT-5, яка значно обганяє все, що компанія досі робила. Сем Альтман, засновник і CEO, заявив, що якщо попередні моделі можна було порівняти з учнями та студентами, то GPT-5 – це досвідчений експерт з будь-якого питання. Ось усе, що розробники відкрили на презентації.

На що здатна модель GPT-5?

OpenAI позиціює GPT-5 як свою найдосконалішу модель на сьогодні, яка перевершує попередників у кодуванні, написанні текстів, точності та безпеці. Однією з ключових змін є те, що GPT-5 за замовчуванням працює як модель для міркувань. Це означає, що система запрограмована розбивати складні проблеми на менші частини для їх вирішення, що спрощує досвід для користувачів, яким раніше потрібно було активувати цю функцію Think Longer вручну. Модель також працює значно швидше та, за твердженням розробників, має менше "галюцинацій", тобто надає точніші відповіді, пише 24 Канал з посиланням на офіційну презентацію OpenAI.

Дивіться також ChatGPT попросить вас зробити перерву, якщо ви говорите з ним занадто багато

Вона позиціонується як найрозумніша, найшвидша та найкорисніша модель від OpenAI. Серед ключових оновлень – покращена точність, швидкість, можливості міркування, розпізнавання контексту, структуроване мислення та вирішення проблем.

Доступ до моделі організовано таким чином:

GPT-5 – стандартна версія, доступна відразу для всіх: як для безкоштовних користувачів, так і для власників підписки Plus.

GPT-5 mini – полегшена версія, яка вмикається, коли користувачі досягають ліміту запитів до основної моделі.

GPT-5 Pro – найпотужніша версія, доступна виключно для підписників плану Pro за 200 доларів на місяць, яка пропонує необмежену кількість запитів. Користувачі Plus також мають значно вищі ліміти, ніж безкоштовні акаунти.

Безпека

Особливу увагу приділили безпеці. Нова функція Safe Completions дозволяє моделі надавати корисну, але загальну інформацію на делікатні запити, замість того щоб просто відмовляти у відповіді. У складних ситуаціях, коли запит може бути двозначним (наприклад, наукове питання, що потенційно може бути використане для шкоди), модель надасть лише загальну інформацію, яку не можна використати для завдання шкоди. Наприклад, на питання про необхідну енергію для займання матеріалу, модель надасть загальнонаукову інформацію без небезпечних деталей.

Також GPT-5 краще обробляє медичні запити, адаптуючись до рівня знань користувача та його географії, і може пропонувати користувачам питання для обговорення з лікарем-людиною, а не з ШІ.

OpenAI також заявляє, що модель GPT-5 є безпечнішою за попередні моделі. Ба більше, вона вважає її найбезпечнішим штучним інтелектом узагалі на ринку. Хоча моделі штучного інтелекту іноді виявляють схильність до інтриг проти людей або брехні для досягнення власних цілей, OpenAI виявила, що GPT-5 рідше вдається до обману, ніж інші моделі.

Алекс Бойтель, керівник відділу досліджень безпеки OpenAI, зазначив, що зменшення кількості випадків обману покращує не тільки безпеку GPT-5, але й користувацький досвід, створюючи модель, яка є більш "прозорою та чесною, що викликає довіру у користувачів".

Бойтель також зазначає, що GPT-5 краще розрізняє зловмисників, які намагаються зловживати ChatGPT, та користувачів, які роблять нешкідливі запити. Це дозволяє GPT-5 відхиляти більше небезпечних питань, одночасно рідше відмовляючи користувачам, які шукають нешкідливу інформацію.

Кодування

Компанія стверджує, що GPT-5 пропонує продуктивність передового рівня в кодуванні та є їхньою найкращою моделлю для написання коду на ринку. Альтман заявляє, що модель особливо добре справляється з розгортанням цілих програмних застосунків.

Прямо під час презентації доповідачі показали приклади створення ігор, додатка для вивчення французької мови тощо. Поки що все виглядає так, наче програмування тепер займатиме лічені хвилини. Однак, безумовно, новинку ще потрібно тестувати, щоб поглянути на неї незалежним поглядом.

Що ще?

Разом із GPT-5 у ChatGPT з'явилися й інші оновлення:

Можливість налаштовувати колір чатів . Деякі ексклюзивні опції доступні для платних клієнтів.

. Деякі ексклюзивні опції доступні для платних клієнтів. Спрощена інтеграція з сервісами Google: Gmail, Calendar та Contacts.

Чотири попередньо встановлені "особистості" для чат-бота : цинік, робот, слухач і ботанік.

: цинік, робот, слухач і ботанік. Оновлена функція Advanced Voice, яка краще розуміє мовлення та адаптує свій стиль. Вона повністю замінила попередній Standard Voice Mode.

У GPT-5 також значно покращили навички письма – модель здатна перетворювати чернетки на "переконливий, резонансний" текст.

OpenAI стверджує, що GPT-5 є значно швидшою за попередню флагманську модель o3. Генеральний директор OpenAI Сем Альтман зазначив, що швидкість роботи настільки висока, що ви можете запитати себе: "А чи дійсно вона достатньо думає?".

Важливо, що модель має значно менше галюцинацій – за даними OpenAI, вона на 45% рідше містить фактичні помилки, ніж GPT-4o, і на 80% рідше, ніж OpenAI o3, при використанні функції "мислення". Галюцинації були однією з основних слабкостей попередніх моделей міркування.

За допомогою GPT-5 компанія OpenAI також прагнула спростити використання ChatGPT. Замість того щоб просити користувачів вибирати правильні налаштування, GPT-5 оснащений маршрутизатором, що працює в режимі реального часу і вирішує, як надати найкращу відповідь: швидко відповісти на запитання користувача або витратити додатковий час на "обдумування" відповіді.

Доступність GPT-5: вперше для всіх одразу

Модель GPT-5 тепер є стандартною в ChatGPT для всіх зареєстрованих користувачів, замінюючи попередні версії, такі як GPT-4o, OpenAI o3, OpenAI o4-mini, GPT-4.1 та GPT-4.5. Доступ до неї є для всіх користувачів, включаючи безплатних.

Віце-президент OpenAI з питань ChatGPT Нік Терлі заявив, що це частина зусиль компанії, спрямованих на те, щоб уперше надати безкоштовним користувачам доступ до моделі міркувань штучного інтелекту відразу після презентації. Раніше компанія обмежувала ці більш просунуті моделі платним доступом.

Що показують тести?

У SWE-bench Verified – тесті реальних завдань з кодування, взятих з GitHub – GPT-5 набрав 74,9% з першої спроби. Це означає, що GPT-5 перевершив останню модель Claude Opus 4.1 від Anthropic, яка набрала 74,5%, та Gemini 2.5 Pro від Google DeepMind, яка набрала 59,6%.

На останньому іспиті людства – складному тесті, що вимірює ефективність моделей штучного інтелекту в математиці, гуманітарних науках та природничих науках – версія GPT-5 з розширеним міркуванням (GPT-5 Pro) набрала 42% при використанні інструментів. Це трохи менше, ніж xAI змогла досягти з Grok 4 Heavy, яка набрала 44,4% у тому ж тесті.



Результати тестування GPT-5 / Фото OpenAI

У GPQA Diamond – тесті з наукових питань рівня доктора філософії – GPT-5 pro набрав 89,4% з першої спроби, випередивши Claude Opus 4.1, який набрав 80,9%, і Grok 4 Heavy, який набрав 88,9%.

OpenAI також стверджує, що GPT-5 краще відповідає на питання, пов'язані зі здоров'ям. У тесті, що вимірює точність відповідей AI-моделей у темах, пов'язаних з охороною здоров'я, HealthBench Hard Hallucinations, GPT-5 з мисленням галюцинує лише 1,6% часу. Це значно нижче, ніж у попередніх моделей компанії GPT-4o та o3, які набрали відповідно 12,9% та 15,8%.

У тесті Tau-bench, що вимірює здатність моделі штучного інтелекту виконувати імітовані онлайн-завдання, GPT-5 демонструє неоднозначні результати. У частині тесту, що вимірює здатність штучного інтелекту орієнтуватися на веб-сайті авіакомпанії, GPT-5 набрав 63,5%, що трохи поступається результату o3, який набрав 64,8%. В іншій частині тесту, що вимірює здатність ШІ навігації по веб-сайтах роздрібної торгівлі, GPT-5 набрав 81,1%, поступаючись Claude Opus 4.1, який набрав 82,4%.

В цілому Альтман каже, що хоча GPT-5 є значним кроком уперед, це ще не повноцінний штучний загальний інтелект (AGI), оскільки модель поки не здатна до самостійного безперервного навчання.