OpenAI показала GPT-5․6 – нову ШІ-модель із посиленим кіберзахистом

Артур Зайонц

OpenAI представила GPT-5.6 у трьох версіях – що змінилося в новому поколінні моделей / Unsplash / Levart_Photographer

OpenAI відкрила обмежений доступ до нового сімейства моделей GPT-5.6, зробивши головний акцент не лише на продуктивності, а й на кібербезпеці. Разом із новими можливостями компанія представила незвичний підхід до контролю ризиків.

OpenAI офіційно анонсувала обмежений попередній запуск нового сімейства моделей GPT-5.6, до якого входять три версії – Sol, Terra та Luna. Флагманською моделлю стала GPT-5.6 Sol, яку компанія називає своїм найпотужнішим рішенням для роботи із завданнями у сфері кібербезпеки. Про це пише Cyberpress.

Дивіться також Усього за 9 місяців OpenAI створила процесор, який може змінити майбутнє ChatGPT

Чим GPT-5.6 відрізняється від попередніх моделей?

Про презентацію було оголошено 26 червня 2026 року. За словами OpenAI, модель Terra забезпечує продуктивність, близьку до GPT-5.5, але коштує приблизно вдвічі дешевше. Luna стала найдоступнішою моделлю в лінійці, тоді як Sol орієнтована на найскладніші професійні сценарії використання.

Однією з головних особливостей GPT-5.6 Sol стала значно ефективніша робота з довгими завданнями. Під час тестування на бенчмарку ExploitBench модель показала результати, які можна порівняти з Mythos Preview від Anthropic, але для цього їй знадобилося приблизно втричі менше вихідних токенів. Це особливо важливо для дослідження вразливостей, аналізу експлойтів та інших складних процесів, де моделі необхідно підтримувати довгий логічний ланцюг міркувань.

Позитивні результати GPT-5.6 продемонструвала і на ExploitGym – тестовому наборі, створеному дослідниками Каліфорнійського університету в Берклі спільно з OpenAI та іншими лабораторіями, що працюють над передовими системами штучного інтелекту. Усі три моделі нового сімейства показали помітне покращення продуктивності зі збільшенням глибини міркувань.

Новий режим Ultra і рекордні результати

Ще одним нововведенням став режим Ultra. На відміну від традиційної роботи однієї моделі, він використовує допоміжних субагентів, які можуть паралельно виконувати окремі етапи складних багатокрокових завдань.

Це дозволило досягти рекордних результатів у тесті TerminalBench 2.1, який оцінює здатність моделі працювати з командним рядком, планувати послідовність дій, координувати інструменти та виконувати ітеративні завдання.

GPT-5.6 Sol набрала 88,8%, а версія Sol Ultra покращила результат до 91,9%. Крім кібербезпеки, модель також отримала помітні покращення в біологічних дослідженнях. На тесті GeneBench v1 GPT-5.6 Sol перевершила GPT-5.5, водночас використовуючи менше вихідних токенів

Попри суттєве зростання можливостей, OpenAI заявляє, що GPT-5.6 Sol не перевищує рівень "Cyber Critical" у власній системі оцінки ризиків Preparedness Framework. Під час внутрішніх випробувань із браузерами Chromium та Firefox модель змогла знаходити програмні помилки та окремі компоненти майбутніх експлойтів, однак у контрольованих умовах вона не змогла самостійно створити повністю працездатний ланцюг атаки.

Компанія також представила багаторівневу систему захисту від зловживань.

На першому рівні сама модель навчена відмовляти у виконанні запитів, пов'язаних із забороненою кіберактивністю, навіть якщо користувач намагається приховати свої наміри або застосовує методи обходу обмежень.

Другий рівень забезпечують класифікатори, які аналізують відповіді в режимі реального часу. Якщо система виявляє потенційно небезпечний запит, генерація тимчасово призупиняється, а повний контекст діалогу передається більшій моделі для додаткової перевірки. Лише після цього ухвалюється рішення, чи можна показувати відповідь користувачу.

Третій рівень пов'язаний з аналізом поведінки акаунтів. За словами OpenAI, система здатна відрізняти легітимні дослідження кібербезпеки від систематичних спроб використати модель для шкідливої діяльності, хоча зовні такі сценарії можуть виглядати схожими. Окремо компанія запровадила диференційований контроль доступу. Найчутливіші функції не відкриваються всім користувачам за замовчуванням, але залишаються доступними для перевірки коду, пошуку вразливостей, створення виправлень та оборонних тестів.

Понад 700 тисяч годин тестування та співпраця з урядом США

Для перевірки ефективності нової системи безпеки OpenAI витратила понад 700 тисяч еквівалентних GPU-годин на відеоприскорювачах NVIDIA A100. Ці ресурси були використані для автоматизованого "червоного тестування" (red teaming), яке було зосереджене на універсальних методах обходу захисту, здатних працювати в різних сценаріях, а не лише в окремих випадках.

Паралельно компанія продовжує залучати незалежних експертів, які перевіряють модель за допомогою нестандартних сценаріїв атак, які можуть залишитися непоміченими автоматизованими системами. Незвичним кроком стало й те, що OpenAI ще до запуску GPT-5.6 координувала свої дії з урядом США. Компанія заздалегідь поділилася інформацією про можливості моделі та планами її запуску.

На прохання американської влади першими доступ до GPT-5.6 отримали лише обмежене коло перевірених партнерів, інформацію про яких передали федеральним органам. Це пов'язано з роботою над майбутньою нормативною базою щодо використання передових моделей штучного інтелекту у сфері кібербезпеки.

Водночас OpenAI підкреслює, що не планує робити такий порядок запуску постійною практикою, оскільки він обмежує доступ до нових інструментів для дослідників, розробників і партнерів, які використовують їх із захисною метою. Наразі GPT-5.6 доступна лише обмеженому колу перевірених партнерів через API та Codex. Повноцінний запуск у ChatGPT і широке відкриття API компанія очікує здійснити протягом найближчих тижнів.

Також OpenAI повідомила про партнерство з Cerebras. Починаючи з липня 2026 року компанії планують забезпечити швидкість роботи GPT-5.6 Sol до 750 токенів за секунду.