OpenAI официально анонсировала ограниченный предварительный запуск нового семейства моделей GPT-5.6, в которое входят три версии — Sol, Terra и Luna. Флагманской моделью стала GPT-5.6 Sol, которую компания называет своим самым мощным решением для работы с задачами в сфере кибербезопасности. Об этом пишет Cyberpress.

Смотрите также Всего за 9 месяцев OpenAI создала процессор, который может изменить будущее ChatGPT

Чем GPT-5.6 отличается от предыдущих моделей?

О презентации было объявлено 26 июня 2026 года. По словам OpenAI, модель Terra обеспечивает производительность, близкую к GPT-5.5, но стоит примерно вдвое дешевле. Luna стала самой доступной моделью в линейке, тогда как Sol ориентирована на самые сложные профессиональные сценарии использования.

Одной из главных особенностей GPT-5.6 Sol стала значительно более эффективная работа с длинными задачами. Во время тестирования на бенчмарке ExploitBench модель показала результаты, сопоставимые с Mythos Preview от Anthropic, но для этого ей потребовалось примерно в три раза меньше выходных токенов. Это особенно важно для исследования уязвимостей, анализа эксплойтов и других сложных процессов, где модели необходимо поддерживать длинную логическую цепочку рассуждений.

Положительные результаты GPT-5.6 продемонстрировала и на ExploitGym — тестовом наборе, созданном исследователями Калифорнийского университета в Беркли совместно с OpenAI и другими лабораториями, работающими над передовыми системами искусственного интеллекта. Все три модели нового семейства показали заметное улучшение производительности с увеличением глубины рассуждений.

Новый режим Ultra и рекордные результаты

Ещё одним нововведением стал режим Ultra. В отличие от традиционной работы одной модели, он использует вспомогательных субагентов, которые могут параллельно выполнять отдельные этапы сложных многошаговых задач.

Это позволило достичь рекордных результатов в тесте TerminalBench 2.1, который оценивает способность модели работать с командной строкой, планировать последовательность действий, координировать инструменты и выполнять итеративные задачи.

GPT-5.6 Sol набрала 88,8%, а версия Sol Ultra улучшила результат до 91,9%. Помимо кибербезопасности, модель также получила заметные улучшения в биологических исследованиях. В тесте GeneBench v1 GPT-5.6 Sol превзошла GPT-5.5, одновременно используя меньше выходных токенов.

Несмотря на существенный рост возможностей, OpenAI заявляет, что GPT-5.6 Sol не превышает уровень "Cyber Critical" в собственной системе оценки рисков Preparedness Framework. Во время внутренних испытаний с браузерами Chromium и Firefox модель смогла находить программные ошибки и отдельные компоненты будущих эксплойтов, однако в контролируемых условиях она не смогла самостоятельно создать полностью работоспособную цепочку атаки.

Компания также представила многоуровневую систему защиты от злоупотреблений.

На первом уровне сама модель обучена отказывать в выполнении запросов, связанных с запрещённой киберактивностью, даже если пользователь пытается скрыть свои намерения или использует методы обхода ограничений.

Второй уровень обеспечивают классификаторы, которые анализируют ответы в режиме реального времени. Если система обнаруживает потенциально опасный запрос, генерация временно приостанавливается, а полный контекст диалога передаётся более крупной модели для дополнительной проверки. Только после этого принимается решение, можно ли показывать ответ пользователю.

Третий уровень связан с анализом поведения аккаунтов. По словам OpenAI, система способна отличать легитимные исследования кибербезопасности от систематических попыток использовать модель для вредоносной деятельности, хотя внешне такие сценарии могут выглядеть похожими. Отдельно компания внедрила дифференцированный контроль доступа. Наиболее чувствительные функции не открываются всем пользователям по умолчанию, но остаются доступными для проверки кода, поиска уязвимостей, создания исправлений и оборонительных тестов.

Более 700 тысяч часов тестирования и сотрудничество с правительством США

Для проверки эффективности новой системы безопасности OpenAI потратила более 700 тысяч эквивалентных GPU-часов на видеоускорителях NVIDIA A100. Эти ресурсы использовались для автоматизированного "красного тестирования" (red teaming), сосредоточенного на универсальных методах обхода защиты, которые могут работать в разных сценариях, а не только в отдельных случаях.

Параллельно компания продолжает привлекать независимых экспертов, которые проверяют модель с помощью нестандартных сценариев атак, способных оставаться незамеченными автоматизированными системами. Необычным шагом стало и то, что OpenAI ещё до запуска GPT-5.6 координировала свои действия с правительством США. Компания заранее поделилась информацией о возможностях модели и планах её запуска.

По запросу американских властей первыми доступ к GPT-5.6 получили лишь ограниченный круг проверенных партнёров, информация о которых была передана федеральным органам. Это связано с разработкой будущей нормативной базы по использованию передовых моделей искусственного интеллекта в сфере кибербезопасности.

В то же время OpenAI подчёркивает, что не планирует делать такой порядок запуска постоянной практикой, поскольку он ограничивает доступ к новым инструментам для исследователей, разработчиков и партнёров, использующих их в защитных целях. Сейчас GPT-5.6 доступна лишь ограниченному кругу проверенных партнёров через API и Codex. Полноценный запуск в ChatGPT и широкое открытие API компания ожидает в течение ближайших недель.

Также OpenAI сообщила о партнёрстве с Cerebras. Начиная с июля 2026 года компании планируют обеспечить скорость работы GPT-5.6 Sol до 750 токенов в секунду.