На что способна модель GPT-5?

OpenAI позиционирует GPT-5 как свою самую совершенную модель на сегодня, которая превосходит предшественников в кодировании, написании текстов, точности и безопасности. Одним из ключевых изменений является то, что GPT-5 по умолчанию работает как модель для рассуждений. Это означает, что система запрограммирована разбивать сложные проблемы на более мелкие части для их решения, что упрощает опыт для пользователей, которым раньше нужно было активировать эту функцию Think Longer вручную. Модель также работает значительно быстрее и, по утверждению разработчиков, имеет меньше "галлюцинаций", то есть предоставляет более точные ответы, пишет 24 Канал со ссылкой на официальную презентацию OpenAI.

Смотрите также ChatGPT попросит вас сделать перерыв, если вы говорите с ним слишком много

Она позиционируется как самая умная, самая быстрая и самая полезная модель от OpenAI. Среди ключевых обновлений – улучшенная точность, скорость, возможности рассуждения, распознавание контекста, структурированное мышление и решение проблем.

Доступ к модели организован следующим образом:

  • GPT-5 – стандартная версия, доступна сразу для всех: как для бесплатных пользователей, так и для владельцев подписки Plus.
  • GPT-5 mini – облегченная версия, которая включается, когда пользователи достигают лимита запросов к основной модели.
  • GPT-5 Pro – самая мощная версия, доступна исключительно для подписчиков плана Pro за 200 долларов в месяц, которая предлагает неограниченное количество запросов. Пользователи Plus также имеют значительно более высокие лимиты, чем бесплатные аккаунты.

Безопасность

Особое внимание уделили безопасности. Новая функция Safe Completions позволяет модели предоставлять полезную, но общую информацию на деликатные запросы, вместо того чтобы просто отказывать в ответе. В сложных ситуациях, когда запрос может быть двусмысленным (например, научный вопрос, что потенциально может быть использовано для вреда), модель предоставит только общую информацию, которую нельзя использовать для нанесения вреда. Например, на вопрос о необходимой энергии для воспламенения материала, модель предоставит общенаучную информацию без опасных деталей.

Также GPT-5 лучше обрабатывает медицинские запросы, адаптируясь к уровню знаний пользователя и его географии, и может предлагать пользователям вопросы для обсуждения с врачом-человеком, а не с ИИ.

OpenAI также заявляет, что модель GPT-5 является безопаснее предыдущих моделей. Более того, она считает ее самым безопасным искусственным интеллектом вообще на рынке. Хотя модели искусственного интеллекта иногда проявляют склонность к интригам против людей или лжи для достижения собственных целей, OpenAI обнаружила, что GPT-5 реже прибегает к обману, чем другие модели.

Алекс Бойтель, руководитель отдела исследований безопасности OpenAI, отметил, что уменьшение количества случаев обмана улучшает не только безопасность GPT-5, но и пользовательский опыт, создавая модель, которая является более "прозрачной и честной, что вызывает доверие у пользователей".

Бойтель также отмечает, что GPT-5 лучше различает злоумышленников, которые пытаются злоупотреблять ChatGPT, и пользователей, которые делают безвредные запросы. Это позволяет GPT-5 отклонять больше опасных вопросов, одновременно реже отказывая пользователям, которые ищут безвредную информацию.

Кодирование

Компания утверждает, что GPT-5 предлагает производительность передового уровня в кодировании и является их лучшей моделью для написания кода на рынке. Альтман заявляет, что модель особенно хорошо справляется с развертыванием целых программных приложений.

Прямо во время презентации докладчики показали примеры создания игр, приложения для изучения французского языка и тому подобное. Пока все выглядит так, как будто программирование теперь будет занимать считанные минуты. Однако, безусловно, новинку еще нужно тестировать, чтобы взглянуть на нее независимым взглядом.

Что еще?

Вместе с GPT-5 в ChatGPT появились и другие обновления:

  • Возможность настраивать цвет чатов. Некоторые эксклюзивные опции доступны для платных клиентов.
  • Упрощенная интеграция с сервисами Google: Gmail, Calendar и Contacts.
  • Четыре предустановленные "личности" для чат-бота: циник, робот, слушатель и ботаник.
  • Обновленная функция Advanced Voice, которая лучше понимает речь и адаптирует свой стиль. Она полностью заменила предыдущий Standard Voice Mode.

В GPT-5 также значительно улучшили навыки письма – модель способна превращать черновики в "убедительный, резонансный" текст.

OpenAI утверждает, что GPT-5 значительно быстрее предыдущей флагманской модели o3. Генеральный директор OpenAI Сэм Альтман отметил, что скорость работы настолько высока, что вы можете спросить себя: "А действительно ли она достаточно думает?".

Важно, что модель имеет значительно меньше галлюцинаций – по данным OpenAI, она на 45% реже содержит фактические ошибки, чем GPT-4o, и на 80% реже, чем OpenAI o3, при использовании функции "мышления". Галлюцинации были одной из основных слабостей предыдущих моделей рассуждения.

С помощью GPT-5 компания OpenAI также стремилась упростить использование ChatGPT. Вместо того чтобы просить пользователей выбирать правильные настройки, GPT-5 оснащен маршрутизатором, работающим в режиме реального времени и решающим, как предоставить наилучший ответ: быстро ответить на вопрос пользователя или потратить дополнительное время на "обдумывание" ответа.

Доступность GPT-5: впервые для всех сразу

Модель GPT-5 теперь является стандартной в ChatGPT для всех зарегистрированных пользователей, заменяя предыдущие версии, такие как GPT-4o, OpenAI o3, OpenAI o4-mini, GPT-4.1 и GPT-4.5. Доступ к ней есть для всех пользователей, включая бесплатных.

Вице-президент OpenAI по вопросам ChatGPT Ник Терли заявил, что это часть усилий компании, направленных на то, чтобы впервые предоставить бесплатным пользователям доступ к модели рассуждений искусственного интеллекта сразу после презентации. Ранее компания ограничивала эти более продвинутые модели платным доступом.

Что показывают тесты?

  • В SWE-bench Verified – тесте реальных задач по кодированию, взятых с GitHub – GPT-5 набрал 74,9% с первой попытки. Это означает, что GPT-5 превзошел последнюю модель Claude Opus 4.1 от Anthropic, которая набрала 74,5%, и Gemini 2.5 Pro от Google DeepMind, которая набрала 59,6%.
  • На последнем экзамене человечества – сложном тесте, измеряющем эффективность моделей искусственного интеллекта в математике, гуманитарных науках и естественных науках – версия GPT-5 с расширенным рассуждением (GPT-5 Pro) набрала 42% при использовании инструментов. Это немного меньше, чем xAI смогла достичь с Grok 4 Heavy, которая набрала 44,4% в том же тесте.

Результаты тестирования GPT-5
Результаты тестирования GPT-5 / Фото OpenAI

  • В GPQA Diamond – тесте по научным вопросам уровня доктора философии – GPT-5 pro набрал 89,4% с первой попытки, опередив Claude Opus 4.1, который набрал 80,9%, и Grok 4 Heavy, который набрал 88,9%.
  • OpenAI также утверждает, что GPT-5 лучше отвечает на вопросы, связанные со здоровьем. В тесте, измеряющем точность ответов AI-моделей в темах, связанных со здравоохранением, HealthBench Hard Hallucinations, GPT-5 с мышлением галлюцинирует только 1,6% времени. Это значительно ниже, чем у предыдущих моделей компании GPT-4o и o3, которые набрали соответственно 12,9% и 15,8%.
  • В тесте Tau-bench, измеряющий способность модели искусственного интеллекта выполнять имитированные онлайн-задачи, GPT-5 демонстрирует неоднозначные результаты. В части теста, измеряющей способность искусственного интеллекта ориентироваться на веб-сайте авиакомпании, GPT-5 набрал 63,5%, что немного уступает результату o3, который набрал 64,8%. В другой части теста, измеряющего способность ИИ навигации по веб-сайтам розничной торговли, GPT-5 набрал 81,1%, уступая Claude Opus 4.1, который набрал 82,4%.

В целом Альтман говорит, что хотя GPT-5 является значительным шагом вперед, это еще не полноценный искусственный общий интеллект (AGI), поскольку модель пока не способна к самостоятельному непрерывному обучению.