29 квітня, 17:26
6

ChatGPT нарешті може відповісти на питання, яке було йому не під силу всі 4 роки

Основні тези
  • OpenAI оголосила, що ChatGPT навчився правильно рахувати букви у словах, але користувачі вказують на нові помилки.
  • GPT-5.5 представлено як нову модель з покращеними можливостями для виконання складних задач і роботою з різними типами даних.

OpenAI з гордістю оголосила, що ChatGPT нарешті навчився правильно рахувати букви у словах. Однак радість, здається, виявилася дещо передчасною.

Чи справді ШІ навчився рахувати?

Одним із найвідоміших прикладів того, як ChatGPT впевнено помиляється, було просте запитання: скільки разів літера "R" зустрічається у слові "strawberry"? Правильна відповідь – тричі, але довгий час чат-бот наполегливо стверджував інше й навіть відмовлявся визнавати помилку, коли користувачі його виправляли. Схожа проблема траплялася й в інших великих мовних моделях, пише 9to5Google.

Дивіться також Докодувались: ШІ-агент Claude видалив усю базу даних компанії за 9 секунд 

29 квітня компанія OpenAI похвалилася у своєму акаунті в Twitter/X, що "нарешті" впоралася з цим завданням. Разом із цим компанія навела ще один приклад вирішеної проблеми: раніше на запитання "Я хочу помити машину, але автомийка знаходиться лише за 50 метрів – чи варто мені йти пішки чи їхати туди?" ChatGPT нерідко радив іти пішки, попри очевидну абсурдність такої поради, тому що машину потрібно взяти з собою. Зараз обидва ці завдання чат-бот виконує правильно.

Не все так просто

Та ентузіазм компанії охолов майже миттєво. У відповідях під дописом OpenAI користувачі почали наводити приклади нових збоїв тієї ж природи. Наприклад, на запитання користувача Натана Еспінози про кількість літер "R" у слові "cranberry" ChatGPT знову видає неправильну відповідь, стверджуючи, що їх лише одна, хоча насправді їх також три.

Усе це наводить на думку, що компанія не вирішила проблему системно, а просто вручну "вшила" правильні відповіді для кількох конкретних прикладів.

Практика так званих "hardcoded" рішень – коли модель фактично завчає відповідь на певне конкретне запитання, а не вчиться розуміти логіку – не є чимось новим у світі штучного інтелекту. Однак виглядає щонайменше іронічно, коли компанія публічно святкує "перемогу", яка насправді маскує незмінну системну ваду.

Усі чат-боти помиляються

Проблема помилок великих мовних моделей залишається однією з найсерйозніших у галузі. Чат-бот не лише помиляється – він робить це з упевненістю, а в разі заперечень може ще й наполягати на хибній версії, переконуючи користувача у своїй правоті. 

На тлі колосальних ресурсів – фінансових, енергетичних, обчислювальних – які поглинає розвиток ШІ, така поведінка виглядає як серйозна невідповідність між витратами та результатом.

OpenAI випустила GPT-5.5

Хоча компанія в своїй публікації не каже, про яку модель іде мова, варто нагадати, що OpenAI щойно випустила GPT-5.5. Це флагманська модель, представлена 23 квітня 2026 року як наступник GPT-5.4. Вона позиціонується не просто як черговий апдейт, а як перехід до більш "агентного" типу ШІ, який не лише відповідає на питання, а й здатен виконувати складні багатокрокові задачі з плануванням і контролем помилок.

У лінійці GPT-5.5 є кілька варіантів%

  • Базова модель "GPT-5.5" – це універсальний варіант для складної роботи з великим контекстом до приблизно 1 мільйона токенів і підтримкою інструментів типу веб-пошуку, роботи з файлами та навіть керування комп’ютером, зазначено на сайті OpenAI.
  • Є також "GPT-5.5 Pro" – більш "важка" версія, яка використовує більше обчислень для глибшого мислення, але працює повільніше і дорожче.
  • У ChatGPT також окремо виділяють режим "Thinking", який оптимізований під складні задачі з довгим ланцюгом міркувань.

Ключова зміна – це рівень reasoning і здатність працювати як агент. GPT-5.5 краще планує дії, розбиває задачі на етапи і може самостійно виконувати робочі процеси, наприклад: дослідження, написання коду, аналіз даних або взаємодію з софтом. У тестах на "робочі сценарії" (а не просто питання-відповіді) модель показує дуже високі результати. Наприклад, близько 84,9% у бенчмарках, що імітують реальні професії, пише OpenAI в своєму оголошенні.

Окремо варто звернути увагу на мультимодальність нового рівня. Якщо попередні покоління комбінували різні моделі (текст + зображення тощо), то GPT-5.5 працює з текстом, зображеннями, аудіо і відео в єдиній архітектурі. Це означає, що вона краще розуміє контекст між різними типами даних, а не просто "перекладає" їх один в один, відзначає Vellum.

У практичному використанні найбільший стрибок видно у програмуванні та так званій knowledge work. Модель значно краще справляється з дебагом, рефакторингом, написанням тестів і підтримкою великих кодових баз. Видання TechRadar помітило, що нове покоління також ефективніше з точки зору витрат токенів і часу – в корпоративних сценаріях заявляють до десятків разів кращу ефективність порівняно з попередніми поколіннями.

Ще один напрям – наукові дослідження. GPT-5.5 вже не просто відповідає на питання, а здатна проходити повний цикл: формулювати гіпотези, аналізувати дані, перевіряти припущення і коригувати підхід. Уже є приклади, де модель допомагала знаходити нові математичні доведення або працювати з біоінформатикою на рівні, близькому до дослідника.

Де вже можна випробувати GPT-5.5

З точки зору продукту, GPT-5.5 інтегрована в ChatGPT, API і корпоративні рішення. Вона підтримує "tool use" – тобто може викликати зовнішні інструменти, працювати з файлами, браузером або навіть інтерфейсом комп’ютера. Це критично для переходу від чатботів до "цифрових агентів", які реально виконують роботу, а не просто генерують текст.

Важлива деталь – ефективність і економіка. GPT-5.5 оптимізована так, щоб виконувати складні задачі дешевше у масштабі, що робить її придатною для масового корпоративного використання. Це один із ключових факторів, чому компанії починають впроваджувати такі моделі у внутрішні процеси.

Пов'язані теми: