ChatGPT нарешті може відповісти на питання, яке було йому не під силу всі 4 роки
- OpenAI оголосила, що ChatGPT навчився правильно рахувати букви у словах, але користувачі вказують на нові помилки.
- GPT-5.5 представлено як нову модель з покращеними можливостями для виконання складних задач і роботою з різними типами даних.
OpenAI з гордістю оголосила, що ChatGPT нарешті навчився правильно рахувати букви у словах. Однак радість, здається, виявилася дещо передчасною.
Чи справді ШІ навчився рахувати?
Одним із найвідоміших прикладів того, як ChatGPT впевнено помиляється, було просте запитання: скільки разів літера "R" зустрічається у слові "strawberry"? Правильна відповідь – тричі, але довгий час чат-бот наполегливо стверджував інше й навіть відмовлявся визнавати помилку, коли користувачі його виправляли. Схожа проблема траплялася й в інших великих мовних моделях, пише 9to5Google.
Дивіться також Докодувались: ШІ-агент Claude видалив усю базу даних компанії за 9 секунд
29 квітня компанія OpenAI похвалилася у своєму акаунті в Twitter/X, що "нарешті" впоралася з цим завданням. Разом із цим компанія навела ще один приклад вирішеної проблеми: раніше на запитання "Я хочу помити машину, але автомийка знаходиться лише за 50 метрів – чи варто мені йти пішки чи їхати туди?" ChatGPT нерідко радив іти пішки, попри очевидну абсурдність такої поради, тому що машину потрібно взяти з собою. Зараз обидва ці завдання чат-бот виконує правильно.
Не все так просто
Та ентузіазм компанії охолов майже миттєво. У відповідях під дописом OpenAI користувачі почали наводити приклади нових збоїв тієї ж природи. Наприклад, на запитання користувача Натана Еспінози про кількість літер "R" у слові "cranberry" ChatGPT знову видає неправильну відповідь, стверджуючи, що їх лише одна, хоча насправді їх також три.
Усе це наводить на думку, що компанія не вирішила проблему системно, а просто вручну "вшила" правильні відповіді для кількох конкретних прикладів.
Практика так званих "hardcoded" рішень – коли модель фактично завчає відповідь на певне конкретне запитання, а не вчиться розуміти логіку – не є чимось новим у світі штучного інтелекту. Однак виглядає щонайменше іронічно, коли компанія публічно святкує "перемогу", яка насправді маскує незмінну системну ваду.
Усі чат-боти помиляються
Проблема помилок великих мовних моделей залишається однією з найсерйозніших у галузі. Чат-бот не лише помиляється – він робить це з упевненістю, а в разі заперечень може ще й наполягати на хибній версії, переконуючи користувача у своїй правоті.
На тлі колосальних ресурсів – фінансових, енергетичних, обчислювальних – які поглинає розвиток ШІ, така поведінка виглядає як серйозна невідповідність між витратами та результатом.
OpenAI випустила GPT-5.5
Хоча компанія в своїй публікації не каже, про яку модель іде мова, варто нагадати, що OpenAI щойно випустила GPT-5.5. Це флагманська модель, представлена 23 квітня 2026 року як наступник GPT-5.4. Вона позиціонується не просто як черговий апдейт, а як перехід до більш "агентного" типу ШІ, який не лише відповідає на питання, а й здатен виконувати складні багатокрокові задачі з плануванням і контролем помилок.
У лінійці GPT-5.5 є кілька варіантів%
- Базова модель "GPT-5.5" – це універсальний варіант для складної роботи з великим контекстом до приблизно 1 мільйона токенів і підтримкою інструментів типу веб-пошуку, роботи з файлами та навіть керування комп’ютером, зазначено на сайті OpenAI.
- Є також "GPT-5.5 Pro" – більш "важка" версія, яка використовує більше обчислень для глибшого мислення, але працює повільніше і дорожче.
- У ChatGPT також окремо виділяють режим "Thinking", який оптимізований під складні задачі з довгим ланцюгом міркувань.
Ключова зміна – це рівень reasoning і здатність працювати як агент. GPT-5.5 краще планує дії, розбиває задачі на етапи і може самостійно виконувати робочі процеси, наприклад: дослідження, написання коду, аналіз даних або взаємодію з софтом. У тестах на "робочі сценарії" (а не просто питання-відповіді) модель показує дуже високі результати. Наприклад, близько 84,9% у бенчмарках, що імітують реальні професії, пише OpenAI в своєму оголошенні.
Окремо варто звернути увагу на мультимодальність нового рівня. Якщо попередні покоління комбінували різні моделі (текст + зображення тощо), то GPT-5.5 працює з текстом, зображеннями, аудіо і відео в єдиній архітектурі. Це означає, що вона краще розуміє контекст між різними типами даних, а не просто "перекладає" їх один в один, відзначає Vellum.
У практичному використанні найбільший стрибок видно у програмуванні та так званій knowledge work. Модель значно краще справляється з дебагом, рефакторингом, написанням тестів і підтримкою великих кодових баз. Видання TechRadar помітило, що нове покоління також ефективніше з точки зору витрат токенів і часу – в корпоративних сценаріях заявляють до десятків разів кращу ефективність порівняно з попередніми поколіннями.
Ще один напрям – наукові дослідження. GPT-5.5 вже не просто відповідає на питання, а здатна проходити повний цикл: формулювати гіпотези, аналізувати дані, перевіряти припущення і коригувати підхід. Уже є приклади, де модель допомагала знаходити нові математичні доведення або працювати з біоінформатикою на рівні, близькому до дослідника.
Де вже можна випробувати GPT-5.5
З точки зору продукту, GPT-5.5 інтегрована в ChatGPT, API і корпоративні рішення. Вона підтримує "tool use" – тобто може викликати зовнішні інструменти, працювати з файлами, браузером або навіть інтерфейсом комп’ютера. Це критично для переходу від чатботів до "цифрових агентів", які реально виконують роботу, а не просто генерують текст.
Важлива деталь – ефективність і економіка. GPT-5.5 оптимізована так, щоб виконувати складні задачі дешевше у масштабі, що робить її придатною для масового корпоративного використання. Це один із ключових факторів, чому компанії починають впроваджувати такі моделі у внутрішні процеси.