Епоха безплатного ШІ добігає кінця: як ми поступово втрачаємо ліміти та що буде далі

Ще недавно технологічні гіганти змагалися у щедрості, пропонуючи необмежений доступ до своїх найпотужніших розробок. Проте у 2026 році правила гри кардинально змінилися. Ринок досяг переломної точки, де обчислювальні ресурси та енергія стають занадто дорогими для безконтрольного використання.

Чому безплатного штучного інтелекту стає все менше?

Сьогодні індустрія штучного інтелекту стикається з жорсткою реальністю: запуск та підтримка потужних моделей потребують колосальних фінансових вкладень. Протягом останніх років компанії свідомо йшли на збитки, намагаючись завоювати ринок, проте у 2026 році цей підхід став нежиттєздатним. За даними джерел, партнери OpenAI, серед яких SoftBank та Oracle, накопичили майже 100 мільярдів доларів боргу лише для розбудови дата-центрів. 24 Канал проаналізував ринок і готовий розповісти про те, що чекає на всіх нас уже в найближчому майбутньому.

Дивіться також Довгоочікувана модель Claude Mythos усе-таки вийде: де нею можна буде скористатися

Фізичні обмеження інфраструктури відіграють ключову роль у зміні стратегії. Очікується, що цього року світові центри обробки даних споживатимуть від 650 до 1050 терават-годин електроенергії, що перевищує показники таких країн, як Японія.

"Цей крок спрямований на зниження бар'єрів для розробників та прискорення розширення екосистеми ШІ", – заявив раніше генеральний директор Google Сундар Пічаї, коментуючи нову цінову політику компанії, спрямовану на оптимізацію витрат, цитує TradingKey.

Що змінилося в OpenAI

OpenAI суттєво переглянула умови для користувачів ChatGPT. Нова базова модель GPT-5.5 тепер доступна безплатним користувачам з жорстким лімітом – лише 10 запитів на 5 годин. Після досягнення цієї межі система автоматично перемикає діалог на спрощену версію "mini", пише ITC.UA.

Найбільш просунута функція "Thinking" (міркування) у безплатному тарифі обмежена лише одним повідомленням на добу. Для тих, хто потребує більшого, OpenAI пропонує план Plus за 20 доларів на місяць з лімітом 80 запитів на 3 години, або новий план Pro 5X за 100 доларів, що надає п'ятикратний обсяг ресурсів.

Важливо розуміти, що сучасна система обмежень, зокрема Codex від OpenAI, почала базуватися не просто на кількості повідомлень, а на часі міркування моделі. Наприклад, у плані Plus одна хвилина міркування моделі GPT-5.4 коштує приблизно 2,5% від загального п'ятигодинного ліміту.

У NORDIS переконані: комфорт не має шкодити довкіллю. Тому кондиціонери бренду створені за простим принципом – поєднання простоти, екологічності та інженерної точності. Сталий розвиток – не тренд, а основа діяльності компанії зі Скандинавії.

Як Google порізала свої ліміти

Google також відмовився від фіксованих щоденних лімітів на користь гнучкої кредитної системи. Тепер споживання ресурсів Gemini залежить від складності завдання: прості тексти коштують дешево, тоді як генерація відео чи аналіз великих кодових баз миттєво списують значну частку кредитів.

Корпорація також знизила ціну на преміальний план AI Ultra з 250 до 200 доларів на місяць та ввела проміжний тариф за 100 доларів. Це відбувається на тлі стрімкого зростання частки Google на ринку: за даними Similarweb, Gemini потроїла свою частку, досягнувши 25,46%, тоді як ChatGPT впав з 77,43% до 56,72%.

Anthropic розчарувала всіх найбільше

Anthropic останніми місяцями також зіткнулася з хвилею критики через зміну політики лімітів у Claude. Але, аналізуючи соцмережі, ми помітили значно більшу хвилю невдоволення на адресу Claude, ніж щодо інших ШІ.

Користувачі, зокрема платних тарифів Pro та Max, почали масово скаржитися, що доступний обсяг використання моделі почав вичерпуватися значно швидше, ніж раніше. Особливо багато претензій виникло після запуску нових моделей Claude 4.6 та інструментів Claude Code, пише MacRumors.

Anthropic офіційно підтвердила, що компанія "коригує" ліміти під час пікових годин через різке зростання навантаження на інфраструктуру. Йдеться про часові проміжки з 5:00 до 11:00 за тихоокеанським часом США, коли користувачі почали швидше витрачати свої "п'ятигодинні" сесії.

Компанія стверджує, що загальні тижневі ліміти нібито не змінилися, однак сам механізм розподілу ресурсів став жорсткішим. Anthropic навіть визнала, що приблизно 7% користувачів почали впиратися в обмеження раніше, ніж до змін.

Найбільше невдоволення викликало те, що ці зміни відбувалися майже без публічних анонсів. Частина інформації з'являлася лише у соцмережах або в коментарях співробітників компанії. На Reddit та GitHub користувачі почали писати, що Claude Max за 100 – 200 доларів тепер іноді "згорає" буквально за 30 – 90 хвилин активної роботи. Деякі повідомляли, що один складний запит міг витратити понад 20% доступного ліміту.

Окремою проблемою стали так звані "приховані" витрати токенів. Користувачі Claude Code підозрювали, що система почала агресивніше враховувати контекст, кешування та внутрішні процеси моделей. Через це навіть прості сценарії програмування або редагування текстів почали споживати значно більше обчислювальних ресурсів, бо система щоразу перечитує заново попередній контекст. Anthropic частково підтвердила існування помилок кешування, які могли пришвидшувати витрату лімітів.

Паралельно компанія почала просувати нову систему "extra usage" або "usage credits". Її суть полягає в тому, що після вичерпання стандартних лімітів користувач може продовжити працювати з Claude у кредит.

Таким чином, навіть платна підписка більше не гарантує безперервного доступу до сервісу. Anthropic пояснює ситуацію дуже просто: сучасні ШІ-моделі стали надто дорогими в обслуговуванні. Нові функції на кшталт "thinking mode", агентних сценаріїв, пошуку в інтернеті та мільйонного контекстного вікна різко збільшують витрати GPU-ресурсів. Фактично компанії продають користувачам доступ до надзвичайно дорогих дата-центрів, а фіксована ціна підписки дедалі гірше покриває реальні витрати.

Дивіться також Розробник втратив тисячі доларів, залишивши ШІ-помічника працювати на всю ніч

Привіт, реклама

Ще однією важливою зміною стала поява реклами. OpenAI офіційно запустила ChatGPT Ads у лютому 2026 року для користувачів безплатних та базових тарифів у США. Рекламні оголошення інтегруються безпосередньо в діалоги як спонсоровані рекомендації. При цьому вартість розміщення сягає 60 доларів за 1000 показів.

На противагу лідерам ринку, пошукова система Perplexity прийняла рішення повністю відмовитися від реклами, вважаючи, що вона підриває довіру користувачів.

Як тільки реклама з'являється в результатах, користувачі неминуче починають сумніватися, чи зберігають відповіді свою цілісність, чи містять прихований комерційний вплив,
– повідомило раніше керівництво Perplexity.

Ринок уже реагує

Для розробників та малого бізнесу зміни в підрахунку та лімітах стали серйозним викликом. Вартість розробки програм на базі ШІ зросла через необхідність оплачувати кожен токен та обчислювальну потужність. Ідея про те, що штучний інтелект швидко замінить людей і радикально скоротить витрати компаній, починає стикатися з реальністю обчислювальних витрат. У 2026 році низка великих технологічних компаній прямо заявила, що сучасний генеративний ШІ в окремих випадках обходиться дорожче за звичайних працівників. Особливо гостро проблема проявилася після масового впровадження агентних систем на кшталт Claude Code від Anthropic, пише Axios.

Uber панікує

Одним із найгучніших прикладів стала ситуація в Uber. Компанія активно інтегрувала Claude Code та Cursor у роботу своїх інженерів наприкінці 2025 року. Вже до квітня 2026 року Uber повністю вичерпала річний бюджет, виділений на ШІ-інструменти. Про це повідомляли як галузеві медіа, так і самі керівники компанії.

За словами CTO Uber Правіна Нага, компанія буквально "повернулася до креслярської дошки" після того, як витрати вийшли з-під контролю. Основною причиною стали не ліцензії як такі, а модель оплати за токени та обчислення. Інженери Uber почали настільки активно використовувати Claude Code, що витрати на одного працівника сягнули 500 – 2000 доларів на місяць. При масштабі у приблизно 5000 інженерів це перетворилося на десятки або навіть сотні мільйонів доларів потенційних річних витрат.

Uber також повідомила, що близько 95% її інженерів уже регулярно користуються ШІ-інструментами, а приблизно 70% комітів коду тепер створюються за участю генеративного ШІ. Тобто проблема виникла не через провал технології, а навпаки – через її надто активне використання. Claude Code виявився настільки корисним, що компанія просто не змогла фінансово контролювати масштаби його споживання, зазначило видання Briefs Finance.

Але результатів немає

На цьому фоні особливо резонансною стала заява президента та COO Uber Ендрю Макдональда. Він прямо сказав, що компанії стає "все важче виправдовувати" витрати на ШІ. За його словами, між величезними витратами на токени й реальними покращеннями продуктів для користувачів поки немає очевидного зв'язку. Іншими словами, компанія витрачає дедалі більше грошей, але не може прямо довести, що це приносить пропорційний бізнес-результат, зазначає The Verge.

Nvidia теж не змовчала

Паралельно подібні сигнали почали надходити і від Nvidia. Віцепрезидент компанії з Applied Deep Learning Браян Катандзаро заявив, що для його команди "вартість обчислень значно перевищує витрати на працівників". Це одна з перших настільки прямих заяв від великого гравця ринку про те, що сучасний ШІ вже не виглядає дешевою альтернативою людям, пригадує Tom's Hardware.

Дивіться також ШІ не здатен адекватно оцінювати тексти, написані людиною – дослідження вчених Кембриджа

То що ж на нас чекає далі?

Дослідники та економісти починають говорити, що повна автоматизація може бути економічно невигідною. Нещодавня наукова робота "Economics of Human and AI Collaboration" дійшла висновку, що часткова автоматизація часто дешевша й ефективніша, ніж повна заміна людей на ШІ. Чим вищої точності та надійності вимагає бізнес, тим дорожче стає використання ШІ-систем.

На Reddit і в професійних спільнотах ситуацію вже називають "кризою токенів". Користувачі відзначають, що великі компанії почали усвідомлювати: генеративний ШІ – це не дешеве програмне забезпечення на кшталт SaaS-сервісу з фіксованою ціною, а фактично постійний потік витрат на обчислення. І якщо працівник має стабільну зарплату, то витрати на ШІ можуть неконтрольовано зростати залежно від інтенсивності використання.

Майбутнє індустрії тепер вбачається у гібридних моделях: використанні локальних обчислень на пристроях з чипами на кшталт Apple Silicon для простих завдань та залученні потужних хмарних API лише для найскладніших проблем.

Проте епоха безмежного та безкоштовного доступу до інтелекту машин залишилась у минулому, поступившись місцем суворому економічному розрахунку та боротьбі за кожну ват-годину енергії.

Пов'язані теми:

Техно

Штучний інтелект OpenAI

Google