Почему бесплатного искусственного интеллекта становится все меньше?

Сегодня индустрия искусственного интеллекта сталкивается с жесткой реальностью: запуск и поддержка мощных моделей требуют колоссальных финансовых вложений. В последние годы компании сознательно шли на убытки, пытаясь завоевать рынок, однако в 2026 году этот подход стал нежизнеспособным. По данным источников, партнеры OpenAI, среди которых SoftBank и Oracle, накопили почти 100 миллиардов долларов долга только для развития дата-центров. 24 Канал проанализировал рынок и готов рассказать о том, что ждет всех нас уже в ближайшем будущем.

Смотрите также Долгожданная модель Claude Mythos все-таки выйдет: где ею можно будет воспользоваться

Физические ограничения инфраструктуры играют ключевую роль в изменении стратегии. Ожидается, что в этом году мировые центры обработки данных будут потреблять от 650 до 1050 тераватт-часов электроэнергии, что превышает показатели таких стран, как Япония.

"Этот шаг направлен на снижение барьеров для разработчиков и ускорение расширения экосистемы ИИ", – заявил ранее генеральный директор Google Сундар Пичаи, комментируя новую ценовую политику компании, направленную на оптимизацию расходов, цитирует TradingKey.

Google Если для вас важны оперативные новости Добавьте 24 Канал в избранное в Google Добавить

Что изменилось в OpenAI

OpenAI существенно пересмотрела условия для пользователей ChatGPT. Новая базовая модель GPT-5.5 теперь доступна бесплатным пользователям с жестким лимитом – только 10 запросов на 5 часов. После достижения этого предела система автоматически переключает диалог на упрощенную версию "mini", пишет ITC.UA.

Наиболее продвинутая функция "Thinking" (рассуждения) в бесплатном тарифе ограничена лишь одним сообщением в сутки. Для тех, кто нуждается в большем, OpenAI предлагает план Plus за 20 долларов в месяц с лимитом 80 запросов на 3 часа, или новый план Pro 5X за 100 долларов, предоставляющий пятикратный объем ресурсов.

Важно понимать, что современная система ограничений, в частности Codex от OpenAI, начала базироваться не просто на количестве сообщений, а на времени рассуждения модели. Например, в плане Plus одна минута рассуждения модели GPT-5.4 стоит примерно 2,5% от общего пятичасового лимита.

Как Google порезала свои лимиты

Google также отказался от фиксированных ежедневных лимитов в пользу гибкой кредитной системы. Теперь потребление ресурсов Gemini зависит от сложности задачи: простые тексты стоят дешево, тогда как генерация видео или анализ больших кодовых баз мгновенно списывают значительную долю кредитов.

Корпорация также снизила цену на премиальный план AI Ultra с 250 до 200 долларов в месяц и ввела промежуточный тариф за 100 долларов. Это происходит на фоне стремительного роста доли Google на рынке: по данным Similarweb, Gemini утроила свою долю, достигнув 25,46%, тогда как ChatGPT упал с 77,43% до 56,72%.

Anthropic разочаровала всех больше всего

Anthropic в последние месяцы также столкнулась с волной критики из-за изменения политики лимитов в Claude. Но, анализируя соцсети, мы заметили значительно большую волну недовольства в адрес Claude, чем в отношении других ИИ.

Пользователи, в частности платных тарифов Pro и Max, начали массово жаловаться, что доступный объем использования модели начал исчерпываться значительно быстрее, чем раньше. Особенно много претензий возникло после запуска новых моделей Claude 4.6 и инструментов Claude Code, пишет MacRumors.

Anthropic официально подтвердила, что компания "корректирует" лимиты во время пиковых часов из-за резкого роста нагрузки на инфраструктуру. Речь идет о временных промежутках с 5:00 до 11:00 по тихоокеанскому времени США, когда пользователи начали быстрее расходовать свои "пятичасовые" сессии.

Компания утверждает, что общие недельные лимиты якобы не изменились, однако сам механизм распределения ресурсов стал жестче. Anthropic даже признала, что примерно 7% пользователей начали упираться в ограничения раньше, чем до изменений.

Наибольшее недовольство вызвало то, что эти изменения происходили почти без публичных анонсов. Часть информации появлялась только в соцсетях или в комментариях сотрудников компании. На Reddit и GitHub пользователи начали писать, что Claude Max за 100 – 200 долларов теперь иногда "сгорает" буквально за 30 – 90 минут активной работы. Некоторые сообщали, что один сложный запрос мог потратить более 20% доступного лимита.

Отдельной проблемой стали так называемые "скрытые" расходы токенов. Пользователи Claude Code подозревали, что система начала агрессивнее учитывать контекст, кэширования и внутренние процессы моделей. Из-за этого даже простые сценарии программирования или редактирования текстов начали потреблять значительно больше вычислительных ресурсов, потому что система каждый раз перечитывает заново предыдущий контекст. Anthropic частично подтвердила существование ошибок кэширования, которые могли ускорять расход лимитов.

Параллельно компания начала продвигать новую систему "extra usage" или "usage credits". Ее суть заключается в том, что после исчерпания стандартных лимитов пользователь может продолжить работать с Claude в кредит.

Таким образом, даже платная подписка больше не гарантирует непрерывного доступа к сервису. Anthropic объясняет ситуацию очень просто: современные ИИ-модели стали слишком дорогими в обслуживании. Новые функции вроде "thinking mode", агентных сценариев, поиска в интернете и миллионного контекстного окна резко увеличивают затраты GPU-ресурсов. Фактически компании продают пользователям доступ к чрезвычайно дорогим дата-центрам, а фиксированная цена подписки все хуже покрывает реальные расходы.

Смотрите также Разработчик потерял тысячи долларов, оставив ИИ-помощника работать на всю ночь

Привет, реклама

Еще одним важным изменением стало появление рекламы. OpenAI официально запустила ChatGPT Ads в феврале 2026 года для пользователей бесплатных и базовых тарифов в США. Рекламные объявления интегрируются непосредственно в диалоги как спонсируемые рекомендации. При этом стоимость размещения достигает 60 долларов за 1000 показов.

В противовес лидерам рынка, поисковая система Perplexity приняла решение полностью отказаться от рекламы, считая, что она подрывает доверие пользователей.

Как только реклама появляется в результатах, пользователи неизбежно начинают сомневаться, сохраняют ли ответы свою целостность, или содержат скрытое коммерческое влияние,
– сообщило ранее руководство Perplexity.

Рынок уже реагирует

Для разработчиков и малого бизнеса изменения в подсчете и лимитах стали серьезным вызовом. Стоимость разработки программ на базе ИИ выросла из-за необходимости оплачивать каждый токен и вычислительную мощность. Идея о том, что искусственный интеллект быстро заменит людей и радикально сократит расходы компаний, начинает сталкиваться с реальностью вычислительных затрат. В 2026 году ряд крупных технологических компаний прямо заявили, что современный генеративный ИИ в отдельных случаях обходится дороже обычных работников. Особенно остро проблема проявилась после массового внедрения агентных систем вроде Claude Code от Anthropic, пишет Axios.

Uber паникует

Одним из самых громких примеров стала ситуация в Uber. Компания активно интегрировала Claude Code и Cursor в работу своих инженеров в конце 2025 года. Уже к апрелю 2026 года Uber полностью исчерпала годовой бюджет, выделенный на ИИ-инструменты. Об этом сообщали как отраслевые медиа, так и сами руководители компании.

По словам CTO Uber Правина Нага, компания буквально "вернулась к чертежной доске" после того, как расходы вышли из-под контроля. Основной причиной стали не лицензии как таковые, а модель оплаты за токены и вычисления. Инженеры Uber начали настолько активно использовать Claude Code, что расходы на одного работника достигли 500 – 2000 долларов в месяц. При масштабе в примерно 5000 инженеров это превратилось в десятки или даже сотни миллионов долларов потенциальных годовых расходов.

Uber также сообщила, что около 95% ее инженеров уже регулярно пользуются ИИ-инструментами, а примерно 70% коммитов кода теперь создаются с участием генеративного ИИ. То есть проблема возникла не из-за провала технологии, а наоборот – из-за ее слишком активного использования. Claude Code оказался настолько полезным, что компания просто не смогла финансово контролировать масштабы его потребления, отметило издание Briefs Finance.

Но результатов нет

На этом фоне особенно резонансным стало заявление президента и COO Uber Эндрю Макдональда. Он прямо сказал, что компании становится "все труднее оправдывать" расходы на ИИ. По его словам, между огромными затратами на токены и реальными улучшениями продуктов для пользователей пока нет очевидной связи. Другими словами, компания тратит все больше денег, но не может прямо доказать, что это приносит пропорциональный бизнес-результат, отмечает The Verge.

Nvidia тоже не промолчала

Параллельно подобные сигналы начали поступать и от Nvidia. Вице-президент компании по Applied Deep Learning Брайан Катандзаро заявил, что для его команды "стоимость вычислений значительно превышает затраты на работников". Это одно из первых настолько прямых заявлений от крупного игрока рынка о том, что современный ИИ уже не выглядит дешевой альтернативой людям, вспоминает Tom's Hardware.

Смотрите также ИИ не способен адекватно оценивать тексты, написанные человеком – исследования ученых Кембриджа

Так что же нас ждет дальше?

Исследователи и экономисты начинают говорить, что полная автоматизация может быть экономически невыгодной. Недавняя научная работа "Economics of Human and AI Collaboration" пришла к выводу, что частичная автоматизация часто дешевле и эффективнее, чем полная замена людей на ИИ. Чем более высокой точности и надежности требует бизнес, тем дороже становится использование ИИ-систем.

На Reddit и в профессиональных сообществах ситуацию уже называют "кризисом токенов". Пользователи отмечают, что крупные компании начали осознавать: генеративный ИИ – это не дешевое программное обеспечение вроде SaaS-сервиса с фиксированной ценой, а фактически постоянный поток расходов на вычисления. И если работник имеет стабильную зарплату, то расходы на ИИ могут неконтролируемо расти в зависимости от интенсивности использования.

Будущее индустрии теперь видится в гибридных моделях: использовании локальных вычислений на устройствах с чипами вроде Apple Silicon для простых задач и привлечении мощных облачных API только для сложных проблем.

Однако эпоха безграничного и бесплатного доступа к интеллекту машин осталась в прошлом, уступив место строгому экономическому расчету и борьбе за каждый ватт-час энергии.