Звіт Стенфорда: АІ майже як людина, але не розуміє аналоговий час

Основні тези

Штучний інтелект досяг значного прогресу, але інструменти для його контролю та впровадження не встигають за розвитком технологій.
Звіт Стенфорда виділяє три ключові проблеми: дефіцит талантів, зниження прозорості та зміни на ринку праці.

Штучний інтелект швидко наближається до людського рівня у виконанні завдань, але системи контролю, оцінки та впровадження відстають. Новий звіт Стенфорда показує дисбаланс між можливостями технологій і готовністю бізнесу їх використовувати.

Системи штучного інтелекту за останні півтора року зробили різкий стрибок. Якщо ще 18 місяців тому AI-агенти провалювали 88% реальних комп'ютерних завдань, то станом на березень 2026 року найкращі моделі виконують їх у 66% випадків. Це лише на кілька відсотків нижче за людський рівень. Про це пише Forbes.

Дивіться також Google починає запуск свого додатка для комп'ютерів, і ви точно захочете його встановити

Чому розвиток ШІ випереджає готовність компаній?

Такі дані містить новий звіт Stanford Institute for Human-Centered AI – масштабне дослідження обсягом 423 сторінки, яке аналізує розвиток ШІ у різних сферах: від технологій і інвестицій до ринку праці та довіри суспільства. Документ підготували незалежні експерти з академічного середовища, бізнесу та державної політики, що додає йому ваги.

Попри очевидний прогрес, головний висновок звіту полягає не в тому, що ШІ стає кращим. Проблема в іншому – інструменти для контролю, оцінки та впровадження цих технологій не встигають за їх розвитком.

Інвестиції у ШІ демонструють стрімке зростання. У 2025 році глобальні вкладення бізнесу досягли 581,7 мільярда доларів – більш ніж удвічі більше, ніж роком раніше. Лише США забезпечили майже 286 мільярдів, що у 23 рази перевищує зафіксовані приватні інвестиції Китаю.

Паралельно зростає і ефективність моделей. У сфері програмування їхня продуктивність майже зрівнялася з людською, а в тестах для веб-агентів рівень успішності піднявся з 15% до понад 74% за два роки. Генеративний ШІ також встановив рекорд швидкості поширення – його почали використовувати понад половина населення лише за три роки, швидше, ніж інтернет чи персональні комп'ютери.

Втім, розвиток має нерівномірний характер. Дослідники називають це ефектом "нерівного фронту". Наприклад, сучасні моделі здатні показувати результати рівня золотої медалі на математичних олімпіадах або вирішувати задачі з кібербезпеки з точністю понад 90%. Водночас вони можуть помилятися у простих речах – наприклад, правильно зчитують аналоговий годинник лише у половині випадків.

Також ШІ досі має проблеми з багатокроковим плануванням, фінансовим аналізом і розумінням відео. Роботи, що працюють у фізичному середовищі, успішно виконують лише близько 12% побутових завдань.

Ця нестабільність створює серйозні ризики для бізнесу. Високі результати в одному тесті не гарантують надійності в реальних умовах. Система може добре писати код, але не розуміти бізнес-контексту. А агент, який справляється з більшістю задач, може провалити саме ті, що є критично важливими.

Окрім технологічних викликів, звіт виділяє три ключові проблеми.

Перша – дефіцит талантів. Потік дослідників ШІ до США скоротився на 89% з 2017 року, і на 80% лише за останній рік. Це змінює глобальну конкуренцію за спеціалістів.

Друга – зниження прозорості. Індекс відкритості фундаментальних моделей впав із 58 до 40 балів. Найпотужніші системи дедалі рідше розкривають дані про навчання та ризики, що ускладнює їх використання для компаній.

Третя – зміни на ринку праці. У США зайнятість серед молодих програмістів віком 22–25 років знизилась майже на 20%, тоді як кількість старших спеціалістів зростає. Подібна тенденція спостерігається і в сфері підтримки клієнтів. Продуктивність зростає на 14–26%, але саме початкові позиції зникають.

Окрему увагу приділено екологічному впливу. Навчання однієї великої моделі може створювати десятки тисяч тонн викидів CO₂. Потужність дата-центрів, що обслуговують ШІ, вже співмірна з енергоспоживанням великих регіонів. Крім того, використання води для обчислень може досягати масштабів, співставних із потребами мільйонів людей.

Ще один виклик – довіра. Лише 31% американців довіряють уряду у питаннях регулювання ШІ. При цьому технологія поширюється швидше, ніж будь-коли в історії.

У підсумку звіт показує: штучний інтелект уже майже досяг рівня людини у багатьох завданнях. Але інфраструктура для його безпечного та ефективного використання – від стандартів до ринку праці – суттєво відстає. І саме це стане головним викликом найближчих років.

Пов'язані теми:

Техно

Штучний інтелект дослідження