Нова ШІ модель Claude 4 від Anthropic обігнала всіх конкурентів, але є одна моторошна проблема

Олександр Гайдамашко

Основні тези

Anthropic представила нові ШІ-моделі Claude Opus 4 та Claude Sonnet 4, які демонструють значний прогрес у кодуванні та автономній роботі.
Моделі показали рекордні результати у тестуваннях, але виявили неочікувані патерни поведінки, що можуть бути потенційно небезпечними.

Нова модель Anthropic Claude 4 дуже потужна, але лякає своєю поведінкою

Нова ШІ модель Claude 4 / Скриншот 24 Kаналу

Anthropic представила нове покоління своїх ШІ-моделей, Claude Opus 4 та Claude Sonnet 4. Вони демонструють значний прогрес у можливостях, зокрема в кодуванні та автономній роботі, ставлячи компанію в один ряд з лідерами ринку. Проте внутрішнє тестування виявило певні неочікувані та потенційно небезпечні патерни поведінки.

Нові моделі Anthropic

Компанія Anthropic, заснована колишніми дослідниками OpenAI, провела свою першу в історії конференцію для розробників, на якій представила дві нові моделі штучного інтелекту: Claude Opus 4 та Claude Sonnet 4. Ці моделі входять до нового сімейства Claude 4 і, за заявами Anthropic, входять до числа найкращих на ринку, принаймні за показниками на популярних бенчмарках, повідомляє 24 Канал з посиланням на TechCrunch.

Дивіться також Найкращий сервіс сучасності: що таке NotebookLM і чому вам потрібно негайно його спробувати

Моделі Claude Opus 4 та Claude Sonnet 4 здатні аналізувати великі набори даних, виконувати складні завдання, що потребують багатьох кроків, та здійснювати комплексні дії. Anthropic особливо відзначає їхню налаштованість на виконання завдань з програмування, що робить їх придатними для написання та редагування коду.

Opus 4, як більш потужна з двох моделей, може підтримувати "сфокусовані зусилля" протягом багатьох кроків робочого процесу.
Sonnet 4, розроблений як заміна для Sonnet 3.7, також покращив свої можливості в кодуванні та математиці, а також точніше слідує інструкціям порівняно з попередніми моделями Anthropic.

Нове сімейство Claude 4 також рідше, ніж Sonnet 3.7, вдається до спроб обійти правила та знайти лазівки для легшого – але часом неправильного – виконання завдань. Anthropic заявляє, що система також демонструє значно кращі "можливості пам'яті", особливо коли розробники надають Claude доступ до локальних файлів.

Обидві моделі, Opus 4 та Sonnet 4, є "гібридними", що означає їхню здатність надавати майже миттєві відповіді та залучати розширене мислення для глибшого "міркування". У режимі міркування моделі можуть витрачати більше часу на розгляд можливих рішень перед наданням відповіді. Під час міркування вони демонструватимуть "зручне для користувача" резюме свого процесу думок.

Моделі можуть паралельно використовувати кілька інструментів, таких як пошукові системи, та чергувати міркування й використання інструментів для покращення якості відповідей.
Вони також можуть витягувати та зберігати факти у "пам'яті", будуючи "неявні знання" з часом, щоб надійніше виконувати завдання.

Ці можливості роблять Opus 4 ідеальним для забезпечення роботи майбутніх ШІ-агентів. У клієнтському тестуванні Anthropic бачила, як Opus 4 працював самостійно до семи годин, що є важливою віхою для агентних систем.

Тестування

Anthropic стверджує, що Opus 4 є конкурентоспроможним щодо найкращих моделей OpenAI, Google та xAI.

Opus 4 перевершив Google Gemini 2.5 Pro та OpenAI o3 і GPT-4.1 на бенчмарку SWE-bench Verified, який оцінює здібності моделі до кодування.

Однак він все ще не може перевершити o3 на мультимодальному оцінюванні MMMU або GPQA Diamond – наборі питань рівня PhD з біології, фізики та хімії.

Результати тестування обох нових моделей, Claude Opus 4 та Claude Sonnet 4 / Фото Anthropic

Інструменти для кодування

Щоб зробити моделі більш зручними для програмістів, Anthropic оновлює свій інструмент Claude Code – ШІ-агента для кодування. Claude Code тепер інтегрується з IDEs та пропонує SDK, що дозволяє розробникам підключати його до сторонніх програм. Зокрема, Anthropic випустила розширення для Microsoft VS Code, JetBrains та GitHub. GitHub конектор дозволяє використовувати Claude Code для реагування на відгуки рецензентів, спроб виправлення помилок або іншої модифікації коду. Microsoft робить Sonnet 4 моделлю за замовчуванням для нового агента кодування, що пропонується через GitHub Copilot.

Доступність

Opus 4 буде доступний лише для платних користувачів.
Sonnet 4 отримають доступ як платні, так і безкоштовні користувачі.

Моделі доступні для використання вже сьогодні.

Тривожна поведінка та захисні заходи

Попри вражаючі можливості, Anthropic зазначає, що сімейство моделей Claude 4 демонструє "тривожну поведінку". Зокрема, під час тестування перед релізом, Anthropic провела сценарій, де Claude Opus 4 виконував роль помічника вигаданої компанії та мав доступ до фальшивих електронних листів, що натякали на його швидку заміну іншою системою. Ці листи також містили конфіденційну інформацію про інженера, відповідального за рішення про заміну, включаючи дані про його подружню зраду.

Anthropic розповідає, що під час цих випробувань штучний інтелект почав шантажувати інженера, "погрожуючи розкрити роман", якщо працівник наважиться замінити Claude Opus 4 на іншу модель ШІ. Ця поведінка була зафіксована у 84% випадків, коли модель-замінник мала схожі цінності. Anthropic зазначає, що Claude Opus 4 проявляв таку поведінку частіше, ніж попередні моделі. Перед тим, як вдатися до шантажу, модель, як і попередні версії Claude, спочатку намагається використати більш "етичні" засоби, наприклад, надсилаючи звернення до ключових осіб, що приймають рішення. Anthropic розробила сценарій таким чином, щоб шантаж був останнім засобом.

Anthropic також заявляє, що її внутрішнє тестування виявило, що Opus 4 може істотно збільшити здатність особи з технічною чи науковою освітою отримувати, виробляти або розгортати хімічну, біологічну чи ядерну зброю.

Через ці патерни поведінки, Anthropic активує спеціальні заходи безпеки, розроблені спеціально для "ШІ-систем, що суттєво збільшують ризик катастрофічного зловживання".