Компанія Anthropic повідомила про повне припинення доступу до моделей Fable 5 і Mythos 5 для всіх користувачів. Рішення набуло чинності після отримання урядового розпорядження 12 червня, яке, за словами компанії, було пов'язане з міркуваннями національної безпеки. Про це пише Engadget.

Дивіться також Щось велике насувається: OpenAI готує GPT-5․6 значно раніше, ніж очікували

Чому Anthropic зупинила доступ до своїх нових моделей?

Обмеження торкнулися лише цих двох моделей. Інші продукти Anthropic, включно з чат-ботом Claude та рештою моделей компанії, продовжують працювати у звичайному режимі.

За інформацією Anthropic, влада США вимагала призупинити доступ до нових моделей для всіх іноземних громадян незалежно від їхнього місця перебування. Обмеження поширюється навіть на співробітників самої компанії, якщо вони не є громадянами США.

Google Якщо оперативні новини для вас важливі Додайте 24 Канал у вибрані в Google Додати

Хоча уряд не розкрив конкретних причин свого рішення, в Anthropic припускають, що воно може бути пов'язане з інформацією про потенційний спосіб обходу захисних механізмів Fable 5.

Йдеться про так званий jailbreak – метод, який дозволяє змусити модель виконувати дії або генерувати відповіді всупереч встановленим обмеженням. Такі техніки останніми роками стали однією з головних проблем для розробників генеративного штучного інтелекту.

Компанія зазначила, що отримала від урядовців усні докази існування одного потенційного способу обходу захисту. За словами Anthropic, інформацію надала неназвана організація. Водночас йдеться не про універсальний механізм злому, а про вузькоспеціалізований метод, який може працювати лише за певних умов.

У компанії пообіцяли надати додаткові подробиці протягом найближчої доби.

Чим особливі Fable 5 і Mythos 5?

Fable 5 була представлена лише 9 червня. Модель створювалася як спосіб надати ширшому колу користувачів частину можливостей більш просунутої системи Mythos.

Сама Mythos є флагманською кібербезпековою моделлю Anthropic. Вона не перебуває у відкритому доступі та використовується лише партнерами програми Project Glasswing.

За словами розробників, можливості Fable 5 перевершують усі попередні моделі компанії. Як приклад Anthropic наводила результати власних тестів, під час яких модель успішно пройшла гру Pokémon FireRed. Раніше Claude не зміг завершити проходження оригінальної Pokémon Red, на основі якої створена FireRed.

У матеріалах про запуск Fable 5 Anthropic детально описувала систему захисту нової моделі. Розробники стверджують, що впровадили жорсткі механізми контролю для зменшення ризику використання системи у завданнях, пов'язаних із кібербезпекою та потенційно шкідливою діяльністю.

У компанії зазначили, що захист виявився настільки суворим, що частина користувачів скаржилася на надмірні обмеження.

Anthropic також підкреслила, що жоден розробник не може гарантувати абсолютну невразливість моделей до jailbreak-атак. На думку компанії, завдання полягає не у створенні ідеального захисту, а в тому, щоб зробити подібні атаки максимально складними та дорогими.

У своїй заяві Anthropic пояснила: "Ми прагнули зробити обходи захисту або вузькоспеціалізованими, або дуже дорогими у створенні, а також поєднати це з ретельним моніторингом, щоб швидко виявляти та припиняти будь-які успішні атаки".

Конфлікт навколо регулювання штучного інтелекту

Особливу увагу привернула позиція самої Anthropic щодо рішення влади. Компанія давно виступає за посилення контролю над передовими системами штучного інтелекту та неодноразово закликала до створення чітких механізмів державного нагляду.

Проте цього разу розробник фактично розкритикував дії уряду. "Як ми вже заявляли публічно, ми вважаємо, що уряд повинен мати можливість блокувати небезпечні впровадження в межах законодавчого процесу, який є прозорим, справедливим, зрозумілим і ґрунтується на технічних фактах. Ці дії не відповідають таким принципам", – заявили в Anthropic.

Таким чином, ситуація навколо Fable 5 і Mythos 5 стала одним із перших великих випадків, коли американська влада фактично втрутилася в розповсюдження нових моделей штучного інтелекту через потенційні ризики безпеці. Подальший розвиток подій може стати важливим прецедентом для всієї індустрії ШІ та визначити, як саме регулюватимуться найпотужніші алгоритми в майбутньому.