Новый ИИ от Anthropic получил особый режим безопасности после инцидента с хакерами

Anthropic представила новую модель искусственного интеллекта Claude Fable 5, которую считают одной из самых мощных в линейке компании. В то же время ее запуск сопровождается усиленными мерами безопасности и рядом необычных ограничений для пользователей.

Компания Anthropic официально выпустила Claude Fable 5 – первую публичную версию своей модели искусственного интеллекта Mythos. Еще до релиза система привлекла внимание из-за сообщений о несанкционированном доступе к модели со стороны киберпреступников, что усилило дискуссии о рисках ее использования. Об этом пишет Ubergizmo.

Почему запуск Claude Fable 5 сопровождается жесткими ограничениями?

Mythos создавалась с акцентом на выявление критических уязвимостей в программном обеспечении и цифровой инфраструктуре. Именно эта особенность сделала модель потенциально полезной как для специалистов по кибербезопасности, так и для злоумышленников. Поэтому Anthropic решила ввести дополнительные механизмы контроля перед открытием доступа для более широкой аудитории.

По словам компании, подготовка к релизу включала более 1000 часов тестирования с участием внутренних специалистов и внешних партнеров. В результате были созданы специальные классификаторы безопасности, которые анализируют запросы пользователей в режиме реального времени.

Если система определяет, что запрос касается кибербезопасности, химии, биологии или технологий дистилляции моделей искусственного интеллекта, он автоматически перенаправляется на более контролируемую модель Claude Opus 4.8. Таким образом Anthropic пытается ограничить доступ к наиболее чувствительным возможностям Fable 5.

Еще одним необычным решением стала обязательная политика хранения данных в течение 30 дней. Она распространяется даже на корпоративных клиентов, которые ранее пользовались соглашениями о полном отказе от сохранения информации.

В Anthropic отмечают, что собранные данные будут использоваться исключительно для мониторинга потенциально опасной активности и выявления возможных нарушений правил использования. Компания отдельно подчеркнула, что эта информация не будет привлекаться для обучения или дообучения моделей.

Кто получит доступ к Claude Fable 5?

На первом этапе модель доступна подписчикам тарифных планов Pro, Max, Team и Enterprise. Такой формат будет действовать до 22 июля 2026 года.

После этой даты Anthropic планирует перейти на систему оплаты за использование. В то же время в компании отмечают, что в будущем Fable 5 может снова стать частью подписных пакетов.

Стоимость использования новой модели составляет 10 долларов за миллион входных токенов и 50 долларов за миллион выходных токенов. Это примерно вдвое дороже тарифов Claude Opus 4.8.

Несмотря на высокую цену и ограничения, первые корпоративные пользователи сообщают о заметном росте производительности. По данным компаний Workspace и Genspark, новые модели демонстрируют результаты, превосходящие конкурентов в сфере проектирования интерфейсов и программирования видеоигр.

Отдельно отмечаются возможности модели в выполнении сложных многоэтапных задач. Аналитическая компания Hex сообщила, что Fable 5 стала первой моделью, которая смогла поддерживать 90% уровень автономного выполнения длительных аналитических задач без внешней помощи. В самой Anthropic утверждают, что Claude Fable 5 самостоятельно обрабатывает около 95% запросов пользователей и лишь в отдельных случаях обращается к Claude Opus 4.8 для дополнительной проверки или выполнения задач.

Новый этап в развитии ИИ или источник новых рисков?

Запуск Claude Fable 5 демонстрирует, что ведущие разработчики искусственного интеллекта все чаще сталкиваются с дилеммой между расширением возможностей своих моделей и необходимостью контролировать потенциальные риски.

В случае Anthropic компания фактически выбрала компромиссный подход: предоставила пользователям доступ к более мощной системе, но одновременно ввела дополнительные механизмы мониторинга, фильтрации и ограничения функций. Насколько эффективной окажется такая стратегия, станет понятно после первых месяцев реальной эксплуатации модели.

Связанные темы:

Техно

Искусственный интеллект OpenAI