Anthropic запустила новую версию флагманской модели Claude Opus

Рынок искусственного интеллекта получил очередное обновление, которое обещает пересмотреть подход к написанию кода и выполнению сложных аналитических задач. Компания Anthropic выпустила свою новую флагманскую модель, сделав ставку на точность, честность и самостоятельность цифрового помощника в условиях реальных задач.

Какие возможности предлагает новая версия Claude Opus?

Компания Anthropic официально представила Claude Opus 4.8 – прямое обновление предыдущей версии 4.7. Разработчики позиционируют новинку как "более эффективного партнера", который демонстрирует существенный прогресс в написании кода, междисциплинарном мышлении, автономном использовании компьютера и финансовом анализе. Главный акцент сделали на "агентных" функциях – способности модели действовать самостоятельно в течение длительных сессий без постоянного надзора человека. Об этом пишет издание Cyber Press.

Одной из важнейших характеристик Claude Opus 4.8 стала его повышенная честность. Ранние тесты показали, что модель значительно чаще указывает на неуверенность в своих результатах и реже делает безосновательные заявления. В сфере программирования это критически важно: по данным оценивания, Opus 4.8 в четыре раза реже своего предшественника пропускает ошибки в написанном им же коде.

Компания также подтянула показатели "просоциального" поведения, что означает лучшее соблюдение интересов пользователя и более низкий уровень склонности к обману.

Модель стала более эффективным партнером, что демонстрирует улучшение в агентном программировании, междисциплинарном мышлении и финансовом анализе,
– прокомментировали представители компании Anthropic в своем официальном анонсе.

Технические показатели модели впечатляют. В тесте SWE-Bench Pro Claude Opus 4.8 набрал 69,2 процента, обойдя GPT-5.5 и Gemini 3.1 Pro. Хотя решение от OpenAI все еще удерживает лидерство в терминальном кодировании, Anthropic уверенно доминирует в других инженерных дисциплинах.

Кроме качества, разработчики существенно поработали над доступностью технологии. Новый "быстрый режим" (Fast Mode) работает в 2,5 раза быстрее стандартного и стал в три раза дешевле, чем предыдущие аналогичные решения. Для обычного использования цена осталась неизменной: 5 долларов за миллион входных токенов и 25 долларов за миллион выходных.

Результаты тестирования Claude Opus 4.8 / Изображение Anthropic

Новые функции

Среди ключевых нововведений стоит выделить "Динамические рабочие процессы" (Dynamic workflows). Эта функция позволяет искусственному интеллекту планировать огромные задачи и запускать сотни параллельных субагентов за одну сессию. Это открывает путь к полной автоматизации миграций больших баз кода, насчитывающих сотни тысяч строк.

Также появился инструмент контроля усилий (Effort control), где пользователь может выбирать, насколько глубоко Claude должен погружаться в проблему. По умолчанию установлен высокий уровень, но для простых запросов можно выбрать экономный вариант, чтобы сохранить лимиты и ускорить ответ, пишет издание Neowin.

Claude Mythos приближается

Напомним, пока Anthropic не выпустила в свет еще более мощную модель Claude Mythos. Она демонстрирует настолько хорошие результаты в поиске уязвимостей в программном обеспечении, что компания просто побоялась выпускать ее. Это могло бы обернуться катастрофой для всех, поскольку позволило бы хакерам искать бреши в безопасности сайтов, серверов, программ и приложений. Но сейчас компания говорит, что внедрила предохранители и впоследствии таки обнародует модель.

Связанные темы:

Искусственный интеллект

Техно