Онлайн Редакция Вакансии Контакты Игры Гороскоп
29 мая, 11:03
3

Anthropic запустила новую версию флагманской модели Claude Opus

Рынок искусственного интеллекта получил очередное обновление, которое обещает пересмотреть подход к написанию кода и выполнению сложных аналитических задач. Компания Anthropic выпустила свою новую флагманскую модель, сделав ставку на точность, честность и самостоятельность цифрового помощника в условиях реальных задач.

Какие возможности предлагает новая версия Claude Opus?

Компания Anthropic официально представила Claude Opus 4.8 – прямое обновление предыдущей версии 4.7. Разработчики позиционируют новинку как "более эффективного партнера", который демонстрирует существенный прогресс в написании кода, междисциплинарном мышлении, автономном использовании компьютера и финансовом анализе. Главный акцент сделали на "агентных" функциях – способности модели действовать самостоятельно в течение длительных сессий без постоянного надзора человека. Об этом пишет издание Cyber Press.

Смотрите также Опрос показал, что почти 100% генеральных директоров планируют заменить людей на ИИ

Одной из важнейших характеристик Claude Opus 4.8 стала его повышенная честность. Ранние тесты показали, что модель значительно чаще указывает на неуверенность в своих результатах и реже делает безосновательные заявления. В сфере программирования это критически важно: по данным оценивания, Opus 4.8 в четыре раза реже своего предшественника пропускает ошибки в написанном им же коде.

Компания также подтянула показатели "просоциального" поведения, что означает лучшее соблюдение интересов пользователя и более низкий уровень склонности к обману.

Модель стала более эффективным партнером, что демонстрирует улучшение в агентном программировании, междисциплинарном мышлении и финансовом анализе,
– прокомментировали представители компании Anthropic в своем официальном анонсе.

Технические показатели модели впечатляют. В тесте SWE-Bench Pro Claude Opus 4.8 набрал 69,2 процента, обойдя GPT-5.5 и Gemini 3.1 Pro. Хотя решение от OpenAI все еще удерживает лидерство в терминальном кодировании, Anthropic уверенно доминирует в других инженерных дисциплинах.

Кроме качества, разработчики существенно поработали над доступностью технологии. Новый "быстрый режим" (Fast Mode) работает в 2,5 раза быстрее стандартного и стал в три раза дешевле, чем предыдущие аналогичные решения. Для обычного использования цена осталась неизменной: 5 долларов за миллион входных токенов и 25 долларов за миллион выходных.


Результаты тестирования Claude Opus 4.8 / Изображение Anthropic

Новые функции

Среди ключевых нововведений стоит выделить "Динамические рабочие процессы" (Dynamic workflows). Эта функция позволяет искусственному интеллекту планировать огромные задачи и запускать сотни параллельных субагентов за одну сессию. Это открывает путь к полной автоматизации миграций больших баз кода, насчитывающих сотни тысяч строк.

Также появился инструмент контроля усилий (Effort control), где пользователь может выбирать, насколько глубоко Claude должен погружаться в проблему. По умолчанию установлен высокий уровень, но для простых запросов можно выбрать экономный вариант, чтобы сохранить лимиты и ускорить ответ, пишет издание Neowin.

Claude Mythos приближается

Напомним, пока Anthropic не выпустила в свет еще более мощную модель Claude Mythos. Она демонстрирует настолько хорошие результаты в поиске уязвимостей в программном обеспечении, что компания просто побоялась выпускать ее. Это могло бы обернуться катастрофой для всех, поскольку позволило бы хакерам искать бреши в безопасности сайтов, серверов, программ и приложений. Но сейчас компания говорит, что внедрила предохранители и впоследствии таки обнародует модель.

Связанные темы: