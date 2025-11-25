Anthropic представила Claude Opus 4.5 і заявила, що це їхня найпотужніша модель для написання коду, створення агентів та взаємодії з комп'ютером. За словами компанії, вона краще справляється з повсякденними завданнями, зокрема глибокими дослідженнями, та демонструє відчутний стрибок у можливостях порівняно з попередніми версіями. Про це повідомляє 24 Канал із посиланням на повідомлення Anthropic.

Що нового в Claude Opus 4.5?

Ранні тестувальники повідомили, що Opus 4.5 здатна виконувати задачі, які були недоступні моделі Sonnet 4.5. Модель упевненіше працює в умовах невизначеності, краще аналізує компроміси та коректно реагує без надмірних підказок. Також заявлено про покращення у сфері зору, логічних міркувань, математики та програмування.

Як пише Macrumors, разом із запуском моделі Anthropic оновила свої додатки, платформу Claude Developer Platform і систему Claude Code. Користувачі отримали інструменти для довготривалої роботи агентів та нові способи використання Claude — у Excel, Chrome і на комп'ютері.

У застосунках Claude тепер прибрали обмеження на довгі діалоги: модель автоматично стискає попередній контекст, що дозволяє продовжувати розмову без переривань. Веброзширення Claude для Chrome стало доступне всім користувачам тарифу Max, а доступ до бета-версії Claude для Excel відкрили для Max, Team та Enterprise.

Claude Code тепер інтегрований у десктопний застосунок. Завдяки Opus 4.5 він точніше формує плани виконання завдань і послідовніше їх реалізує. Модель ставить уточнювальні питання наперед, після чого створює план, який користувач може редагувати перед запуском.

Claude Opus 4.5 уже доступна у застосунках Anthropic та через API. Компанія зняла окремі ліміти для користувачів Claude та Claude Code з доступом до цієї моделі, а для підписників Max і Team Premium збільшила загальні квоти використання.

Компанія OpenAI, відома створенням ChatGPT, представила нову методику для оцінки можливостей штучного інтелекту. Система отримала назву GDPval і покликана визначити, наскільки ефективно нейромережі справляються з реальними робочими завданнями. Результати дослідження виявилися несподіваними навіть для самих розробників.

Дослідження, проведене спільно з економістом із Гарварду Девідом Демінгом для Національного бюро економічних досліджень (NBER), порівнювало відповіді ШІ з еталонними відповідями експертів у конкретних галузях. На подив багатьох, перше місце посів не ChatGPT, а модель Claude Opus 4.1 від компанії Anthropic, йдеться в звіті.