Які можливості пропонує нова версія Claude Opus?
Компанія Anthropic офіційно представила Claude Opus 4.8 – пряме оновлення попередньої версії 4.7. Розробники позиціонують новинку як "ефективнішого партнера", який демонструє суттєвий прогрес у написанні коду, міждисциплінарному мисленні, автономному використанні комп'ютера та фінансовому аналізі. Головний акцент зробили на "агентних" функціях – здатності моделі діяти самостійно протягом тривалих сесій без постійного нагляду людини. Про це пише видання Cyber Press.
Дивіться також Опитування показало, що майже 100% генеральних директорів планують замінити людей на ШІ
Однією з найважливіших характеристик Claude Opus 4.8 стала його підвищена чесність. Ранні тести показали, що модель значно частіше вказує на невпевненість у своїх результатах і рідше робить безпідставні заяви. У сфері програмування це критично важливо: за даними оцінювання, Opus 4.8 у чотири рази рідше за свого попередника пропускає помилки у написаному ним же коді.
Компанія також підтягнула показники "просоціальної" поведінки, що означає краще дотримання інтересів користувача та нижчий рівень схильності до обману.
Модель стала ефективнішим партнером, що демонструє покращення в агентному програмуванні, міждисциплінарному мисленні та фінансовому аналізі,
– прокоментували представники компанії Anthropic у своєму офіційному анонсі.
Технічні показники моделі вражають. У тесті SWE-Bench Pro Claude Opus 4.8 набрав 69,2 відсотка, обійшовши GPT-5.5 та Gemini 3.1 Pro. Хоча рішення від OpenAI все ще утримує лідерство в термінальному кодуванні, Anthropic упевнено домінує в інших інженерних дисциплінах.
Окрім якості, розробники суттєво попрацювали над доступністю технології. Новий "швидкий режим" (Fast Mode) працює у 2,5 раза швидше за стандартний і став утричі дешевшим, ніж попередні аналогічні рішення. Для звичайного використання ціна залишилася незмінною: 5 доларів за мільйон вхідних токенів і 25 доларів за мільйон вихідних.
Результати тестування Claude Opus 4.8 / Зображення Anthropic
Нові функції
Серед ключових нововведень варто виділити "Динамічні робочі процеси" (Dynamic workflows). Ця функція дозволяє штучному інтелекту планувати величезні завдання й запускати сотні паралельних субагентів за одну сесію. Це відкриває шлях до повної автоматизації міграцій великих баз коду, які налічують сотні тисяч рядків.
Також з'явився інструмент контролю зусиль (Effort control), де користувач може обирати, наскільки глибоко Claude має занурюватися в проблему. За замовчуванням встановлено високий рівень, але для простих запитів можна обрати економний варіант, щоб зберегти ліміти й пришвидшити відповідь, пише видання Neowin.
Claude Mythos наближається
Нагадаємо, поки що Anthropic не випустила в світ ще потужнішу модель Claude Mythos. Вона демонструє настільки хороші результати в пошуку вразливостей у програмному забезпеченні, що компанія просто побоялася випускати її. Це могло б обернутися катастрофою для всіх, оскільки дозволило б хакерам шукати прогалини в безпеці сайтів, серверів, програм і додатків. Але зараз компанія каже, що впровадила запобіжники й згодом таки оприлюднить модель.



