Ця модель штучного інтелекту вже потіснила GPT-4o за більшістю параметрів

24 червня 2024, 13:31
Читать новость на русском

Джерело:

Anthropic

Презентація GPT-4o залишила нас у приємному шоці від тих можливостей, які продемонструвала компанія OpenAI зі своєю найновішою мовною моделлю. Але технології не стоять на місці, тож це було лише питанням часу, коли конкуренти покажуть щось краще. Цього разу вперед виривається Claude від Anthropic.

Деталі

Оновлений чат-бот Claude 3.5 Sonnet перевершує не лише свою попередню версію Claude 3 Sonnet, а й найпотужнішу версію моделі Anthropic Claude 3 Opus, працюючи вдвічі швидше за неї. Користувачі Claude (в тому числі на безкоштовних акаунтах) можуть випробувати новинку вже сьогодні.

Дивіться також Едвард Сноуден звинуватив розробників ChatGPT у зраді людства й просить не вірити чат-боту

Sonnet називають найбільш збалансованою моделлю Anthropic, але це лише одна з трьох версій у сімействі. Поряд із нею очікуються Claude 3.5 Haiku (найшвидша версія, але не така потужна) і Claude 3.5 Opus (найпотужніша, але дещо повільніша). Обидні з'являться пізніше цього року.


Порівняння моделей Claude показує, що Sonnet обігнала Opus у швидкості, але не за кількістю навчальних даних / Фото Anthropic

Оновлення Sonnet вийшло лише через кілька місяців після появи сімейства Claude 3, демонструючи, з якою шаленою швидкістю компанії, що займаються розробкою ШІ, працюють над створенням своїх найновіших і найпотужніших розробок. Anthropic стверджує, що Claude 3.5 Sonnet – це крок уперед у розумінні нюансів, гумору та складних підказок, і він може писати більш природним тоном.

Бенчмарки (тести, які оцінюють ту чи іншу програму чи пристрій) показують, що нова модель б'є галузеві рекорди в міркуваннях на рівні аспірантури, знаннях на рівні бакалаврату та майстерності кодування. Вона перевершує GPT-4o від OpenAI у багатьох тестах, опублікованих Anthropic. Однак останні моделі Claude, ChatGPT, Gemini і Llama мають тенденцію набирати в більшості тестів лише кілька відсоткових пунктів одна від одної, що підкреслює жорстку конкуренцію.


Результати тестування Claude, ChatGPT, Gemini і Llama / Фото Anthropic

  • Компанія стверджує, що Claude 3.5 Sonnet також краще інтерпретує візуальне введення, ніж Claude 3.0 Opus.
  • Нова модель може "точно розшифровувати текст з недосконалих зображень", що, як сподіваються розробники, привабить клієнтів у сфері роздрібної торгівлі, логістики та фінансових послуг, які потребують даних з діаграм, графіків та інших візуальних підказок.
  • Оновлення також принесло нову робочу область, яку компанія називає Artifacts. Коли ви просите чат-бота генерувати контент, наприклад, код, текстові документи або вебдизайн, праворуч від чату з'являється спеціальне вікно. Ви можете попросити внести зміни у те, що вже бачите, і ШІ оновить вікно "Артефакти" останніми результатами своєї роботи.

Новий вигляд Claude: відео

Компанія розглядає Artifacts як перший крок до того, щоб зробити Claude простором для ширшої командної співпраці.

У найближчому майбутньому команди – а з часом і цілі організації – зможуть безпечно централізувати свої знання, документи та поточну роботу в одному спільному просторі, а Claude слугуватиме товаришем по команді на вимогу,
– йдеться у пресрелізі компанії.

Claude 3.5 Sonnet вже доступний для всіх, хто має обліковий запис, на сайті компанії, а також у додатку Claude для iOS.