Эта модель искусственного интеллекта уже потеснила GPT-4o по большинству параметров

24 июня 2024, 13:31
Читати новину українською

Источник:

Anthropic

Презентация GPT-4o оставила нас в приятном шоке от тех возможностей, которые продемонстрировала компания OpenAI со своей новейшей языковой моделью. Но технологии не стоят на месте, так что это был лишь вопрос времени, когда конкуренты покажут что-то лучше. На этот раз вперед вырывается Claude от Anthropic.

Детали

Обновленный чат-бот Claude 3.5 Sonnet превосходит не только свою предыдущую версию Claude 3 Sonnet, но и самую мощную версию модели Anthropic Claude 3 Opus, работая вдвое быстрее нее. Пользователи Claude (в том числе на бесплатных аккаунтах) могут испытать новинку уже сегодня.

Смотрите также Эдвард Сноуден обвинил разработчиков ChatGPT в предательстве человечества и просит не верить чат-боту

Sonnet называют наиболее сбалансированной моделью Anthropic, но это лишь одна из трех версий в семействе. Наряду с ней ожидаются Claude 3.5 Haiku (самая быстрая версия, но не такая мощная) и Claude 3.5 Opus (самая мощная, но несколько медленнее). Оба появятся позже в этом году.


Сравнение моделей Claude показывает, что Sonnet обогнала Opus в скорости, но не по количеству учебных данных / Фото Anthropic

Обновление Sonnet вышло лишь через несколько месяцев после появления семейства Claude 3, демонстрируя, с какой бешеной скоростью компании, занимающиеся разработкой ИИ, работают над созданием своих новейших и мощных разработок. Anthropic утверждает, что Claude 3.5 Sonnet – это шаг вперед в понимании нюансов, юмора и сложных подсказок, и он может писать более естественным тоном.

Бенчмарки (тесты, которые оценивают ту или иную программу или устройство) показывают, что новая модель бьет отраслевые рекорды в рассуждениях на уровне аспирантуры, знаниях на уровне бакалавриата и мастерстве кодирования. Она превосходит GPT-4o от OpenAI во многих тестах, опубликованных Anthropic. Однако последние модели Claude, ChatGPT, Gemini и Llama имеют тенденцию набирать в большинстве тестов лишь несколько процентных пунктов друг от друга, что подчеркивает жесткую конкуренцию.


Результаты тестирования Claude, ChatGPT, Gemini и Llama / Фото Anthropic

  • Компания утверждает, что Claude 3.5 Sonnet также лучше интерпретирует визуальный ввод, чем Claude 3.0 Opus.
  • Новая модель может "точно расшифровывать текст из несовершенных изображений", что, как надеются разработчики, привлечет клиентов в сфере розничной торговли, логистики и финансовых услуг, которые нуждаются в данных из диаграмм, графиков и других визуальных подсказок.
  • Обновление также принесло новую рабочую область, которую компания называет Artifacts. Когда вы просите чат-бота генерировать контент, например, код, текстовые документы или веб-дизайн, справа от чата появляется специальное окно. Вы можете попросить внести изменения в то, что уже видите, и ИИ обновит окно "Артефакты" последними результатами своей работы.

Новый вид Claude: видео

Компания рассматривает Artifacts как первый шаг к тому, чтобы сделать Claude пространством для более широкого командного сотрудничества.

В ближайшем будущем команды – а со временем и целые организации – смогут безопасно централизовать свои знания, документы и текущую работу в одном общем пространстве, а Claude будет служить товарищем по команде по требованию,
– говорится в пресс-релизе компании.

Claude 3.5 Sonnet уже доступен для всех, кто имеет учетную запись, на сайте компании, а также в приложении Claude для iOS.