Речь идет о новой системе о3, которая набрала 85% в тесте ARC-AGI. Что это за тест и что означают его результаты – рассказывает 24 Канал со ссылкой на The Economic Time.
Интересно Энергетические компании массово хотят интегрировать ИИ в энергосети по очень простым причинам
Что означают результаты теста
Предыдущий рекорд ИИ в этом тесте составлял 55%. Теперь же ИИ показал результат, который соизмерим со средним показателем среди людей. Это событие делает компанию OpenAI на шаг ближе к созданию искусственного общего интеллекта. Несмотря на то, что есть много скептиков создания ИИ, все же многие исследователи говорят, что перспектива его создания ближе, чем считалось ранее.
Тест ARC-AGI, который прошел ИИ, это проверка способности адаптироваться к новым ситуациям. С помощью тестирования определяли, сколько примеров нужно для понимания работы ИИ. Например, известный всем ChatGPT не эффективен в этом, хоть и тренирован на миллионах примеров теста, но для более тяжелых задач ему не хватает данных.
ChatGPT не эффективен в тесте ARC-AGI / Фото Pexels
Пока ИИ не сможет эффективно учиться на небольшой выборке, его будут использовать для повторяющихся задач, где ошибки допустимы. Способность обобщать новые проблемы из минимума данных является ключевым элементом интеллекта. Тест ARC-AGI проверяет способность адаптироваться на выборке, предлагая задачи с сетками. ИИ нужно найти закономерность, которая преобразует левую сетку в правую. Каждый вопрос содержит 3 примера, после чего ИИ должен обобщить правило для четвертого. Это что-то напоминает тесты на IQ, которые дают проходить в школах.
Модель о3 продемонстрировала высокую способность к адаптации. Хотя об этой системе известно очень мало, ведь разработчики рассказывают не так много. Перспективы этой системы станут понятными после выпуска. В частности сейчас под вопросом, действительно ли ИИ может обобщать так же, как и среднестатистический человек. Если это действительно так – то это повлечет технологическую революцию и начнет эру ИИ, который совершенствуется самостоятельно. Это потребует новых ориентиров для ИИ и новых подходов в управлении.