Работа GPT-4 улучшилась на 30% благодаря программе самоанализа

Источник:

AI Explained

С каждым днем нейросети становятся все умнее и ловче. Более того, они учатся анализировать сами себя и исправлять ошибки. Примером тому стал успех программы "Reflexion" для нейросети GPT-4.

Саморефлексия для GPT

Название "Reflexion" идеально отражает суть – разработчики системы заставили нейросеть критически оценивать собственную работу и создавать рекомендации для самой себя по устранению ошибок.

Интересно Блогер смог активировать Windows бесплатно с помощью ChatGPT

Эта система создает тесты для самопроверки работы нейросети, но делает это в тысячи раз быстрее и эффективнее человека. Она не универсальна, для каждой задачи нужно провести свой цикл работ и проверок. Но результат того стоит: например, в тесте "HumanEval" по решению проблем программирования на языке Python GPT-4 показал результат в 67% задач. А после применения "Рефлексии" – 88 процентов.

Если нейросеть может выполнить какую-нибудь задачу, то она же может оценить качество ее выполнения и дать конструктивную критику.

В тесте на решение многоэтапных задач "Alfworld" применение программы позволило повысить эффективность работы GPT-4 с 73% до 97%.
В тесте "HotPotQA" по анализу данных из Википедии показатели выросли с 34% до 53%.
Усредненная оценка показывает увеличение эффективности работы нейросети с системой самоконтроля на 30%.

К сожалению, GPT-4 все еще совершает фундаментальные ошибки, потому что эта система в принципе неспособна на осознание своей ошибки.

Дополнение "Рефлексия" снижает количество ошибочных выводов, но поскольку исполнитель и проверяющий являются одной и той же системой, данная архитектура не может распознать собственные промахи, если ей не указали на них извне. Это делает этот инструмент удобным и полезным только при условии, что его работу будут контролировать владеющие нужными знаниями.

Связанные темы:

Искусственный интеллект

ChatGPT