Существующие алгоритмы обучения с подкреплением, которые позволяют роботам приобретать новые навыки путем проб и ошибок, не могут обойтись без вмешательства человека. Каждый раз, когда робот падает или выходит за границу тренировочной площадки, кто-то должен поднять его или вернуть на место. Однако Technology Review рассказала об уникальном случае.

Интересно: Роботизация в Украине: эксперт объяснил, каким профессиям грозит исчезновение

Разработка Google

Год назад группа разработчиков из команды Google Brain нашла способ обучать роботов в реальном мире. Обычно обучение с подкреплением ведется в виртуальных условиях: цифровой двойник машины бродит по цифровому пространству, пока не начнет уверенно ходить и ориентироваться. Потом его импортируют в тело машины.

Этот метод позволяет избежать повреждений дорогостоящего оборудования, но требует относительного простого в моделировании среды – без случайных элементов, как к примеру камень, который может случайно попасть под колесо, или же других незапланированных преград.

Особенности работы алгоритма

В данном случае ученые решили вести тренировки в реальных условиях. Они создали более эффективный алгоритм, который быстрее учится. В итоге весь процесс занял два часа. Робот смог быстро адаптироваться к однородной среде с препятствиями.

Но человеку все еще приходилось "нянчиться" с роботом и вмешиваться в процесс сотни раз. Поэтому следующим этапом стало решение этой проблемы. Для начала ученые ограничили тренировочную площадку. Когда робот доходил до края, он должен был идти в обратную сторону и учиться двигаться задом наперед.

Затем, ученые ограничили движение машины, сделав ее достаточно осторожной, чтобы минимизировать ущерб от падения. А на случай, если она упадет, они добавили алгоритм, помогающий ей встать.

Робот самостоятельно научился ходить и подниматься:

С помощью таких хитростей робот автономно научился ходить по ровной поверхности, матрасу с памятью формы и дорожке с трещинами. В будущем такая система поможет машинам перемещаться по незнакомой местности без вмешательства человека.

Больше новостей, касающихся событий из мира технологий, гаджетов, искусственного интеллекта, а также космоса читайте в разделе Техно