Подробности

Команда робототехников из Google DeepMind представила три новые разработки, которые должны помочь нашим будущим роботам принимать более быстрые, качественные и безопасные решения. Одно из них включает систему сбора учебных данных с так называемой "Конституцией робота", которая гарантирует, что ваш офисный ассистент сможет принести пользу, не навредив при этом окружающим.

Смотрите также LG разработала маленького двуногого робота с искусственным интеллектом

Система сбора данных AutoRT от Google может использовать визуальную языковую модель (VLM) и большую языковую модель (LLM), которые работают вместе, чтобы понять свое окружение, адаптироваться к незнакомым условиям и принять решение о соответствующих задачах. Конституция робота, вдохновленная "Тремя законами робототехники" Айзека Азимова, описывается как набор "ориентированных на безопасность подсказок", указывающих LLM избегать определенного набора задач, которые связаны с людьми, животными, острыми предметами и даже электрическими приборами.

Для дополнительной безопасности инженеры DeepMind запрограммировали роботов на автоматическую остановку, если усилие на искусственные суставы превышает определенный порог, а также добавили физический выключатель, с помощью которого люди-операторы могут деактивировать машину.

В течение семи месяцев Google развернула парк из 53 роботов AutoRT в четырех различных офисных зданиях и провела более 77 000 испытаний. Некоторые роботы контролировались дистанционно людьми-операторами, тогда как другие работали либо на основе сценария, либо полностью автономно, используя модель обучения искусственного интеллекта Google Robotic Transformer (RT-2).

Роботы, используемые в испытаниях, не подражали человеческому телу в своем дизайне. Они оснащены лишь камерой, манипулятором и системой передвижения.

Робот, используемый в эксперименте
Робот, используемый в эксперименте / Фото Google

Для каждого робота система использует VLM, чтобы понять его окружение и объекты в пределах видимости. Затем LLM предлагает список творческих задач, которые робот может выполнить, например, "Положи закуску на столешницу", и играет роль лица, принимающего решение, чтобы выбрать подходящую задачу для робота,
– отмечает Google в своем блоге.

  • Среди других новых технологий DeepMind - SARA-RT, нейросетевая архитектура, разработанная для того, чтобы сделать существующий робот-трансформер RT-2 более точным и быстрым.
  • Компания также анонсировала RT-Trajectory, которая добавляет 2D-очертания, чтобы помочь роботам лучше выполнять конкретные физические задачи, например, вытирать стол.

Кажется, нам еще очень далеко до роботов, которые автономно подают напитки и взбивают подушки, но когда они появятся, они, возможно, будут обладать той самой Конституцией робота.