Армия США надеется, что это поможет ей достичь превосходства на поле боя. Кроме того, метод может быть полезен в разведке или при защите важных военных и гражданских объектов.
Не пропустите В Новой Зеландии испытают первую беспроводную систему передачи энергии на большие расстояния
"Поиск оптимального способа наведения в режиме реального времени для этих машин – это ключевое требование для повышения тактической ситуационной осведомленности бойцов. Это позволит армии США доминировать в сложной обстановке", – считает Джемини Джордж, сотрудник командования по развитию боевых возможностей США.
Джемини Джордж и его коллеги разработали метод управления большими скоплениями дронов на основе иерархического обучения с подкреплением (HRL). Скопление обученных беспилотных аппаратов можно будет отправлять в определенные области, снабдив их набором инструкций. При этом стая дронов будет автоматически поддерживать строй и выполнять приказы. Таким образом, диспетчерам-людям не придется беспокоиться про отдельные дроны и наземные транспортные средства – достаточно будет указать группе роботов определенное место на карте. Машины, как команда, отправятся туда, куда им прикажут, и будут работать вместе как одна боевая единица.
"Использование иерархического обучения с подкреплением позволит нам контролировать скопление беспилотных летательных и наземных транспортных средств, чтобы они могли оптимально выполнять различные виды миссий", – отметил Джемини Джордж.
Сотрудники лаборатории надеются, что в будущем автономные наземные роботы и летающие дроны смогут без вмешательства человека работать вместе и исследовать землю и небо.
"Скопление роботов могут использоваться для постоянного наблюдения и разведки в густонаселенной городской местности, а также для защиты периметра военной базы или ценных активов", – отметил эксперт.
Интересно Инженеры создали технологию производства дисплеев нового поколения
Обучение с подкреплением
Одним из способов машинного обучения, в ходе которого ИИ обучается, взаимодействуя со средой, является обучение с подкреплением. Иерархическое обучение с подкреплением позволяет ИИ использовать не только элементарные действия, но и подпоследовательности, изученные ранее при работе с предыдущей задачей.
"У каждого агента свой собственный цикл обучения с соответствующим вознаграждением. Мы смогли значительно сократить время обучения, запустив эти циклы обучения параллельно", –заявил Джемини Джордж.
В лаборатории отмечают, что рассчитывают с помощью нового алгоритма управлять скоплениями от десятков до сотен машин. Однако пока что команда использовала свой метод только на четырех квадрокоптерах в пределах одного помещения и применять алгоритм в условиях реального боя еще рано.