В своем исследовании компания сосредоточилась на "точечно-целевой навигационной модели" – системе, которая может перемещаться по новым средам без какой-либо карты или GPS-датчика. Эта технология применяет алгоритмы, имитирующие мыслительные процессы человека в упрощенном формате.
Не упустите Сотрудника Google отстранили от работы он заявил, что искусственный интеллект получил сознание
В масштабе пары физических объектов разница между таким алгоритмом и использующим GPS несущественна. Однако если речь идет об оцифровке зданий или даже городов, новый алгоритм Meta сможет легко обойти конкурентов благодаря меньшему объему обрабатываемых данных.
AR-очки, которые показывают нам, где мы оставили свои ключи, например, требуют фундаментально новых технологий, которые помогают ИИ понимать расположение и размеры незнакомой, постоянно меняющейся среды без ресурсоемких вычислений и предварительно загруженных карт. Как людям, нам не нужно знать точное расположение или длину нашего журнального столика, чтобы иметь возможность ходить вокруг него, не натыкаясь на его углы.
– объяснили инженеры.
Этот же принцип используется и в новой модели. Эта система использует технику, известную как визуальная адометрия. Она позволяет ИИ определять свое местоположение на основе визуальных данных – например, если робот с поддержкой этой системы подойдет к стене, а затем развернется на 90 градусов, то он запомнит, что двигаться назад больше не имеет смысла и учитывать это, прокладывая новый маршрут. В компании утверждают, что эта методика может использоваться для создания эффективных нейронов без аннотаций от человека.
Чтобы еще больше повысить эффективность ИИ, Meta создала коллекцию обучающих данных Habitat-Web. В этой библиотеке представлено более 100 тысяч разных методов объектно-целевой навигации. Технология связывает симулятор Habitat, работающий через обычный веб-браузер с сервисом Mechanical Turk и позволяет дистанционно управлять виртуальными работами в любом масштабе.
По заявлениям разработчика, агенты ИИ, обученные на этих данных, могут достигать самых "современных результатов" - например, они учатся искать объекты, заглядывая в комнаты и проверяют скрытые углы.
Читайте на сайте Эксперты не поверили в зарождение сознания в искусственном интеллекте Google
Новый модульный подход
Вдобавок команда Meta создала модульный подход "подключи и работай". Это решение помогает работам обобщать разнообразные наборы семантических навигационных задач посредством системы обучения с нулевым опытом. Идея состоит в том, чтобы помочь агентам ИИ адаптироваться на лету без ресурсоемких карт и обучения. Модель один раз "захватывает" основные данные визуальной навигации, а затем применяет их к разным задачам в трехмерной среде без повторного обучения.
В результатах исследования инженеры рассказали, что новые модели требуют в 12,5 раза меньше учебных данных и показывают успешные результаты на 14% чаще конкурентов. В перспективе разработчики хотят внедрить такие модели в метавселенную компании, а также в будущие AR/VR-гарнитуры.