У своєму дослідженні компанія зосередилася на "точково-цільовій навігаційній моделі" – системі, яка може переміщатися новими середовищами без будь-якої карти або GPS-датчика. Ця технологія застосовує алгоритми, що імітують розумові процеси людини у спрощеному форматі.
Не пропустіть Співробітника Google відсторонили від роботи він заявив, що штучний інтелект отримав свідомість
У масштабі пари фізичних об'єктів різниця між таким алгоритмом і тим, що використовує GPS, несуттєва. Однак, якщо мовиться про оцифрування будівель або навіть міст, новий алгоритм Meta зможе легко обійти конкурентів завдяки меншому обсягу даних, що обробляються.
AR-окуляри, які показують нам, де ми залишили свої ключі, наприклад, вимагають фундаментально нових технологій, які допомагають ШІ розуміти розташування та розміри незнайомого, постійно мінливого середовища без ресурсомістких обчислень та попередньо завантажених карток. Як людям, нам не потрібно знати точне розташування або довжину нашого журнального столика, щоб мати можливість ходити навколо нього, не натикаючись на його кути,
– пояснили інженери.
Той самий принцип використовується і в новій моделі. Ця система використовує техніку, відому як візуальна адометрія. Вона дозволяє ШІ визначати своє місце розташування на основі візуальних даних – наприклад, якщо робот з підтримкою цієї системи підійде до стіни, а потім розгорнеться на 90 градусів, то він запам'ятає, що рухатися назад більше не має сенсу і враховуватиме це, прокладаючи новий маршрут. У компанії стверджують, що ця методика може використовуватись для створення ефективних нейронних моделей без анотацій від людини.
Щоб ще більше підвищити ефективність ШІ, Meta створила колекцію навчальних даних Habitat-Web. У цій бібліотеці представлено понад 100 тисяч різних методів об'єктно-цільової навігації. Технологія пов'язує симулятор Habitat, що працює через звичайний веб-браузер, із сервісом Mechanical Turk і дозволяє дистанційно керувати віртуальними роботами у будь-якому масштабі.
За заявами розробника, агенти ШІ, навчені на цих даних, можуть досягати "найсучасніших результатів" – наприклад, вони вчаться шукати об'єкти, заглядаючи в кімнати та перевіряють приховані кути.
Читайте на сайті Експерти не повірили в зародження свідомості у штучного інтелекту Google
Новий модульний підхід
На додаток команда Meta створила модульний підхід "підключи та працюй". Це рішення допомагає роботам узагальнювати різноманітні набори семантичних навігаційних завдань за допомогою системи навчання з нульовим досвідом. Ідея полягає в тому, щоб допомогти агентам ШІ адаптуватися на льоту без ресурсомістких карт та навчання. Модель один раз "захоплює" основні дані візуальної навігації, а потім застосовує їх до різних завдань у тривимірному середовищі без повторного навчання.
У результатах дослідження інженери розповіли, що нові моделі вимагають у 12,5 раза менше навчальних даних та показують успішні результати на 14% частіше за конкурентів. У перспективі розробники хочуть впровадити такі моделі у метавсесвіт компанії, а також у майбутні AR/VR-гарнітури.