Дослідники вперше продемонстрували роботу супутника, який здатний самостійно визначати, що саме він бачить із космосу, без необхідності надсилати всі отримані зображення на Землю для подальшого аналізу. Про це пише Sciencealert.
Дивіться також NASA інвестує сотні мільйонів у посадкові апарати: куди вони полетять
Як супутник навчився "розуміти" свої знімки?
Йдеться про супутник YAM-9, на борту якого працює система NAVI-Orbital, створена фахівцями Лабораторії реактивного руху NASA (JPL) спільно з компанією Loft Orbital. Опис розробки опублікований на сервері препринтів arXiv. Це означає, що дослідження ще не пройшло незалежне наукове рецензування.
Традиційно супутники фотографують поверхню Землі, після чого передають величезні масиви даних на наземні станції. Уже там знімки аналізують люди або спеціалізовані алгоритми.
Однак сучасні супутники створюють настільки багато зображень, що швидкість їх передачі, доступна пропускна здатність каналів зв'язку та енергоспоживання поступово стають серйозними обмеженнями. Нова технологія пропонує інший підхід – аналізувати інформацію безпосередньо на орбіті.
Що вміє новий штучний інтелект?
На відміну від традиційних супутникових систем, NAVI-Orbital дозволяє оператору ставити завдання звичайною людською мовою. Наприклад, можна дати команду: "Знайди всі великі залізничні вузли в цій країні" або попросити знайти мости, автомагістралі, водойми чи ознаки стихійних лих, зокрема повеней або лісових пожеж.
Раніше для того, щоб навчити супутник розпізнавати новий об'єкт, потрібно було створювати нові командні послідовності, повторно перевіряти програмне забезпечення та завантажувати нові виконувані файли. У підході NAVI-Orbital достатньо просто змінити текстовий запит, – пояснюють автори роботи.
За словами старшої менеджерки з маркетингу Loft Orbital Сари Престон, тепер штучний інтелект може самостійно "бачити" зображення та визначати, що саме шукає оператор. Це суттєво скорочує час між отриманням знімка та його аналізом.
Яка модель ШІ працює на супутнику?
В основі системи лежить Gemma 3 – компактна модель штучного інтелекту, створена Google DeepMind. На відміну від великих мовних моделей, які зазвичай працюють у потужних дата-центрах, Gemma 3 достатньо компактна, щоб запускатися навіть на ноутбуках.
Для супутників це має принципове значення, адже вони обмежені розмірами, енергоспоживанням і продуктивністю бортових комп'ютерів. Gemma 3 є мультимодальною моделлю, яка одночасно працює з текстом і зображеннями.
Система NAVI-Orbital складається з трьох окремих AI-агентів:
- координатора, який керує виконанням завдань;
- детектора, що аналізує, класифікує та коротко описує зображення;
- діалогового агента, який дозволяє оператору ставити запитання щодо отриманих результатів.
Завдяки цьому технічним спеціалістам більше не потрібно програмувати окремий алгоритм для кожної нової місії. Під час наземних випробувань систему протестували на 7960 супутникових знімках. Вона змогла правильно класифікувати їх із точністю 88,2 %. ШІ розпізнавав житлову забудову, пляжі, сільськогосподарські угіддя, гірські райони та інші типи місцевості. Поки що система виконала лише два реальні сеанси роботи безпосередньо на орбіті, але розробники вже планують нові випробування.
Для чого це може знадобитися?
Дослідники вважають, що технологія матиме значно ширше застосування, ніж просто супутникові знімки Землі. У майбутньому подібні AI-помічники можуть працювати на місячних і марсіанських роверах.
"Ми подумали: астронавти працюватимуть у герметичних скафандрах, їм незручно користуватися клавіатурою. Чому б не дати їм інтерактивного AI-помічника, як у відеоіграх чи фантастичних фільмах?" – пояснив старший системний інженер Хуан Дельфа Вікторія.
У Loft Orbital прогнозують, що мережа приблизно зі 100 таких супутників дозволить організувати майже безперервне спостереження за всією Землею в режимі реального часу. У такому випадку супутники не передаватимуть усі отримані знімки на Землю. Вони самостійно аналізуватимуть ситуацію й надсилатимуть повідомлення лише тоді, коли виявлять потрібну подію – наприклад, нафтову пляму біля узбережжя, нове будівництво поблизу державного кордону, дим від масштабних пожеж або інші визначені оператором об'єкти.
Які ризики бачать автори дослідження?
Попри перспективність технології, розробники визнають, що вона ще потребує вдосконалення. Зокрема, необхідно підвищити точність роботи системи та перевірити її стійкість до навмисно шкідливих або некоректних запитів.
Крім того, дослідники звертають увагу на етичні питання. Передача важливих рішень щодо інтерпретації супутникових знімків штучному інтелекту може викликати дискусії, особливо якщо технологію використовуватимуть для військових, прикордонних або розвідувальних завдань.
У своїй роботі автори наголошують, що нинішні результати лише демонструють принципову працездатність системи, а не підтверджують її повну надійність у всіх можливих сценаріях. Водночас вони переконані, що подібні AI-системи незабаром можуть стати стандартом для космічних апаратів нового покоління.


