В Google навчили нейромережу створювати відео лише з двох кадрів

Нейромережі вже навчилися самостійно анімувати статичні зображення та навіть поліпшувати якість старих відео. Однак це не все, на що здатний штучний інтелект: дослідний підрозділ Google по роботі з ШІ анонсував новий алгоритм, який домальовує відеоряд на основі першого та останнього кадрів.

Як працює нейромережа? Як повідомляється на сайті arxiv.org, розроблена співробітниками пошукового гіганта нейромережа складається з трьох компонентів.

Читайте також: Як у фантастичному фільмі: IKEA розробила технологію, що сканує мозок покупців

Декодер двовимірного зображення конвертує вхідні дані в спеціальний формат для аналізу, генератор прихованого тривимірного уявлення навчається на основі отриманої інформації, а відеогенератор декодує отриману інформацію в нові кадри майбутнього відео.

Суть експеременту. Щоб перевірити роботу технології, розробники стиснули три набори кадрів до роздільної здатності 64x64 пікселя. Кожен зразок містив в цілому 16 кадрів, 14 з яких треба було створити штучному інтелекту.

Кадри згеровані штучним інтелектом

Дослідники запускали алгоритм 100 разів для кожної пари вихідних зображень, при цьому навчання нейромережі зайняло близько 5 днів з використанням відеокарти NVIDIA Tesla V100. В результаті згенеровані послідовності відповідали заданим початковим і кінцевим кадрам і були схожі за стилем.

Які перспективи у нейромережі? У перспективі, за словами розробників, алгоритм може стати корисним інструментом для генерації відео на основі мінімального набору вхідної інформації.

Більше новин, що стосуються подій зі світу технологій, ґаджетів, штучного інтелекту, а також космосу читайте у розділі Техно

Пов'язані теми:

Техно

Штучний інтелект