В Google навчили нейромережу створювати відео лише з двох кадрів
Нейромережі вже навчилися самостійно анімувати статичні зображення та навіть поліпшувати якість старих відео. Однак це не все, на що здатний штучний інтелект: дослідний підрозділ Google по роботі з ШІ анонсував новий алгоритм, який домальовує відеоряд на основі першого та останнього кадрів.
Як працює нейромережа? Як повідомляється на сайті arxiv.org, розроблена співробітниками пошукового гіганта нейромережа складається з трьох компонентів.
Читайте також: Як у фантастичному фільмі: IKEA розробила технологію, що сканує мозок покупців
Декодер двовимірного зображення конвертує вхідні дані в спеціальний формат для аналізу, генератор прихованого тривимірного уявлення навчається на основі отриманої інформації, а відеогенератор декодує отриману інформацію в нові кадри майбутнього відео.
Суть експеременту. Щоб перевірити роботу технології, розробники стиснули три набори кадрів до роздільної здатності 64x64 пікселя. Кожен зразок містив в цілому 16 кадрів, 14 з яких треба було створити штучному інтелекту.
Кадри згеровані штучним інтелектом
Дослідники запускали алгоритм 100 разів для кожної пари вихідних зображень, при цьому навчання нейромережі зайняло близько 5 днів з використанням відеокарти NVIDIA Tesla V100. В результаті згенеровані послідовності відповідали заданим початковим і кінцевим кадрам і були схожі за стилем.
Які перспективи у нейромережі? У перспективі, за словами розробників, алгоритм може стати корисним інструментом для генерації відео на основі мінімального набору вхідної інформації.
Більше новин, що стосуються подій зі світу технологій, ґаджетів, штучного інтелекту, а також космосу читайте у розділі Техно