С единой фотографии: искусственный интеллект создает трехмерные головы для конференций

Разработчики NVIDIA AI представили нейросеть, которая может создавать трехмерную голову человека на основе одной лишь фотографии. Объект реагирует на широкий спектр манипуляций — может поворачиваться в стороны, менять направление взгляда.

Nvidia – одна из лидеров в разработке генеративных моделей искусственного интеллекта. Эти алгоритмы имеют большой потенциал в сфере развлечений и видеоигр. Группа специалистов компании опубликовала статью с описанием новой модели. Результаты работы свидетельствуют, что новый алгоритм превосходит другие методы в стандартных тестах, в том числе их же нейросеть vid2vid, которую они разработали в прошлом году, пишет VentureBeat.

Интересно До одной фразы: искусственный интеллект сократит длинные научные статьи

Что известно

Кроме того, ИИ достиг стандарта сжатия Н.264 для видео высокого качества, используя на 90 процентов меньше ширины полосы частот, чем аналоги.

Модифицируя только трансформацию ключевых точек, мы можем генерировать видео. Передавая только трансформации ключевых точек, мы смогли достичь гораздо более высокого коэффициента сжатия, чем методы, существующие сейчас. Существенно снизив ширину полосы и обеспечив более полный опыт, мы думаем, мы сделали важный шаг в будущее видеоконференций,
– пишут авторы в своем исследовании.

Новая модель вышла после дебюта Maxine, сервиса видеоконференций Nvidia. Дополнительно к виртуальному фону, как в Zoom, Maxine оснащена другими функциями с поддержкой ИИ – снижением уровня шума, коррекцией положения лица на экране и альтернативным ИИ-аватаром.

Демонстрация возможностей алгоритма: видео

Связанные темы:

Техно

Искусственный интеллект