Microsoft представила ИИ-инструмент, который превращает фото в реалистичные видео

23 апреля 2024, 13:31
Читати новину українською

Источник:

Microsoft

Новый инструмент искусственного интеллекта от Microsoft может превращать фотографии в реалистичные видео с людьми, которые разговаривают и поют. Создатели признают, что он имеет потенциал для злоупотреблений, поэтому планируют вводить ограничения и предохранители.

Детали

Microsoft Research Asia представила новый экспериментальный инструмент искусственного интеллекта под названием VASA-1. Он берет неподвижное изображение человека или даже его рисунок, а также имеющийся аудиофайл, чтобы создать из них реалистичное видео с лицом, разговаривающего или поющего. ИИ имеет возможность генерировать выражения и движения головы для существующего неподвижного изображения, а также соответствующие движения губ, чтобы соответствовать произнесенным словам или песни.

Смотрите также GPT-4 приблизился к врачам по уровню оценки зрения

Исследователи загрузили множество примеров на страницу проекта, и некоторые результаты – хотя и не все – выглядят настолько хорошо, что могут обмануть людей, заставив их думать, что перед ними настоящая видеосъемка.

Хотя движения губ и головы в примерах все еще могут выглядеть несколько роботизированными и несинхронными при внимательном просмотре, все же очевидно, что технология может быть использована для легкого и быстрого создания дипфейков реальных людей. Сами исследователи осознают этот потенциал и решили не выпускать "онлайн-демонстрацию, API, продукт, дополнительные детали реализации или любые связанные предложения", пока не будут уверены, что их технология "будет использоваться ответственно и в соответствии с надлежащими правилами". Вероятно, ИИ также не будет срабатывать в случае известных личностей, таких как президенты, бизнесмены, инфлюенсеры, блогеры и другие.


Пример работы технологии / Фото Microsoft

Исследователи считают, что их технология имеет множество преимуществ, несмотря на ее потенциал для злоупотреблений. По их словам, она может быть использована для повышения образовательной справедливости, а также для улучшения доступности для тех, кто имеет проблемы с коммуникацией, возможно, путем предоставления им доступа к аватару, который может общаться за них. Он также может обеспечить общение и терапевтическую поддержку тем, кто в ней нуждается, считают они, намекая на то, что VASA-1 может быть использован в программах, которые предлагают доступ к персонажам с искусственным интеллектом, с которыми люди смогут разговаривать.