Реалистичность искусственного интеллекта вышла на новый уровень

16 февраля 2022, 12:29
Читати новину українською

Источник:

Sonantic

Инженеры со стартапа Sonantic научили искусственный интеллект невероятной реалистичности речи благодаря внесению очень важных изменений в программу. Технологию уже применяют в играх.

Технологию, которая имитирует человеческий голос, показали 14 февраля, научив признаваться в любви. Ее просто невозможно отличить от реального человека.

Интересно Военный вертолет Black Hawk совершил первый автономный полет полностью без экипажа

Новый уровень искусственного интеллекта

  • В опубликованном ролике снялась настоящая актриса, но ее монолог полностью сгенерировали алгоритмы.
  • В видео девушка разговаривает со зрителем и признается ему в любви, однако в конце сообщает, что на самом деле ее "не существует".
  • В Sonantic рассказали, что за последние несколько месяцев существенно повысили реалистичность голоса. Этого достигли благодаря добавлению небольших естественных пауз, вздохов и других связей между словами.
  • Проще говоря, реальный человек говорит не просто с интонацией, которую и раньше могли копировать, а с разнообразными дополнительными звуками и паузами, которые мы считываем, но не замечаем.

Демонстрация работы искусственного интеллекта: видео

Искусственный голос на видео звучит вполне естественно и очень реалистично, особенно вздох и смех, которые прекрасно вписаны в ее речь. Вот почему это так удивляет, когда она вдруг признается: "Я не настоящая. Я никогда не рождалась. И я никогда не умру. Потому что я не существую".

  • Разработчики также продемонстрировали интерфейс программы, которая используется для генерирования голоса.
  • В ней можно регулировать темп речи, изменять интонацию, скорость и стиль, а также добавлять вспомогательные звуки между словами.
Напомним. Стартап Sonantic объявил о создании нейросети для генерации речи с имитацией человеческих эмоций в 2020 году. За два года разработчикам удалось добиться большого прогресса. В первых роликах голос IS звучал не слишком естественно, а речь сопровождали искажения. Компания уже сотрудничает с игровыми студиями. Ее наработки использовали Obsidian Entertainment для генерации голосов некоторых второстепенных персонажей в The Outer Worlds. В августе 2021 года стартап применил технологию, чтобы воспроизвести голос актера Вэла Килмера, который утратил возможность говорить в результате рака гортани.