Реалістичність штучного інтелекту вийшла на новий рівень

16 лютого 2022, 12:29
Читать новость на русском

Джерело:

Sonantic

Інженери зі стартапу Sonantic навчили штучний інтелект неймовірній реалістичності мови завдяки внесенню дуже важливих змін в програму. Технологію вже застосовують в іграх.

Технологію, яка імітує людський голос, показали 14 лютого, навчивши зізнаватись у коханні. Її просто неможливо відрізнити від реальної людини.

Цікаво Військовий вертоліт Black Hawk здійснив перший автономний політ повністю без екіпажу

Новий рівень штучного інтелекту

  • В опублікованому ролику знялася справжня актриса, але її монолог повністю згенерували алгоритми.
  • У відео дівчина розмовляє з глядачем і зізнається йому в коханні, проте в кінці повідомляє, що насправді її "не існує".
  • У Sonantic розповіли, що за останні кілька місяців істотно підвищили реалістичність голосу. Цього досягли завдяки додаванню невеликих природних пауз, зітхань і інших звуків між словами.
  • Простіше кажучи, реальна людина говорить не просто з інтонацією, яку роботи й раніше могли копіювати, а з різноманітними додатковими звуками та паузами, які ми зчитуємо, але не помічаємо.

Демонстрація роботи штучного інтелекту: відео

Штучний голос на відео звучить цілком природно і дуже реалістично, особливо зітхання та сміх, які чудово вписані в її мову. Ось чому це так дивує, коли вона раптом зізнається: "Я не справжня. Я ніколи не народжувалась. І я ніколи не помру. Тому що я не існую"

  • Розробники також продемонстрували інтерфейс програми, яка використовується для генерування голосу.
  • У ній можна регулювати темп мови, змінювати інтонацію, швидкість і стиль, а також додавати допоміжні звуки між словами.
Нагадаємо. Стартап Sonantic оголосив про створення нейромережі для генерації мови з імітацією людських емоцій у 2020 році. За два роки розробникам вдалося домогтися великого прогресу. У перших роликах голос ШІ звучав не надто природно, а мову супроводжували спотворення. Компанія уже співпрацює з ігровими студіями. Її напрацювання використовували Obsidian Entertainment для генерації голосів деяких другорядних персонажів в The Outer Worlds. У серпні 2021 року стартап застосував технологію, щоб відтворити голос актора Вела Кілмера, який втратив можливість говорити в результаті раку гортані.