Техно Штучний інтелект Новий штучний інтелект від Google створює музику за текстовим описом

Новий штучний інтелект від Google створює музику за текстовим описом

Автор:

Олександр Гайдамашко

15:31, 30 січня 2023

2 хв

Читать новость на русском

Google представив нейромережу для створення музики

Ілюстративне фото / Marcela Laskoski

Сьогодні на ринку можна знайти масу нейромереж для будь-яких цілей. Ми маємо ChatGPT для генерування тексту, DALL-E для створення зображень та новий VALL-E для імітації голосу людини. Тепер настав час музики.

Джерело:

Google

За розробкою стоїть компанія Google. Вона розробила нейромережевий сервіс MusicLM, завдання якого полягає у створенні музичних творів. Приклади робіт можна послухати на демо-сайті.

Цікаво Штучний інтелект від Microsoft імітує будь-який людський голос

Як це працює

MusicLM генерує музику за текстовими запитами. Користувач може задати жанр, настрій, темп та інші бажані нюанси.

Ми представляємо MusicLM – модель, що генерує високоякісну музику з текстових описів, на кшталт "заспокійлива скрипкова мелодія, підкріплена спотвореним гітарним рифом",
– розповідають розробники на сайті.

MusicLM розглядає процес умовної генерації музики як ієрархічну задачу моделювання послідовності, і генерує музику з частотою 24 кілогерців, яка залишається незмінною протягом декількох хвилин. Розробники запевняють, що MusicLM перевершує попередні системи як за якістю звуку, так і за дотриманням текстового опису.

Нейромережа також може об'єднувати кілька різних творів в один загальний. Для цього в анотації потрібно вказати описи для кожного з них.
Крім того, можна вибрати рівень володіння інструментами — наприклад, для того, щоб композицію начебто зіграв музикант-початківець або, навпаки, віртуоз.
Інструкції також можуть надаватись і в формі звуків. Наприклад, користувач наспівує чи насвистує мелодію, а нейромережа адаптує її до повноцінного треку з урахуванням стилю.

Нейромережа не позбавлена недоліків. Іноді можна помітити спотворення в звуці, а генерувати вокал вона хоч і намагається, але майже не вміє — замість осмислених слів виходить якась плутанина.

Випробувати MusicLM самостійно поки що не вийде, адже технологія перебуває на початковій стадії розробки й доступна тільки її творцям.