Штучний інтелект розшифрує тексти з давно втрачених мов

Олександр Гайдамашко

Штучний інтелект навчили розшифровувати тексти втрачених мов

Штучний інтелект розшифрує тексти з давно втрачених мов / Ілюстративне фото

Вчені створили систему штучного інтелекту, яка допомагатиме лінгвістам перекладати тексти з мертвих і втрачених мов.

У Массачусетському технологічному інституті розробили алгоритм, який дозволяє створити перекладача зі спеціалізацією на одній з втрачених мов, повідомляється на сайті інституту.

Актуально Нова технологія значно прискорить час навчання нейромереж

Що відомо про розробку

Повідомляється, що програма буде розшифровувати діалекти, на яких давно ніхто не говорить, від яких залишилися лише деякі записи, але майже немає відомостей про синтаксис, граматику і словниковий запас. Людині-лінгвісту в такій ситуації не вистачає даних для роботи, але штучний інтелект може згенерувати відсутні фрагменти і прочитати стародавні написи. Він самостійно підбиратиме споріднені мови, що мають спільні риси, і вивчатиме їх через цей зв'язок.

Лінгвістика показує, що всі мови розвиваються за певними схемами. Одні слова запозичуюють звучання з інших. Знаючи такі закономірності і маючи в якості основи відому мову, можна змоделювати безліч варіантів утворення слів. Аналізуючи ці дані, штучний інтелект вибудує найбільш правдоподібний варіант мови, якою могли б говорити люди.

Регіна Барзілай
Регіна Барзілай – одна з авторів розробки / фото mitibmwatsonailab

Авторами розробки є професор Регіна Барзілай і аспірант Джамінг Луо. Перші експерименти з алгоритмом довели правоту тих вчених, які стверджували, що Іберійська мова не є спорідненою мові басків. Зараз розробляють систему аналізу семантичного наповнення мови, щоб можна було виділяти ключові слова і здійснювати їх пошук по контексту. Наприклад, якщо зустрічається ім'я полководця, яке неможливо перекласти, але вказано приблизне місце і час битви, ШІ зможе знайти в історичних хроніках цю подію і таким чином дізнатися, як звали воїна.