У Массачусетському технологічному інституті розробили алгоритм, який дозволяє створити перекладача зі спеціалізацією на одній з втрачених мов, повідомляється на сайті інституту.
Актуально Нова технологія значно прискорить час навчання нейромереж
Що відомо про розробку
Повідомляється, що програма буде розшифровувати діалекти, на яких давно ніхто не говорить, від яких залишилися лише деякі записи, але майже немає відомостей про синтаксис, граматику і словниковий запас. Людині-лінгвісту в такій ситуації не вистачає даних для роботи, але штучний інтелект може згенерувати відсутні фрагменти і прочитати стародавні написи. Він самостійно підбиратиме споріднені мови, що мають спільні риси, і вивчатиме їх через цей зв'язок.
Лінгвістика показує, що всі мови розвиваються за певними схемами. Одні слова запозичуюють звучання з інших. Знаючи такі закономірності і маючи в якості основи відому мову, можна змоделювати безліч варіантів утворення слів. Аналізуючи ці дані, штучний інтелект вибудує найбільш правдоподібний варіант мови, якою могли б говорити люди.
Регіна Барзілай – одна з авторів розробки / фото mitibmwatsonailab
Авторами розробки є професор Регіна Барзілай і аспірант Джамінг Луо. Перші експерименти з алгоритмом довели правоту тих вчених, які стверджували, що Іберійська мова не є спорідненою мові басків. Зараз розробляють систему аналізу семантичного наповнення мови, щоб можна було виділяти ключові слова і здійснювати їх пошук по контексту. Наприклад, якщо зустрічається ім'я полководця, яке неможливо перекласти, але вказано приблизне місце і час битви, ШІ зможе знайти в історичних хроніках цю подію і таким чином дізнатися, як звали воїна.