В Массачусетском технологическом институте разработали алгоритм, который позволяет создать переводчика со специализацией на одном из утраченных языков, сообщается на сайте института.
Актуально Новая технология значительно ускорит время обучения нейросетей
Что известно о разработке
Сообщается, что программа будет расшифровывать диалекты, на которых давно никто не говорит, от которых остались лишь некоторые записи, но почти нет сведений о синтаксисе, грамматике и словарном запасе. Человеку-лингвисту в такой ситуации не хватает данных для работы, но искусственный интеллект может сгенерировать недостающие фрагменты и прочитать древние надписи. Он самостоятельно будет подбирать родственные языки, имеющие общие черты, и изучать их через эту связь.
Лингвистика показывает, что все языки развиваются по определенным схемам. Одни слова заимствуют звучание из других. Зная такие закономерности и имея в качестве основы известную речь, можно смоделировать множество вариантов образования слов. Анализируя эти данные, искусственный интеллект выстроит наиболее правдоподобный вариант языка, на котором могли бы говорить люди.
Регина Барзилай – одна из авторов разработки / фото mitibmwatsonailab
Авторами разработки являются профессор Регина Барзилай и аспирант Джаминг Луо. Первые эксперименты с алгоритмом доказали правоту тех ученых, которые утверждали, что Иберийский язык не является родственным языку Басков. Сейчас разрабатывают систему анализа семантического наполнения языка, чтобы можно было выделять ключевые слова и осуществлять их поиск по контексту. Например, если встречается имя полководца, которое невозможно перевести, но указано примерное место и время битвы, ИИ сможет найти в исторических хрониках это событие и таким образом узнать, как звали воина.