Самое большое расширение в истории: Google Translate получит 110 языков, среди которых крымскотатарский
Переводчик Google переживет крупнейшее за всю свою историю расширение, получив 110 новых языков в свою платформу. Это расширение имеет целью обеспечить поддержку перевода на языки, на которых говорят более 614 миллионов носителей, или примерно 8% населения планеты.
Среди новых языков – такие широко распространенные, как кантонский и панджаби (шахмукхи), а также языки малых коренных народов, некоторые из которых находятся в процессе возрождения. Около четверти новых языков происходят из Африки, что является самым большим расширением африканских языков в Google сегодня. Среди них фон, киконго, луо, га, свати, венда и волоф.
Читайте на сайте Бесплатное обучение от Google: компания приглашает украинский бизнес
Одним из заметных языков является крымскотатарский, тюркский язык, классифицирован ЮНЕСКО как такой, что требует дополнительной защиты. После того, как в январе 2023 года Украина создала Национальную комиссию по вопросам крымскотатарского языка, к нему снова вернулось внимание.
Другие важные дополнения включают:
- Афар: Тональный язык, на котором говорят в Джибути, Эритрее и Эфиопии, благодаря значительному вкладу общины волонтеров.
- Менский: Кельтский язык острова Мэн, возрожден после почти полного исчезновения в 1974 году.
- Нко: Стандартизированная форма западноафриканского языка мандинка с уникальным алфавитом, изобретенным в 1949 году.
- Тамазигский (амазигский): Берберский язык из Северной Африки, имеющий письменные формы как латиницей, так и шрифтом тифинаг.
- Ток-писин: Креольский язык на основе английского, что служит языком межэтнического общения в Папуа-Новой Гвинее.
Как и почему Google добавляет новые языки?
Подход Google к добавлению новых языков предусматривает предоставление приоритета самым распространенным разновидностям и тесное сотрудничество с лингвистическими экспертами и носителями языков. Это гарантирует, что переводы будут максимально точными и полезными. Например, модель ромского языка создает текст, наиболее близкий к южно-волоскому ромскому языку, но с элементами других диалектов.
Смотрите также Google уберет бесконечную прокрутку в результатах поиска
Интеграция PaLM 2 позволяет эффективнее изучать близкородственные языки, такие как языки, подобные хинди (авадхи и марвади), и французские креольские языки (сейшельский креольский и маврикийский креольский). С развитием технологий Google планирует и в дальнейшем расширять поддержку большего количества языковых разновидностей и правописных стандартов, что будет способствовать дальнейшему расширению глобального охвата и доступности Google Переводчика.