Найбільше розширення в історії: Google Translate отримає 110 мов, серед яких кримськотатарська

27 червня 2024, 19:02
Читать новость на русском

Перекладач Google переживе найбільше за всю свою історію розширення, отримавши 110 нових мов до своєї платформи. Це розширення має на меті забезпечити підтримку перекладу мовами, якими розмовляють понад 614 мільйонів носіїв, або приблизно 8% населення планети.

Серед нових мов – такі широко поширені, як кантонська та панджабі (шахмукхі), а також мови малих корінних народів, деякі з яких перебувають у процесі відродження. Близько чверті нових мов походять з Африки, що є найбільшим розширенням африканських мов у Google сьогодні. Серед них фон, кіконго, луо, га, сваті, венда та волоф.

Читайте на сайті Безкоштовне навчання від Google: компанія запрошує український бізнес

Однією з помітних мов є кримськотатарська, тюркська мова, класифікована ЮНЕСКО як така, що потребує додаткового захисту. Після того, як у січні 2023 року Україна створила Національну комісію з питань кримськотатарської мови, до неї знову повернулася увага.

Інші важливі доповнення включають:

  • Афар: Тональна мова, якою розмовляють у Джибуті, Еритреї та Ефіопії, завдяки значному внеску громади волонтерів.
  • Менська: Кельтська мова острова Мен, відроджена після майже повного зникнення у 1974 році.
  • Нко: Стандартизована форма західноафриканської мови мандінка з унікальним алфавітом, винайденим у 1949 році.
  • Тамазігська (амазігська): Берберська мова з Північної Африки, що має письмові форми як латиницею, так і шрифтом тифінаг.
  • Ток-пісін: Креольська мова на основі англійської, що слугує мовою міжетнічного спілкування в Папуа-Новій Гвінеї.

Як і чому Google додає нові мови?

Підхід Google до додавання нових мов передбачає надання пріоритету найпоширенішим різновидам і тісну співпрацю з лінгвістичними експертами та носіями мов. Це гарантує, що переклади будуть максимально точними та корисними. Наприклад, модель ромської мови створює текст, найбільш близький до південно-волоської ромської мови, але з елементами інших діалектів.

Дивіться також Google прибере нескінченну прокрутку в результатах пошуку

Інтеграція PaLM 2 дозволяє ефективніше вивчати близькоспоріднені мови, такі як мови, подібні до хінді (авадхі та марваді), та французькі креольські мови (сейшельська креольська та маврикійська креольська). З розвитком технологій Google планує й надалі розширювати підтримку більшої кількості мовних різновидів і правописних стандартів, що сприятиме подальшому розширенню глобального охоплення та доступності Google Перекладача.