Google Translate использует ИИ для перевода на 110 новых языков

Google Translate использует ИИ для перевода на 110 новых языков

  • Последнее расширение Google Translate охватывает языки, на которых говорят более 614 миллионов человек, то есть около 8% населения мира.
  • Новые языки варьируются от широко распространенных до диалектов коренных народов и даже языков, носителей которых в настоящее время нет.
  • Языковая модель Google PaLM 2 сыграла решающую роль в добавлении языков, родственных хинди и французскому креольскому языку.
  • Около четверти новых языков составляют африканские языки, такие как фон, киконго, луо, га, свати, венда и волоф.

Как наблюдатель, глубоко ценящий языковое и культурное разнообразие, я в восторге от последнего расширения Google Translate, добавившего 110 новых языков. Учитывая, что на этих языках говорят более 614 миллионов человек, или около 8% мирового населения, это обновление действительно впечатляет.


Я заметил, что искусственный интеллект играет значительную роль в развитии Google Translate: добавление не менее 110 новых языков означает его самое существенное расширение на сегодняшний день.

В недавнем сообщении в блоге Google раскрыл планы масштабного расширения, которое затронет более 614 миллионов человек по всему миру, или примерно 8% мирового населения. Разнообразие поразительно: оно включает не только широко распространенные языки, которыми пользуются более 100 миллионов человек, но и драгоценные диалекты, ценимые общинами коренных народов.

Google демонстрирует свою приверженность защите исчезающих языков, включая в свои языковые предложения даже те, для которых нет носителей языка.

Развивая это примечательное событие, Google в своем последнем расширении отдал приоритет африканским языкам, на которые приходится примерно четверть новых включений. Такие языки, как фон, киконго, луо, га, свати, венда и волоф, были интегрированы в Google Translate, что означает значительный прогресс в поддержке африканских языков.

Большая языковая модель Google PaLM 2 внесла значительный вклад в расширение Translate. Он приобретает знания родственных языков, способствуя интеграции менее известных языков, таких как авадхи и марвади, в языковую семью хинди, в дополнение к французским креольским языкам, таким как сейшельский и маврикийский.

В то же время приверженность Google языковому разнообразию очевидна, поскольку компания вводит широко распространенные языки, такие как кантонский диалект. Однако это расширение сопряжено с уникальными проблемами из-за сходства написания символов с мандаринским языком. Тем не менее, Google упорно пытается преодолеть эти препятствия. Яркой иллюстрацией этой приверженности может служить включение мэнского языка, кельтского языка с острова Мэн, который находился на грани исчезновения в 1974 году. Благодаря инициативам по возрождению, число свободно говорящих на нем с тех пор значительно выросло.

«Кроме того, в этом расширении используется письмо Шахмукхи, персидско-арабская адаптация, популярная в Пакистане, которая является доминирующим языком в этой стране, на котором говорит большинство ее населения».

Google понимает, что перевод языков — сложная задача, учитывая существование региональных нюансов, диалектов и орфографических различий. Например, цыганский язык создает уникальные проблемы из-за его многочисленных диалектов и отсутствия общепринятой стандартизированной версии.

Как наблюдатель, я бы сказал это так: перед своим последним расширением Google Translate претерпел значительное обновление еще в мае 2022 года, включив в него машинный перевод Zero-Shot. Эта революционная технология позволяет модели понимать новые языки, не полагаясь на предварительно переведенные данные. Это стало большим шагом вперед в машинном переводе, позволив Google преодолеть еще более широкие языковые различия.

Эта разработка является значительным достижением проекта Google «1000 языков» — инициативы, направленной на использование моделей искусственного интеллекта для облегчения поддержки 1000 ведущих языков мира.

Смотрите также

2024-06-28 05:23