Группа ученых европейских стран определила цифровое представление 21 из 30 изученных языков как "несуществующее" или в лучшем случае "слабое".
Группа ученых европейских стран определила цифровое представление 21 из 30 изученных языков как "несуществующее" или в лучшем случае "слабое". В их числе баскский, шведский, датский, языки стран Балтии, греческий, финский, болгарский и другие. Отчет был приурочен к Европейскому дню языков, символизирующему важность развития богатого языкового и культурного наследия Европы.
Было установлено, что исландский, латвийский, литовский и мальтийский языки имеют наивысший риск исчезновения в цифровом мире, но и другие языки, такие как болгарский, греческий, венгерский и польский, тоже под угрозой.
Исследование, подготовленное более чем 200 экспертами и описанное в 31 частях на официальном онлайн-ресурсе исследовательских центров Многоязычного европейского технологического сообщества (Multilingual Europe Technology Alliance Network of Excellence, META-NET), оценило технологическую поддержку каждого из языков в четырех различных областях: машинный перевод, речевое взаимодействие, текстовый анализ и доступность языковых источников.
Несколько языков, в их числе исландский, латвийский, литовский и мальтийский, получили низший балл по всем четырем направлениям. Даже английский с его наилучшим результатом не может считаться имеющим "отличную поддержку" – только "хорошую". Голландский, французский, немецкий, итальянский и испанский получили оценку "посредственная поддержка". Такие языки как баскский, болгарский, каталонский, греческий, венгерский и польский имеют "фрагментарную поддержку", что также относит их к группе повышенного риска.
Языковые компьютерные технологии используются для обработки устной и письменной речи. Известные примеры: проверка орфографии и грамматики, цифровые "персональные помощники" (такие как Siri для iPhone), телефонные диалоговые системы и поисковые сайты.
Нехватка необходимого ПО для языков высокого риска означает, что они не смогут выжить в нынешнем цифровом мире. Языковые технологические системы зависят в первую очередь от больших массивов разговорных и письменных данных, которые трудно составить для языков с относительно небольшим числом носителей.
Окончательный вывод отчета таков: Европе нужны скоординированные широкомасштабные мероприятия для создания недостающих технологий и их переноса на языки, близкие к цифровому вымиранию.
Отметим, что 50% экономически активных жителей Латвии в возрасте от 18 до 55 лет одобряют введение в вузах программ, обучение по которым преимущественно проходило бы на английском, немецком, французском и языках других стран ЕС. Как показал опрос, проведенный по заказу телеканала LNT, 15% респондентов полностью поддерживают введение таких программ, а 35% - скорее поддерживают.