Тема сохранения культурного кода и языкового многообразия в глобальной цифровой среде с каждым годом звучит все острее, именно этой теме была посвящена одна из секций RIGF 2026.
«Что такое культурный код? Это ключ к пониманию культуры народа, его уникальных особенностей и истории. Он передается через язык, искусство, традиции. И язык здесь – не просто инструмент коммуникации, а главный носитель смыслов», – так начал секцию ее ведущий директор Координационного центра Андрей Воробьев.
Участники секции задались вопросом: а что происходит с культурным кодом, когда жизнь все больше перетекает в цифровую среду? Какие цифровые технологии работают на сохранение языков?
«Если язык не представлен в интернете – он постепенно уходит из повседневной жизни. Если нет раскладок клавиатуры, нет словарей, нет систем машинного перевода, то пользоваться языком в цифровой среде становится крайне сложно. Это не гипотетическая угроза, а реальность, с которой сталкиваются десятки малых языков по всему миру», – подчеркнул Андрей Воробьев.
Сергей Чумарев (МИД России) отметил, что основная угроза заключается в исчезновении носителей языка, когда молодое поколение перестает использовать для общения национальный язык и перестает быть его носителем. Он подчеркнул, что Россия вносит значительный вклад в цифровизацию языков коренных народов, в том числе в рамках Международного десятилетия языков коренных народов, которое реализуется под эгидой ЮНЕСКО в 2022-2023гг. Причем процесс цифровизации языков идет не только за счет поддержки со стороны государства, но и со стороны общества, когда этими вопросами занимаются активисты на местах, поддерживающие родные языки.
«Элемент государственно-частного партнерства в этой области присутствует практически у всех стран с многонациональным населением», – заключил Сергей Чумарев.
Осенью прошлого года на Всемирной конференции по развитию электросвязи (WTDC) в Баку ICANN предложил разработать совместно с МСЭ новые индикаторы, которые позволят оценивать степень адаптации принципов универсального принятия многоязычных доменных имен и адресов электронной почты в разных странах. Фарид Нахли, координатор программ регионального офиса СНГ Международного союза электросвязи, в своем выступлении отметил, что индикаторы МСЭ часто фигурируют в целевых метриках администраций связи.
«Метрики, оценивающие степень внедрения принципов универсального принятия в технические системы публичных и государственных сервисов, могли бы стать дополнительной мотивацией для самых разных стран, чтобы обратить внимание на этот вопрос. Однако инициатива по их разработке должна быть предложена профильным сообществом», – рассказал спикер.
Тимур Цыбиков (ФАДН) рассказал о результатах масштабного мониторинга состояния и развития языков народов России в сфере информационных технологий, который провело Федеральное агентство по делам национальностей. В мониторинге участвовал 41 субъект Российской Федерации, была собрана информация по 70 языкам народов России. С 2024 года выросло число языков, для которых созданы электронные словари: с 59 в 2024 году до 68 в 2025. Для 42 языков уже созданы языковые корпусы, а цифровая клавиатура разработана для 59 языков.
Александр Болховитянов (Яндекс), напомнил, что в России проживают представители 194 национальностей, которые являются носителями более чем 300 языков, и 150 из них языки народов России.
«Но собрать эти языки в корпуса могут только представители регионов – без их участия нам не справиться, это очень сложная задача», – рассказал спикер.
Также он отметил, что процесс цифровизации влияет на эволюцию языков: в языках появляются новые слова, отражающие современную реальность и новые понятия. Эта работа ведется компанией в рамках реализации проекта «Языки народов России».
О важности многоязычия для современного общества рассказал Сергей Марков (Сбербанк). Он подчеркнул, что в мире существует более 7000 языков, каждый из которых несет культурное и лингвистическое наследие, потеря этого наследия обедняет человечество. Сохранению этих языков во многом способствуют большие языковые модели (LLM): благодаря им поддерживаются малоресурсные языки, многие из которых находятся на грани исчезновения, количество текстовых материалов на них ограничено. При этом многоязычные модели улучшают качество машинного перевода: добавление многоязычных данных в обучающие корпуса LLM расширяют их языковые способности. Развивается и «интеллект» моделей – за счёт уникальных элементов культуры, представленных в различных языковых традициях. Кроме того, присутствует и этическая составляющая: разработка многоязычных моделей способствует более справедливому технологическому развитию, уменьшая доминацию нескольких самых популярных мировых языков.
Игорь Поздеев (Удмуртский федеральный исследовательский центр Уральского отделения РАН) рассказал о практических шагах, которые делаются для сохранения и развития удмуртского языка. В 2019 году был создан Национальный корпус удмуртского языка – информационно-справочная система, основанная на собрании удмуртских текстов в электронной форме. Спикер рассказал, что за эти годы в корпус было добавлено более 11 млн. словообразований, разработан корпус письменных памятников удмуртского языка и разработана программа автоматического определения частей речи на основе контекста (Part-of-Speech tagger). Также Игорь Поздеев рассказал о сотрудничестве с компанией Яндекс. В результате обновления модели перевода для удмуртского языка в Яндексе по замерам, сделанным в марте 2026 года, качество перевода с удмуртского на русский язык (udm-ru) и с русского на удмуртский язык (ru-udm) значительно улучшилось: с удмуртского на русский язык – в 4,5 раза, а с русского на удмуртский – в 7,86 раз.
Мария Колесникова (Координационный центр доменов .RU/.РФ) рассказала о том, что в 2025 году в домене .РФ был расширен список допустимых кириллических символов – теперь в нем поддерживаются 18 языков народов России помимо русского. В ближайшее время этот список будет дополнен, и в домене .РФ будут поддерживаться все государственные языки Республик Российской Федерации. Таким образом Координационный центр вносит свой вклад в сохранение и развитие многоязычия и культурного разнообразия народов нашей страны в цифровой среде.
Подводя итоги, Андрей Воробьев отметил, что Россия – одна из немногих стран, где задача цифрового сохранения языкового многообразия решается на системном уровне, и это приносит заметные результаты. При этом сохраняется ряд серьезных вызовов: от отсутствия символов в Unicode до дефицита датасетов и профильных специалистов. И их преодоление невозможно без активного участия носителей языков, волонтеров и региональных сообществ.