На Камчатке разработают ИИ-корпус для сохранения корякского языка

Камчатка, язык, ИИ, проект, культура

Камчатский государственный университет имени Витуса Беринга совместно с НИУ ВШЭ запускает проект по созданию цифрового корпуса корякского языка с использованием технологий искусственного интеллекта.

Этот язык относится к числу исчезающих: носители в основном проживают в отдаленных северных поселениях, а молодое поколение переходит на русский. Ученые намерены сохранить язык в цифровой форме, собрав тексты, аудиозаписи и лингвистические данные в единую базу.

Исследователи формируют размеченный корпус, который позволит обучать нейросетевые модели и разрабатывать прикладные решения — от переводчиков до образовательных сервисов. Из-за ограниченного объема данных специалисты применяют методы, рассчитанные на работу с малыми выборками, сочетая автоматическую обработку с ручной разметкой.

Материалы для проекта собирают в ходе экспедиций на север Камчатки, где фиксируют живую речь и изучают языковую структуру. Параллельно команда создает цифровые продукты, включая словари, обучающие приложения и сервисы на корякском языке.

Фото: КамГУ им. Беринга