В Сибири создали алгоритм для перевода дореволюционных изданий

@Rossijskaja gazeta

Фото: iStock

Новосибирские ученые создали систему, позволяющую переводить дореволюционные тексты в современную русскую орфографию

Старые книги сегодня непонятны для многих россиян. После реформы орфографии русского языка изменились многие правила. Разработанная учеными система автоматически приведет текст в привычный для читателя вид практически без участия человека.

- В старом правописании морфем можно выделить несколько групп слов, - сообщает официальное издание СО РАН "Наука в Сибири". - Исследователи сопоставили устаревшее и современное написание для каждой из групп и, выявив закономерности между ними, описали правила перевода, лежащие в основе программы.

После завершения первого этапа перевода программа переходит к этапу замены устаревших букв.

Алгоритм создан для работы с большими объемами текстов. Он может выполнять рутинную работу редакторов и дает ученым дополнительные инструменты для анализа текстов.

Исследователи рассчитывают, что проект будет востребован массовыми пользователями, например, библиотеками с большим объемом дореволюционных фондов.

Анализ
×
СО РАН; СИБИРСКОЕ ОТДЕЛЕНИЕ РАН
Сфера деятельности:Образование и наука
137