Открытый корпус вепсского и карельского языков ВепКар — один из важнейших инструментов сохранения национальных языковНа заседании Президиума РАН в Москве обсудили вопросы фундаментальных проблем лингвистики и

Ирма Муллонен на заседании Президиума РАН

18 апреля 2024

Открытый корпус вепсского и карельского языков ВепКар — один из важнейших инструментов сохранения национальных языковНа заседании Президиума РАН в Москве обсудили вопросы фундаментальных проблем лингвистики и задачи корпусных исследований языков. Ученые Института языка, литературы и истории (ИЯЛИ) КарНЦ РАН Ирма Муллонен и Ирина Новак представили основные результаты работы над Открытым корпусом вепсского и карельского языков (ВепКар), которые ведутся в Карелии 15 лет. На сегодняшний день в базе содержится 6 тысяч текстов разного размера.

9 апреля в Москве прошло заседание Президиума РАН, посвященное вопросам фундаментальных проблем лингвистики и задачам корпусных исследований языков. Научные сотрудники Института языка, литературы и истории (ИЯЛИ) КарНЦ РАН Ирма Муллонен и Ирина Новак выступили с докладом о результатах работы над Открытым корпусом вепсского и карельского языков ВепКар. Корпус создавался 15 лет назад с целью сохранения и системного изучения языков прибалтийско-финских народов Карелии. Программированием занимаются специалисты Института прикладных математических исследований (ИПМИ) КарНЦ РАН.ВепКар решает несколько основных задач. Помимо исследовательской, это сохранение и накопление письменных текстов, а также образцов звучащей карельской и вепсской речи. Сейчас в нем 6 тысяч текстов, которые содержат 2 миллиона словоупотреблений.— Любой желающий может пользоваться ВепКаром как электронной библиотекой и как полноценным электронным словарем. Кроме того, на основе данных корпуса разрабатываются приложения с упрощенным интерфейсом, такие как Мультимедийный словарь карельского языка для широкого круга пользователей. Таким образом, корпус является инструментом сохранения карельского и вепсского языков и дает большие возможности для тех, кто их учит. Можно найти слово и проверить, как оно звучит, как правильно пишется, какими грамматическими особенностями обладает, — пояснила Ирма Муллонен, член-корреспондент РАН, главный научный сотрудник Сектора языкознания Института языка, литературы и истории КарНЦ РАН.Основной доклад на заседании касался современного этапа развития корпусной лингвистики. В своем выступлении Академик РАН Владимир Плунгян особое внимание уделил терминологии и методологии этого направления. В докладе была представлена краткая история развития корпусной лингвистики в России и в мире, обозначены современные приоритеты этой области исследований. Кроме того, докладчик сообщил о высокой востребованности главного проекта отечественной корпусной лингвистики — Национального корпуса русского языка.
Подробнее о представленных на заседании темах можно прочитать на сайте РАН.— В России сейчас создается не один корпус национальных языков. Однако ВепКар, создающийся в КарНЦ РАН, продвинулся дальше других и в наполнении материалами, и в их грамматической и семантической разметке. Он способен сейчас работать как полноценная платформа для проведения научных исследований. Видимо, поэтому нам и предложили выступить. По итогам заседания президиум РАН отметил необходимость поддержки корпусных исследований в стране. Одна из ближайших конкретных мер такой поддержки - это проведение Российским научным фондом тематического конкурса проектов создания корпусных ресурсов по языкам России. Надеемся, что такая специальная программа РНФ будет объявлена и мы в ней поучаствуем,— подытожила Ирма Муллонен.Фото: www.ras.ru