Специалисты Института вычислительных технологий СО РАН создают систему, умеющую сравнивать и классифицировать тексты. Данная разработка поможет литературоведам.
Новосибирские ученые загрузили в компьютер особенности стилистики и жанра произведений литературы, а также научили его группировать тексты по множеству параметров, понимать образы и смыслы, и определять верное ударение.
Отмечается, что программа умеет отличать омографы — слова, пишущиеся одинаково, но имеющие разное значение. Компьютер ориентируется на контекст и понимает правильный смысл слова.
По словам кандидата филологических наук Ольги Кожемякиной, ученые реализовали интерфейс филолога, который воспринимает определённый круг запросов для поиска и сравнения текстов, а после выдает достаточно точный результат. Кожемякина отметила, что систему обучали произведениях Александра Пушкина, которые он написал в период Болдинской осени. В настоящее время машина может оперировать всеми произведениями этого или другого поэта, подчеркнула кандидат филологических наук.
Программа также может работать с документами или контентом соцсетей. Кроме того, разработка учёных из Сибири может оказаться полезной для сервисов машинного перевода текста.
Фото: из открытых источников.