Компьютерная лингвистика: новые возможности для медиков

В Центре языка и мозга НИУ ВШЭНижний Новгород прошел научный семинар «Компьютерная лингвистика и создание диагностических и терапевтических методик для людей с неврологическими и психиатрическими расстройствами». Семинар объединил специалистов из различных областей — медицины, лингвистики, когнитивных наук — и проводился с участием экспертов и практикующих медиков из разных городов, включая Нижний Новгород и Москву.

Компьютерная лингвистика: новые возможности для медиков

© Пресс-служба НИУ ВШЭ - Нижний Новгород

Этот семинар — часть стратегического проекта НИУ ВШЭ «Устойчивый мозг: нейрокогнитивные технологии адаптации, обучения, развития и реабилитации человека в изменяющейся среде» в рамках программы стратегического академического лидерства «Приоритет 2030».

Докладчики представили ключевые методы и инструменты компьютерной лингвистики, позволяющие объективно проводить диагностику неврологических и психических расстройств, характеризующихся нарушениями или особенностями речи. А также различные приложения для проведения речевой терапии, реабилитации и диагностики на основе образцов звучащей речи и приложение для коррекции аномии.

Участие в семинаре практикующих медиков позволило обсудить перспективы использования цифровых диагностических и терапевтических инструментов в клинической практике.

Мария Худякова, директор Центра языка и мозга НИУ ВШЭНижний Новгород

Худякова Мария Викторовна

Для нашего стратегического проекта и программы «Приоритет 2030» очень важны такие объединённые семинары. Во-первых, они позволяют узнавать, что делают другие коллеги, включенные в работу большого распределённого проекта, и придумывать совместно что-то новое. И, во-вторых, – это возможность подключить к разговору внешних участников, в нашем случае – медиков.  Когда ты разрабатываешь какую-то технологию, отрабатываешь её, нужно обязательно разговаривать с теми, кто её будет использовать. Такие встречи – это способ создавать какие-то новые научные коллаборации. Например, для того, чтобы опробовать наши технологии, обязательно нужны клинические базы, и в рамках таких семинаров мы можем найти новых заинтересованных партнёров, выстроить новые региональные связи, которые дадут нам возможность провести клинические исследования и потом донести наш продукт до потребителя.

В докладе Марии Худяковой «Речевые корпуса как инструмент для исследований и создания диагностических и терапевтических методик» основное внимание было уделено использованию речевых корпусов для анализа и диагностики речевых и когнитивных особенностей.

Языковые корпуса представляют собой коллекции текстов, образцов речи, видеозаписей на различных языках, используемые лингвистами для изучения языковых явлений, проведения количественного и качественного анализа, выявления закономерностей и тенденций. Языковые корпуса бывают общие (национальный корпус русского языка, открытый корпус) и специализированные (клинические).

Мария Викторовна отметила, что создание специализированных, в том числе клинических, корпусов на русском языке представляет собой сложную, но необходимую задачу для исследования особенностей речи при различных нарушениях. К таким корпусам предъявляются строгие требования, включая аннотацию речевых ошибок, демографические и клинические данные, а также соблюдение требований этики и законодательства о хранении медицинской информации.

Также в докладе были представлены результаты исследований трех подкорпусов корпуса 3D (Discourse Diversity Database), включающих пациентов до и после резекции опухолей мозга, пациентов с расстройствами шизофренического спектра и аффективными расстройствами и неврологически здоровых носителей языка.

Анализ данных участников исследования в двух секциях «клинические» и «норма» проводился с помощью различных заданий, таких как пересказ историй по сериям рисунков, воспоминания из личного опыта и инструкции по сборке мебели, что позволило выявить когнитивные и языковые особенности этих групп. Дополнительно выполнялось задание на вербальную беглость, которое измеряет количество слов, воспроизводимых пациентами на заданные категории, такие как животные или слова на определённую букву. Этот тест широко применяется для оценки когнитивных способностей и выявления расстройств мышления.

При депрессии характерны: снижение количества слов, снижение количества переключений между семантическими кластерами по сравнению с нормой, что обусловлено общим когнитивным дефицитом.

При биполярном расстройстве в стадии мании характерны: не сниженное количество слов, рост количества переключений между кластерами по сравнению с нормой.

При расстройстве мышления характерны: снижение количества слов, менее выражены кластеры по сравнению с нормой.

Мария Худякова также рассказала о применении методов компьютерной лингвистики для анализа семантических кластеров, позволяющих различать норму и патологию речи. Используя автоматическую кластеризацию слов с применением векторных моделей на материале Национального корпуса русского языка и Википедии, исследователи могут определять меру близости слов, которая отражает структуры в ментальном лексиконе человека. Например, автоматическая кластеризация показала различия в речевых паттернах между здоровыми людьми и пациентами с психиатрическими расстройствами, что подтверждает перспективность этого метода для диагностики.

«В исследованиях, когда мы говорим про психиатрические расстройства, нам всегда очень сложно выделить языковую норму. Поэтому мы решили, что хорошо было бы собрать большой образец нормы, но при этом, чтобы эту норму диагностировал психиатр, чтобы это была не самопровозглашённая норма. Потому что наша технология должна замечать какие-то очень тонкие вещи и чётко их отслеживать», – отметила Мария Худякова.

В рамках пилотного анализа были проанализированы данные 195 участников (люди без психиатрического диагноза и пациенты стационара психиатрической больницы).

Исследование показало, что в контрольной группе ассоциации между реакциями более стандартизированы, при этом в группе пациентов отмечается большая связанность слов внутри одного кластера. Обнаружены различия между группами по нескольким метрикам.

Подводя итог, Мария Худякова подчеркнула, что разрабатываемые инструменты, включая методы семантической кластеризации, помогут в дальнейшем использовать данные клинических корпусов для диагностики и терапевтических методик.

В 2024 г. планируется провести анализ вербальной беглости на материале 400 записей и сравнивать тяжесть различной симптоматики по психиатрическим шкалам.

В 2025 г. в рамках проекта планируется создание мобильного приложения и его апробация в психиатрических клиниках Москвы и Нижнего Новгорода.

В последние годы в нейролингвистических исследованиях активно используется автоматизированный анализ речи для диагностики и понимания различных психоневрологических расстройств. В рамках одного из таких проектов, проведённого специалистами в области лингвистики, психологии и психиатрии, был разработан инструмент для создания «речевых профилей» пациентов с различными расстройствами. Это исследование позволяет выявить, как различные психоневрологические нарушения влияют на структуру речи, включая лексический, синтаксический и ассоциативный компоненты.

Основной задачей исследователей было создание модели, которая могла бы выделить ключевые характеристики речи, отличающие здоровых людей от тех, у кого есть нарушения, такие как афазия, шизофрения, депрессия или биполярное расстройство. В рамках проекта был собран большой корпус речевых данных, проведена кластеризация лексики и выявлены статистические метрики, такие как лексическое разнообразие и количество существительных, что помогло различать группы с нарушениями речи.

В качестве источников данных был использованы записи устной речи 69 человек с различными расстройствами и 210 человек участников контрольной группы с транскриптами, предоставивших свои данные для анализа.

В ходе исследования были сделаны следующие выводы: речь людей с ментальными расстройствами в целом проще, состоит из более коротких предложений, менее динамична и содержит более конкретную лексику. В то время как речь контрольной группы более активна и разнообразна в плане действий и длины предложений, речь людей с ментальными расстройствами, хоть и проще, может быть более предсказуемой и конкретной.

Предполагается, что эти технологии могут быть использованы не только для диагностики, но и для обучения студентов, а также в качестве вспомогательных инструментов в медицинской практике для дифференциации разных типов расстройств. Важной проблемой остаётся необходимость работы с чистыми группами пациентов, чтобы исключить влияние медикаментозной терапии на результаты анализа.

Пока модель находится на стадии разработки, но уже сейчас её результаты открывают новые перспективы в области психиатрии и нейролингвистики, предлагая более точные и объективные методы диагностики и понимания речи пациентов с психоневрологическими расстройствами.

Для более глубокого анализа получаемых данных эксперты семинара отметили важность привлечения в команду экспертов психотерапевтов и предложили провести совместную с кафедрой психиатрии ПИМУ работу по дифференциации нормы с помощью коротких тестов, а также включить в исследование, помимо женщин, данные мужчин.

Мария Худякова

Мы поняли, что цифры, которые мы получаем, они разные для группы «нормы» психиатрической и группы «ненормы», то есть людей с депрессиями, людей с шизофренией, шизотипическим расстройством и так далее. Но теперь нужно обсудить это с клинической точки зрения и понять, что эти цифры нам дают в клиническом плане. Понятно, что мы не можем использовать мобильное приложение для диагностики. Но такие приложения можно использовать для скрининга и для оценки динамики. Например, одна из идей, которая была высказана в ходе семинара, про которую мы совершенно не думали раньше, – это применение для преподавания и объяснения молодым специалистам, на что обращать внимание при оценке речи пациента врачом.

В докладе Ольги Ляшевской, профессора Школы лингвистики, «Из опыта разработки приложений для реабилитации и тренировки навыков» речь шла о мобильных и браузерных приложениях для людей с утратой или угнетением речевых и языковых навыков, функций зрения и слуха. Такие приложения используются в качестве бытовых тренажеров как дополнение к занятиям со специалистами.

К примеру, мобильное приложение СЛОН (СЛОво Назови) предназначено для реабилитации после инсульта со слабой или средней степенью нарушений. Приложение дает пользователю возможность самостоятельной работы (голосовой ввод и озвучивание заданий) и получения обратной связи, а специалисту возможность импортировать данные пациента.

В рамках исследования использовались генеративные сети для генерации контента (тексты упражнений, изображения, озвучивание задание, генерация шрифтов) и модели для сопоставления аудио, записанного пользователем, с образцом.

Перспектива развития исследования заключается в персонализации упражнений и возможности гибкого дополнения со стороны специалистов.

Мария Худякова

В наших планах – расширение проекта на весь Приволжский федеральный округ, т.к. у медиков есть большая заинтересованность в том, чтобы получить работающий инструмент, который позволяет сократить время обработки данных при проведении диагностической и реабилитационной работы с пациентом.

Основным итогом семинара стало составление плана работы проекта на следующий год, который включает составление списка критериев для сбора новой порции данных для исследований.

Данные о правообладателе фото и видеоматериалов взяты с сайта «ВШЭ в Нижнем Новгороде», подробнее в Правилах сервиса
Анализ
×
Худякова Мария Викторовна
Ляшевская Ольга
ВЫСШАЯ ШКОЛА ЭКОНОМИКИ
Сфера деятельности:Образование и наука
501
Психиатрическая больница
Компании