Экологи, айтишники и философы Тюмени и Новосибирска исследовали, как решить задачу поиска упоминаний экологических практик в текстах соцсетей.
В условиях ухудшающейся экологической ситуации и дефицита ресурсов необходимо активно привлекать общество к социальным экологическим (зеленым) практикам, то есть к повседневным действиям, направленным на гармонизацию отношений человека и его окружающей среды.
Согласно данным Всероссийского центра изучения общественного мнения, некоторые из этих действий, способные повлиять на экологическую ситуацию, не только мало распространены, но и остаются практически незамеченными.
Статья«Поиск упоминаний экологических практик в социальных сетях с помощью методов классификации текстов»ученых университетов Новосибирска и ТюмениАнны Глазковой,Ольги Захаровой,Антона Захарова,Натальи Москвиной,Тимура Еникеева,Арсения Ходырева,Всеволода Боровинского,Ирины Пупышевойвышлав журнале«Моделирование и анализ информационных систем».
В работе, в частности, говорится, что в зависимости от того, как экологические практики влияют на потребление, их можно разделить на два типа: адаптационные и трансформационные.
Адаптационные практики – реакция общества на ухудшающуюся экологическую обстановку. Они не предполагают сокращения потребления. Трансформационные – практики, которые рассчитаны на сокращение производства товаров и услуг и потребления обществом вещества и энергии.
Чтобы эффективно внедрять экологические практики, необходимо обладать определённой информационной базой о том, какие из них уже существуют в обществе, насколько распространены среди них те, которые ведут к сокращению потребления, кто является инициатором подобных практик, кто их поддерживает и так далее.
Однако сегодня знаний о распространенности экологических практик очень мало, поскольку сбор требуемого объема информации традиционными социологическими методами (анкетирование, интервью) — очень трудоемкий и занимает много времени. Тем не менее, в социальных сетях сформирован значительный объем неструктурированной текстовой информации, связанной с экологической тематикой.
Автоматический анализ текстов экологических сообществ в социальных сетях позволил бы собрать и структурировать большое количество текстовых данных в рассматриваемой предметной области, ускорить их обработку и сделать выводы о распространенности тех или иных видов практик.
В связи с этим возникает необходимость разработки методов автоматического получения информации об экологических практиках в социальных сетях. В работе описывается подход к автоматическому поиску упоминаний экологических практик в текстах социальных сетей с помощью методов классификации текстов.
Авторами представлен корпус текстов социальных сетей, снабженный экспертной разметкой девяти видов экологических практик. Предлагается подход к полуавтоматическому дополнению исходного корпуса текстов для уменьшения дисбаланса количества различных видов практик. Приводятся и обсуждаются результаты сравнения нескольких моделей машинного обучения для автоматического поиска упоминаний экологических практик.
Исследование связано с анализом текстов, размещенных в социальных сетях, и, в частности, их классификацией с применением методов машинного обучения, обработки естественного языка и компьютерной лингвистики.
В результате сравнения моделей машинного обучения лучшее качество классификации было получено с помощью лингвистической модели Conversational RuBERT, дообученной с помощью дополненного корпуса текстов. Результат работы представлен в виде прототипа приложения – чат-бота Telegram для поиска упоминаний экологических практик в тексте на естественном языке.
Исследование выполнено в рамках работы на Большой математической мастерской, организованной Математическим центром в Академгородке в 2022 году.
Источник:
Управление стратегических коммуникаций и сайт Naked Science