Лаборатория интеллектуальных систем Вятского государственного университета работает с 2008 года
Научно-исследовательская лаборатория интеллектуальных систем Вятского государственного университета работает с 2008 года и занимается научными исследованиями и прикладными разработками в области интеллектуальной обработки текстов, машинного обучения и анализа данных. Коллектив включает докторов и кандидатов наук. молодых ученых и аспирантов, обладающих высокой квалификацией в области автоматической обработки естественного языка, программирования и прикладной математики.
Основные области исследований:
- анализ тональности текстов, в том числе создание словарей оценочной лексики и аспектно-ориентированный анализ тональности;
- автоматическое определение точки зрения автора текста;
- автоматическое извлечение аргументации;
- автоматическая генерация текстов;
- тематическая классификация текстовых документов;
- интеллектуальный анализ мнений в социальных медиа;
- параллельные методы обработки текстовых данных.
За десять лет успешно выполнены и выполняются в настоящее время несколько научно-исследовательских и прикладных проектов, в том числе:
- грант благотворительной программы «Стипендиальная программа Владимира Потанина», проект «Методы визуализации данных» (Е.В.Котельников, 2023-2024 гг.);
- грант РНФ № 23-21-00330 «Разработка и исследование метода управляемой генерации текстов по сюжетной линии» (2023-2024 гг.);
- грант РНФ № 22-21-00885 «Разработка и исследование методов генерации текстов с аргументацией» (2022-2023 гг.);
- хоз.договор с ООО «Нанолек» № 629/22 от 26.07.2022 г. «Разработка алгоритмов семантического поиска по базе нормативных документов фармацевтического производства и создание на его основе вопросно-ответной системы» (рук. Е.В. Котельников, 2022–2023);
- грант благотворительной программы «Стипендиальная программа Владимира Потанина», проект «Машинное обучение на основе больших данных» (А.В.Котельникова, 2022-2023 уч. год);
- грантовый конкурс для преподавателей магистратуры фонда Потанина, проект по разработке учебного курса «Современные нейросетевые языковые модели» (Е.В.Котельников, 2021-2022 гг.);
- совместная программа Минобрнауки России и Германской службы академических обменов (DAAD) «Михаил Ломоносов», проект «Риторические модели порождения текста», совместно с Дармштадтским техническим университетом, Германия (2021 г.);
- хоздоговорная НИР по теме «Разработка и исследование моделей классификации товаров на основе текстового описания» (2021 г.);
- проект № 19-17-50117 «Обзор современных словарей оценочной лексики для анализа мнений на русском и английском языках» (рук. Е.В.Котельников, 2019-2020;
- проведение научно-исследовательских работ в рамках международного научно-образовательного сотрудничества по программе «Михаил Ломоносов» по теме: «Разработка и исследование аннотированного русскоязычного текстового корпуса для анализа аргументации» (2018 г.);
- проект в рамках государственного задания Министерства образования и науки РФ по теме «Разработка и исследование словарей оценочной лексики для анализа тональности текстов» (2017–2019 гг.);
- грант РФФИ по теме «Разработка и исследование интеллектуальной системы информационного поиска и анализа тональности текстовых и речевых документов» (2016–2018 гг.);
- проект в рамках Программы развития Вятского государственного университета «Разработка алгоритмов и программных средств анализа мнений в текстах социальных медиа и архивов электронных СМИ для социологических и маркетинговых исследований» (2017 г.);
- грант РФФИ по теме «Разработка метода аспектно-эмоционального анализа текста на основе тонально-ориентированных распределённых представлений слов» (2016 г.);
- проект в рамках государственного задания Министерства образования и науки РФ по теме «Разработка и исследование системы автоматического анализа мнений в текстовых документах» (2014-2016 гг.);
- проект в рамках государственного задания Министерства образования и науки РФ по теме «Модели, методы и программные средства автоматического распознавания эмоциональной составляющей в текстах» (2012–2013 гг.);
- грант РФФИ по теме «Разработка параллельной системы автоматической текстовой классификации» (2012 г.)
Уровень исследований сотрудников лаборатории подтверждается публикациями в ведущих журналах и выступлениями на престижных конференциях. Более 20 работ опубликованы в изданиях, индексируемых международными базами данных Web of Science и Scopus, в том числе:
- Vychegzhanin S. V., Kotelnikova A. V., Sergeev A. V., Kotelnikov E. V. Controllable Story Generation based on Perplexity Minimization // Analysis of Images, Social Networks and Texts: 11th International Conference (AIST 2023), Yerevan, Armenia, 28-30 September 2023 / eds. D. Ignatov [et al.]. - Cham: Springer, 2023. - (LNCS, vol. 14486). - 2024. - pp. 154-169.
- Goloviznina V., Fishcheva I., Peskisheva T., Kotelnikov E. V. Aspect-based Argument Generation in Russian // Komp'juternaja Lingvistika i Intellektual'nye Tehnologii: Computational Linguistics and Technologies Proceedings of the International Conference "Dialogue 2023", 14-16 June 2023. - 2023. - Vol. 22. - pp. 117-129.
- Kotelnikova A. V., Vychegzhanin S. V., Kotelnikov E. V. Cross-domain sentiment analysis based on small in-domain fine-tuning // IEEE Access. - 2023. - Vol. 11. - pp. 41061-41074.
- Vychegzhanin S. V., Kotelnikova A. V., Sergeev A. V., Kotelnikov E. V. MaxProb: Controllable Story Generation from Storyline // Komp'juternaja Lingvistika i Intellektual'nye Tehnologii: Computational Linguistics and Technologies Proceedings of the International Conference "Dialogue 2023", 14-16 June 2023. - 2023. - Vol. 22. - pp. 539-553.
- Фищева И. Н., Пескишева Т. А., Головизнина В. С., Котельников Е. В. Метод классификации аспектов аргументации в русскоязычных текстах // Программные системы: Теория и приложения. - 2023. - Т. 14. - №4 (59). - С. 25-45.
- Fishcheva I., Osadchiy D., Bochenina K., Kotelnikov E. Argumentative Text Generation in Economic Domain // Komp'juternaja Lingvistika i Intellektual'nye Tehnologii (Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue 2022” Moscow, 15-18 June 2022). - 2022. - Vol. 21. - pp. 211-222.
- Goloviznina V. S., Kotelnikov E. V. Automatic Summarization of Russian Texts: Comparison of Extractive and Abstractive Methods // Komp'juternaja Lingvistika i Intellektual'nye Tehnologii (Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue 2022” Moscow, 15-18 June 2022). - 2022. - Vol. 21. - pp. 223-236.
- Vychegzhanin S. V., Kotelnikov E. V. Collocation2Text: Controllable Text Generation from Guide Phrases in Russian // Komp'juternaja Lingvistika i Intellektual'nye Tehnologii (Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue 2022” Moscow, 15-18 June 2022). - 2022. - Vol. 21. - pp. 564-576.
- Kotelnikov E., Loukachevitch N., Nikishina I., Panchenko A. RuArg-2022: Argument Mining Evaluation // Komp'juternaja Lingvistika i Intellektual'nye Tehnologii (Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue 2022” Moscow, 15-18 June 2022). - 2022. - Vol. 21. - pp. 333-348.
- Pashchenko D. E., Razova E. V., Kotelnikova A. V., Vychegzhanin S. V., Kotelnikov E. V. Interpretation of Language Models Attention Matrices in Texts Sentiment Analysis // 8th International Conference on Information Technology and Nanotechnology (ITNT 2022), Samara 23-27 May 2022. - 2022.
- Razova E. V., Vychegzhanin S. V., Kotelnikov E. V. Does BERT look at sentiment lexicon? // Recent Trends in Analysis of Images, Social Networks and Texts: 10th International Conference on Analysis of Images, Social Networks, and Texts (AIST 2021), Tbilisi, Georgia, 16-18 December 2021. - Cham : Springer. - (CCIS ; vol. 1573). - 2022. - pp. 55-67.
- Vychegzhanin S. V., Kotelnikov E. V. A New Method for Stance Detection based on Feature Selection Techniques and Ensembles of Classifiers // IEEE Access. - 2021. - Vol. 9. - pp. 134899-134915.
- Vychegzhanin S. V., Milov V., Kotelnikov E. V. Comparative analysis of machine learning methods for news categorization in Russian // CEUR Workshop Proceedings: 2nd International Scientific and Practical Conference "Information Technologies and Intelligent Decision Making Systems" (ITIDMS-II-2021), Moscow, 1 July 2021. - 2021. - Vol. 2922. - pp. 100-108.
- Kotelnikov E. V. Current Landscape of Russian Sentiment Corpora // Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегод. междунар. конф. «Диалог» (2021). Вып. 20 = Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference “Dialogue” (2021). Issue 20. - 2021. - pp. 433-444.
- Kotelnikova A. V., Paschenko D. E., Razova E. V. Lexicon-based Methods and BERT Model for Sentiment Analysis of Russian Text Corpora // CEUR Workshop Proceedings: 2nd International Scientific and Practical Conference "Information Technologies and Intelligent Decision Making Systems" (ITIDMS-II-2021), Moscow, 1 July 2021. - 2021. - Vol. 2922. - pp. 73-81.
- Fishcheva I. N., Goloviznina V. S., Kotelnikov E. V. Traditional Machine Learning and Deep Learning Models for Argumentation Mining in Russian Texts // Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегод. междунар. конф. «Диалог» (2021). Вып. 20 = Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference “Dialogue” (2021). Issue 20. - 2021. - pp. 246-258.
- Kotelnikova A.V. Comparison of Deep Learning and Rule-based Method for the Sentiment Analysis Task // 2020 International Multi-Conference on Industrial Engineering and Modern Technologies (FarEastCon 2020), Vladivostok, Russian Federation, 6-9 October 2020. - 2020.
- Котельников Е.В., Разова Е.В., Котельникова А.В., Вычегжанин С.В. Современные словари оценочной лексики для анализа мнений на русском и английском языках (аналитический обзор) // Научно-техническая информация. Сер. 2. Информационные процессы и системы. - 2020. - №12. - С. 16-33.
- Kotelnikov E. V., Milov V.R. Comparison of rule induction, decision trees and formal concept analysis approaches for classification // Journal of Physics: Conf. Series, vol. 1015;
- Kotelnikov E.V. TextJSM: text sentiment analysis method // Automatic Documentation and Mathematical Linguistics. 2018. Vol. 52(01). P. 24–34;
- Kotelnikov E.V., Razova E.V., Fishcheva I.N. A close look at Russian morphological parsers: which one is the best? // In: Filchenkov A., Pivovarova L., Žižka J. (eds) Artificial Intelligence and Natural Language. AINL 2017. Communications in Computer and Information Science, vol 789. Springer. 2018. P. 131–142;
- Vychegzhanin S.V., Kotelnikov E.V. Stance Detection in Russian: a Feature Selection and Machine Learning Based Approach // Supplementary proceedings of the 6th conference on Analysis of Images, Social Networks, and Texts. Moscow, July 27-29, 2017. P. 166-177;
- Pontiki M., Galanis D., Papageorgiou H., Androutsopoulos I., Manandhar S., AL-Smadi M., Al-Ayyoub M., Zhao Y., Qin B., De Clercq O., Hoste V., Apidianaki M., Tannier X., Loukachevitch N., Kotelnikov E., Bel N., Jiménez-Zafra S.M., Eryiğit G. SemEval-2016 Task 5: Aspect Based Sentiment Analysis // Proceedings of the 10th International Workshop on Semantic Evaluation (SemEval-2016), pages 19–30, San Diego, California, June 16-17, 2016;
- Kotelnikov E.V., Bushmeleva N.A., Razova E.V., Peskisheva T.A., Pletneva M.V. Manually Created Sentiment Lexicons: Research and Development // Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference “Dialogue”, 01–04 June 2016. Issue 15 (22). – P. 281–295;
- Kotelnikov E.V., Pletneva M.V. Text Sentiment Classification based on Genetic Algorithm and Word and Document Co-clustering // Journal of Computer and Systems Sciences International. 2016. Vol. 55, No. 1, pp. 106–114.
Также сотрудниками лаборатории получено 15 свидетельств о государственной регистрации программ для ЭВМ, в том числе:
- Котельников Е.В., Котельникова А.В. Компьютерная поддержка экспертной разметки оценочной лексики. Свидетельство о государственной регистрации программы для ЭВМ № 2018661391 от 07.09.2018 г.;
- Котельников Е.В., Митягина Е.В. Анализ тональности текстов в социальных медиа. РОСПАТЕНТ. Свидетельство о регистрации программы для ЭВМ № 2017619673 от 01.09.2017 г.;
- Котельников Е.В., Митягина Е.В. Автоматическое извлечение общедоступной информации из социальных сетей в Интернете. РОСПАТЕНТ. Свидетельство о регистрации программы для ЭВМ № 2017619515 от 25.08.2017 г.;
- Котельников Е. В. Параллельный ДСМ-метод анализа тональности текстов. РОСПАТЕНТ. Свидетельство о регистрации программы для ЭВМ № 2017619857 от 08.09.2017 г.;
- Котельников Е. В. Интеллектуальный анализ тональности текстов TextJSM. РОСПАТЕНТ. Свидетельство о регистрации программы для ЭВМ № 2015614277 от 13.04.2015 г.
Руководитель лаборатории – доктор технических наук, доцент, профессор кафедры прикладной математики и информатики Евгений Вячеславович Котельников является признанным ученым в области интеллектуального анализа текстов:
- Профиль Google Scholar
- WoS ResearcherID: A-3606-2014
- Scopus AuthorID: 56004884100
- Профиль РИНЦ
Е.В. Котельников является постоянным рецензентом шести ведущих конференций по анализу текстов и социальных медиа:
- Международная конференция по компьютерной лингвистике и интеллектуальным технологиям «Диалог»;
- International Conference on Text, Speech and Dialogue (TSD);
- International Conference on Artificial Intelligence and Natural Language (AINL);
- International Conference «Analysis of Images, Social networks and Texts» (AIST);
- International Conference «Digital Transformations & Global Society» (DTGS);
- International Conference «Electronic Governance and Open Society: Challenges in Eurasia» (EGOSE).
В настоящее время Е.В. Котельников проходит трехмесячную стажировку в Applied CompLing Discourse Research Lab (Потсдамский университет).
Лаборатория интеллектуальных систем обладает необходимым оборудованием для выполнения сложных вычислений (в том числе на графических картах) и хранения больших объемов данных:
- 1 сервер (Intel Core i9-7920X, 12 ядер, 2,9 ГГц; 96 Гб ОЗУ; SSD 1Тб; HDD 6 Тб; видеокарта NVIDIA GeForce GTX TITAN Xp 12Gb);
- 9 рабочих станций (процессор Intel Core i7-7800X, 6 ядер, 3,5 ГГц; 64 Гб ОЗУ, SSD 1 Тб, HDD 2 Тб, видеокарта NVidia GTX 1050TI).
Кроме того, сотрудники лаборатории имеют доступ к высокопроизводительному вычислительному кластеру Вятского государственного университета: Compute Cluster Platform 3000 BL470c (20 Терафлопс, 50 терабайт, 2034 процессора Xeon 53xx 2.33 GHz).
Таким образом, сотрудники лаборатории интеллектуальных систем обладают высокой квалификацией и значительным опытом, а также имеют необходимые материальные ресурсы для выполнения сложных научно-исследовательских и прикладных работ в области автоматической обработки естественного языка.