С помощью инструмента машинного обучения былиобнаружены 161 979 новых видов РНК-вирусов, которые, по мнению исследователей, значительно улучшат картирование жизни на Земле и помогут в идентификации многих миллионов еще не охарактеризованных вирусов.
Исследование международной группы ученых, опубликованное в журнале Cell, является одной из крупнейших известных работ по открытию видов вирусов.
«Это окно в ранее скрытую часть жизни на Земле показало удивительное биоразнообразие», — сказал старший автор, профессор Эдвардс Холмс из Школы медицинских наук факультета медицины и здравоохранения Сиднейского университета.
По словам Холмса, это самое большое количество новых видов вирусов, обнаруженных в ходе одного исследования, что значительно расширяет знания о вирусах, живущих среди людей.
«Обнаружить так много новых вирусов одним махом — это просто потрясающе, и это лишь поверхностный взгляд в мир открытий. Еще миллионы видов должны быть обнаружены, и мы можем применить этот же подход к идентификации бактерий и паразитов», — добавил он.
Хотя РНК-вирусы обычно ассоциируются с человеческими заболеваниями, они также встречаются в экстремальных условиях по всему миру и даже могут играть ключевую роль в глобальных экосистемах. В этом исследовании они были обнаружены в атмосфере, горячих и гидротермальных источниках.
«То, что экстремальные среды являются переносчиками стольких типов вирусов, является еще одним примером их феноменального разнообразия и стойкости к выживанию в самых суровых условиях, что потенциально дает нам подсказки о том, как появились вирусы и другие элементарные формы жизни», — сказал профессор Холмс.
Исследователи создали алгоритм глубокого обучения LucaProt для обработки огромных массивов данных о генетических последовательностях, включая длинные геномы вирусов длиной до 47 250 нуклеотидов и сложную геномную информацию, что позволило обнаружить более 160 тыс. вирусов.
Холмс рассказал, что большинство этих вирусов уже были секвенированы и находились в публичных базах данных, но они были настолько разными, что никто не знал, что это такое.
«Они включали то, что часто называют последовательностью темной материи. Наш метод ИИ смог организовать и классифицировать всю эту разрозненную информацию, впервые проливая свет на значение этой темной материи», — добавил он.
Инструмент искусственного интеллекта был обучен вычислять темную материю и идентифицировать вирусы на основе последовательностей и вторичных структур белка, которые все РНК-вирусы используют для репликации. По сравнению с традиционными методами ему удалось значительно ускорить обнаружение вирусов .
Профессор Манг Ши, соавтор исследования из Университета Сунь Ятсена, сказал, что раньше исследователи полагались на биоинформатические конвейеры для обнаружения вирусов и это ограничивало разнообразие, которое они могли исследовать.
Теперь, по его словам, у них есть гораздо более эффективная модель на основе ИИ, которая обеспечивает исключительную чувствительность и специфичность и в то же время позволяет гораздо глубже изучить вирусное разнообразие. Он также добавил, что они планируют применять эту модель в различных приложениях.
Соавтор доктор Чжао-Жун Ли, который занимается исследованиями в Apsara Lab Alibaba Cloud Intelligence, рассказал, что LucaProt представляет собой значительную интеграцию передовых технологий ИИ и вирусологии и демонстрирует способность ИИ эффективно выполнять задачи в биологических исследованиях.
По его словам, эта интеграция дает ценные идеи и поддержку для дальнейшего расшифровывания биологических последовательностей и деконструкции биологических систем с новой точки зрения. Он заявил, что исследователи продолжат работу в области ИИ для вирусологии.
«Очевидным следующим шагом станет обучение нашего метода обнаружению еще большего количества этого удивительного разнообразия, и кто знает, какие еще сюрпризы нас ждут», — заключил Холмс.
Ранее исследователи из группы когнитивной вычислительной нейронауки в FAU акцентировали внимание на способности мозга к предсказательному кодированию. С помощью ИИ и информации от пациентов с эпилепсией они установили, что спонтанные активности мозга играют значительную роль в обработке информации без внешних стимулов.