Исследователи искусственного интеллекта и биологи объединяются, чтобы обнаружить закономерности в общении животных, которые трудно наблюдать человеческим глазом. Автор познавательного ролика на канале Vox рассказывает о том, как в будущем ИИ-модели смогут помочь понять своего питомца.
Джойс Пул: Еще в 80-х годах я заметила, что иногда, когда слон зовет кого-то из членов своей семьи, то отвечает ему только кто-то один, а остальные зов игнорируют. Но если он звучит снова, уже другой слон поднимает голову и громко и раскатисто отвечает.
Полную версию видео смотрите эксклюзивно в сообществе ИноСМИ ВКонтакте
Это Джойс Пул, она уже 50 лет изучает африканских слонов и особенности их взаимодействия.
Джойс Пул: И я задумалась, а вдруг они как-то умеют перенаправлять зов конкретной особи? Но проверить это возможности не было.
Спустя много лет она стала партнером Микки Пардо, который разработал исследование на основе ее наблюдений.
Микки Пардо: Я приехал в место их обитания и стал фиксировать все крики и одновременно тщательнейшим образом наблюдать за их поведением. Мы знали, кто кричит, к кому обращается и в каком контексте.
Ученые закодировали акустическую информацию из записей в длинную строку чисел вкупе с данными, которые Микки собрал о каждом зове. В статистическую модель поместили около 500 таких записей, и по акустической структуре каждого нового крика она могла с большей точностью определить адресата.
В общем, есть свидетельства того, что африканские слоны дают друг другу имена.
Вот один из примеров того, как искусственный интеллект помогает понять язык животных. А теперь специалисты по искусственному интеллекту хотят сделать следующий шаг и задействовать языковые модели, подобные тем, что используются в чат-ботах, но с акцентом на межвидовое общение.
Когда исследователи изучают общение животных, то используют несколько методов: запись характерных звуков, наблюдение и документирование сопровождающих их поведения и контекста, а иногда и воспроизведение звуков для оценки реакции животного. Во всех этих областях уже задействован ИИ. Записи с мест часто звучат не так (~), а так (~). Несколько животных одновременно издают звук, обращаясь друг к другу на фоне внешних шумов. Это известно как феномен "вечеринки", и в области исследований животных данная проблема весьма распространена. Но машинному обучению уже удалось решить аналогичную проблему с распознаванием человеческой речи.
Например, модель Deep Karaoke обучали на множестве музыкальных треков, где отдельно записывались инструменты и вокал, а затем на полностью сведенных композициях. Затем она смогла самостоятельно разбить трек на вокальные и инструментальные партии.
Недавно специалисты в области ИИ добились определенных успехов в применении подобных алгоритмов к звукам, издаваемым животными. То есть можно записать шум группы макак и выделить среди всех звуков один конкретный. Исследователи также могли бы начать использовать нейросети при воспроизведении записей в полевых условиях. Есть модели, которые можно обучить на множестве примеров звукозаписей, а затем создать еще одну уникальную версию. Специалисты уже начали разработку аналогичных моделей для записи звуков животных.
Все это виды "контролируемого обучения", то есть модель обучается на множестве выбранных человеком примеров. А в исследовании с именами слонов им удалось добавить к этому еще и наблюдения, что вкупе со звуковыми данными помогло обнаружить в криках слонов нечто, что в противном случае было бы доступно исключительно путем наблюдения.
Йосс Йовель: Необходимо снабдить примечаниями множество данных.
Йосс Йовель обучил статистическую модель 15 тысячам вокализаций египетских фруктовых летучих мышей, и она сумела определить отправителя крика, его контекст, поведенческую реакцию на него и адресата.
Йосс Йовель: Все примечания мы вводили вручную, а это уже ограничение исследования, потому что мы люди, а не летучие мыши, и наверняка что-то упускаем.
В этом и заключается проблема моделей обучения с участием оператора: они ограничены уже имеющимся у человека знаниями об общении животных для маркировки данных. Но многого мы все же не знаем. Вот почему некоторые эксперты по искусственному интеллекту говорят, что наибольшим потенциалом для расшифровки общения животных обладают нейросети с самоконтролем. Именно так обучаются модели обработки естественного языка вроде ChatGPT.
Вместо отмеченных человеком примеров они обучаются на большом объеме немаркированных данных, а затем могут сортировать их в соответствии с шаблонами и категориями, которые обнаруживают самостоятельно. ChatGPT, например, учится на книгах, веб-сайтах, соцсетях и всем остальном, что можно найти в интернете, делая собственные выводы о том, как работает язык.
Дельфины смотрят в зеркало и узнаю́т себя. Слоны тоже. Это своего рода самосознание.
Одна из связанных с данными моделями проблем связана с этапом самостоятельного обучения, который называется валидацией. То есть людям все еще необходимо совершенствовать эти модели, оценивая их ответы. Как это сделать, если общение так сильно отличается от нашего? Также могут не оправдаться ожидания касаемо способности разговаривать с животными на едином языке и на основе единого опыта.
— "Привет, Курт, как дела, чувак?" Теперь переведу это в мяуканье.
— Мы поздоровались. Привет-привет. В следующий раз спрошу, как дела.
Чтобы создать эти модели, первым делом необходимо собрать гораздо больше данных о звуковых коммуникациях животных, чем существует на сегодняшний день.
Джойс Пул: В данный момент я создаю базу данных отдельных криков, сейчас в ней 10 тысяч записей, и на самом деле это очень мало.
Исследователи животных со всего мира проводят масштабную работу по сбору данных, маркируя и записывая звуки животных с помощью разных приспособлений, чтобы "накормить" жаждущие данных модели. Время покажет, сможет ли ИИ оказать реальное содействие полноценному межвидовому общению. Но исследователи надеются, что открытия, сделанные на этом пути, продолжат оказывать влияние на наше понимание тех видов, с которыми мы делим планету.
Джойс Пул: Мы не единственные, кто общается, заботится друг о друге, думает о прошлом и будущем. У животных тоже есть право быть здесь.