Учёные США создали ИИ, который способен воссоздать улицы по их звукам

@

Техасский университет в Остине объявил о разработке инновационной модели искусственного интеллекта, способной генерировать изображения городских улиц на основе аудиозаписей. Для обучения системы использовались аудиовизуальные клипы, содержащие звуки и изображения улиц из различных стран.

В процессе обучения были использованы клипы с статичными изображениями и окружающими звуками, собранные из видеороликов на YouTube. Они охватывали как городские, так и сельские улицы Северной Америки, Азии и Европы. При помощи алгоритмов ИИ научился сопоставлять звуки с определёнными объектами на изображениях.

В рамках эксперимента были взяты фотографии вместе с 2 сгенерированными изображениями других улиц, одновременно проигрывая звуковую дорожку, соответствующую первому изображению. Задача заключалась в том, чтобы определить, какое из 3 изображений соответствует прослушиваемому звуку. В результате была достигнута точность в 80% при определении нужных фото.

По словам авторов проекта, данное исследование открывает новые перспективы для криминалистики, для изучения воздействия восприятия звуков и изображений на психическое здоровье человека, а также для разработки методов городского проектирования в населённых пунктах.

Фото: freepik, Техасский университет в Остине

Данные о правообладателе фото и видеоматериалов взяты с сайта «Чудо техники», подробнее в Правилах сервиса
Анализ
×
Техасский университет в Остине
Сфера деятельности:Образование и наука
4