Команда ученых из Техасского университета в Остине разработала технологию, которая с помощью генеративного искусственного интеллекта (ИИ) преобразует звуки из аудиозаписей в изображения улиц. Это открытие показывает, что машины могут воспроизводить связь между звуками и визуальными характеристиками, схожую с человеческим восприятием.
Исследователи собрали данные из разных городских и сельских местностей, включая аудиозаписи и изображения. Эти данные использовались для обучения модели искусственного интеллекта.