Вышел PrismAudio — генерация звука прямо из видео
Лаборатория Tongyi Lab представила PrismAudio — новый фреймворк для задачи Video-to-Audio, то есть автоматической генерации звуковой дорожки по видеоряду.
Проект стал развитием идей предыдущей модели ThinkSound, но с более продуманной архитектурой.Главное отличие — разбиение генерации звука на 4 независимых «перцептивных измерения».
habr.com