CAT4D от Google DeepMind превращает видео в простые 3D-сцены
Новая система искусственного интеллекта от Google DeepMind способна превращать обычные видео в динамические 3D-сцены. Команда, в которую входят исследователи из Колумбийского университета и Калифорнийского университета в Сан-Диего, назвала своё творение CAT4D.Система использует диффузионную модель, которая принимает видео, снятое под одним углом, и генерирует виды с нескольких точек зрения.
Затем она объединяет эти различные перспективы в динамическую 3D-сцену. Конечный результат? Видео, в котором можно рассматривать объект под множеством углов.До сих пор для создания чего-то подобного требовались сложные установки с несколькими камерами, одновременно записывающими одну и ту же сцену.
habr.com