Вышла VoxHammer — нейросеть для локального редактирования 3D-объектов
Исследователи Tencent представили открытую модель машинного обучения для локального редактирования 3D-объектов. Главная особенность нейросети в том, что она вносит изменения напрямую в родное латентное трёхмерное пространство, а не в многоракурсные изображения.Во время редактирования VoxHammer сперва получает инвертированную траекторию и кэширует KV-токены.
После этого нейросеть начинает «пересобирать» 3D-модель, учитывая новые вводные, включая текстовые запросы, изображения и наложенную маску.
habr.com