cognitronn технологии крипто ByteDance cognitronn

Depth Anything 3 упрощает 3D-генерацию из изображений

ByteDance представила Depth Anything 3 (DA3) - новую мультимодальную модель, способную предсказывать пространственно-согласованную геометрию по одному или нескольким изображениям без необходимости знать параметры камеры.

Главная особенность DA3 - радикальное упрощение архитектуры: единый трансформер использует унифицированное представление depth-ray, что позволяет одной модели одновременно решать задачи оценки глубины, определения позы камеры и генерации 3D-гауссианов для новых ракурсов.В тестах DA3 превосходит предыдущие версии по точности и устойчивости, обеспечивая улучшенное качество 3D-визуализации для приложений в AR/VR, дизайне и робототехнике.

DMCA