Lego daniilshat технологии Xiaomi общество Lego daniilshat

Xiaomi Robotics представила VLA-модель, которая преобразует изображения и текстовые инструкции в команды для роботов

Инженеры робототехнического подразделения Xiaomi представили Xiaomi-Robotics-0 — Vision-Language-Action (VLA) модель, которая получает на вход изображение с текстовыми инструкциями и преобразует их в команды для роботов.

При этом нейросеть нацелена на плавное управление без резких движений из-за задержки инференса.Авторы проекта отмечают, что частая проблема VLA-моделей заключается в том, что управлением роботом получается рваным и дёрганым.

DMCA