Маск стирает грань: Grok Imagine научился синхронизировать губы и генерировать звук
Илон Маск (Elon Musk) продолжает превращать свою соцсеть X в выставку достижений нейросетевого хозяйства. На этот раз обновление коснулось Grok Imagine — инструмента, который теперь не просто рисует картинки, а создает видео, где персонажи разговаривают и звучат слишком убедительно для нашего спокойного сна.Главная проблема большинства генеративных видеомоделей — это эффект «зловещей долины», когда глаза вроде человеческие, а движения губ живут собственной жизнью, отдельно от звуковой дорожки.
В последнем обновлении xAI, похоже, решили эту проблему. Теперь Grok Imagine значительно лучше синхронизирует мимику с речью и, что важнее, самостоятельно добавляет реалистичный звук.Сам Маск, презентуя возможности модели на своей странице в X, подчеркнул: в продемонстрированном ролике нет ни одного реального кадра.
gagadget.com