Новая AI-модель от ByteDance оживляет статичные изображения с помощью звука

habr.com:

Материнская компания TikTok, ByteDance, разработала систему AI под названием INFP, которая способна заставлять статичные портретные фотографии говорить и реагировать на аудиовход.Что отличает INFP (Interactive, Natural, Flash and Person-generic) от других, так это его способность создавать реалистичные видео разговоров между двумя людьми без необходимости вручного назначения ролей говорящего и слушающего.

Система автоматически определяет эти роли по ходу разговора.Система работает в два основных этапа. На первом этапе, который ByteDance называет "Motion-Based Head Imitation" (Имитация движений головы на основе движения), AI учится учитывать все мелкие детали того, как люди общаются — такие как мимика и движение головы во время разговоров.

Читать на habr.com Все новости от habr.com

Новая модель AI Tencent Hunyuan3D 2.0 превращает 2D-изображения в детализированные 3D-объекты

Alibaba Qwen представила новую ИИ-модель. Она превосходит решения от OpenAI и DeepSeek

Разбираемся, как устроена R1 – новая бесплатная ризонинг модель ИИ из Китая, работающая на уровне o1 от OpenAI

Доставщик рекламы. «Новая почта» начала продавать свои площадки под рекламные интеграции. Сколько она будет на этом зарабатывать

Новая модель AI Tencent Hunyuan3D 2.0 превращает 2D-изображения в детализированные 3D-объекты

Alibaba Qwen представила новую ИИ-модель. Она превосходит решения от OpenAI и DeepSeek

Разбираемся, как устроена R1 – новая бесплатная ризонинг модель ИИ из Китая, работающая на уровне o1 от OpenAI

В Новой Зеландии анонсирован проект Whoosh — транспорт будущего с капсулами

MatterGen: Microsoft представляет инструменты AI для создания и моделирования новых материалов

Новая технология пространственного звука Eclipsa Audio от Samsung и Google появится в Android 16

Интимный рекорд: модель занялась сексом с более чем 1000 мужчин за полдня – фото

Microsoft формирует новую внутреннюю организацию, ориентированную на разработку AI

Casio анонсировала новую модель калькулятора Comfy JT-200T с обновленным дизайном и солнечной батареей на верхней панели

Xiaomi готовится выпустить на мировой рынок новую модель электросамоката с повышенным запасом хода

Кампания Apple Back to School стала доступна в Бразилии, Австралии, Новой Зеландии и Южной Корее

В Ollama появилась новая модель Phi-4

Bloomberg: новая модель iPad Air выйдет весной 2025 года и получит чип M4 вместо устаревшего M3

Samsung Galaxy Ring получит новые размеры и функции уже в этом месяце

Новая термохромная технология способна менять изображения при нагревании

Новые «Blueprints» от Nvidia обещают готовых к использованию AI-агентов

Intel представляет новые процессоры Core Ultra с производительностью в 2-3 раза выше для AI-приложений

AI-модель нового поколения xAI не была представлена вовремя, что стало тенденцией

ASUS представила новую модель Vivobook Pro 15 с процессорами Intel Core Ultra 9 и графикой NVIDIA GeForce RTX 4050

Новая модель LAM способна выполнять задачи в Word

Hugging Face выпустила фреймворк Smolagents, упрощающий создание AI-агентов с помощью всего нескольких строк кода

Сатья Наделла: OpenAI — новый технологический гигант нашего времени

Почему новая модель AI от DeepSeek считает себя ChatGPT

Какие страны встретили Новый год раньше всех

Samsung добавила новые размеры Galaxy Ring на свою официальную страницу поддержки

Microsoft запускает проект SPARROW для защиты биоразнообразия с помощью AI

Соучредитель Tornado Cash Алексей Перцев выйдет на свободу

Сооснователь Tornado Cash оспорит в Верховном Суде США нарушение процессуальных норм в ходе его дела

Как изменится качество воды, если прокипятить ее несколько раз

Ролик, который оставил много вопросов: Ubisoft удивила публику странным Live-action-трейлером Assassin's Creed Shadows

Это надо видеть! В сети опубликовано фото двухцветного флагманского смартфона Xiaomi 15 Ultra

Чем соцсети могут быть полезными для нас и какие опасности они несут

Google выпустила февральское обновление безопасности Android

С какими продуктами нельзя сочетать жаренный картофель - предупреждение врача

Релиз NanaZip 5.0

Валентинка для незаменимых: признайся в любви своему HR

Разработчики Chernobyl Lite 2 раскрыли дату выхода ранней версии и представили кинематографический трейлер игры

Украина получила от Нидерландов еще одну партию истребителей F-16

Apple открыла код системы сборки проектов Swift Build

Фрукт, который может негативно отразиться на вашем зрении

«Джин» — новое эссе Артура Хейса. Краткий пересказ

Халява кончилась: DeepSeek вводит лимиты на использование ИИ и повышает тарифы

Команда биржи Gate.io подвела итоги 2024 года

В Sygnum спрогнозировали рост капитализации биткоина до $20 млрд на фоне создания стратегического резерва

СМИ: Чехия освободила держателей криптоактивов от налога на прибыль

Paradox Interactive приобрела разработчика Surviving Mars, студию Haemimont Games

Obsidian подтвердила режим 60 fps для Avowed на Xbox Series X после предыдущих заявлений о его необязательности

Toyota построила свой первый в Америке завод по производству аккумуляторов для электромобилей

Управление данными в Deckhouse стало проще: интеграция с TATLIN.UNIFIED

Релиз открытого инструментария для загрузки прошивок Fwupd 2.0.5

Релиз инструмента для профессиональной записи и обработки звука Ardour 8.11

Релиз инструмента для редактирования и обработки видео с открытым исходным кодом VirtualDub2 2.2

Как быстро разгладить морщины после 40 лет - простой и эффективный способ

Semler Scientific приобрела 871 BTC

Сожженный свиток из Помпеев развернули благодаря современным технологиям: что написано внутри

ByteDance запускает ИИ-видеогенератор OmniHuman-1, который создаёт сверхреалистичные видео с любого фото

Больше новостей