Nari Labs выпустила компактную модель Dia для генерации диалогов из текста
Разработчики Nari Labs выпустили компактную нейросеть Dia для генерации диалогов из текста. Также пользователи могут управлять эмоциями собеседников и невербальной коммуникацией: смехом, кашлем и вздохами.Dia получает на вход стенограмму и генерирует из неё реалистичную аудиозапись диалога.
Несмотря на широкие возможности управления эмоциями и манерой разговора, разработчики не реализовали выбор конкретного голоса.
habr.com