Вышла новая открытая модель синтеза речи Kani-TTS-370M
Вышла новая открытая модель синтеза речи Kani-TTS-370M, обеспечивающая естественное и выразительное звучание при высокой скорости работы.
Модель насчитывает 370 миллионов параметров и оптимизирована для работы на потребительских GPU, включая RTX 3060, где она способна генерировать речь в реальном времени.Kani-TTS сочетает технологии NanoCodec и LFM2-350M, что обеспечивает компактность модели и качество звучания, сопоставимое с крупными нейросетевыми TTS-системами.
habr.com