cognitronn технологии крипто cognitronn

ElevenLabs представила STT-модель с задержкой менее 150 мс

Компания ElevenLabs выпустила Scribe v2 Realtime, новую модель Speech-to-Text, оптимизированную для задач, где важна минимальная задержка.

Система предназначена для голосовых ассистентов, конференц-агентов и создания субтитров в реальном времени. Задержка обработки речи составляет менее 150 мс, модель поддерживает более 90 языков и демонстрирует точность 93,5 % на 30 популярных языках.

DMCA