OpenAI выпускает новое поколение аудиомоделей: улучшенное распознавание и настройка стиля речи ИИ
Компания OpenAI выпустила новое поколение аудиомоделей, которые позволяют разработчикам настраивать речь своих ИИ-помощников.
Обновление включает улучшенное распознавание речи и возможность управлять стилем речи ИИ с помощью простых текстовых команд.По данным OpenAI, их новые модели gpt-4o-transcribe и gpt-4o-mini-transcribe допускают меньше ошибок при преобразовании речи в текст, чем предыдущие системы Whisper.
habr.com