В каталоге готовых моделей Selectel появились модели для распознавания речи

habr.com:

Мы расширили наш Foundation Models Catalog — добавили в него модели для транскрибации аудио (Speech-to-Text), включая легендарное семейство Whisper и GLM-ASR-Nano — новую передовую модель для распознавания речи.

Они умеют конвертировать живую речь в связный структурированный текст: отлично справляются с шумом, распознают сложные термины, понимают разные акценты и автоматически расставляют знаки препинания. Главные фишки новых моделей: мультиязычность — точечное распознавание десятков языков мира;высокая точность — уверенно разбирают даже тихую или быструю речь;широкий спектр задач — от расшифровки звонков до создания субтитров к видео. Сферы применения: голосовые ассистенты и умные боты;транскрибация интервью, лекций и созвонов;аналитика работы колл-центров.Новые модели уже доступны в Foundation Models Catalog — можете протестировать их и подключить к вашим сервисам через API.

Читать на habr.com Все новости от habr.com

Владельцам этих моделей iPhone стоит насторожиться – эксперты

Adobe и Walt Disney Imagineering разработали кастомные ИИ‑модели для проектирования тематических парков

Разработчик проиндексировал 669 ГБ видео с помощью локальных моделей и настроил поиск по сценам на естественном языке

Блокировка моделей Anthropic заставила лидеров G7 пересмотреть зависимость от ИИ США

Владельцам этих моделей iPhone стоит насторожиться – эксперты

Adobe и Walt Disney Imagineering разработали кастомные ИИ‑модели для проектирования тематических парков

Блокировка моделей Anthropic заставила лидеров G7 пересмотреть зависимость от ИИ США

Энтузиасты нашли способ запускать обучение ИИ-моделей на Neural Engine в Apple M4

Связка дешёвых моделей обошла GPT-5.5 и Opus 4.8

OpenRouter Fusion обошел GPT-5.5 и Opus 4.8 — за счет совещания моделей

OpenClaw и LabelStudio: расширяем каталог AI-маркетплейса Selectel