Microsoft представила MAI-Transcribe-1 – нейросеть для распознавания при плохом качестве и одновременной речи
Модель поддерживает 25 языков (арабский, китайский, чешский, датский, нидерландский, английский, финский, французский, немецкий, хинди, венгерский, индонезийский, итальянский, японский, корейский, норвежский букмол, польский, португальский, румынский, русский, испанский, шведский, тайский, турецкий, вьетнамский) и демонстрирует самую низкую частоту ошибок среди всех протестированных систем на эталонном бенчмарке FLEURS.
В тестах она обошла Scribe v2, Whisper-large-V3, GPT-Transcribe и даже Gemini 3.1 Flash-Lite.Особенность MAI-Transcribe-1 – устойчивость к сложным условиям записи: фоновому шуму, плохому качеству звука и перекрёстной речи (когда несколько человек говорят одновременно).
habr.com