AnnieBronson продукты Nvidia Евросоюз AnnieBronson

Nvidia выпустила большой открытый набор данных Granary для обучения ИИ и работы с текстами на европейских языках

Nvidia представила крупный набор данных и две ИИ-модели для распознавания и перевода речи на европейских языках. В датасет под названием Granary вошло около миллиона часов аудио, из них свыше 650 тысяч часов предназначены для системы распознавания речи, а 350 тысяч часов — для перевода.

Granary охватывает 26 европейских языков: все 24 официальных языка Европейского союза, а также русский и украинский. Кроме широко представленных языков, таких как немецкий и французский, в Granary вошли аудиозаписи сравнительно редких языков, для которых ранее крупные датасеты не выходили, например хорватского, эстонского и мальтийского.

DMCA