Россия технологии Сбербанк Россия

«Сбер» открывает доступ к датасету Golos

GitHub.Данные Golos могут быть использованы для распознавания и синтеза речи. Сбер предоставит их по лицензии, допускающей использование в исследовательских и коммерческих целях.Над датасетом работала команда SberDevices.

Было сгенерировано более 1240 часов речи, похожей на запросы пользователей. Датасет Golos составляют обезличенные записи, прослушанные и размеченные вручную.Помимо данных, «Сбер» выкладывает обученную на них модель распознавания речи.

DMCA