«Сбер» открывает доступ к датасету Golos
GitHub.Данные Golos могут быть использованы для распознавания и синтеза речи. Сбер предоставит их по лицензии, допускающей использование в исследовательских и коммерческих целях.Над датасетом работала команда SberDevices.
Было сгенерировано более 1240 часов речи, похожей на запросы пользователей. Датасет Golos составляют обезличенные записи, прослушанные и размеченные вручную.Помимо данных, «Сбер» выкладывает обученную на них модель распознавания речи.