VK выложила в открытый доступ датасет для инженеров, развивающих рекомендательные системы
Специалисты AI VK выложили в открытый доступ датасет VK-LSVD (Large Short-Video Dataset). По словам компании VK, с помощью этого датасета инженеры и учёные смогут развивать и совершенствовать рекомендательные алгоритмы для большей персонализации разрабатываемых решений.Выложенный датасет включает 40 млрд обезличенных уникальных взаимодействий 10 млн пользователей с 20 млн коротких видео за январь-июнь 2025, включая агрегированные лайки, дизлайки, пересылку знакомым, продолжительность просмотра и контекст воспроизведения.В VK отмечают, что все данные в датасете представлены в формате числовых идентификаторов и обеспечивают полную конфиденциальность.
Для каждого ролика предоставлен эмбеддинг, а для каждого пользователя предоставлены социально-демографические характеристики.
habr.com