Rossiyada raqamli kontent sohasidagi eng keng ko'lamli ochiq ma'lumotlar to'plamlaridan biri taqdim etilgan. VK tadqiqotchilarga qisqa videolar bilan foydalanuvchilarning o'zaro ta'siri haqida bir qator ma'lumotlarga kirish huquqini berdi. VK-Lsvd (large Short-Video Dataset) ma'lumotlar to'plami olti oy davomida 10 million odamning xatti-harakati va 20 million video ma'lumotlarini o'z ichiga olgan 40 milliarddan ortiq shaxssiz o'zaro ta'sirlarni o'z ichiga oladi.
To'plamda tomoshabinlar qisqa videolarga qanday munosabatda bo'lishlari haqida batafsil ma'lumotlar mavjud: yoqtirishlar, yoqtirishlar, repostlar, ko'rish vaqti va ijro etish konteksti hisobga olinadi. Bundan tashqari, ishlab chiquvchilar foydalanuvchilarning ijtimoiy-demografik xususiyatlari to'g'risidagi ma'lumotlarga ega bo'lishdi, bu esa shaxsiylashtirilgan tavsiyalar algoritmlarini tahlil qilish va ishlab chiqishda aniqlikni sezilarli darajada oshirishga imkon beradi.
Qisqa videolarning o'ziga xos xususiyati bor-ular fonda sezilmaydi, har bir tarkib birligi tomoshabinlarning u yoki bu reaktsiyasini oladi. Bu bunday massivlarni sun'iy intellekt sohasidagi mutaxassislar uchun ayniqsa qimmatli qiladi, chunki ma'lumotlar nafaqat foydalanuvchilarning afzalliklarini, balki tarkibni iste'mol qilish naqshlarini ham modellashtirishga imkon beradi.
Bunday ochiq ma'lumotlar to'plamini nashr etish ilmiy va texnologik hamjamiyat uchun muhim voqea hisoblanadi. Bu tavsiya tizimlarini takomillashtirish, mashinani o'rganish sohasida yangi yondashuvlarni ishlab chiqish va xulq-atvor ma'lumotlarini tahlil qilishning innovatsion modellarini sinab ko'rish imkoniyatini beradi.