İş

Yandex, öneri sistemleri için dünyanın en büyük etkinlik veri setini yayınladı

Yandex, öneri sistemlerini geliştirmek amacıyla, Yandex Music akış servisinden 10 ay boyunca toplanan 4,79 milyar anonimleştirilmiş kullanıcı etkileşimini içeren dünyanın en büyük açık etkinlik veri setini araştırmacıların kullanımına sundu.

Veri seti, anonimleştirilmiş ses katıştırmaları, organik etkileşim işaretleri ve zaman damgaları gibi öğeleri içeriyor. Bu sayede, araştırmacılar yeni öneri algoritmalarını test etme ve mevcut sistemlerle karşılaştırma fırsatı buluyor.

Yambda-5B olarak adlandırılan bu veri seti, 1 milyon kullanıcıdan alınan yaklaşık 4,79 milyar etkileşimle

Veri seti, üç farklı büyüklükte sunuluyor: 5 milyar, 500 milyon ve 50 milyon etkinlik. Hugging Face üzerinden erişilebilen bu veri seti, araştırmalara ve geliştirme süreçlerine önemli katkılar sağlamayı amaçlıyor. Özellikle, veri seti, sınırlı kaynaklara sahip startup’ların öneri sistemlerini oluşturup test etmelerine olanak tanıyor.

Yandex’in öneri sistemleri başkanı Nikolai Savushkin, büyük veri setlerinin akademik araştırmalarla endüstri arasındaki boşluğu dolduracağına ve inovasyonu hızlandıracağına dikkat çekti. Yambda veri setinin sunulması, öneri sistemleri ve büyük dil modelleri gibi hızla gelişen alanlarda önemli bir adım olarak değerlendiriliyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu