Sayfalar

24 Mayıs 2014 Cumartesi

Association Rule

Association rule datamining teknikleri içinde birliktelik kurallarını belirlemek için kullanılır. Özellikle Perakende sektöründe Sepet Analizi için idealdir.  Amaç aşağıdaki gibi bir sonuca ulaşmaktır.

{PANTOLON, SWEAT} => {GÖMLEK}

Bu sonuca ulaşmak için yöntem tüm olası durumlar için hesaplamalar yapabilir. Sonuç kümesi olarak sadece doğruluğu ve değeri yüksek sonuçlar kullanılır.

Üzerinde çalışılacak tüm terimler için;
 I ={terim1 , terim2, .... } şeklindedir.   

Bu Terimlerden oluşan her bir Set sistemin veri kaynağıdır.
D = {set1 , set2 , set3 ..... } 
her bir set I kümesinin bir  alt eşit kümesi olabilir. 

Amaç 
 X => Y sonucuna ulaşmaktır. 
Burada  X ve Y kümeleri I Kümesinin alt kümeleri ve X kesişim Y = boş küme olmalıdır.

 İlgili şartlar altında tüm durumlar için üç değer belirlenir;

support (destek) :    supp şeklinde de geçer.
supp = (X U Y kümesini içeren Set sayısı) / (Toplam Set Sayısı)
Dolayısıyla Support değeri ilgili değerin toplam set içindeki oranını verir.

confidence (güven):  conf şeklinde de geçer.

conf =  (X U Y kümesini içeren Set sayısı) / (X kümesini içeren Set sayısı)

Bu da X terimlerini içeren Set ler içinde Y 'ninde olduğu Set lerin oranını verir.

Aşağıdaki Sonuç kümesini için;
1. satır  "Bir Sepette Pantalon ve Sweat , Gömlek olması tüm sepetlerin %1'inde görülmektedir. Pantalon ve Sweat içeren sepetlerin ise %47 ' sinde Gömlek vardır." anlamı çıkar.
5. satır "Sepette Pantalon ve Gömlek olması tüm sepetlerin %3.3'ünde görülmektedir. İçinde Pantrol olan sepetlerin  %30 'unda ise Gömlek de vardır.


lhs
rhssupportconfidencelift
1{PANTOLON,





SWEAT}=>{GÖMLEK}0.0104890.470527 2.123
2{TRİKO,





SWEAT}=>{GÖMLEK}0.0106270.4108731.8542
3{GÖMLEK,





TRİKO}=>{SWEAT}0.0106270.3714742.4407
4{GÖMLEK,





PANTOLON}=>{SWEAT}0.0104890.3168522.0818
5{PANTOLON}=>{GÖMLEK}0.0331040.3072971.3868

The R uygulaması kullanılarak Association rule kullanımı ayrıca anlatılacak.




Hiç yorum yok:

Yorum Gönder