| 
  • If you are citizen of an European Union member nation, you may not use this service unless you are at least 16 years old.

  • Stop wasting time looking for files and revisions. Connect your Gmail, DriveDropbox, and Slack accounts and in less than 2 minutes, Dokkio will automatically organize all your file attachments. Learn more and claim your free account.

View
 

Dasar Analisis Asosiasi

Page history last edited by PBworks 14 years, 3 months ago

Pengantar

 

Dasar analisis asosiasi atau association rule mining adalah teknik data mining untuk menemukan aturan assosiatif antara suatu kombinasi item. Contoh dari aturan assosiatif dari analisa pembelian di suatu pasar swalayan adalah bisa diketahui berapa besar kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Dengan pengetahuan tsb. pemilik pasar swalayan dapat mengatur penempatan barangnya atau merancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu.

Karena analisis asosiasi menjadi terkenal karena aplikasinya untuk menganalisa isi keranjang belanja

di pasar swalayan, analisis asosiasi juga sering disebut dengan istilah basket analysis.

 

Analisis asosiasi dikenal juga sebagai salah satu teknik data mining yang menjadi dasar dari berbagai teknik data mining lainnya. Khususnya salah satu tahap dari analisis asosiasi yang disebut analisis pola frequensi tinggi (frequent pattern mining) menarik perhatian banyak peneliti untuk menghasilkan algoritma yang efisien.

 

Bentuk dasar aturan assosiatif

 

Penting tidaknya suatu aturan assosiatif dapat diketahui dengan dua parameter, support(nilai penunjang) yaitu persentase kombinasi item tsb. dalam database dan confidence(nilai kepastian) yaitu kuatnya hubungan antar item dalam aturan assosiatif.

 

Aturan assosiatif biasanya dinyatakan dalam bentuk :

 

{roti, mentega} -> {susu} (support = 40%, confidence = 50%)

 

Yang artinya : "50% dari transaksi di database yang memuat item roti dan mentega juga memuat item susu. Sedangkan 40% dari seluruh transaksi yang ada di database memuat ketiga item itu."

 

Dapat juga diartikan : "Seorang konsumen yang membeli roti dan mentega punya kemungkinan 50% untuk juga membeli susu. Aturan ini cukup signifikan karena mewakili 40% dari catatan transaksi selama ini."

 

Analisis asosiasi didefinisikan suatu proses untuk menemukan semua aturan assosiatif yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk confidence (minimum confidence).

 

Metodologi dasar analisis asosiasi

 

Metodologi dasar analisis asosiasi terbagi menjadi dua tahap :

 

  1. analisa pola frekuensi tinggi

 

Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database. Sebagai contoh, ada database dari transaksi belanja pasar swalayan seperti berikut :

 

ID transaksiitem terjual
1pena,roti,mentega
2roti,mentega,telur,susu
3buncis,telur,susu
4roti,mentega
5roti,mentega,kecap,telur,susu

 

Syarat minimum dari nilai support untuk pola frekuensi tinggi dalam contoh ini adalah 30%.

 

Diketahui bahwa jumlah transaksi yang memuat {roti,mentega} ada 4 (support 80%), sedangkan jumlah transaksi yang memuat {roti,mentega,susu} ada 2 (support 40%), transaksi yang memuat {buncis} hanya 1 (support 20%) dsb.

 

Sehingga diperoleh pola frekuensi tinggi yang memenuhi syarat minimum nilai support adalah :

 

kombinasi itemsupport
{roti}80%
{mentega}80%
{telur}60%
{susu}60%
{roti,mentega}80%
{telur,susu}60%
{roti,susu}40%
{mentega,susu}40%
{roti,telur}40%
{mentega,telur}40%
{roti,mentega,susu}40%
{roti,mentega,telur,susu}40%

 

  1. pembentukan aturan assosiatif

 

Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan assosiatif A->B

dari support pola frekuensi tinggi A dan B dengan menggunakan rumus berikut :

 

confidence(A->B) = support(B) / support (A U B)

Disini A U B adalah union dari pola A dan B

 

Bila syarat minimum untuk confidence dari contoh diatas adalah 50% maka salah satu aturan assosiatif yang dapat ditemukan adalah :

{telur,susu} -> {roti,mentega}

dengan nilai confidence 66.6% karena

support({roti,mentega})/support({roti,mentega,telur,susu}) = 40%/60% = 66.6%

 

Aturan assosiatif lain yang dapat ditemukan diantaranya adalah :

 

aturan assosiatifsupportconfidence
{telur,susu} -> {roti,mentega}40%66.6%
{roti,mentega} -> {susu}40%50%
{mentega,susu} -> {roti}40%100%

 

Perlu dicatat bahwa tahap pertama untuk mencari pola frekuensi tinggi biasanya paling banyak menghabiskan waktu. Karenanya banyak peneliti berusaha mengembangkan algoritma yang efisien.

 

Algoritma-algoritma analisis asosiasi

 

Algoritma paling terkenal untuk menemukan pola frekuensi tinggi dan juga aturan assosiatif adalah Apriori yang dikembangkan para peneliti IBM Almaden :

 

R. Agrawal and R. Srikant. "Fast Algorithms for Mining Association Rules". Proc. of the 20th Int'l Conference on Very Large Databases, Santiago, Chile, September 1994.

http://www.almaden.ibm.com/software/projects/iis/hdb/publications.shtml

 

Source code dari algoritma-algoritma terbaru dapat di-download dari

Frequent Itemset Mining Implementations Repository

http://fimi.cs.helsinki.fi/

Disini juga tersedia beberapa dataset yang sering dijadikan benchmark untuk menguji performa dari algoritma analisa asosiasi.

Comments (0)

You don't have permission to comment on this page.