Sabtu, 13 Mei 2017

Klasifikasi Dataset UCI Ecoli pada WEKA Menggunakan Metode Decision Tree, Naive Bayes dan Bayesian Network

Haloo semuanya, pada postingan kali ini saya akan membahas mengenai klasifikasi menggunakan tools WEKA.
Dan metode yang akan digunakan adalah Decision Tree, Naive Bayes dan Bayesian Network. 


Sebelum saya berlanjut ke tutorialnya, saya akan menjelaskan terlebih dahulu apa itu Decision Tree, Naive Bayes dan Bayes Network???
1. Decision Tree adalah salah satu metode klasifikasi yang paling populer karena mudah diinterpretasikan oleh manusia. Decision Tree digunakan untuk pengenalan pola dan termasuk dalam pengenalan pola secara statistik.
2. Naive Bayes adalah suatu klasifikasi berpeluang sederhana berdasarkan aplikasi teorema bayes dengan asumsi antar variabel penjelas saling bebas (independen). Naive Bayes dapat digunakan untuk berbagai macam keperluan antara lain untuk klasifikasi dokumen, deteksi spam atau filtering spam, dan masalah klasifikasi lainnya.
3. Bayesian Network adalah suatu interpretasi dari kalkulus yang memuat konsep probabilitas sebagai derajat dimana suatu pernyataan dipercaya benar. Metode bayesian juga dapat digunakan sebagai alat pengambilan keputusan untuk memperbarui tingkat kepercayaan dari suatu informasi.


Tools Yang Akan Digunakan :
Notepad
Ms. Excel 2016
WEKA : Download


Langkah pertama, Buka UCI Machine Learning untuk mendownload dataset. Berikut link dari UCI Machine Learning : https://archive.ics.uci.edu/ml/datasets.html


Pilihlah dataset yang kalian inginkan. Namun sebelum memilih, yang harus diperhatikan pada saat memilih dataset adalah jenis dataset yang akan dipilih seperti multivariate, time-series, dll. Serta perhatikan kategori classification / Regressionnya dan juga jenis atributnya. Dan disini saya akan menggunakan Ecoli Data Set.


Berdasarkan dataset yang telah dipilih, maka kita akan mendapatkan informasi detail dari dataset yang akan digunakan adalah :
Dataset Characteristics   : Multivariate
Attribute Characteristics : Real Associated
Tasks                               : Classification
Number of Instances       : 336
Number of Attributes      : 8
Missing Values?              : No
Area                                 : Life
Date Donated                  : 1996 – 09 – 01
Number of Web Hits       : 133343
Attribute Information      :
1. Sequence Name
2. mcg
3. gvh
4. lip
5. chg
6. aac
7. alm1
8. alm2
9. Class Distribution

Selanjutnya, kita masuk ke dalam Data Folder. Lalu pilih ecoli.data.


Maka akan muncul tampilan seperti yang ada di bawah ini. Tampilan tersebut adalah dataset yang bisa kita gunakan. Dan langkah selanjutnya adalah lakukan copy paste pada notepad.


Lalu ubah spasi menjadi , (koma). Dengan cara Replace All. Dan tambahkan attribute Sequence Name,mcg,gvh,lip,chg,aac,alm1,alm2, Class Distribution pada bagian atas dataset.



Setelah itu, langkah selanjutnya adalah lakukan copy paste pada data yang sudah kita rapihkan di notepad ke dalam excel. Lalu save as file tersebut dengan format .csv.






Dan sekarang kita mulai melakukan klasifikasi menggunakan Decision Tree, Naive Bayes dan Bayesian Network.



Klasifikasi Decision Tree         


1.       Buka Aplikasi WEKA, lalu pilih Explorer.




2.  Masukkan file .csv yang telah dibuat. Dengan cara Klik Open File >> Cari File .csv >> Ubah File of Type dengan CSV data Files >> Klik Open.



3.  Lakukan klasifikasi Decision Tree, dengan cara Buka Tab Classify >> Klik Choose >> Pilih Trees >> Klik J48.




4.   Lalu ubah Test Option menjadi Use Training Set dan Klik Start.



5.  Hasil dari klasifikasi menggunakan metode Decision Tree adalah seperti gambar di bawah ini:


Jadi klasifikasi Ecoli Dataset menggunakan metode Decision Tree memiliki akurasi sebesar 93%.





Klasifikasi Naive Bayes            
1    
      1. Buka Aplikasi WEKA, lalu pilih Explorer.



2.  Masukkan file .csv yang telah dibuat. Dengan cara Klik Open File >> Cari File .csv >> Ubah File of Type dengan CSV data Files >> Klik Open.



3.  Lakukan klasifikasi Naive Bayes, dengan cara Buka Tab Classify >> Klik Choose >> Pilih Bayes >> Klik NaiveBayes.



4.   Lalu ubah Test Option menjadi Use Training Set dan Klik Start.




5.   Hasil dari klasifikasi menggunakan metode Naive Bayes adalah seperti gambar di bawah ini:


Jadi klasifikasi Ecoli Dataset menggunakan metode Naive Bayes memiliki akurasi sebesar 92%.





Klasifikasi Bayesian Network

   1. Buka Aplikasi WEKA, lalu pilih Explorer.



2.  Masukkan file .csv yang telah dibuat. Dengan cara Klik Open File >> Cari File .csv >> Ubah File of Type dengan CSV data Files >> Klik Open.



3.  Lakukan klasifikasi Bayesian Network, dengan cara Buka Tab Classify >> Klik Choose >> Pilih Bayes >> Klik BayesNet.



4.   Lalu ubah Test Option menjadi Use Training Set dan Klik Start.



5. Hasil dari klasifikasi menggunakan metode Bayesian Network adalah seperti gambar di bawah ini:



Jadi klasifikasi Ecoli Dataset menggunakan metode Bayesian Network memiliki akurasi sebesar 95%.





Kesimpulan

     Dari ketiga metode klasifikasi yang telah diuji, yaitu Decision Tree, Naive Bayes dan Bayesian Network. Dapat disimpulkan bahwa metode Bayesian Network memiliki akurasi yang lebih tinggi sebesar 95% dibanding Decision Tree dan Naive Bayes. Karena Bayesian sendiri memiliki kelebihan mudah untuk dipahami, hanya memerlukan pengkodean yang sederhana dan lebih cepat dalam perhitungan. Maka dari itu dalam Klasifikasi Dataset Ecoli lebih cocok menggunakan metode Bayesian Network.


Ingin download Tutorialnya??? Klik Disini


Dan apabila kalian ingin lihat video tutorialnyanya, kalian bisa lihat di bawah ini!!!





Referensi