Haloo semuanya, pada postingan kali ini saya akan membahas mengenai klasifikasi menggunakan tools WEKA.
Dan metode yang akan digunakan adalah Decision Tree, Naive Bayes dan Bayesian Network.
Sebelum saya berlanjut ke tutorialnya, saya akan menjelaskan terlebih dahulu apa itu Decision Tree, Naive Bayes dan Bayes Network???
1. Decision Tree adalah salah satu metode klasifikasi yang paling populer karena mudah diinterpretasikan oleh manusia. Decision Tree digunakan untuk pengenalan pola dan termasuk dalam pengenalan pola secara statistik.
2. Naive Bayes adalah suatu klasifikasi berpeluang sederhana berdasarkan aplikasi teorema bayes dengan asumsi antar variabel penjelas saling bebas (independen). Naive Bayes dapat digunakan untuk berbagai macam keperluan antara lain untuk klasifikasi dokumen, deteksi spam atau filtering spam, dan masalah klasifikasi lainnya.
3. Bayesian Network adalah suatu interpretasi dari kalkulus yang memuat konsep probabilitas sebagai derajat dimana suatu pernyataan dipercaya benar. Metode bayesian juga dapat digunakan sebagai alat pengambilan keputusan untuk memperbarui tingkat kepercayaan dari suatu informasi.
Tools Yang Akan Digunakan :
Notepad
Ms. Excel 2016
WEKA : Download
Langkah pertama, Buka UCI Machine Learning untuk mendownload dataset. Berikut link dari UCI Machine Learning : https://archive.ics.uci.edu/ml/datasets.html
Dan metode yang akan digunakan adalah Decision Tree, Naive Bayes dan Bayesian Network.
Sebelum saya berlanjut ke tutorialnya, saya akan menjelaskan terlebih dahulu apa itu Decision Tree, Naive Bayes dan Bayes Network???
1. Decision Tree adalah salah satu metode klasifikasi yang paling populer karena mudah diinterpretasikan oleh manusia. Decision Tree digunakan untuk pengenalan pola dan termasuk dalam pengenalan pola secara statistik.
2. Naive Bayes adalah suatu klasifikasi berpeluang sederhana berdasarkan aplikasi teorema bayes dengan asumsi antar variabel penjelas saling bebas (independen). Naive Bayes dapat digunakan untuk berbagai macam keperluan antara lain untuk klasifikasi dokumen, deteksi spam atau filtering spam, dan masalah klasifikasi lainnya.
3. Bayesian Network adalah suatu interpretasi dari kalkulus yang memuat konsep probabilitas sebagai derajat dimana suatu pernyataan dipercaya benar. Metode bayesian juga dapat digunakan sebagai alat pengambilan keputusan untuk memperbarui tingkat kepercayaan dari suatu informasi.
Tools Yang Akan Digunakan :
Notepad
Ms. Excel 2016
WEKA : Download
Langkah pertama, Buka UCI Machine Learning untuk mendownload dataset. Berikut link dari UCI Machine Learning : https://archive.ics.uci.edu/ml/datasets.html
Pilihlah dataset yang kalian inginkan. Namun sebelum memilih, yang harus diperhatikan pada saat memilih dataset adalah jenis dataset yang akan dipilih seperti multivariate, time-series, dll. Serta perhatikan kategori classification / Regressionnya dan juga jenis atributnya. Dan disini saya akan menggunakan Ecoli Data Set.
Berdasarkan dataset yang telah dipilih, maka kita akan mendapatkan informasi detail dari dataset yang akan digunakan adalah :
Dataset Characteristics : Multivariate
Attribute Characteristics : Real Associated
Tasks : Classification
Number of Instances : 336
Number of Attributes : 8
Missing Values? : No
Area : Life
Date Donated : 1996 – 09 – 01
Number of Web Hits : 133343
Attribute Information :
1. Sequence Name
2. mcg
3. gvh
4. lip
5. chg
6. aac
7. alm1
8. alm2
9. Class Distribution
Selanjutnya, kita masuk ke dalam Data Folder. Lalu pilih ecoli.data.
Dataset Characteristics : Multivariate
Attribute Characteristics : Real Associated
Tasks : Classification
Number of Instances : 336
Number of Attributes : 8
Missing Values? : No
Area : Life
Date Donated : 1996 – 09 – 01
Number of Web Hits : 133343
Attribute Information :
1. Sequence Name
2. mcg
3. gvh
4. lip
5. chg
6. aac
7. alm1
8. alm2
9. Class Distribution
Selanjutnya, kita masuk ke dalam Data Folder. Lalu pilih ecoli.data.
Maka akan muncul tampilan seperti yang ada di bawah ini. Tampilan tersebut adalah dataset yang bisa kita gunakan. Dan langkah selanjutnya adalah lakukan copy paste pada notepad.
Lalu ubah spasi menjadi , (koma). Dengan cara Replace All. Dan tambahkan attribute Sequence Name,mcg,gvh,lip,chg,aac,alm1,alm2,
Class Distribution pada bagian atas dataset.
Setelah itu, langkah selanjutnya adalah lakukan copy paste pada data yang sudah kita rapihkan di notepad ke dalam excel. Lalu save as file tersebut dengan format .csv.
Dan sekarang kita mulai melakukan klasifikasi menggunakan Decision Tree, Naive Bayes dan Bayesian Network.
Klasifikasi Decision Tree
Setelah itu, langkah selanjutnya adalah lakukan copy paste pada data yang sudah kita rapihkan di notepad ke dalam excel. Lalu save as file tersebut dengan format .csv.
Dan sekarang kita mulai melakukan klasifikasi menggunakan Decision Tree, Naive Bayes dan Bayesian Network.
Klasifikasi Decision Tree
1.
Buka Aplikasi WEKA, lalu pilih Explorer.
2. Masukkan file .csv yang telah dibuat. Dengan
cara Klik Open File >> Cari File .csv >> Ubah File of Type dengan
CSV data Files >> Klik Open.
3. Lakukan klasifikasi Decision Tree, dengan cara
Buka Tab Classify >> Klik Choose >> Pilih Trees >> Klik J48.
4. Lalu ubah Test Option menjadi Use Training Set dan
Klik Start.
5. Hasil dari klasifikasi menggunakan metode
Decision Tree adalah seperti gambar di bawah ini:
Jadi klasifikasi Ecoli Dataset
menggunakan metode Decision Tree memiliki akurasi sebesar 93%.
Klasifikasi Naive Bayes
1
1. Buka Aplikasi WEKA, lalu pilih Explorer.
1. Buka Aplikasi WEKA, lalu pilih Explorer.
2. Masukkan file .csv yang telah dibuat. Dengan
cara Klik Open File >> Cari File .csv >> Ubah File of Type dengan
CSV data Files >> Klik Open.
3. Lakukan klasifikasi Naive Bayes, dengan cara
Buka Tab Classify >> Klik Choose >> Pilih Bayes >> Klik NaiveBayes.
4. Lalu ubah Test Option menjadi Use Training Set dan
Klik Start.
5. Hasil dari klasifikasi menggunakan metode Naive
Bayes adalah seperti gambar di bawah ini:
Jadi klasifikasi Ecoli Dataset menggunakan
metode Naive Bayes memiliki akurasi sebesar 92%.
Klasifikasi Bayesian Network
1. Buka
Aplikasi WEKA, lalu pilih Explorer.
2. Masukkan file .csv yang telah dibuat. Dengan
cara Klik Open File >> Cari File .csv >> Ubah File of Type dengan
CSV data Files >> Klik Open.
3. Lakukan klasifikasi Bayesian Network, dengan cara
Buka Tab Classify >> Klik Choose >> Pilih Bayes >> Klik
BayesNet.
4. Lalu ubah Test Option menjadi Use Training Set dan
Klik Start.
5. Hasil dari klasifikasi menggunakan metode
Bayesian Network adalah seperti gambar di bawah ini:
Jadi klasifikasi Ecoli Dataset
menggunakan metode Bayesian Network memiliki akurasi sebesar 95%.
Kesimpulan
Dari ketiga metode klasifikasi yang telah
diuji, yaitu Decision Tree, Naive Bayes dan Bayesian Network. Dapat disimpulkan
bahwa metode Bayesian Network memiliki akurasi yang lebih tinggi sebesar 95% dibanding Decision
Tree dan Naive Bayes. Karena Bayesian sendiri memiliki kelebihan mudah untuk
dipahami, hanya memerlukan pengkodean yang sederhana dan lebih cepat dalam
perhitungan. Maka dari itu dalam Klasifikasi Dataset Ecoli lebih cocok
menggunakan metode Bayesian Network.
Ingin download Tutorialnya??? Klik Disini
Dan apabila kalian ingin lihat video tutorialnyanya, kalian bisa lihat di bawah ini!!!
Dan apabila kalian ingin lihat video tutorialnyanya, kalian bisa lihat di bawah ini!!!
Referensi