Page 95 - E Modul Data Analytics
P. 95
Data Analytics
7. Naïve Bayes mudah untuk digunakan ditambah dengan aplikasi RapidMiner yang telah
menyediakan algoritma tersebut.
8. Pengklasifikasian dokumen dengan Naïve Bayes dapat di personalisasi dan juga dapat
disesuaikan dengan kebutuhan setiap orang.
9. Jika digunakan dalam bahasa pemrograman, kode Naïve Bayes cukup sederhana.
10. Naïve Bayes dapat digunakan dalam klasifikasi permasalahan biner ataupun multiclass.
Kekurangan Naïve Bayes:
1. Pada Naïve Bayes apabila probabilitas kondisionalnya bernilai nol, maka probabilitas
prediksi juga akan bernilai nol.
2. Pada Naïve Bayes diasusikan bahwa masing-masing variabel independen membuat
berkurangnya akurasi, karena biasanya ada korelasi antara variabel yang satu dengan
variabel yang lain.
3. Keakuratan Naïve Bayes tidak dapat diukur hanya menggunakan satu probabilitas saja.
Diperlukan pengujian dan bukti-bukti lain untuk membuktikannya.
4. Untuk membuat keputusan, pada Naïve Bayes diperlukan pengetahuan awal atau
pengetahuan mengenai masa sebelumnya. Keberhasilan Naïve Bayes sangat bergantung
pada pengetahuan awal tersebut. Terdapat beberap celah yang dapat mengurangi
efektivitasnya. Naïve Bayes dirancang untuk menganalisis dan mendeteksi data yang
bersifat text saja, tidak bisa berupa gambar
Teorema Bayein menghitung nilai posterior probability P (H|X) menggunakan probabilitas
P(H), P(X), dan P (Kantardzic, 2011), di mana nilai X adalah data uji yang kelasnya tidak
diketahui. Nilai H adalah hipotesis data X adalah suatu kelas yang spesifik. Nilai P(X|H) atau
disebut juga dengan likelihood, adalah probabilitas hipotesis X berdasarkan kondisi H. nilai P(H)
atau disebut juga dengan prior probability adalah hipotesisH. Sedangkan nilai P(X) yang disebut
juga dengan predictor prior probability adalah probabilitas X.(X|H).
( | ). ( )
P(H|X) =
( )
Algoritma Naïve Bayes ini sangat cocok untuk klarifikasi untuk dataset bertipe nominal.
Untuk dataset bertipe nominal, perhitungan algoritma Naïve Bayes menggunakan persamaan.
83