Page 96 - E Modul Data Analytics
P. 96
Data Analytics
Apabila dataset bertipe numeric maka digunakan penghitungan distribusi Gaussian (Ryu &
Baik, 2016). Perhitungan distribusi dapat dilihat dari persamaan, di mana dihitung terlebih
dahulu rata-rata u sesuai persamaan, dan standard deviasi o sesuai persamaan.
1 −( − ) 2
( , , ) = 2 2
√2 .
∑
=
∑ ( − ) 2
= √
− 1
Langkah-langkah algoritma Naïve Bayes
1. Menyiapkan dataset
2. Lalu hitunglah jumlah kelas yang terpadat di data latih
3. Lalu hitunglah jumlah kasus dengan kelas yang sama.
4. Kemudian dikalikan hasil sesuai pada data uji yang akan dicari kelasnya.
5. Lalu bandingkan hasil per kelas, nilai yang paling tinggi dapat ditetentukan sebagai kelas
baru.
7.3 Aplikasi Klasifikasi (Studi Kasus)
7.3.1 Penghitungan Manual Tipe Data Nominal Algoritma Naïve Bayes
Dataset yang digunakan pada perhitungan manual ini adalah data pembelian komputer.
Dataset pembelian computer dibagi menjadi dua, yaitu data latih (dapat dilihat pada tabel 1) dan
data uji (dapat dilihat pada tabel 2). dataset pembelian komputer bertipe data nominal terdiri
dari 4 atribut dan 21 kelas. Berikut adalah langkah langkah perhitungan manual algoritma Naïve
Bayes:
1. Siapkan dataset. Seperti yang telah dijelaskan di atas, dataset yang digunakan pada
perhitungan manual ini menggunakan dataset pembelian computer. Dan dapat di lihat pada
tabel 1 dan 2.
84