Page 5 - Analisis Statistik Bigdata menggunakan Aplikasi Phyton
P. 5
BAB I
PENDAHULUAN
1. Peran Statistik di Era Big Data
Di era Big Data saat ini, pengetahuan tentang volume, kecepatan, dan
ragam data (volume, velocity, variety) terus meningkat secara eksponensial,
sehingga peranan statistik menjadi sangat penting dan semakin krusial. Statistik
bukan lagi sekadar alat bantu; melainkan fondasi metodologi yang memastikan
bahwa hasil analisis data yang besar data bersifat valid, dapat dipercaya, serta
bermanfaat. Statistik membantu memastikan bahwa data besar (big data) yang
digunakan memenuhi standar kualitas, diantaranya bebas dari bias, outlier, missing
value, serta memiliki representasi yang memadai terhadap populasi target. Tanpa
pendekatan statistik, mudah sekali membuat kesimpulan yang berpeluang salah dari
data besar (big data) yang belum dibersihkan atau tidak representatif.
Big Data tidak hanya besar jumlahnya, tapi juga sangat bervariasi
(heterogen), bergerak cepat, dan mungkin berasal dari berbagai sumber yang
berbeda (terstruktur, semi-terstruktur, tidak terstruktur). Statistik menyediakan
kerangka untuk:
1) Membuat model yang dapat menangani variabilitas dan heterogenitas data;
2) Mengukur dan mengendalikan ketidakpastian dan varians dalam pengukuran;
3) Mengaplikasikan teknik sampling, resampling, dan inferensi agar hasil analisis
tidak bias.
Pendekatan statistik klasik di era big data perlu digabung dengan algoritma
pembelajaran mesin dan teknik komputasi tinggi. Statistik menyediakan landasan
teoretis dan inferensial, sementara machine learning/teknik komputasi
menyediakan kecepatan dan kapasitas skalabilitas. Statistik juga membantu
mengubah data besar menjadi informasi yang dapat digunakan untuk pengambilan
Keputusan.

