Page 5 - Analisis Statistik Bigdata menggunakan Aplikasi Phyton
P. 5

BAB I

                                                       PENDAHULUAN



                           1.  Peran Statistik di Era Big Data

                                    Di  era  Big  Data  saat  ini,  pengetahuan  tentang  volume,  kecepatan,  dan
                            ragam  data  (volume,  velocity,  variety)  terus  meningkat  secara  eksponensial,

                            sehingga peranan statistik menjadi sangat penting dan semakin krusial. Statistik
                            bukan  lagi  sekadar  alat  bantu;  melainkan  fondasi  metodologi  yang  memastikan

                            bahwa  hasil  analisis  data  yang  besar  data  bersifat  valid,  dapat  dipercaya,  serta

                            bermanfaat.  Statistik  membantu  memastikan  bahwa  data  besar  (big  data)  yang
                            digunakan memenuhi standar kualitas, diantaranya bebas dari bias, outlier, missing

                            value, serta memiliki representasi yang memadai terhadap populasi target. Tanpa

                            pendekatan statistik, mudah sekali membuat kesimpulan yang berpeluang salah dari
                            data besar (big data) yang belum dibersihkan atau tidak representatif.

                                    Big  Data  tidak  hanya  besar  jumlahnya,  tapi  juga  sangat  bervariasi
                            (heterogen),  bergerak  cepat,  dan  mungkin  berasal  dari  berbagai  sumber  yang

                            berbeda  (terstruktur,  semi-terstruktur,  tidak  terstruktur).  Statistik  menyediakan
                            kerangka untuk:

                             1) Membuat model yang dapat menangani variabilitas dan heterogenitas data;

                             2) Mengukur dan mengendalikan ketidakpastian dan varians dalam pengukuran;
                             3) Mengaplikasikan teknik sampling, resampling, dan inferensi agar hasil analisis

                                tidak bias.

                                    Pendekatan statistik klasik di era big data perlu digabung dengan algoritma

                            pembelajaran mesin dan teknik komputasi tinggi. Statistik menyediakan landasan

                            teoretis  dan  inferensial,  sementara  machine  learning/teknik  komputasi
                            menyediakan  kecepatan  dan  kapasitas  skalabilitas.  Statistik  juga  membantu

                            mengubah data besar menjadi informasi yang dapat digunakan untuk pengambilan
                            Keputusan.
   1   2   3   4   5   6   7   8   9   10