Page 28 - Analisis Statistik Bigdata menggunakan Aplikasi Phyton
P. 28

18) Anaconda sudah siap digunakan untuk coding Python.
























                           3.  Managemen Data dengan Python

                            a.  Library utama (NumPy, Pandas)

                                      Pada Python terdapat Pandas dan NumPy adalah dua library fundamental
                            yang sering digunakan bersama untuk analisis data. Meskipun keduanya berfokus

                            pada data, ada perbedaan mendasar dalam fungsi dan tujuan utamanya.

                                      NumPy adalah library inti untuk komputasi ilmiah di Python. Tujuan
                            utamanya  adalah  menyediakan  objek  array  multidimensional  berkinerja  tinggi,

                            yang dikenal sebagai ⁠ndarray ⁠. Array ini jauh lebih efisien dalam hal memori dan
                            kecepatan pemrosesan dibandingkan dengan list bawaan Python, terutama untuk

                            operasi  numerik  skala  besar.  NumPy  sangat  ideal  untuk  tugas-tugas  yang
                            membutuhkan komputasi numerik intensif, seperti dalam machine learning, sinyal

                            digital, dan pemodelan ilmiah.

                                      Pandas dibangun di atas NumPy dan dirancang khusus untuk analisis
                            data struktural (data tabel).  Objek utamanya adalah ⁠ DataFrame ⁠ yang mirip dengan

                            tabel di spreadsheet atau database. ⁠ DataFrame ⁠ memiliki baris dan kolom berlabel,

                            yang  membuatnya  sangat  intuitif  untuk  bekerja  dengan  data.  DataFrame
                            menyediakan  struktur  data  ⁠ DataFrame ⁠  yang  fleksibel  untuk  data  tabuler,

                            menjadikannya alat yang sempurna untuk data set seperti CSV, Excel, atau tabel
   23   24   25   26   27   28   29   30   31   32   33