Page 28 - Analisis Statistik Bigdata menggunakan Aplikasi Phyton
P. 28
18) Anaconda sudah siap digunakan untuk coding Python.
3. Managemen Data dengan Python
a. Library utama (NumPy, Pandas)
Pada Python terdapat Pandas dan NumPy adalah dua library fundamental
yang sering digunakan bersama untuk analisis data. Meskipun keduanya berfokus
pada data, ada perbedaan mendasar dalam fungsi dan tujuan utamanya.
NumPy adalah library inti untuk komputasi ilmiah di Python. Tujuan
utamanya adalah menyediakan objek array multidimensional berkinerja tinggi,
yang dikenal sebagai ndarray . Array ini jauh lebih efisien dalam hal memori dan
kecepatan pemrosesan dibandingkan dengan list bawaan Python, terutama untuk
operasi numerik skala besar. NumPy sangat ideal untuk tugas-tugas yang
membutuhkan komputasi numerik intensif, seperti dalam machine learning, sinyal
digital, dan pemodelan ilmiah.
Pandas dibangun di atas NumPy dan dirancang khusus untuk analisis
data struktural (data tabel). Objek utamanya adalah DataFrame yang mirip dengan
tabel di spreadsheet atau database. DataFrame memiliki baris dan kolom berlabel,
yang membuatnya sangat intuitif untuk bekerja dengan data. DataFrame
menyediakan struktur data DataFrame yang fleksibel untuk data tabuler,
menjadikannya alat yang sempurna untuk data set seperti CSV, Excel, atau tabel

