Page 82 - E-Modul Teknologi Virtualisasi dan Cloud FIX
P. 82
mengalami kegagalan. Ketika cluster dihentikan, penyimpanan
sementara akan dipulihkan.
• EMR File System (EMRFS): Amazon EMR meningkatkan Hadoop
dengan memungkinkan pengguna mengakses data yang
disimpan di Amazon S3, seolah-olah itu adalah sistem file yang
mirip dengan HDFS. EMR File System (EMRFS) juga dapat
digunakan untuk menyimpan data menggunakan HDFS atau
Amazon S3.
• Sistem file lokal: Sistem file lokal mengacu pada disk yang
terpasang secara lokal. Setiap node dalam cluster Hadoop
dibangun menggunakan Instans Ec2 Amazon yang memiliki
sejumlah chunk penyimpanan disk yang sudah terpasang
sebelumnya. Data pada volume penyimpanan instan hanya
dipertahankan selama masa hidup instans Amazon EC2.
b. Manajemen Sumber Daya Cluster
Selanjutnya adalah lapisan Manajemen Sumber Daya Cluster.
Lapisan ini bertanggung jawab atas manajemen sumber daya cluster
dan penjadwalan pemrosesan data.
• YARN: YARN adalah fitur yang dikembangkan dalam Apache
Hadoop 2.0 untuk mengelola sumber daya cluster secara remote
untuk berbagai kerangka pemrosesan data, dan digunakan
secara default di AWS EMR. Di sisi lain, kerangka kerja dan
aplikasi lain yang tersedia di AWS EMR tidak menggunakan YARN
sebagai manajer sumber daya.
• Agen: Setiap node dalam cluster EMR memiliki agen yang
mengelola elemen YARN, memantau kesehatan cluster, dan
berinteraksi dengan EMR.
72