Kecepatan dalam memproses data sangat diperlukan demi
mendapatkan suatu informasi yang bermanfaat. Karena sumber
informasi yang tersedia sangat besar dan tidak terbatas, hal ini tentu saja
menyulitkan pengguna dalam mendapatkan informasi yang diharapkan.
Keterbatasan waktu dan perangkat yang dimiliki merupakan salah satu
penyebabnya. Untuk mengolah dan memproses dengan melibatkan data
yang besar, Apache mengembangkan Hadoop Distributed File System
(HDFS) dan Hadoop Mapreduce dalam suatu framework yang bernama
Hadoop. Framework ini dapat menyelesaikan permasalahan secara
paralel atau bersama-sama. Oleh karena itu pada proyek akhir ini
dilakukan pengolahan serta pemrosesan data log jaringan EEPIS dalam
skala data yang besar menggunakan Hadoop Mapreduce. Permasalahan
ini diimplememtasikan pada sistem Single-Node Cluster (1-Node) dan
Multi-Node Cluster (5-Node).
Dari Hasil penelitian ini didapatkan bahwa sistem Multi-Node
Cluster mampu memproses data logfile lebih cepat dari pada sistem
Single-Node Cluster. Performa distribusi waktu tercepat adalah
menggunakan sistem 5-Cluster. Diperoleh sistem ini dapat memproses
data 3.71 kali lebih cepat dari pada sistem Single-Node Cluster.
Sehingga dapat disimpulkan bahwa semakin banyaknya node-node yang
terhubung dalam Cluster Hadoop Mapreduce, kecepatan distribusi
waktu yang dihasilkan akan semakin singkat terhadap data yang
diberikan.
Kata Kunci: Hadoop, HDFS, Mapreduce, Single-Node Cluster, Multi-
Node Cluster