Abstract :
Big Data saat ini menjadi topik hangat di kalangan organisasi dan peneliti seluruh
dunia karena munculnya teknologi dan media baru. Hadoop Mapreduce dan
Apache Spark adalah dua framework opensource populer untuk memproses data
dalam jumlah besar. Tujuan dalam penilitian ini yaitu Mengukur tingkat akurasi
dan performa dengan algoritma Support Vector Machine pada proses perbandingan
Apache Spark dan Hadoop Mapreduce. Cluster multi-node akan dibuat dimana 3
VM akan dibuat, masing-masing akan menginstal Apache Spark dan Apache
Hadoop, dengan aturan bahwa 1 VM akan bertindak sebagai master dan dua lainnya
sebagai pekerja. Dataset yang sudah ada dalam Hadoop Mapreduce dan Apache
Spark lalu diuji menggunakan algorirtma SVM. Hasilnya, setelah dilakukan 9
pengujian menemukan bahwa terdapat 9 akurasi yang berbeda dimana rata-rata
akurasinya ada pada nilai 80% lalu terdapat perbedaan kecepatan pada training
time dan testing time dimana Apache Spark dalam penilitian ini lebih cepat 3 kali
lipat dibandingkan dengan Apache Hadoop.
Kata kunci : Big Data, Hadoop Mapreduce, Apache Spark, Support Vector
Machine