Abstract :
Penelitian ini bertujuan untuk menganalisis pengaruh pra proses pada analisis sentimen. Pra proses ini dianalisis berdasarkan dari jurnal yang meneliti analisis sentimen sebanyak 50 jurnal. Setelah menganalisis pra proses jurnal, lalu melakukan analisis sentimen menggunakan kumpulan kombinasi pra proses yang didapat dari hasil analisis jurnal. Penelitian ini menggunakan support vector machine sebagai algoritma klasifikasi dengan kernel yang digunakan adalah kernel linier. Penelitian ini menggunakan data latih sebanyak 150 data dan data uji sebanyak 50 data yang diambil dari media sosial twitter. Berdasarkan hasil pengujian dilakukan menggunakan metode confusion matrix yang dilakukan terhadap data uji dengan kombinasi pra proses hasil analisis dari jurnal didapat hasil akurasi yang berbeda-beda tiap kombinasi pra proses dengan akurasi terbaik adalah analisis sentimen dengan kombinasi pra proses Normalisasi Fitur, Case Folding, Tokenizing, Stopword Removal, Stemming Dan Convert Negasi dengan hasil akurasi 94%. Berdasarkan hasil pengujian, kombinasi pra proses yang menggunakan tahapan pra proses lebih banyak tidak menjamin menghasilkan akurasi lebih baik. Begitu pula yang memakai jumlah tahapan yang sama bisa menghasilkan akurasi yang berbeda jika menggunakan pra proses yang berbeda. Dari pengujian yang telah dilakukan dapat ditarik kesimpulan bahwa analisis sentimen menggunakan pra proses yang berbeda dapat menghasilkan nilai akurasi yang berbeda.