Abstract :
Adanya sistem zonasi dalam sistem Penerimaan Peserta Didik Baru (PPDB) di Indonesia menyebabkan banyak masyarakat yang menuangkan opini mereka tentang sistem zonasi yang ada di Indonesia melalui media sosial. Salah satu media sosial yang popular di masyarakat adalah Twitter. Media sosial ini mampu menghubungkan banyak orang dengan berbagai topik dari seluruh dunia Dengan menggunakan Twitter masyarakat dapat memberikan berbagai macam pendapat mereka tentang apapun dalam bentuk komentar.
Dalam penelitian ini, diklasifikasikan apakah suatu tweet termasuk dalam kelas positif, negatif atau netral dalam kaitan penerapan sistem zonasi di Indonesia. Oleh karena itu, tweet yang telah dikumpulkan dan diberi label perlu dipraproses, meliputi case folding, cleaning, tokenisasi, normalisasi kata, stopword removal dan stemming. Selanjutnya, dilakukan ekstraksi fitur berdasarkan nilai document frequency dan threshold minimum bagi kata untuk dipilih sebagai fitur.
Setiap ditentukan nilai fitur dengan term frequency-inverse document frequency. Setelah dilakukan percobaan metode Support Vector Machine(SVM) menggunakan kernel liear dan percobaan tuning parameter dengan menggunakan kernel RBF, diketahui hasil akurasi dengan menggunakan kernel linear adalah 75% . Parameter terbaik adalah pasangan parameter C=1 dan γ=1 menggunakan kernel RBF dengan rataan akurasi sebesar 81% .
Kata kunci – kernel RBF , klasifikasi , Sistem zonasi, SVM , Tweet,