Abstract :
Kata Kunci : Naive Bayes Classifier, SMS spam, Text Mining, Bahasa Indonesia, Java Programming.
Short Message Service (SMS) adalah salah satu layanan komunikasi untuk mengirim dan menerima pesan singkat berupa teks pada telepon seluler (ponsel). SMS masih digunakan setiap harinya karena kemudahan penggunaan, sederhana, cepat, dan murah. Meningkatnya penggunaan SMS dimanfaatkan oleh banyak pihak untuk mendapatkan keuntungan, salah satunya adalah mengirimkan spam melalui SMS. Metode yang digunakan melakukan pendekatan probabilistik dalam melakukan inferensi yakni berbasis teorema bayes secara umum. Data latih yang digunakan pada proses pengkategorian didapat dari jurnal dan sudah memiliki kategori sebelumnya yaitu SMS spam dan bukan spam. Aplikasi pada SMS berbahasa Indonesia, yang mempunyai morfologi tertentu dalam pemrosesan pengkategorian. Aplikasi melakukan beberapa tahapan dalam melakukan pemrosesan diantaranya adalah preprocessing berupa case folding, dan parsing, transformation berupa penghapusan stopword removal dan stemming, penghitungan frekuensi dan probabilitas dan perhitungan naïve bayes. Pengkategorian yang dihasilkan oleh aplikasi dibandingkan dengan pengkategorian manual mempunyai rata rata precision sebesar 24%, recall 88% dan Confusion Matrix (Akurasi) sebesar 62%.