Abstract :
Media sosial merupakan salah satu manifestasi perkembangan digital yang sangat pesat dan dijadikan sebagai sebuah sarana untuk melakukan komunikasi, berbagi informasi dan juga untuk mengemukakan suatu pendapat, Media Sosial sering digunakan untuk menyebarkan ujaran kebencian, contohnya teitter. Banyaj bentuk ujrana kebencian di platform media sosial yang didasari oleh motif SARA (suku, agama, ras dan antargolongan). Di sisi lain, terdapat Undang-Undang Informasi dan Elektronik (UU ITE) untuk membatasi ruang bagi masyarakat dalam mengutarakan pendapat du dunia maya yang serba bebas. Ujaran kebencian merupakan salah satu permasalahan yang masuk ke dalam UU ITE. Klasifikasi teks adalah salah atu cara yang dapat dilakukan untuk menganalisa sebuah kalimat. Penelitian ini menggunakan algoritma Improved K-Nearest Neighbor dengan pembobotan term TF-IDF-1CSpF untuk melakukan klasifikasi data teks kalimat ujaran kebencian di twitter. 1.00 data tweet dengan 5 label yaitu agama, ras, fisik, gender dan lainnya digunakan untuk pelatihan dengan validasi 10 K-Fold Cross Validation dan diperoleh hasil nilai rata-rata akurasi, presisi, recall dan fl-score sebesar 88,11%, 91,18%, 87,59% dan 88,51%