Institusion
Universitas Pembangunan Nasional Veteran Yogyakarta
Author
Assabila, Maulida Maizani
Subject
ZA Information resources
Datestamp
2024-10-03 03:50:24
Abstract :
vii
ABSTRAK
Pemindahan Ibu Kota Negara Indonesia dari Jakarta ke Kalimantan Timur telah menjadi
isu yang menarik banyak perhatian publik dan memicu berbagai reaksi di media sosial, terutama
di Twitter. Penelitian ini bertujuan untuk menganalisis sentimen masyarakat terhadap kebijakan
pemindahan ibu kota dengan menggunakan metode Naïve Bayes. Untuk meningkatkan akurasi
dan kinerja model, penelitian ini mengimplementasikan teknik seleksi fitur Chi-Square untuk
mengurangi jumlah fitur yang tidak relevan, serta menggunakan teknik SMOTE untuk
menangani masalah imbalanced dataset yang sering terjadi dalam analisis sentimen.
Penelitian dimulai dengan pengumpulan data melalui web-scraping dari Twitter dan
pengolahan teks melalui berbagai tahap preprocessing. Data dibersihkan, dinormalisasi, dan
diberi label sebagai sentimen positif atau negatif. Setelah itu, pembobotan kata dilakukan
menggunakan TF-IDF, diikuti dengan teknik SMOTE untuk menyeimbangkan distribusi kelas,
serta seleksi fitur menggunakan Chi-Square.
Hasil penelitian menunjukkan bahwa seleksi fitur Chi-Square berhasil mengurangi
jumlah fitur dari 4127 menjadi 1000 fitur yang paling relevan, yang berkontribusi pada
peningkatan akurasi model sebesar 9%. Teknik SMOTE juga terbukti efektif dalam
meningkatkan performa model dengan menyeimbangkan distribusi data antara kelas positif dan
negatif, yang menghasilkan peningkatan akurasi sebesar 6%. Kombinasi antara seleksi fitur Chi-
Square dan teknik SMOTE menghasilkan performa terbaik pada model Naïve Bayes, dengan
peningkatan akurasi sebesar 15%. Model menghasilkan akurasi tertinggi mencapai 89%, presisi
86%, recall 92%, dan f1-score 89%. Penelitian ini menunjukkan bahwa penggunaan kedua
teknik tersebut secara bersamaan dapat meningkatkan kinerja model dalam analisis sentimen,
sehingga dapat menjadi alat evaluasi yang efektif dalam mendukung pengambilan keputusan
kebijakan publik di masa depan.
Kata Kunci: Analisis Sentimen, Naïve Bayes, Chi-Square, SMOTE, IKN.
viii
ABSTRACT
The relocation of Indonesia's capital city from Jakarta to East Kalimantan has become
an issue that has garnered significant public attention, triggering various reactions on social
media, particularly on Twitter. This research aims to analyze public sentiment towards the
capital relocation policy using the Naïve Bayes method. To improve the model's accuracy and
performance, this study implements the Chi-Square feature selection technique to reduce
irrelevant features and applies the SMOTE technique to address the imbalanced dataset issue,
which is common in sentiment analysis.
The research began with data collection through web scraping from Twitter, followed by
text processing through several preprocessing stages. The data was cleaned, normalized, and
labeled as either positive or negative sentiment. Afterward, term weighting was performed using
TF-IDF, followed by SMOTE to balance class distribution, and feature selection was conducted
using Chi-Square.
The results show that Chi-Square feature selection successfully reduced the number of
features from 4127 to 1000 of the most relevant features, contributing to a 9% increase in model
accuracy. SMOTE also proved effective in enhancing model performance by balancing the data
distribution between positive and negative classes, resulting in a 6% accuracy improvement.
The combination of Chi-Square feature selection and SMOTE yielded the best performance for
the Naïve Bayes model, with a 15% accuracy increase. The model achieved a maximum
accuracy of 89%, precision of 86%, recall of 92%, and f1-score of 89%. This study demonstrates
that using both techniques together can significantly enhance model performance in sentiment
analysis, making it a valuable tool for evaluating public policies in the future.
Keywords: Sentiment Analysis, Naïve Bayes, Chi-Square, SMOTE, IKN.