Abstract :
Era globalisasi ditandai dengan perkembangan teknologi dan informasi, hal
ini berimbas pada kebutuhan manusia akan informasi. PMB (Penerimaan
Mahasiswa Baru) merupakan aktivitas rutin perguruan tinggi pada setiap
pembukaan ajaran baru. Pelaksanaan PMB tidak luput dari berbagai pertanyaan
yang sudah pernah ditanyakan sebelumnya. Dengan memanfaatkan teknologi
informasi maka lahirlah FAQ (Frequently Asked Question) yang berisikan jawaban
dari pertanyaan-pertanyaan yang sering dilontarkan oleh orang-orang yang
membutuhkan informasi. Untuk mengurangi beban pihak PMB dalam menjawab
pertanyaan secara berulang-ulang, maka dibangunlah sistem penjawab FAQ
dengan menerapkan pembobotan TF-IDF (Term Frequency-Inverse Document
Frequency) dan algoritma cosine similarity.
Pembobotan TF-IDF merupakan metode untuk memberikan bobot
hubungan suatu kata (term) terhadap suatu dokumen berdasarkan dua konsep, yaitu
frekuensi kemunculan kata di dalam sebuah dokumen dan inverse frekuensi
dokumen yang mengandung kata tersebut. TF-IDF digunakan untuk mengevaluasi
seberapa pentingnya sebuah kata di dalam sebuah dokumen. Sedangkan cosine
similarity merupakan metode yang digunakan untuk menghitung tingkat kesamaan
(similarity) antar dua buah objek. Metode ini menghitung similarity antara dua buah
objek yang dinyatakan dalam dua buah vektor dengan menggunakan kata kunci
(keyword) dari sebuah dokumen sebagai ukuran.
Penelitian ini menggunakan 7 buah sampel data dari keseluruhan data FAQ
yang didapat dari wawancara dengan Ibu Susilawati, S.Kom, salah satu staf PMB
Universitas Bumigora. Data sampel yang digunakan akan melalui proses
preprocessing, pembobotan TF-IDF, dan metode cosine similarity untuk
menentukan tingkat kesamaan tertinggi yang nantinya akan keluar sebagai hasil
akhir. Dengan menggunakan pembobotan TF-IDF dan metode cosine similarity
pada 7 data sampel bisa mendapatkan tingkat akurasi hingga mencapai 64.28%.