@thesis{thesis, author={Agatha Salsabilla}, title ={PERBANDINGAN JARAK EUCLIDEAN DISTANCE DAN COSINE SIMILARITY PADA ALGORITMA K-NEAREST NEIGHBOR UNTUK KLASIFIKASI JURNAL INTERNASIONAL}, year={2024}, url={http://eprints.upnyk.ac.id/40536/}, abstract={Dengan semakin banyaknya jurnal ilmiah yang dipublikasikan secara daring, kebutuhan akan sistem klasifikasi kategori jurnal yang efisien dan akurat menjadi sangat penting. Dalam mengklasifikasi jurnal dibutuhkan 2 parameter utama yaitu judul dan abstrak. Pada penelitian ini dilakukan 4 tahap. Pertama, pre-processing dataset yang mencakup case folding, tokenizing, stopword removal, dan stemming. Kedua, dilakukan pembobotan kata menggunakan Term Frequency-Inverse Document Frequency (TF-IDF). Setelah pembobotan, dilakukan penerapan algoritma K-Nearest Neighbor (K-NN). Di salah satu proses K-NN terdapat perhitungan jarak metriks. Pada penelitian ini perhitungan jarak cosine similarity dan euclidean distance dibandingkan. Hasil penelitian menunjukkan bahwa terdapat perbedaan dalam kinerja algoritma K-Nearest Neighbor (K-NN) berdasarkan kedua metode perhitungan jarak tersebut. Terakhir, pengujian dengan confusion matrix. Cosine similarity cenderung memberikan hasil yang lebih baik dalam mengukur kemiripan antar dokumen teks, terutama dalam konteks klasifikasi teks yang melibatkan banyak dimensi dan variasi kata. Hasil akurasi terbesar oleh cosine similarity sebesar 0,8249 pada k = 23. Di sisi lain, euclidean distance, meskipun sederhana dan intuitif, kurang efektif dalam menangani data teks yang memiliki dimensi tinggi. Hasil akurasi terbesar oleh euclidean distance sebesar 0,8209 pada k = 23. Kata kunci: K-Nearest Neighbor (K-NN), Cosine Similarity, Euclidean Distance, Jarak metriks, Text mining, Jurnal} }