DETAIL DOCUMENT
Analisis Performance Hdbscan Pada Clustering Berita Bahasa Indonesia
Total View This Week0
Institusion
Institut Teknologi Telkom Purwokerto
Author
Julyana, Islam Kartini
Subject
T Technology (General) 
Datestamp
2021-08-03 01:08:41 
Abstract :
Meningkatnya penggunaan internet telah memicu pertumbuhan dan pertukaran informasi menjadi jauh lebih pesat dibandingkan era sebelumnya. Volume berita elektronik berbahasa Indonesia semakin bertambah besar dan menyimpan informasi yang berharga di dalamnya. Pengelompokan berita berbahasa Indonesia merupakan salah satu solusi yang dapat digunakan untuk mempermudah mencerna informasi penting. Clustering dapat digunakan untuk membantu menganalisis berita dengan mengelompokan secara otomatis berita yang memiliki kesamaan. Clustering menggunakan teknik HDBSCAN. HDBSCAN merupakan teknik clustering dengan jumlah cluster tidak perlu ditentukan di awal inisialisasi. Clustering dilakukan menggunakan tahap pre-processing, pembobotan term frequency inverse documnet-frequency (tf.idf), dan perhitungan core point. Hasil penelitian menunjukan bahwa HDBSCAN mampu melakukan cluster terhadap berita berbahasa Indonesia dan menghasilkan nilai validasi F-Meassure sebesar 0,847. Kata kunci : Berita Indonesia, HDBSCAN, Pre-processing, tf.idf, F-Meassure 
Institution Info

Institut Teknologi Telkom Purwokerto