DETAIL DOCUMENT
PENERAPAN CORPUS-BASED TEXT SIMILARITY SEBAGAI PENGUKUR KESAMAAN FITUR PADA DATA BIBLIOGRAFI UNTUK MENINGKATKAN AKURASI KLASIFIKASI KESAMAAN PENULIS
Total View This Week0
Institusion
Universitas Sriwijaya
Author
AZIS MULKI RAFANI (STUDENT ID : 09011281722034)
Firdaus Firdaus (LECTURER ID : 0221017801)
Subject
Q334-342 Computer science. Artificial intelligence. Algorithms. Robotics. Automation. 
Datestamp
2021-08-04 07:19:21 
Abstract :
Author Name Disambiguation (AND) adalah kasus ambiguitas nama penulis yang terjadi pada suatu publikasi dalam database Digital Library (DL) yang disebabkan karena kondisi Synonymity Dan Homonymity pada nama penulis (author). Dalam tugas akhir ini mengusulkan penerapan Corpus-based Text Similarity dengan menggunakan feature extraction Bag of Words (BOW) dan Term Frequency-Inverse Document Frequency (TF-IDF) dengan classifier Deep Neural Network (DNN), Support Vector Machine dan Random Forest. Dataset yang digunakan adalah Dataset DBLP Labeled Data oleh Jinseok Kim, dkk. Penelitian yang dilakukan berfokus pada ekstraksi fitur dalam pengolahan data guna menciptakan fitur yang efektif untuk digunakan dalam klasifikasi. Parameter accuracy, precision, dan recall merupakan tolak ukur untuk mengetahui tingkat keberhasilan dari metode yang digunakan untuk mengatasi permasalahan AND pada kasus author matching. Dari 2 pendekatan dan 3 classifier, hasil terbaik didapatkan pada pendekatan BOW menggunakan classifier Random Forest, yang memiliki hasil accuracy, precision dan recall sebesar 99,80%, 99,84% dan 99,95%. 
Institution Info

Universitas Sriwijaya