DETAIL DOCUMENT
Ekstraksi Informasi Dokumen Karya Ilmiah Menggunakan Algoritma Maximum Entropy Markov Model
Total View This Week0
Institusion
Universitas Komputer Indonesia
Author
Ilman, Dina
Subject
004_Data Processing & Computer Science 
Datestamp
2019-10-02 04:13:02 
Abstract :
Pendeteksian kategori dokumen karya ilmiah belum mampu dilakukan untuk dokumen dengan format beragam. Permasalahan tersebut dapat diatasi jika menggunakan machine learning. Algoritma machine learning yang digunakan adalah Maximum Entropy Markov Model (MEMM). Algoritma MEMM merupakan salah satu gabungan dari Markov Model dengan Logistic Regression. Proses pelatihan dari algoritma tersebut dokumen karya ilmiah dipelajari terlebih dahulu pola dari dataset dengan menentukan nilai lerarning rate dan bobot awal theta. Pengulangan berhenti berdasarkan nilai cross entropy jika sudah mendekati konvergen dan jumlah pengulangan. Pengujian berdasarkan model yang sudah dilatih dengan algoritma viterbi untuk mengekstraksi kategori pada dokumen karya ilmiah. Berdasarkan pengujian pada 40 dokumen karya ilmiah skripsi tahun 2011 sampai 2018, diperoleh rata-rata akurasi dengan pengujian token-kelas sebesar 77% dengan learning rate 0.001. Perolehan akurasi token-kelas disebabkan penggunaan fungsi fitur yang kurang unik untuk menentukan ciri dari setiap kategori dokumen, pelatihan bobot theta perlu menggunakan metode tambahan agar lebih tepat dan pengaruh learning rate yang menentukan seberapa banyak proses pelatihan dilakukan. 
Institution Info

Universitas Komputer Indonesia