Abstract :
Fakultas Teknologi Informasi (FTI) Universitas Kristen Duta Wacana (UKDW) memiliki suatu repositori untuk menyimpan seluruh dokumen resmi yang telah diterbitkan. Repositori tersebut menggunakan Apache SOLR (Search on Lucene, Rescaled) atau yang biasa disebut SOLR sebagai mesin pencari. SOLR mengalami kesulitan dalam proses pencarian dokumen. Hal ini dikarenakan sebagian besar dokumen yang tersimpan merupakan data tidak terstruktur dan belum memiliki indeks. SOLR akan kesulitan untuk melakukan pencarian berdasarkan isi dari dokumen tersebut, seperti contoh mencari berdasarkan judul atau tanggal pengesahan dokumen dari dokumen tersebut. SOLR sendiri tidak memiliki fitur untuk menentukan indeks secara otomatis dalam dokumen tersebut. Pada kasus ini, Named Entity Recognition (NER) dapat membantu pada proses pemberian indeks secara otomatis terhadap dokumen. NER membantu menentukan entitas dari suatu kata atau frasa dimana kata yang sudah mendapat entitas dapat dijadikan sebagai indeks untuk mesin pencari SOLR. Peneliti menggunakan dokumen resmi yang dikeluarkan dan tersimpan pada repositori FTI UKDW. Isi dari dokumen tersebut akan diberi entitas dengan mengimplementasi NER menggunakan metode Conditional Random Fields (CRF). Entitas yang terbentuk akan diubah menjadi indeks dan tersimpan dalam format JSON. Indeks dengan format JSON tersebut akan disimpan pada mesin pencari SOLR yang akan digunakan SOLR dalam proses pencarian kembali. Penelitian ini, menghasilkan sebuah sistem otomatisasi pemberian indeks dokumen dengan implementasi NER. Sistem tersebut dapat memberikan indeks dokumen dengan mengandalkan entitas yang didapati dari pengujian dengan CRF. Indeks yang didapat dapat digunakan oleh repositori FTI UKDW. Indeks yang telah terbentuk akan dipakai oleh SOLR untuk proses pencarian kembali.