DETAIL DOCUMENT
RANCANG BANGUN SISTEM DATA CLEANING UNTUK MASTER DATA KONSUMEN DI PT XYZ DENGAN MENERAPKAN METODE SORTED NEIGHBOURHOOD DAN METODE N-GRAM
Total View This Week0
Institusion
Universitas Bakrie
Author
Mualifa, Rahma
Subject
Computer Science 
Datestamp
2016-08-15 02:59:50 
Abstract :
Penelitian ini membahas tentang rancang bangun sistem data cleaning untuk dapat mendeteksi duplikasi data yang ada pada master data konsumen Divisi Consumer Care PT XYZ. Metode yang digunakan dalam penelitian ini untuk mendeteksi duplikasi data adalah dengan menerapkan pendekatan metode Sorted Neighbourhood (SNM) dan N-Gram. Sistem data cleaning ini bertujuan membantu user untuk dapat mempermudah menemukan duplikasi data. Selain itu, sistem ini juga dapat membantu user untuk dapat merapikan format penulisan telepon dan fax yang ada pada master data konsumen Divisi Consumer Care PT XYZ. Sistem yang akan dibangun adalah sistem web based dengan menggunakan bahasa pemrograman C#. Hasil dari sistem data cleaning yang dibangun kemudian akan diuji coba kepada user dan dinilai seberapa efektif metode SNM dan N-Gram dalam mendeteksi duplikasi data dengan menghitung nilai recall dan precision terhadap hasil proses deteksi duplikasi data. 
Institution Info

Universitas Bakrie