@thesis{thesis, author={Mualifa Rahma}, title ={RANCANG BANGUN SISTEM DATA CLEANING UNTUK MASTER DATA KONSUMEN DI PT XYZ DENGAN MENERAPKAN METODE SORTED NEIGHBOURHOOD DAN METODE N-GRAM}, year={2016}, url={http://repository.bakrie.ac.id/196/}, abstract={Penelitian ini membahas tentang rancang bangun sistem data cleaning untuk dapat mendeteksi duplikasi data yang ada pada master data konsumen Divisi Consumer Care PT XYZ. Metode yang digunakan dalam penelitian ini untuk mendeteksi duplikasi data adalah dengan menerapkan pendekatan metode Sorted Neighbourhood (SNM) dan N-Gram. Sistem data cleaning ini bertujuan membantu user untuk dapat mempermudah menemukan duplikasi data. Selain itu, sistem ini juga dapat membantu user untuk dapat merapikan format penulisan telepon dan fax yang ada pada master data konsumen Divisi Consumer Care PT XYZ. Sistem yang akan dibangun adalah sistem web based dengan menggunakan bahasa pemrograman C#. Hasil dari sistem data cleaning yang dibangun kemudian akan diuji coba kepada user dan dinilai seberapa efektif metode SNM dan N-Gram dalam mendeteksi duplikasi data dengan menghitung nilai recall dan precision terhadap hasil proses deteksi duplikasi data.} }