|
|
|
# Pengembangan Aplikasi Data Cleaning untuk Multiple Data Edits
|
|
|
|
|
|
|
|
Aplikasi ini mengembangkan metode semi-auto yang memperbaiki data secara hollistic atau secara menyeluruh dengan memperhatikan interaksi antar rules untuk mendapatkan perbaikan data terbaik dan menyediakan opsi untuk mempermudah perbaikan manual. Perbaikan manual diterapkan karena beberapa error hanya bisa diperbaiki oleh pengalaman Subject matter. Aplikasi ini bertujuan untuk mempermudah dan mengurangi waktu, tenaga, dan cost yang dipakai BPS pada tahap perbaikan data.
|
|
|
|
|
|
|
|
### Instalation
|
|
|
|
|
|
|
|
* Prosesor intel core i5-3317U ~1.7Ghz
|
|
|
|
* RAM 12 GB
|
|
|
|
* Harddisk 1 TB
|
|
|
|
* VGA NVIDIA GeForce GT 740M 2GB
|
|
|
|
* Windows OS
|
|
|
|
* Netbeans 8.1
|
|
|
|
* yfiles 2.14 Evaluation
|
|
|
|
* Ms Excel
|
|
|
|
|
|
|
|
### Bahasa Pemograman
|
|
|
|
|
|
|
|
* Java
|
|
|
|
|
|
|
|
### Datasets
|
|
|
|
* Subset dari Data Susenas 2016: 209 Atribut, 483 Rules, 100 Record Random, dan error rate sebesar 5%, 10%, 15%, 20%, 25%, 30%
|
|
|
|
|
|
|
|
### Fitur
|
|
|
|
|
|
|
|
* GUI input files
|
|
|
|
* Perbaikan data secara hollistic atau menyeluruh dengan memperhatikan interaksi antar rules
|
|
|
|
* Deskripsi data yang memiliki error
|
|
|
|
* Deskripsi data yang telah diperbaiki
|
|
|
|
* Melihat rules yang dilanggar
|
|
|
|
* Representasi Rules berupa graph
|
|
|
|
* Representasi graph error
|
|
|
|
* Perbaikan data manual
|
|
|
|
|
|
|
|
|
|
|
|
### Demo dan Screenshoot Aplikasi
|
|
|
|
#### Menu Input
|
|
|
|

|
|
|
|
* User bisa memilih opsi input data atau input rules atau input domain dan multiple. jika setelah selesai menginput files perbaikan data akan dimulai tengan mengclick tombol centang. Perbaikan data akan dimulai setelah tombol centang memperiksa apakah data telah dimasukan, jika salah satu files belum diinput aplikasi akan memberi peringatan.
|
|
|
|
|
|
|
|
#### Input Data atau Input Rules
|
|
|
|

|
|
|
|
* Tampilan ketika User memilih opsi input data atau input rules
|
|
|
|
|
|
|
|
#### Input Domain dan Multiple
|
|
|
|

|
|
|
|
* Tampilan ketika User memilih opsi input domain dan multiple
|
|
|
|
|
|
|
|
#### Deskripsi Data
|
|
|
|

|
|
|
|
* User dapat melihat data yang memiliki error, jumlah error, rules yang dilanggar, dan representasi rules.
|
|
|
|
|
|
|
|
#### Rules yang dilanggar
|
|
|
|

|
|
|
|
* tampilan jika opsi 'rules' diclick.
|
|
|
|
|
|
|
|
#### Representasi Rules
|
|
|
|

|
|
|
|
* tampilan jika opsi 'Representasi rules' diclick.
|
|
|
|
|
|
|
|
#### Deskripsi Data Setelah Diperbaiki
|
|
|
|

|
|
|
|
* User dapat melihat data yang memiliki error, jumlah error, rules yang dilanggar, dan representasi graph error pada data yang telah diperbaiki. terdapat juga opsi perbaikan manual pada panel ini.
|
|
|
|
|
|
|
|
#### Representasi Graph Error
|
|
|
|

|
|
|
|
* tampilan jika opsi 'Graph' diclick.
|
|
|
|
|
|
|
|
#### Perbaikan Data Secara Manual
|
|
|
|

|
|
|
|
* aplikasi akan membuka aplikasi MS excel dengan data baru. data baru adalah data yang telah diperbaiki, hal ini dilakukan supaya tidak kehilangan data asli.
|
|
|
|
|
|
|
|
### Dokumentasi Pengembangan |
|
|
|
\ No newline at end of file |