... | @@ -30,9 +30,9 @@ |
... | @@ -30,9 +30,9 @@ |
|
|
|
|
|
* Pemilihan Kombinasi Algoritma
|
|
* Pemilihan Kombinasi Algoritma
|
|
|
|
|
|
![Screen_Shot_2017-08-10_at_9.38.36_PM](/uploads/728e5f75d1ff25de26d1f662296eb538/Screen_Shot_2017-08-10_at_9.38.36_PM.png)
|
|
![Screen_Shot_2017-08-13_at_8.14.35_PM](/uploads/38ee39a64e5a9f53ebe99715e9791377/Screen_Shot_2017-08-13_at_8.14.35_PM.png)
|
|
|
|
|
|
![Screen_Shot_2017-08-10_at_9.38.48_PM](/uploads/ecaf3ac0fc2162e4a9290673c8d8faad/Screen_Shot_2017-08-10_at_9.38.48_PM.png)
|
|
![Screen_Shot_2017-08-13_at_8.15.18_PM](/uploads/77b75fc301619c5d1aaab9a1a4d2cfe3/Screen_Shot_2017-08-13_at_8.15.18_PM.png)
|
|
|
|
|
|
Pada pemilihan kombinasi, pengguna dapat memilih kombinasi *preprocessing* dan kombinasi algoritma yang ingin digunakan. Kombinasi algoritma terdiri dari kombinasi preprocessing dan metode klasifikasi. Pengguna dapat memilih kombinasi algoritma dengan menggunakan menu *drop down* seperti pada gambar di atas.
|
|
Pada pemilihan kombinasi, pengguna dapat memilih kombinasi *preprocessing* dan kombinasi algoritma yang ingin digunakan. Kombinasi algoritma terdiri dari kombinasi preprocessing dan metode klasifikasi. Pengguna dapat memilih kombinasi algoritma dengan menggunakan menu *drop down* seperti pada gambar di atas.
|
|
|
|
|
... | @@ -47,7 +47,7 @@ Pengguna dapat memasukkan data twitter yang berekstensi .csv atau .txt ke dalam |
... | @@ -47,7 +47,7 @@ Pengguna dapat memasukkan data twitter yang berekstensi .csv atau .txt ke dalam |
|
|
|
|
|
* Penggunaan Konversi Kata (normalisasi) atau Tidak
|
|
* Penggunaan Konversi Kata (normalisasi) atau Tidak
|
|
|
|
|
|
![Screen_Shot_2017-08-10_at_9.25.35_PM](/uploads/d532abe2e32f3fcb3ae2baf7be5fb21c/Screen_Shot_2017-08-10_at_9.25.35_PM.png)
|
|
![Screen_Shot_2017-08-13_at_8.14.20_PM](/uploads/4f0fa4999e0e0b875da6c159d97ee753/Screen_Shot_2017-08-13_at_8.14.20_PM.png)
|
|
|
|
|
|
Konversi kata berpengaruh terhadap hasil klasifikasi. Oleh karena itu, pada aplikasi ini user dapat memilih menggunakan `konversi kata(normalisasi) atau tidak` dengan Menggunakan menu *drop down* pada gambar. Konversi kata berarti menyamakan istilah istilah penting yang terdapat pada data twit.
|
|
Konversi kata berpengaruh terhadap hasil klasifikasi. Oleh karena itu, pada aplikasi ini user dapat memilih menggunakan `konversi kata(normalisasi) atau tidak` dengan Menggunakan menu *drop down* pada gambar. Konversi kata berarti menyamakan istilah istilah penting yang terdapat pada data twit.
|
|
|
|
|
... | @@ -55,7 +55,7 @@ Konversi kata berpengaruh terhadap hasil klasifikasi. Oleh karena itu, pada apli |
... | @@ -55,7 +55,7 @@ Konversi kata berpengaruh terhadap hasil klasifikasi. Oleh karena itu, pada apli |
|
|
|
|
|
* Penggunaan Stemming atau Tidak
|
|
* Penggunaan Stemming atau Tidak
|
|
|
|
|
|
![Screen_Shot_2017-08-10_at_9.25.42_PM](/uploads/05d950032f944269d9d386a3113bae28/Screen_Shot_2017-08-10_at_9.25.42_PM.png)
|
|
![Screen_Shot_2017-08-13_at_8.14.27_PM](/uploads/8b12e4a34d8a480f1339cb78cc9ab6ab/Screen_Shot_2017-08-13_at_8.14.27_PM.png)
|
|
|
|
|
|
Penggunaan `stemming atau tidak` dalam tahap *preprocessing* akan berpengaruh terhadap hasil klasifikasi. Pengguna dapat dengan mudah untuk memilih menggunakan tahapan *stemming* dalam *preprocessing* atau tidak pada menu *drop down* gambar di atas. Menggunakan *stemming* berarti kata pada twit diubah menjadi bentuk kata dasar sesuai dengan kaidah bahasa Indonesia.
|
|
Penggunaan `stemming atau tidak` dalam tahap *preprocessing* akan berpengaruh terhadap hasil klasifikasi. Pengguna dapat dengan mudah untuk memilih menggunakan tahapan *stemming* dalam *preprocessing* atau tidak pada menu *drop down* gambar di atas. Menggunakan *stemming* berarti kata pada twit diubah menjadi bentuk kata dasar sesuai dengan kaidah bahasa Indonesia.
|
|
|
|
|
... | @@ -77,7 +77,7 @@ Setelah *preprocessing* dijalankan, maka akan dihasilkan twit hasil kombinasi *p |
... | @@ -77,7 +77,7 @@ Setelah *preprocessing* dijalankan, maka akan dihasilkan twit hasil kombinasi *p |
|
|
|
|
|
* Pemilihan N-Grams
|
|
* Pemilihan N-Grams
|
|
|
|
|
|
![Screen_Shot_2017-08-10_at_9.25.57_PM](/uploads/93d6f4882b8cb66e15db68f9a2eb9f77/Screen_Shot_2017-08-10_at_9.25.57_PM.png)
|
|
![Screen_Shot_2017-08-13_at_8.14.55_PM](/uploads/8d2e7fb4d9dd24cbc4eccfe2e268724e/Screen_Shot_2017-08-13_at_8.14.55_PM.png)
|
|
|
|
|
|
N-Grams berhubungan dengan seleksi fitur dan proses tokenisasi yang digunakan. Dalam aplikasi ini, N-Grams yang dapat dipilih oleh pengguna berupa `unigram`, `unigram+bigram`, dan `unigram+bigram+trigram` dengan menggunakan menu *drop down* seperti pada gambar di atas.
|
|
N-Grams berhubungan dengan seleksi fitur dan proses tokenisasi yang digunakan. Dalam aplikasi ini, N-Grams yang dapat dipilih oleh pengguna berupa `unigram`, `unigram+bigram`, dan `unigram+bigram+trigram` dengan menggunakan menu *drop down* seperti pada gambar di atas.
|
|
|
|
|
... | @@ -85,7 +85,7 @@ N-Grams berhubungan dengan seleksi fitur dan proses tokenisasi yang digunakan. D |
... | @@ -85,7 +85,7 @@ N-Grams berhubungan dengan seleksi fitur dan proses tokenisasi yang digunakan. D |
|
|
|
|
|
* Pemilihan Seleksi Fitur
|
|
* Pemilihan Seleksi Fitur
|
|
|
|
|
|
![Screen_Shot_2017-08-10_at_9.26.04_PM](/uploads/a49098f2389a51ea28007146b5469906/Screen_Shot_2017-08-10_at_9.26.04_PM.png)
|
|
![Screen_Shot_2017-08-13_at_8.15.02_PM](/uploads/f9aafaca67272aae341fa4de523d124e/Screen_Shot_2017-08-13_at_8.15.02_PM.png)
|
|
|
|
|
|
Pengguna dapat memilih metode seleksi fitur yang digunakan untuk mereduksi term pada document-term matrix. Seleksi fitur yang dapat dipilih ialah `Document Frequency Threshold`, `Information Gain`, `Chi-Square` menggunakan *drop down* seperti pada Gambar di bawah atas.
|
|
Pengguna dapat memilih metode seleksi fitur yang digunakan untuk mereduksi term pada document-term matrix. Seleksi fitur yang dapat dipilih ialah `Document Frequency Threshold`, `Information Gain`, `Chi-Square` menggunakan *drop down* seperti pada Gambar di bawah atas.
|
|
|
|
|
... | @@ -96,14 +96,13 @@ Pengguna dapat memilih metode seleksi fitur yang digunakan untuk mereduksi term |
... | @@ -96,14 +96,13 @@ Pengguna dapat memilih metode seleksi fitur yang digunakan untuk mereduksi term |
|
|
|
|
|
Algoritma klasifikasi twit yang didapat dipilih oleh pengguna berupa `Maximum Entropy`, `Random Forests`, dan `Naïve Bayes`. Pemilihan algoritma klasifikasi menggunakan menu *drop down* seperti pada Gambar di bawah ini.
|
|
Algoritma klasifikasi twit yang didapat dipilih oleh pengguna berupa `Maximum Entropy`, `Random Forests`, dan `Naïve Bayes`. Pemilihan algoritma klasifikasi menggunakan menu *drop down* seperti pada Gambar di bawah ini.
|
|
|
|
|
|
![Screen_Shot_2017-08-10_at_9.26.09_PM](/uploads/a862eb800e81b661dfbdb84219422b7b/Screen_Shot_2017-08-10_at_9.26.09_PM.png)
|
|
![Screen_Shot_2017-08-13_at_8.15.08_PM](/uploads/3ea00de0d2f79cafbcd85341540326f3/Screen_Shot_2017-08-13_at_8.15.08_PM.png)
|
|
|
|
|
|
![Screen_Shot_2017-08-13_at_12.04.18_AM](/uploads/6130ffeb2ca2ebdcd012591e0a05e65d/Screen_Shot_2017-08-13_at_12.04.18_AM.png)
|
|
![Screen_Shot_2017-08-13_at_8.27.10_PM](/uploads/dfd768c9964c928d317e5c145cd03afd/Screen_Shot_2017-08-13_at_8.27.10_PM.png)
|
|
|
|
|
|
Setelah seluruh pemilihan kombinasi preprocessing dan metode klasifikasi digunakan, akan dihasilkan performa 108 model. Setiap model akan diperhitungkan nilai `F1-Scores`, `akurasi`, `precision`, `recall`, `AUC`, `kurva ROC`, dan `waktu` nya. Tampilan hasil performa dari setiap model kombinasi yang dihasilkan terdapat pada gambar di bawah.
|
|
Setelah seluruh pemilihan kombinasi preprocessing dan metode klasifikasi digunakan, akan dihasilkan performa 108 model. Setiap model akan diperhitungkan nilai `F1-Scores`, `akurasi`, `precision`, `recall`, `AUC`, `kurva ROC`, dan `waktu` nya. Tampilan hasil performa dari setiap model kombinasi yang dihasilkan terdapat pada gambar di bawah.
|
|
|
|
|
|
![Screen_Shot_2017-08-10_at_9.41.43_PM](/uploads/cb2ea5d364f3cfab1bbcfc691eb4e65d/Screen_Shot_2017-08-10_at_9.41.43_PM.png)
|
|
![Screen_Shot_2017-08-13_at_8.26.23_PM](/uploads/d6a0930bc625ca2ec9683367610bf1e9/Screen_Shot_2017-08-13_at_8.26.23_PM.png)
|
|
|
|
|
|
|
|
|
|
Confusion matrix, ROC-Curve, Output AUC digunakan sebagai ukuran klasifikasi. Setiap model kombinasi yang dihasilkan akan diukur performanya menggunakan `5X5 Nested Cross Validation`.
|
|
Confusion matrix, ROC-Curve, Output AUC digunakan sebagai ukuran klasifikasi. Setiap model kombinasi yang dihasilkan akan diukur performanya menggunakan `5X5 Nested Cross Validation`.
|
|
|
|
|
... | | ... | |