Klasifikasi Text Mining Review Produk Kosmetik Untuk Teks Bahasa Indonesia Menggunakan Algoritma Naive Bayes

Elly Indrayuni

Sari


Saat ini produk kosmetik sudah menjadi kebutuhan utama kaum wanita yang merupakan target utama dari industri kosmetik. Banyak website yang menyediakan informasi tentang produk kosmetik dengan memberikan banyak informasi berupa gambar dan review pengguna. Membaca semua review yang ada pada sebuah website tentu sangat memakan waktu. Oleh karena itu, analisa sentimen merupakan salah satu solusi mengatasi masalah untuk mengelompokan opini atau review menjadi opini positif atau negatif secara otomatis. Naive Bayes memiliki kelebihan yaitu sederhana, cepat dan memiliki akurasi yang tinggi. N-gram dianggap dapat mengurangi selisih antara klasifikasi kelas positif dan negatif sehingga dapat meningkatkan rata-rata akurasi akhir suatu algoritma. Nilai akurasi yang dihasilkan akan menjadi tolak ukur untuk mencari model pengujian terbaik untuk kasus klasifikasi sentimen. Evaluasi dilakukan menggunakan 10 fold cross validation. Pengukuran akurasi diukur dengan confusion matrix dan kurva ROC. Hasil penelitian menunjukkan penerapan generate n-gram pada tahap preprocessing mempengaruhi nilai akurasi dan nilai AUC yang dihasilkan. Nilai akurasi terbaik yang dihasilkan pada penelitian ini yaitu 90.50% dengan nilai AUC sebesar 0.715 pada penerapan generate n-gram = 2.

Kata Kunci


review, naive bayes, n-gram

Teks Lengkap:

PDF (English)


DOI: https://doi.org/10.31294/jki.v7i1.5740

DOI (PDF (English)): https://doi.org/10.31294/jki.v7i1.5740.g3245

p-ISSN 2339-1928

e-ISSN 2579-633X



Dipublikasikan oleh LPPM Universitas Bina Sarana Informatika

Kampus Pontianak

Jl. Abdurrahman Saleh No.18 A Pontianak, Kalimantan Barat 78124

Telp : (0561)583924, Fax : (0561) 583934

Email : jurnalkhatulistiwainformatika@bsi.ac.id

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License

 

Jurnal Khatulistiwa Informatika Indexed by: