Optimasi Particle Swarm Optimization Sebagai Seleksi Fitur Pada Analisis Sentimen Review Hotel Berbahasa Indonesia Menggunakan Algoritma Naive Bayes

Andi Taufik

Abstract


Saat ini pengunjung  yang menulis review untuk berbagi pengalaman secara online terus meningkat. Setiap pengunjung perlu untuk membuat keputusan saat berlibur sebelum memesan hotel untuk menginap, biasanya menbaca hasil review dari pengunjung sebelumnya, tentunya membutuhkan waktu yang cukup lama apabila membaca review tersebut secara keseluruhan namun, jika hanya sedikit review yang dibaca,  informasi yang didapatkan akan bias. Analisa sentimen bertujuan untuk mengatasi masalah ini dengan secara otomatis mengelompokkan review pengguna menjadi opini positif atau negatif . Pengklasifikasi Naïve Bayes adalah teknik machine learning yang populer untuk klasifikasi teks, karena sangat sederhana, efisien dan memiliki performa yang baik pada banyak domain. Namun, Naïve Bayes memiliki kekurangan yaitu sangat sensitif pada fitur yang terlalu banyak, yang mengakibatkan akurasi klasifikasi menjadi rendah. Oleh karena itu, dalam penelitian ini digunakan metode pemilihan fitur, yaitu Particle Swarm Optimization agar bisa meningkatkan akurasi pengklasifikasi Naïve Bayes. Penelitian ini menghasilkan klasifikasi teks dalam bentuk review positif atau review negatif dari review hotel yang diambil dari situs www. Tripadvisor.com.Pengukuran berdasarkan akurasi Naive Bayes sebelum dan sesudah penambahan metode pemilihan fitur. Evaluasi dilakukan menggunakan 10 fold cross validation. Sedangkan pengukuran akurasi diukur dengan confusion matrix dan kurva ROC. Hasil penelitian menunjukkan peningkatan akurasi Naïve Bayes dari 90.50% menjadi 96.92%

Kata Kunci: Analisa Sentimen, Review Hotel, Naïve Bayes, Particle Swarm Optimization, Klasifikasi teks, pemilihan fitur.


Full Text:

PDF


DOI: https://doi.org/10.31294/jtk.v3i2.1922

Copyright (c) 2017 Andi Taufik

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

ISSN: 2442-2436 (print), and 2550-0120


 dipublikasikan oleh LPPM Universitas Bina Sarana Informatika Jakarta

Jl. Kramat Raya No.98, Kwitang, Kec. Senen, Kota Jakarta Pusat, DKI Jakarta 10450
Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License