Optimasi Algoritma SVM Dan k-NN Berbasis Particle Swarm Optimization Pada Analisis Sentimen Fenomena Tagar #2019GantiPresiden
Abstract
Analisis sentimen adalah proses untuk menentukan konten dataset berbasis teks yang positif atau negatif. Saat ini, opini publik menjadi sumber penting dalam keputusan seseorang dalam menemukan solusi. Algoritma klasifikasi seperti Support Vector Machine (SVM) dan K-Nearest Neighbor (k-NN) diusulkan oleh banyak peneliti untuk digunakan dalam analisis sentimen untuk pendapat ulasan. Namun, klasifikasi sentimen teks memiliki masalah pada banyak atribut yang digunakan dalam dataset. Fitur pemilihan dapat digunakan sebagai proses optimasi untuk mengurangi set fitur asli ke subset yang relatif kecil dari fitur yang secara signifikan meningkatkan akurasi klasifikasi untuk cepat dan efektif. Masalah dalam penelitian ini adalah pemilihan pemilihan fitur untuk meningkatkan nilai akurasi Support Vector Machine (SVM) dan K-Nearest Neighbor (k-NN) dan membandingkan akurasi tertinggi untuk analisis sentimen tweet / komentar yang menggunakan tagar # 2019GantiPresiden. Algoritma perbandingan, SVM menghasilkan akurasi 88,00% dan AUC 0,964, kemudian dibandingkan dengan SVM berdasarkan PSO dengan akurasi 92,75% dan AUC 0,973. Data hasil pengujian untuk akurasi algoritma k-NN adalah 88,50% dan AUC 0,948, kemudian dibandingkan untuk akurasi dengan PSO berbasis k-NN sebesar 75,25% dan AUC 0,768. Hasil pengujian algoritma PSO dapat meningkatkan akurasi SVM, tetapi tidak mampu meningkatkan akurasi algoritma k-NN. Algoritma SVM berbasis PSO terbukti memberikan solusi untuk masalah klasifikasi tweets/ komentar yang menggunakan tagar # 2019GantiPresiden di Twitter agar lebih akurat dan optimal.
Keywords
optimasi analisa sentimen
Full Text:
PDFDOI: https://doi.org/10.31294/jtk.v6i1.6828
Copyright (c) 2020 Atang Saepudin, Riska Aryanti, Eka Fitriani, Dahlia Dahlia
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
ISSN: 2442-2436 (print), and 2550-0120