Evaluasi Kinerja Naive Bayes dan K-Nearest Neighbors pada Analisis Sentimen Ulasan Aplikasi SnackVideo
Abstract
Abstrak
Penelitian ini membandingkan performa algoritma Naive Bayes (NB) dan K-Nearest Neighbors (KNN) dalam analisis sentimen review aplikasi SnackVideo. Dataset berisi 2000 ulasan dengan distribusi seimbang antara sentimen positif dan negatif. Metodologi penelitian mengikuti CRISP-DM, meliputi pengumpulan data melalui web scraping, preprocessing data (transform case, tokenization, stopword removal, dan stemming/lemmatization), pembentukan model klasifikasi dengan NB dan KNN, evaluasi model menggunakan metrik akurasi, recall, presisi, dan AUC, serta komparasi hasil. Hasil evaluasi menunjukkan NB memiliki akurasi 80,46%, recall 88,26%, presisi 77,71%, dan AUC 96,90%, sedangkan KNN memiliki akurasi 78,84%, recall 75,82%, presisi 81,56%, dan AUC 92,70%. Secara umum, NB lebih unggul dalam akurasi, recall, dan AUC, sehingga direkomendasikan sebagai algoritma yang lebih efektif dan efisien untuk analisis sentimen pada dataset besar. KNN lebih cocok untuk kasus yang membutuhkan presisi tinggi dalam prediksi positif.
Kata kunci: Analisis Sentimen, Aplikasi SnackVideo, Naive Bayes, K-Nearest Neighbors, Preprocessing Data, Evaluasi Model
Abstract
This study compares the performance of the Naive Bayes (NB) and K-Nearest Neighbors (KNN) algorithms in sentiment analysis of SnackVideo app reviews. The dataset consists of 2000 reviews with a balanced distribution between positive and negative sentiments. The research methodology follows CRISP-DM, including data collection via web scraping, data preprocessing (transform case, tokenization, stopword removal, and stemming/lemmatization), sentiment classification model building with NB and KNN, model evaluation using metrics such as accuracy, recall, precision, and AUC, and comparison of results. The evaluation results show that NB achieves an accuracy of 80.46%, recall of 88.26%, precision of 77.71%, and AUC of 96.90%, while KNN achieves an accuracy of 78.84%, recall of 75.82%, precision of 81.56%, and AUC of 92.70%. Overall, NB outperforms KNN in terms of accuracy, recall, and AUC, making it a more effective and efficient algorithm for sentiment analysis on large datasets. KNN is more suitable for cases requiring high precision in positive predictions.
Keywords: Sentiment Analysis, SnackVideo App, Naive Bayes, K-Nearest Neighbors, Data Preprocessing, Model Evaluation
Full Text:
PDFReferences
Alfaris, S., & Kusnawi. (2023). Komparasi Metode KNN dan Naive Bayes Terhadap Analisis Sentimen Pengguna Aplikasi Shopee. Indonesian Journal of Computer Science, 12(5). https://doi.org/10.33022/ijcs.v12i5.3304
Asnawi, A. (2024). Model Peningkatan Daya Saing Digital Ditinjau dari Sudut Pandang Collaborative Governance bagi UMKM Kuliner di Surabaya. Syntax Literate ; Jurnal Ilmiah Indonesia, 9(1). https://doi.org/10.36418/syntax-literate.v9i1.14969
Basedt, N., Supriyadi, E., & Nugroho, A. S. (2024). Perbandingan Algoritma Klasifikasi dalam Analisis Sentimen Opini Masyarakat tentang Kenaikan Harga Bbm. Joined Journal (Journal of Informatics Education), 6(2). https://doi.org/10.31331/joined.v6i2.2893
Batubara, D. S., & Fotaleno, F. (2023). Makna Nilai Berita dalam Pembuatan Konten dengan Sumber Platform Snack Video. NUCLEUS, 4(2). https://doi.org/10.37010/nuc.v4i2.1428
Chandra Kusuma, D. N. S., & Oktavianti, R. (2020). Penggunaan Aplikasi Media Sosial Berbasis Audio Visual dalam Membentuk Konsep Diri (Studi Kasus Aplikasi Tiktok). Koneksi, 4(2). https://doi.org/10.24912/kn.v4i2.8214
Cindy Caterine Yolanda, Syafriandi Syafriandi, Yenni Kurniawati, & Dina Fitria. (2024). Sentiment Analysis of DANA Application Reviews on Google Play Store Using Naïve Bayes Classifier Algorithm Based on Information Gain. UNP Journal of Statistics and Data Science, 2(1). https://doi.org/10.24036/ujsds/vol2-iss1/147
Eviyanti, E., Irawan, B., & Bahtiar, A. (2024). PENGGUNAAN ALGORITMA NAÏVE BAYES DALAM MENGANALISIS SENTIMEN ULASAN APLIKASI ADAKAMI DI GOOGLE PLAY STORE. JATI (Jurnal Mahasiswa Teknik Informatika), 7(6). https://doi.org/10.36040/jati.v7i6.8272
Husain, N. P., Sukirman, S., & SAJIAH, S. (2024). Analisis Sentimen Ulasan Pengguna Tiktok pada Google Play Store Berbasis TF-IDF dan Support Vector Machine. Journal of System and Computer Engineering (JSCE), 5(1). https://doi.org/10.61628/jsce.v5i1.1105
Ivania Sidora, L., & Hanum Harani, N. (2024). SISTEM REKOMENDASI MUSIK SPOTIFY MENGGUNAKAN KNN DAN ALGORITMA GENETIKA. JATI (Jurnal Mahasiswa Teknik Informatika), 7(4). https://doi.org/10.36040/jati.v7i4.7073
Kevin, K., Enjeli, M., & Wijaya, A. (2024). Analisis Sentimen Pengunaaan Aplikasi Kinemaster Menggunakan Metode Naive Bayes. Jurnal Ilmiah Computer Science, 2(2). https://doi.org/10.58602/jics.v2i2.24
Liani, N. E., & Aritonang, J. (2022). Tinjauan Potensi Pajak Penghasilan Orang Pribadi Pengguna Aplikasi Snack Video. JURNAL PAJAK INDONESIA (Indonesian Tax Review), 6(2S). https://doi.org/10.31092/jpi.v6i2s.1845
Nuraini, A., Faqih, A., Dwilestari, G., Dienwati Nuris, N., & Narasati, R. (2024). ANALISIS SENTIMEN TERHADAP REVIEW APLIKASI BRIMO DI GOOGLE PLAY STORE MENGGUNAKAN ALGORITMA NAÏVE BAYES. JATI (Jurnal Mahasiswa Teknik Informatika), 7(6). https://doi.org/10.36040/jati.v7i6.8228
Sitorus, A. A., Fitri, Y., & Maharani, A. P. (2024). Pengaruh Komunikasi Digital di Instagram terhadap Peningkatan Partisipasi Milenial pada Pemilu 2024. JIIP - Jurnal Ilmiah Ilmu Pendidikan, 7(2). https://doi.org/10.54371/jiip.v7i2.3959
Suni, E. K., & Sutresno, S. A. (2023). Rekomendasi Content Creator Terbaik sebagai Pendukung Keputusan Penilaian pada Agensi Menggunakan Metode TOPSIS. Building of Informatics, Technology and Science (BITS), 5(2). https://doi.org/10.47065/bits.v5i2.4082
Susanto, H., Pujiyanto, P., & Susilo, G. (2022). Perancangan Media Sosial sebagai Upaya Peningkatan Promosi Produk Distro Bujana Malang. JoLLA: Journal of Language, Literature, and Arts, 2(8). https://doi.org/10.17977/um064v2i82022p1173-1188
Wiratama, M. A., & Pradnya, W. M. (2022). Optimasi Algoritma Data Mining Menggunakan Backward Elimination untuk Klasifikasi Penyakit Diabetes. Jurnal Nasional Pendidikan Teknik Informatika (JANAPATI), 11(1). https://doi.org/10.23887/janapati.v11i1.45282
DOI: https://doi.org/10.31294/ijse.v11i1.26165

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
ISSN : 2714-9935
Published by LPPM Universitas Bina Sarana Informatika
Jl. Kramat Raya No.98, Kwitang, Kec. Senen, Kota Jakarta Pusat, DKI Jakarta 10450
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License