ANALISA SENTIMENT PADA ULASAN FILM DENGAN OPTIMASI ENSEMBLE LEARNING

Andreyestha Andreyestha, Agus Subekti

Abstract


Dalam dunia hiburan khususnya film, kini situs web ulasan film menjadi media bagi orang-orang untuk memberikan penilaian mengenai seberapa bagus film tersebut. Mereka tidak harus menjadi pakar dalam dunia perfilman untuk menilai kualitas dari film yang mereka saksikan, semua orang dapat memberikan penilaian. Sentimen yang ditemukan dalam komentar, umpan balik atau kritik memberikan indikator yang berguna untuk berbagai tujuan dan dapat dikategorikan berdasarkan polaritas, polaritas tersebut cenderung akan dicari tahu apakah secara keseluruhan positif atau negatif. Algoritma Naïve Bayes  dan Random Forest merupakan algoritma yang dapat memberikan hasil analisa klasifikasi sesuai yang diharapkan pada penelitian ini, analisa akan dilakukan dengan membandingkan beberapa kombinasi algoritma untuk diuji pada Polarity Dataset 2.0 dari Cornell University, diantaranya  yaitu Algoritma tersebut akan dikombinasikan dengan seleksi fitur Chi Square, Adaboost, dan Voting. Dari hasil pengujian yang didapat algoritma AdaBosst dan Voting mampu meningkatkan akurasi dari metode Naïve Bayes (NB) and Random Forest (RF). Model yang diusulkan dengan Chi Square + Voting 2 (RF + SVM) memiliki nilai akurai 84,6%, dan model ini memiliki nilai akurasi yang lebih tinggi.


Keywords


movie review, ensemble learning, adaboost, voting

References


A. Kharde, V., & Sonawane, S. S. (2016). Sentiment Analysis of Twitter Data: A Survey of Techniques. International Journal of Computer Applications, 139(11), 5–15. https://doi.org/10.5120/ijca2016908625

Baid, P., Gupta, A., & Chaplot, N. (2017). Sentiment Analysis of Movie Reviews using Machine Learning Techniques, 179(December 2017), 45–49. https://doi.org/10.5120/ijca2017916005

Banerjee, S., & Chua, A. Y. K. (2018). Tracing the growth of IMDb reviewers in terms of rating, readability and usefulness. 2018 4th International Conference on Information Management, ICIM 2018, 57–61. https://doi.org/10.1109/INFOMAN.2018.8392809

Dey, L., Chakraborty, S., Biswas, A., Bose, B., & Tiwari, S. (2016). Sentiment Analysis of Review Datasets Using Naïve Bayes‘ and K-NN Classifier. International Journal of Information Engineering and Electronic Business, 8(4), 54–62. https://doi.org/10.5815/ijieeb.2016.04.07

Gomes, H. M., Barddal, J. P., Enembreck, F., & Bifet, A. (2017). A Survey on Ensemble Learning for Data Stream Classification. ACM Computing Surveys, 50(2), 1–36. https://doi.org/10.1145/3054925

Hu, W., & Hu, W. (2005). Network-based intrusion detection using adaboost algorithm. Proceedings - 2005 IEEE/WIC/ACM InternationalConference on Web Intelligence, WI 2005, 2005, 712–717. https://doi.org/10.1109/WI.2005.107

IMDb, 2019. What Is IMDb. https://help.imdb.com/article/imdb/general-information/what-is-imdb/G836CY29Z4SGNMK5?ref_=helpsect_cons_1_1#.

Narayanan, V., Arora, I., & Bhatia, A. (2013). Fast and accurate sentiment classification using an enhanced Naive Bayes model. Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 8206 LNCS, 194–201. https://doi.org/10.1007/978-3-642-41278-3_24

Palkar, R. K., Gala, K. D., Shah, M. M., & Shah, J. N. (2016). Comparative Evaluation of Supervised Learning Algorithms for Sentiment Analysis of Movie Reviews. International Journal of Computer Applications, 142(1), 975–8887. Retrieved from http://www.ijcaonline.org/archives/volume142/number1/palkar-2016-ijca-909660.pdf

Pratama, N. D., Sari, Y. A., & Adikara, P. P. (2018). Analisis Sentimen Pada Review Konsumen Menggunakan Metode Naive Bayes Dengan Seleksi Fitur Chi Square Untuk Rekomendasi Lokasi Makanan Tradisional. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer (J-PTIIK) Universitas Brawijaya, 2(9), 2982–2988.

Raharjo, A. B., & Quafafou, M. (2015). Penggabungan Keputusan Pada Klasifikasi Multi-Label. JUTI: Jurnal Ilmiah Teknologi Informasi, 13(1), 12. https://doi.org/10.12962/j24068535.v13i1.a384

Saifudin, A., & Wahono, R. S. (2015). Penerapan Teknik Ensemble untuk Menangani Ketidakseimbangan Kelas pada Prediksi Cacat Software. Journal of Software Engineering, 1(1), 28–37.

Socrates, I. G. A., Akbar, A. L., Akbar, M. S., Arifin, A. Z., & Herumurti, D. (2017). Optimasi Naive Bayes Dengan Pemilihan Fitur Dan Pembobotan Gain Ratio. Lontar Komputer : Jurnal Ilmiah Teknologi Informasi, 7(1), 22. https://doi.org/10.24843/lkjiti.2016.v07.i01.p03

Syahfitri Kartika Lidya, Opim Salim Sitompul, S. E. (2015). Sentiment Analysis Pada Teks Bahasa Indonesia Menggunakan Support Vector Machine ( Svm ) dan K - Nearest Neighbour (K-NN). Seminar Nasional Aplikasi Teknologi Informasi 2015 (SNATI 2015), 1–8.




DOI: https://doi.org/10.31294/ji.v7i1.6171

Refbacks

  • There are currently no refbacks.


Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

Index by:

 
  
Published by Department of Research and Public Service (LPPM) Universitas Bina Sarana Informatika with supported Relawan Jurnal Indonesia

Jl. Kramat Raya No.98, Kwitang, Kec. Senen, Kota Jakarta Pusat, DKI Jakarta 10450
Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License