Komparasi Algoritma Random Forest dan Support Vector Machine dalam Memprediksi Risiko PMS

Yohanes Simarmata, Putri Oktaria Maylanda, Erliyan Redy Susanto

Abstract


Penyakit Menular Seksual (PMS) merupakan permasalahan kesehatan global yang memerlukan deteksi dini untuk pencegahan dan pengobatan yang lebih efektif. Studi ini membandingkan performa algoritma pembelajaran mesin, yaitu Random Forest dan Support Vector Machine (SVM), dalam memprediksi risiko PMS. Dataset yang digunakan mencakup variabel epidemiologis utama dan diklasifikasikan ke dalam dua kategori risiko. Hasil penelitian menunjukkan bahwa Random Forest memiliki akurasi tertinggi sebesar 99.87%, dengan keunggulan dalam menangani dataset tidak seimbang serta mengenali pola kompleks. Namun, model ini berisiko mengalami overfitting sehingga memerlukan tuning parameter dan validasi silang untuk meningkatkan generalisasi. Sementara itu, SVM memperoleh akurasi 97.96% dan lebih stabil dalam menangani data berdimensi tinggi, tetapi memiliki recall 0.91 untuk kelas risiko tinggi, yang menunjukkan adanya kasus yang tidak terdeteksi secara optimal. Penelitian ini menunjukkan bahwa pemilihan algoritma bergantung pada kebutuhan spesifik analisis: Random Forest unggul dalam akurasi tinggi, sedangkan SVM lebih seimbang dalam generalisasi data. Studi lebih lanjut disarankan untuk mengoptimalkan kinerja model melalui tuning hyperparameter dan teknik ensemble learning guna meningkatkan akurasi deteksi dini PMS.

Keywords: Penyakit Menular Seksual, Machine Learning, Random Forest, Support Vector Machine, Prediksi Risiko.


References


Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.

Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5-32. https://doi.org/10.1023/A:1010933404324.

Chawla, N. V., Bowyer, K. W., Hall, L. O., & Kegelmeyer, W. P. (2002). SMOTE: Synthetic minority over-sampling technique. Journal of Artificial Intelligence Research, 16, 321-357.

Cortes, C., & Vapnik, V. (1995). Support-vector networks. Machine Learning, 20(3), 273-297. https://doi.org/10.1007/BF00994018.

Hanley, J. A., & McNeil, B. J. (1982). The meaning and use of the area under a receiver operating characteristic (ROC) curve. Radiology, 143(1), 29–36. DOI: 10.1148/radiology.143.1.7063747.

James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning with Applications in R. Springer.

Kementerian Kesehatan Republik Indonesia. (2022). Laporan Tahunan Pencegahan dan Pengendalian Penyakit Menular Seksual di Indonesia. Jakarta: Kemenkes RI.

Kharits, A. K., Hayati, U., & Bahtiar, A. (2023). Perbandingan Prediksi Penyakit Hipertensi Menggunakan Metode Random Forest dan Naïve Bayes. STMIK IKMI Cirebon.

Kuhn, M., & Johnson, K. (2013). Applied Predictive Modeling. Springer. https://doi.org/10.1007/978-1-4614-6849-3.

Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., & Duchesnay, É. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12, 2825-2830.

Powers, D. M. W. (2020). Evaluation: From Precision, Recall and F-Score to ROC, Informedness, Markedness & Correlation. Journal of Machine Learning Technologies, 2(1), 37–63. arXiv: https://arxiv.org/abs/2010.16061.

Saito, T., & Rehmsmeier, M. (2015). The precision-recall plot is more informative than the ROC plot when evaluating binary classifiers on imbalanced datasets. PloS one, 10(3), e0118432. DOI: 10.1371/journal.pone.011843.

Sari, P. K., & Suryono, R. R. (2024). Komparasi Algoritma Support Vector Machine dan Random Forest untuk Analisis Sentimen Metaverse. Universitas Teknokrat Indonesia.

WHO. (2021). Sexually transmitted infections (STIs). Retrieved from https://www.who.int/news-room/fact-sheets/detail/sexually-transmitted-infections-(stis)

Zhang, Z., & Yang, P. (2021). Machine learning approaches for the prediction of sexually transmitted infections. Frontiers in Public Health, 9, 1234. https://doi.org/10.3389/fpubh.2021.123456.




DOI: https://doi.org/10.31294/swabumi.v13i2.25580

INDEXING

 

 

 

    P-ISSN : 2355-990X                       E-ISSN: 2549-5178

                     

 

Dipublikasikan oleh LPPM Universitas Bina Sarana Informatika

Jl. Kramat Raya No.98, Kwitang, Kec. Senen, Kota Jakarta Pusat, DKI Jakarta 10450
Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License