PREDIKSI KUALITAS AIR MENGGUNAKAN METODE RANDOM FOREST, DECISION TREE, DAN GRADIENT BOOSTING
Sari
Air merupakan sumber daya alam yang sangat penting dan menjadi suatu kebutuhan pokok bagi kelangsungan mahluk hidup baik manusia, hewan dan tumbuhan, namun tidak semua air aman untuk dikonsumsi, sehingga diperlukan adanya identifikasi kualitas air yang aman untuk di konsumsi. Memperkirakan kualitas air telah menjadi salah satu tantangan signifikan yang dihadapi dunia dalam beberapa dekade terakhir. Penelitian ini menyajikan model prediksi kualitas air menggunakan tiga algoritma machine learning Decision Tree, Gradient Boosting dan Random Forest, dimana model machine learning tersebut kemudian dievaluasi secara eksperimental dengan menggunakan data water_potability dari kaggle. Ketiga algoritma ini akan dilakukan perbandingan pada proses klasifikasi data untuk mengetahui metode mana yang paling akurat, dilihat dari tingkat akurasi yang paling tinggi. Hasilnya menunjukan pada penelitian ini Random Forest menjadi model yang memiliki akurasi dengan nilai akurasi yang tinggi dan akurat sebesar 88.33%, dan untuk Decision Tree dengan nilai akurasi 80,83% dan Gradient Boosting memiliki akurasi terendah yaitu 73,33%. Sehingga pada penelitian yang dilakukan Random Forest menjadi algoritma paling akurat dan baik untuk digunakan pada dataset water_potability.
Kata Kunci
Teks Lengkap:
PDFReferensi
D. Chicco and G. Jurman, “The advantages of the Matthews correlation coefficient (MCC) over F1 score and accuracy in binary classification evaluation,” BMC Genomics, vol. 21, no. 1, p. 6, Dec. 2020, doi: 10.1186/s12864-019-6413-7.
Dewata, I. & Danhas, Y. H. (2018). Pencemaran Lingkungan. Depok: Rajawali Pres.
Kadiwal, A., 2021. “Water Quality” (Online), (https://www.kaggle.com/adityakadiwal/water-potability, diakses 7 September 2022).
Sahabuddin, E. S. (2015). Filosofi ‘Cemaran’ Air. Kupang: PTK Press.
Siregar, A. (2020). Klasifikasi Untuk Prediksi Cuaca Menggunakan Esemble Learning. PETIR, 13(2), 138 - 147. https://doi.org/10.33322/petir.v13i2.998
Suyasa, W. B. (2015). Pencemaran Air & Pengolahan Air Limbah. Denpasar: Udayana University Press.
Said, H., Matondang, N., & Irmanda, N. (2022).
Penerapan Algoritma K-Nearest Neighbor Untuk Memprediksi Kualitas Air Yang Dapat Dikonsumsi. Techno.COM, Vol. 21, No. 2, Mei 2022: 256-267
Werdiningsih, I., Nuqoba, B., & Muhammadun (2020). Data Mining Menggunakan Android, Weka, Dan SPSS. Surabaya: Penerbit Airlangga University Press.
DOI: https://doi.org/10.31294/jki.v12i1.16004
##submission.copyrightStatement##
Dipublikasikan oleh LPPM Universitas Bina Sarana Informatika
Email : jurnalkhatulistiwainformatika@bsi.ac.id
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License