PREDIKSI KUALITAS AIR MENGGUNAKAN METODE RANDOM FOREST, DECISION TREE, DAN GRADIENT BOOSTING

Nurlaelatul Maulidah, Mawadatul Maulidah, Riki Supriyadi, Hiya Nalatissifa, Sri Diantika, Ahmad Fauzi

Sari


Air merupakan sumber daya alam yang sangat penting dan menjadi suatu kebutuhan pokok bagi kelangsungan mahluk hidup baik manusia, hewan dan tumbuhan, namun tidak semua air aman untuk dikonsumsi, sehingga diperlukan adanya identifikasi kualitas air yang aman untuk di konsumsi. Memperkirakan kualitas air telah menjadi salah satu tantangan signifikan yang dihadapi dunia dalam beberapa dekade terakhir. Penelitian ini menyajikan model prediksi kualitas air menggunakan tiga algoritma machine learning Decision Tree, Gradient Boosting dan Random Forest, dimana model machine learning tersebut kemudian dievaluasi secara eksperimental dengan menggunakan data water_potability dari kaggle. Ketiga algoritma ini akan dilakukan perbandingan pada proses klasifikasi data untuk mengetahui metode mana yang paling akurat, dilihat dari tingkat akurasi yang paling tinggi. Hasilnya menunjukan pada penelitian ini Random Forest menjadi model yang memiliki akurasi dengan nilai akurasi yang tinggi dan akurat sebesar 88.33%, dan untuk Decision Tree dengan nilai akurasi 80,83% dan Gradient Boosting memiliki akurasi terendah yaitu 73,33%. Sehingga pada penelitian yang dilakukan Random Forest menjadi algoritma paling akurat dan baik untuk digunakan pada dataset water_potability.


Kata Kunci


Kualitas Air, Prediksi, Random Forest

Teks Lengkap:

PDF

Referensi


D. Chicco and G. Jurman, “The advantages of the Matthews correlation coefficient (MCC) over F1 score and accuracy in binary classification evaluation,” BMC Genomics, vol. 21, no. 1, p. 6, Dec. 2020, doi: 10.1186/s12864-019-6413-7.

Dewata, I. & Danhas, Y. H. (2018). Pencemaran Lingkungan. Depok: Rajawali Pres.

Kadiwal, A., 2021. “Water Quality” (Online), (https://www.kaggle.com/adityakadiwal/water-potability, diakses 7 September 2022).

Sahabuddin, E. S. (2015). Filosofi ‘Cemaran’ Air. Kupang: PTK Press.

Siregar, A. (2020). Klasifikasi Untuk Prediksi Cuaca Menggunakan Esemble Learning. PETIR, 13(2), 138 - 147. https://doi.org/10.33322/petir.v13i2.998

Suyasa, W. B. (2015). Pencemaran Air & Pengolahan Air Limbah. Denpasar: Udayana University Press.

Said, H., Matondang, N., & Irmanda, N. (2022).

Penerapan Algoritma K-Nearest Neighbor Untuk Memprediksi Kualitas Air Yang Dapat Dikonsumsi. Techno.COM, Vol. 21, No. 2, Mei 2022: 256-267

Werdiningsih, I., Nuqoba, B., & Muhammadun (2020). Data Mining Menggunakan Android, Weka, Dan SPSS. Surabaya: Penerbit Airlangga University Press.




DOI: https://doi.org/10.31294/jki.v12i1.16004

##submission.copyrightStatement##

p-ISSN 2339-1928

e-ISSN 2579-633X



Dipublikasikan oleh LPPM Universitas Bina Sarana Informatika

Email : jurnalkhatulistiwainformatika@bsi.ac.id

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License

 

Jurnal Khatulistiwa Informatika Indexed by:

Image result for logo index sinta