Implementasi Clustering Data Kasus Covid 19 Di Indonesia Menggunakan Algoritma K-Means
Abstract
Covid19 adalah virus pertama kali terdeteksi di Wuhan, Cina pada akhir Desember 2019. Kasus Covid-19 masuk di Indonesia pada Maret 2020, tercatat mencapai 1.511.712 dengan jumlah kematian 40,858 dan sembuh 1.348.330 kasus. Di Indonesia terdapat 34 provinsi yang menjadi persebaran kasus Covid19. Penelitian ini bertujuan untuk mengelompokkan setiap provinsi di Indonesia ke dalam beberapa cluster tertentu agar mengetahui daerah dengan jumlah kasus yang tergolong tinggi, sedang, rendah. Mengelompokan data kasus Covid19 di provinsi Indonesia menggunakan teknik clustering dengan menggunakan algoritma K-means. Data yang digunakan sebanyak 7098 data dari tanggal 1 Maret hingga 11 Oktober 2020. Dataset yang digunakan dari website AtapData (atapdata.ai). Mengolah data tersebut menggunakan Google Collaboratory dengan bahasa pemrograman python. Pada penelitian dilakukan optimasi menggunakan metode elbow yang menghasilkan jumlah cluster sebanyak 3 cluster. Pengujian dilakukan untuk mendapatkan nilai K yang optimal. Melakukan evaluasi menggunakan Sum of Square Error (SSE). Dari hasil evaluasi memiliki jumlah optimal K: 3 yaitu 228913736548657.56.
Kata Kunci : Covid19, algoritma K means, Clustering, Metode Elbow
Covid19 is a virus that was first detected in Wuhan, China at the end of December 2019. Covid-19 cases entered Indonesia in March 2020, it was recorded that it had reached 1,511,712 with 40,858 deaths and 1,348,330 cases of recovery. In Indonesia there are 34 provinces where the spread of Covid19 cases. This study aims to classify each province in Indonesia into certain clusters in order to identify areas with high, medium, low number of cases. The grouping of Covid19 case data in the Indonesian province uses a clustering technique using the K-means algorithm. The data used is 7098 data from March 1 to October 11 2020. The dataset used is from the AtapData website (atapdata.ai). Processing the data using Google Collaboratory with the python programming language. In this research, optimization was carried out using the elbow method which resulted in a total of 3 clusters. Tests are carried out to obtain optimal K values. Evaluation using Sum of Square Error (SSE). From the evaluation results, it has an optimal number of K: 3, namely 228913736548657.56.
Keywords: Covid19, K mean algorithm, Clustering, Elbow Method
Full Text:
PDFReferences
Abdullah, D., Susilo, S., Ahmar, A. S., Rusli, R., & Hidayat, R. (2022). The application of K-means clustering for province clustering in Indonesia of the risk of the COVID-19 pandemic based on COVID-19 data. Quality and Quantity, 56(3), 1283–1291. https://doi.org/10.1007/s11135-021-01176-w
Adhitama, R., Burhanuddin, A., & Ananda, R. (2020). Penentuan Jumlah Cluster Ideal Smk Di Jawa Tengah Dengan Metode X-Means Clustering Dan K-Means Clusterin. JIKO (Jurnal Informatika Dan Komputer), 3(1), 1–5. https://doi.org/10.33387/jiko.v3i1.1635
Cahyo Wiguno, T., & Nataliani, Y. (2022). Penerapan k-Means Clustering Berdasarkan Analisis RFM Terhadap Segmentasi Pembeli untuk Meningkatkan Strategi CRM. Jurnal Media Informatika Budidarma , 6, 1871–1881. https://doi.org/10.30865/mib.v6i4.4472
Ekasetya, V. A., & Jananto, A. (2020). Klusterisasi Optimal Dengan Elbow Method Untuk Pengelompokan Data Kecelakaan Lalu Lintas Di Kota Semarang. Jurnal Dinamika Informatika, 12(1), 20–28. https://doi.org/10.35315/informatika.v12i1.8159
Hardiani, T. (2022). Analisis Clustering Kasus Covid 19 di Indonesia Menggunakan Algoritma K-Means. Jurnal Nasional Pendidikan Teknik Informatika (JANAPATI), 11(2), 156–165. https://doi.org/10.23887/janapati.v11i2.45376
Isy Karima Fauzia, Budi Arif Dermawan, & Tesa Nur Padilah. (2020). Penerapan K-Means Clustering pada Penyakit Infeksi Saluran Pernapasan Akut (ISPA) di Kabupaten Karawang. Jurnal Sistem Dan Informatika (JSI), 15(1), 81–87. https://doi.org/10.30864/jsi.v15i1.350
Negari, N., & Eryando, T. (2021). Analisis Penerimaan Sistem Informasi Pencatatan dan Pelaporan Kasus Acceptance Model ( TAM ) di UPT Puskesmas Cipadung Kota Bandung Analysis of Receiving Information System Recording and Reporting of COVID-19 Case ( Silacak Application Version 1 . 2 . 5 ). Jurnal Bikfokes (Biostatistik, Kependudukan, Dan Informatikan Kesehatan), 19. http://dx.doi.org/10.51181/bikfokes.v1i3.5297
Purwayoga, V. (2021). Optimasi Jumlah Cluster pada Algoritme K-Means untuk Evaluasi Kinerja Dosen. Jurnal Informatika Universitas Pamulang, 6(1), 118. https://doi.org/10.32493/informatika.v6i1.9522
Putu, N., Merliana, E., & Santoso, A. J. (n.d.). Analisa Penentuan Jumlah Cluster Terbaik pada Metode K-Means. 978–979. ISBN: 978-979-3649-81-8
Ruwandara, D., Jajuli, M., & Rizal, A. (2021). Analisis Algoritma K-Means Clustering Untuk Daerah Penyebaran Sampah di Kota Bekasi. JOINS (Journal of Information System), 6(1), 56–63. https://doi.org/10.33633/joins.v6i1.4085
Sindi, S., Ningse, W. R. O., Sihombing, I. A., R.H.Zer, F. I., & Hartama, D. (2020). Analisis Algoritma K-Medoids Clustering Dalam Pengelompokan Penyebaran Covid-19 Di Indonesia. Jurnal Teknologi Informasi, 4(1), 166–173. https://doi.org/10.36294/jurti.v4i1.1296
Wiguna, H., Nugraha, Y., Rizka R, F., Andika, A., Kanggrawan, J. I., & Suherman, A. L. (2020). Kebijakan Berbasis Data: Analisis dan Prediksi Penyebaran COVID-19 di Jakarta dengan Metode Autoregressive Integrated Moving Average (ARIMA). Jurnal Sistem Cerdas, 3(2), 74–83. https://doi.org/10.37396/jsc.v3i2.76
Winarta, A., & Kurniawan, W. J. (2021). Optimasi cluster k-means menggunakan metode elbow pada data pengguna narkoba dengan pemrograman python. Jurnal Teknik Informatika Kaputama (JTIK), 5(1), 113–119.
Zulfa, N., Auliya, R. I., & Zaenal, A. (2021). Analisis Data Mining Untuk Clustering Kasus Covid-19 Di Provinsi Lampung Dengan Algoritma K-Means. Jurnal Teknologi Dan Sistem Informasi (JTSI), 2(2), 100. http://jim.teknokrat.ac.id/index.php/JTSI. https://doi.org/10.33365/jtsi.v2i2.868
DOI: https://doi.org/10.31294/bi.v11i1.14762
DOI (PDF): https://doi.org/10.31294/bi.v11i1.14762.g5859
ISSN: 2338-9761