Metode Distribution Based Balance dan Bagging C4.5 Untuk Prediksi Cacat Software

Nurul Ichsan

Sari


Software berkualitas tinggi adalah software yang tidak ditemukan cacat (defect) baik selama proses pemeriksaan atau pengujian. Masalah utama dalam dataset software metrics adalah imbalance class yang membuat data menjadi tidak seimbang karena data yang cacat (kelas minoritas) jumlahnya lebih sedikit dibandingkan dengan data yang tidak cacat (kelas mayoritas), masalah ini dapat menurunkan kinerja klasifikasi. Pada Penelitian ini, untuk menangani masalah imbalance class dilakukan dengan integrasi Distribution Based Balance dan Bagging berbasis classifier C4.5 dan Naïve Bayes. Hasil  penelitian menunjukkan  bahwa  model yang diusulkan mencapai akurasi dan AUC klasifikasi yang lebih tinggi. Rata-rata akurasi 93.84%, rata-rata nilai AUC 0.939 dengan nilai rata-rata peningkatan presentase AUC mencapai 0.34. Hasil kinerja Classifier C4.5 lebih baik dibandingkan Naïve Bayes dengan rata-rata akhir akurasi dari kinerja model klasifikasi 82.42% dan AUC 0.738 lebih baik dibandingkan kinerja algoritma pembanding Naïve Bayes dengan selisih akurasi 4.4% dan selisih AUC 0.023. Model yang diusulkan merupakan  model  terbaik  dalam  penelitian prediksi cacat software untuk menangani masalah imbalance class.

 


Teks Lengkap:

PDF

Referensi


Chiş, M. (2008). Evolutionary Decision Trees and Software Metrics for Module Defects Identification. Program, 2(2), 25–29.

Hall, T., Beecham, S., Bowes, D., Gray, D., & Counsell, S. (2012). A Systematic Literature Review on Fault Prediction Performance in Software Engineering. 38(6), 1276–1304.

Laradji, I. H., Alshayeb, M., & Ghouti, L. (2014). Software defect prediction using ensemble learning on selected features. INFORMATION AND SOFTWARE TECHNOLOGY. https://doi.org/10.1016/j.infsof.2014.07.005

Lehtinen, T. O. A., Mäntylä, M. V, Vanhanen, J., Itkonen, J., & Lassenius, C. (2014). Perceived causes of software project failures – An analysis of their relationships. Information and Software Technology, 56(6), 623–643. https://doi.org/10.1016/j.infsof.2014.01.015

Lessmann, S., Member, S., Baesens, B., Mues, C., & Pietsch, S. (2008). Benchmarking Classification Models for Software Defect Prediction : A Proposed Framework and Novel Findings. 34(4), 485–496.

Mantas, C. J., & Abellán, J. (2014). Expert Systems with Applications Credal-C4 . 5 : Decision tree based on imprecise probabilities to classify noisy data. EXPERT SYSTEMS WITH APPLICATIONS, 41(10), 4625–4637. https://doi.org/10.1016/j.eswa.2014.01.017

Ming, C., Guoqing, W. U., Mengting, Y., & Hongyan, W. A. N. (2016). Semi-supervised Software Defect Prediction Using Task-Driven Dictionary Learning ∗. 25(6). https://doi.org/10.1049/cje.2016.08.034

Strate, J. D., & Laplante, P. A. (2013). A Literature Review of Research in Software Defect Reporting. 62(2), 444–454.

Wahono, R. S. (2015). A Systematic Literature Review of Software Defect Prediction : Research Trends , Datasets , Methods and Frameworks. 1(1).

Wu, F., Jing, X., Sun, Y., Sun, J., Huang, L., Cui, F., … Prediction, A. S. D. (2018). Cross-Project and Within-Project Semisupervised Software Defect Prediction : A Unified Approach. 1–17.

Yap, B. W., Rani, K. A., Aryani, H., Rahman, A., Fong, S., Khairudin, Z., & Abdullah, N. N. (2014). An Application of Oversampling , Undersampling , Bagging and Boosting in Handling Imbalanced Datasets. 13–23. https://doi.org/10.1007/978-981-4585-18-7




DOI: https://doi.org/10.31294/ijcit.v4i2.6410

P-ISSN: 2527-449X E-ISSN: 2549-7421
Statistik Pengunjung Jurnal IJCIT
 

Dipublikasikan oleh LPPM Universitas Bina Sarana Informatika

Jl. Kramat Raya No.98, Kwitang, Kec. Senen, Kota Jakarta Pusat, DKI Jakarta 10450
Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License