Metode Distribution Based Balance dan Bagging C4.5 Untuk Prediksi Cacat Software
Sari
Software berkualitas tinggi adalah software yang tidak ditemukan cacat (defect) baik selama proses pemeriksaan atau pengujian. Masalah utama dalam dataset software metrics adalah imbalance class yang membuat data menjadi tidak seimbang karena data yang cacat (kelas minoritas) jumlahnya lebih sedikit dibandingkan dengan data yang tidak cacat (kelas mayoritas), masalah ini dapat menurunkan kinerja klasifikasi. Pada Penelitian ini, untuk menangani masalah imbalance class dilakukan dengan integrasi Distribution Based Balance dan Bagging berbasis classifier C4.5 dan Naïve Bayes. Hasil penelitian menunjukkan bahwa model yang diusulkan mencapai akurasi dan AUC klasifikasi yang lebih tinggi. Rata-rata akurasi 93.84%, rata-rata nilai AUC 0.939 dengan nilai rata-rata peningkatan presentase AUC mencapai 0.34. Hasil kinerja Classifier C4.5 lebih baik dibandingkan Naïve Bayes dengan rata-rata akhir akurasi dari kinerja model klasifikasi 82.42% dan AUC 0.738 lebih baik dibandingkan kinerja algoritma pembanding Naïve Bayes dengan selisih akurasi 4.4% dan selisih AUC 0.023. Model yang diusulkan merupakan model terbaik dalam penelitian prediksi cacat software untuk menangani masalah imbalance class.
Teks Lengkap:
PDFReferensi
Chiş, M. (2008). Evolutionary Decision Trees and Software Metrics for Module Defects Identification. Program, 2(2), 25–29.
Hall, T., Beecham, S., Bowes, D., Gray, D., & Counsell, S. (2012). A Systematic Literature Review on Fault Prediction Performance in Software Engineering. 38(6), 1276–1304.
Laradji, I. H., Alshayeb, M., & Ghouti, L. (2014). Software defect prediction using ensemble learning on selected features. INFORMATION AND SOFTWARE TECHNOLOGY. https://doi.org/10.1016/j.infsof.2014.07.005
Lehtinen, T. O. A., Mäntylä, M. V, Vanhanen, J., Itkonen, J., & Lassenius, C. (2014). Perceived causes of software project failures – An analysis of their relationships. Information and Software Technology, 56(6), 623–643. https://doi.org/10.1016/j.infsof.2014.01.015
Lessmann, S., Member, S., Baesens, B., Mues, C., & Pietsch, S. (2008). Benchmarking Classification Models for Software Defect Prediction : A Proposed Framework and Novel Findings. 34(4), 485–496.
Mantas, C. J., & Abellán, J. (2014). Expert Systems with Applications Credal-C4 . 5 : Decision tree based on imprecise probabilities to classify noisy data. EXPERT SYSTEMS WITH APPLICATIONS, 41(10), 4625–4637. https://doi.org/10.1016/j.eswa.2014.01.017
Ming, C., Guoqing, W. U., Mengting, Y., & Hongyan, W. A. N. (2016). Semi-supervised Software Defect Prediction Using Task-Driven Dictionary Learning ∗. 25(6). https://doi.org/10.1049/cje.2016.08.034
Strate, J. D., & Laplante, P. A. (2013). A Literature Review of Research in Software Defect Reporting. 62(2), 444–454.
Wahono, R. S. (2015). A Systematic Literature Review of Software Defect Prediction : Research Trends , Datasets , Methods and Frameworks. 1(1).
Wu, F., Jing, X., Sun, Y., Sun, J., Huang, L., Cui, F., … Prediction, A. S. D. (2018). Cross-Project and Within-Project Semisupervised Software Defect Prediction : A Unified Approach. 1–17.
Yap, B. W., Rani, K. A., Aryani, H., Rahman, A., Fong, S., Khairudin, Z., & Abdullah, N. N. (2014). An Application of Oversampling , Undersampling , Bagging and Boosting in Handling Imbalanced Datasets. 13–23. https://doi.org/10.1007/978-981-4585-18-7
DOI: https://doi.org/10.31294/ijcit.v4i2.6410
##submission.copyrightStatement##
##submission.license.cc.by-sa4.footer##
P-ISSN: 2527-449X E-ISSN: 2549-7421
Statistik Pengunjung Jurnal IJCIT