Deteksi Penyakit Kanker Payudara dengan Seleksi Fitur berbasis Principal Component Analysis dan Random Forest

Ahmad Fauzi, Riki Supriyadi, Nurlaelatul Maulidah

Sari


Abstrak  - Skrining merupakan upaya deteksi dini untuk mengidentifikasi penyakit atau kelainan yang secara klinis belum jelas dengan menggunakan tes, pemeriksaan atau prosedur tertentu. Upaya ini dapat digunakan secara cepat untuk membedakan orang - orang yang kelihatannya sehat tetapi sesungguhnya menderita suatu kelainan.Tujuan utama penelitian ini adalah untuk meningkatkan peforma klasifikasi pada diagnosis kanker payudara dengan menerapkan seleksi fitur pada beberapa algoritme klasifikasi. Penelitian ini menggunakan database kanker payudara Breast Cancer Coimbra Data Set . Metode seleksi fitur berbasis pricipal component analysis akan dipasangkan dengan beberapa algoritme klasifikasi dan metode, seperti Logitboost,Bagging,dan Random Forest. Penelitian ini menggunakan 10 fold cross validation sebagai metode evaluasi. Hasil penelitian menunjukkan metode seleksi fitur berbasis pricipal component analysis mengalami peningkatan peforma klasifikasi secara signifikan setelah dipasangkan dengan seleksi fitur Random Forest dan logitboost, Random forest menunjukan peforma terbaik dengan akurasi 79.3103% dengan nilai AUC sebesar 0,843.

 

Kata Kunci: Seleksi Fitur,PCA, Kanker Payudara,Skrining,Random Forest


Teks Lengkap:

PDF

Referensi


Assiri, A. M. A., & Kamel, H. F. M. (2015). Evaluation of diagnostic and predictive value of serum adipokines : Leptin , resistin and visfatin in postmenopausal breast cancer. Obesity Research & ClinicalPractice.https://doi.org/10.1016/j.orcp.2015.08.017

Assiri, A. M. A., Kamel, H. F. M., & Hassanien, M. F. R. (2015). Resistin , Visfatin , Adiponectin , and Leptin : Risk of Breast Cancer in Pre- and Postmenopausal Saudi Females and Their Possible Diagnostic and Predictive Implications as Novel Biomarkers, 2015.

Bandung, U. T. (2018). Deteksi Kanker Berdasarkan Klasifikasi Microarray Data, 2(4), 181–186.

Cole, K. D., He, H., & Wang, L. (2013). Breast cancer biomarker measurements and standards Keywords :, 17–29. https://doi.org/10.1002/prca.201200075

Ghaderyan, P., Abbasi, A., & Hossein, M. (2014). An efficient seizure prediction method using KNN-based undersampling and linear frequency measures. Journal of Neuroscience Methods, 232, 134–142. https://doi.org/10.1016/j.jneumeth.2014.05.019

Hasan, H., Tahir, N., & Mara, U. T. (2010). Feature Selection of Breast Cancer Based on Principal Component Analysis, 242–245.

Hsiao-Lin Hwa MD PhD, 1, Wen-Hong Kuo MD, 2 Li-Yun Chang PhD, 3 Ming-Yang Wang MD, 4, Tao-Hsin Tung PhD, 5 King-Jen Chang MD 6, 7, and F.-J. H. M., & 1. (2006). PDFlib PLOP : PDF Linearization , Optimization , Protection Page inserted by evaluation version. Journal of Evaluation in Clinical Practice ISSN 1356-1294 Prediction. https://doi.org/10.1111/j.1365-2753.2007.00849.x

KEMENTERIAN KESEHATAN REPUBLIK INDONESIA PANDUAN PENATALAKSANAAN KANKER PAYUDARA. (n.d.). Kanker payudara.

Made Satria Wibawa1), K. D. P. N. (2017). Reduksi Fitur Untuk Optimalisasi Klasifikasi Tumor Payudara Berdasarkan Data Citra FNA, 73–78.

Maria Dalamaga a, B., & ⁎, George Sotiropoulos c, Konstantinos Karmaniolas d, Nicolaos Pelekanos a, Evangelia Papadavid e, A. L. b. (2013). Serum resistin: A biomarker of breast cancer in postmenopausal women? Association with clinicopathological characteristics, tumor markers, inflammatory and metabolic parameters.

Matafome, P., Gomes, D. S. A. L., & Criso, J. (2016). Hyperresistinemia and metabolic dysregulation : a risky crosstalk in obese breast cancer. https://doi.org/10.1007/s12020-016-0893-x

Mendieta-zer, H., Torres-ju, J. J., Gonz, J. M., Ord, A., & Hern, L. V. (2013). The Tetrad BMI , Leptin , Leptin / Adiponectin ( L / A ) Ratio and CA 15-3 are Reliable Biomarkers of Breast Cancer, 20(October 2012), 12–20. https://doi.org/10.1002/jcla.21555

Nasution, M. Z., Nababan, A. A., & Syaliman, K. U. (2019).

PENERAPAN PRINCIPAL COMPONENT ANALYSIS ( PCA ) DALAM PENENTUAN FAKTOR DOMINAN YANG MEMPENGARUHI PENGIDAP KANKER SERVIKS ( Studi Kasus : Cervical Cancer Dataset ), 3(1), 204–210.

Patrício, M., & Caramelo, F. (2016). Comment on “Evaluation of diagnostic and predictive value of serum adipokines: Leptin, resistin and vistafin in postmenopausal breast cancer.” Obesity Research & Clinical Practice, 2015–2016. https://doi.org/10.1016/j.orcp.2015.12.006

Patrício, M., Pereira, J., Crisóstomo, J., Matafome, P., Gomes, M., Seiça, R., & Caramelo, F. (2018). Using Resistin , glucose , age and BMI to predict the presence of breast cancer, 1–8. https://doi.org/10.1186/s12885-017-3877-1

Saputra, W. S. J., Sujatmika, A. R., & Arifin, A. Z. (2011). Seleksi Fitur Menggunakan Random Forest Dan Neural Network, 2011(Ies), 978–979.

Shahura, F., Soesanto, O., & Indriani, F. (2016). Penerapan Metode RBPNN untuk Klasifikasi Kanker Payudara, 03(02), 135–145.

Smildeabtorial, R. B. and A. K. (2014). Analytical Methods, 2812–2831. https://doi.org/10.1039/c3ay41907j

Tian, W., Song, J., Li, Z., & Wilde, P. De. (2014). Bootstrap techniques for sensitivity analysis and model selection in building thermal performance analysis. APPLIED ENERGY, 135, 320–328. https://doi.org/10.1016/j.apenergy.2014.08.110

Wahyuni, E. S., Industri, F. T., Studi, P., Elektro, T., Indonesia, U. I., & Bayes, N. (2016). Penerapan metode seleksi fitur untuk meningkatkan hasil diagnosis kanker payudara, 7(1), 283–294.

Prabowo, Sigit. (2013). Data Minig-Tahap Tahapan Knowledge Discovery In Database (KDD). Juli 10,

http://www.sigitprabowo.id/2013/04/data-mining-tahap-tahapan-knowladge.html

Widiputra, harya Damar. (2016).Apa Itu Data Mining?.Juli 10,2018. https://dosen.perbanas.id/apa-itu-data-mining/

Han, J., Kamber, M., Pei, J. (2012). Data Minning Concept And Techniques. California: Morgan Kaufmann.

Lin L , Wang F , Xie X. (2017). Random forests-based extreme learning machine ensemble for multi-regime time series prediction. Expert Systems With Applications. doi:10.1016/j.eswa.2017.04.013.

Dean, J. 2014. Big Data, Data Mining And Machine Learning. New Jersey. SAS Institute.

Arifin, T., Riana, D., & Hapsari, G. I. (2014). Klasifikasi Statistikal T3kstur Sel Pap Smear Dengan Decesion Tree. Jurnal Informatika, (1), 1-7.




DOI: https://doi.org/10.31294/infortech.v2i1.8079

DOI (PDF): https://doi.org/10.31294/infortech.v2i1.8079.g4111

Refbacks

  • Saat ini tidak ada refbacks.


Dipublikasikan oleh LPPM Universitas Bina Sarana Informatika

Jl. Kramat Raya No.98, Kwitang, Kec. Senen, Kota Jakarta Pusat, DKI Jakarta 10450
Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License