OPTIMASI KLASIFIKASI SEL TUNGGAL PAP SMEAR MENGGUNAKAN CORRELATION BASED FEATURES SELECTION (CFS) BERBASIS C4.5 DAN NAIVE BAYES

Asti Herliana

Sari



Abstract – Cervical cancer was the most dangerous disease and generally attacks women. Early detection through Pap Smear method was one way to prevent the desease to grow in womans cervival canal. Based on the result of Pap Smear methode, the single cell of data that known as herlev data is available. This data, then used as a reference by the experts to find the best level classification from each class of cervical cancer. The decision tree C4.5 and Naïve Bayes have proven to give the best result on 280 data trial of herlev with support by Correlation based Features Selection (CFS) optimization method. The issues raised in the present study was does CFS optimization methode that combined with the classification method of C4.5 and Naïve Bayes can provide increased the accuracy results when it faced the 917 data of herlev. The results of this study show that CFS method that combined either with C4.5 methods and naïve bayes classification accuracy was decrease when compared without using CFS method. In terms of showing that CFS can not provide the best result when if confronted with big data.

Keywords : optimization, classification, single cell of Pap Smear, Correlation based Features Selection, C4.5, Naïve Bayes

 

Abstrak – Kanker serviks merupakan penyakit yang sangat berbahaya dan pada umumnya menyerang kaum wanita. Deteksi sejak dini melalui metode Pap Smear merupakan salah satu cara untuk mencegah penyakit ini berkembang didalam saluran serviks wanita. Berdasarkan hasil dari metode Pap Smear, didapatkanlah data sel tunggal yang kini dikenal dengan data herlev. Data ini, kemudian dijadikan acuan dalam penelitian oleh para ahli dewasa ini untuk menemukan tingkat klasifikasi terbaik dari masing-masing kelas kanker serviks. Metode Decision tree C4.5 dan Naïve Bayes terbukti memberikan hasil yang terbaik pada ujicoba data herlev sebanyak 280 data dengan dukungan dari metode optimasi Correlation based Features Selection(CFS). Permasalahan yang diangkat pada penelitian kali ini adalah apakah metode optimasi CFS yang dikombinasikan dengan metode klasifikasi C4.5 dan Naïve Bayes akan memberikan hasil akurasi yang meningkat ketika digunakan keseluruhan data herlev sebesar 917 data. Hasil dari penelitian kali ini menunjukkan bahwa metode CFS yang dikombinasikan baik dengan metode C4.5 maupun Naïve Bayes menunjukkan penurunan hasil akurasi jika dibandingkan dengan tanpa menggunakan metode CFS. Hal ini menunjukkan bahwa metode optimasi CFS tidak dapat memberikan hasil terbaik jika dihadapkan kepada data yang berjumlah besar.

 Kata kunci : optimasi, klasifikasi, sel tunggal Pap Smear, Correlation based Features Selection,  C4.5, Naïve Bayes.


Teks Lengkap:

PDF

Referensi


Arifin, T. (2014). Klasifikasi Inti Sel Pap Smear Berdasarkan Analisis Tekstur Menggunakan Correlation Based Features Selection Berbasis Algoritma C4.5. Jurnal Informatika. Vol. II No. 2, 123-129.

Han, J., & Kamber, M. (2001). Data Mining Concepts and Techniques. The Morgan Kaufmann Series.

Herliana, A., & Riana, D. (2013, November 3). Klasifikasi Sel Tunggal Pap Smear Berdasarkan Analisis Fitur Dan Analisis Tekstur Terseleksi Menggunakan Correlation-Based Features Selection. Jakarta: Stmik Nusa Mandiri. Retrieved From Www.Academia.Edu: Https://Www.Academia.Edu/11538482/Klasifikasi_Sel_Tunggal_Pap_Smear_Berdasarkan_Analisis_Fitur_Dan_Analisis_Tekstur_Terseleksi_Menggunakan_Correlation-Based_Features_Selection

Jantzen, J., Norup, J., Dounias, G., & Bjerregaard, B. (2005). Pap-Smear Benchmark Data For Pattern Classification. Harlev: Technical University of Denmark.

Larose, D. T. (2005). Discovering Knowledge in Data: An Introduction to Data Mining. New Jersey: Jhon Wiley & Sons Inc.

Martin, Erik. (2003). Pap-Smear Classification. Juni 19, 2013, from Technical University of Denmark:http://labs.fme.aegean.gr/decision/downloads/

Muhummah, I., Anwariyah, K., & Indrayanti. (2012). Extraction adn Selection Features of Cervical Cell Types in Papsmears Digital Images. International Conference on Woman's Health in Science & Engineering (WISE-Health) 2012. Bandung: Institute Technology Bandung.

Ompusunggu, H. S. (2008). Implementasi Seleksi Variabel Menggunakan Metode Correlation-Based Feature Selection Dalam Task Classification. Bandung: Institut Teknologi Telkom.

Rodiyansyah, S. F., & Winarko, E. (2012). Klasifikasi Posting Twitter Kemacetan Lalu Lintas Kota Bandung Menggunakan Naive Bayesian Classification. IJCCS Vol.6 No.1 ISSN: 1978-1520, 91-100.




DOI: https://doi.org/10.31311/ji.v3i2.1167



 dipublikasikan oleh LPPM UBSI
Jl. Kamal Raya No. 18 Cengkareng, Jakarta Barat