Implementasi Algoritma PSO Dan Teknik Bagging Untuk Klasifikasi Sel Pap Smear

Toni Arifin

Sari


Abstrak

Penyakit kanker adalah salah satu penyebab kematian di seluruh dunia. Di indonesia  Kanker serviks dan kanker payudara merupakan penyakit kanker dengan penderita terbanyak. Penyebab kanker serviks adalah virus HPV (Human Papilloma Virus) tipe 16 dan 18. Tes Pap Smear merupakan salah satu pencegahan kanker serviks secara dini. Pada pemeriksaan Pap Smear sel akan di amati di bawah mikroskop untuk membedakan sel normal dan abnormal, pada pemeriksaan ini ahli patologi terkadang kesulitan dalam pengamatan sel karena bentuk sel yang hampir mirip, dan pemeriksaan sel memakan waktu dan terkadang terjadi kesalahan. Tujuan dari penelitian ini adalah mengusulkan model klasifikasi untuk klasifikasi sel Pap Smear untuk memudahkan ahli patologi. Metode yang digunakan adalah kombinasi dari metode Particle Swarm Optimization untuk seleksi fitur dan Teknik Bagging untuk mengatasi jumlah kelas yang tidak seimbang. Dari kombinasi ke 2 metode tersebut di ujicoba dengan metode klasifikasi Decision Tree, Naïve Bayes dan K-NN untuk mengetahui perbandingan dari setiap metode klasifikasi. Hasil dari penelitian ini menunjukkan bahwa penggabungan metode Particle Swarm Optimization dan Teknik Bagging terbukti efektif untuk klasifikasi sel Pap Smear, itu di lihat dari hasil akurasi yang ditunjukkan. Klasifikasi dengan metode K-NN menghasilkan akurasi terbaik untuk klasifikasi sel normal dan abnormal yaitu 95,05%, sedangkan metode klasifikasi dengan akurasi terbaik untuk klasifikasi 7 kelas yaitu Decision Tree dengan 64,24%.

 Kata Kunci: Kanker Serviks, Pap Smear dan Klasifikasi.

  Abstract

Cancer is one of the leading causes of death in worldwide. In Indonesia cervical cancer and breast cancer is a cancer disease with most patients. The cause of cervical cancer is HPV virus (Human Papilloma Virus) types 16 and 18. Pap Smear test is one of the prevention of cervical cancer early. On Pap Smear examination the cells will be observed under a microscope to distinguish normal and abnormal cells, on this examination Pathologists sometimes find it difficult to observe cells because of the almost identical cell shape, and examination are time-consuming and sometimes faulty. The purpose of this research is to propose a classification model for Pap Smear to facilitate Pathologists. The method is used a combination of Particle Swarm Optimization for selection feature and Bagging technique to overcome an unbalanced of classes. From the combination of the two methods, we tested the classification method of Decision Tree, Naïve Bayes and K-NN to find out the comparison of each classification method.  The result of this research indicate that the incorporation of Particle Swarm Optimization method and Bagging Technique proved effective for classification of Pap Smear cells, it is viewed from the accuracy shown results. Classification with K-NN method gives the best accuracy for normal and abnormal cell classification of 95,05%, while classification method with best accuracy for classification 7 class is Decision Tree with 64,24%.

 

Keywords: Cervical Cancer, Pap Smear and Classification.


Kata Kunci


Data Mining Klasifikasi

Teks Lengkap:

PDF

Referensi


Alfisahrin, S. N. (2014). Komparasi Algoritma C4.5, Naive bayes dan Neural Network Untuk Memprediksi Penyakit Jantung. Jakarta: Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri.

Arifin, T. (2014). Implementasi Metode K-Nearest Neighbor Untuk Klasifikasi Citra Sel Pap Smear Menggunakan Analisis Tekstur Nukleus. Jurnal Informatika, 2, 287-295.

Arifin, T. (2014). Metode Data Mining Untuk Klasifikasi Data Sel Nukleus Dan Sel Radang Berdasarkan Analisa Tekstur. Jurnal Informatika, 2, 425-433.

Han, J., & Kamber, M. (2006). Data Mining Concepts and Techniques Second Edition. San Francisco: Diane Cerra.

Hidayatulloh, T., Herliana, A., & Arifin, T. (2016). Klasifikasi Sel Tunggal Pap Smear Berdasarkan Analisis Fitur Berbasis Naïve Bayes Classifier Dan Particle Swarm Optimization. SWABUMI, 4, 186-193.

Jantzen, J., Norup, G. J., Dounias, & Bjerregaard, B. (2005). Papsmear Benchmark Data For Pattern Classification. Technical University of Denmark, 1-20.

KEMENKES. (2015). InfoDatin, Pusat Data dan Informasi Kementrian Kesehatan.

Kementrian Kesehatan Republik Indonesia. (2015). Retrieved July 30, 2016, from www.depkes.go.id: http://www.depkes.go.id/resources/download/pusdatin/infodatin/infodatin-kanker.pdf

Kusrini, & Luthfi. (2009). Algoritma Data Mining. Andi: Yogyakarta.

Laradji, I. H., Alshayeb, M., & Ghouti, L. (2015). Software Defect Prediction Using Ensemble Learning on Selected Features. Information and Software Technology, 388-402.

Liu, X. Y., & Zhou, Z. H. (2013). Ensemble Methods for Class Imbalance Learning. Imbalanced Learning: Foundations, Algorithms, and Applications, First Edition 61-82.

Maimon, O., & Rokach, L. (2010). Data Mining and Knowledge Discovery Handbook Second Edition. New York: Springer.

Martin, E. (2013, July 25). Pap-Smear Classification. Retrieved from http://labs.fme.aegean.gr/decisi on/downloads/

Prasetyo, E. (2012). Data Mining Konsep dan Aplikasi Menggunakan Matlab. Yogyakarta: Andi.

Riskesdas. (2013). Data riset kesehatan.

Rodiansyah, & Winarko. (2013). Klasifikasi Posting Twitter Kemacetan Lalu Lintas Kota Bandung Menggunakan Naive bayesian Classification. IJCCS (Indonesian Journal of Computing and Cybernetics Systems).

Septadina, I. S., Kesuma, H., Handayani, D., Suciati, T., & Liana, P. (2007). Upaya Pencegahan Kanker Serviks Melalui Peningkatan Pengetahuan Kesehatan Reproduksi Wanita Dan Pemeriksaan Metode Iva (Inspeksi Visual Asam Asetat) Di Wilayah Kerja Puskesmas Kenten Palembang. Jurnal Pengabdian Sriwijaya .

Shih Wei, L., Kuo-Ching, Y., Shih-Chieh, C., & Zne-Jung, L. (2008). Particle Swarm Optimization for Parameter Determination and Feature Selection of Support Vector Machines. ScienceDirect: Expert System With Aplications, 1817-1824.

Wahono, R. S., & Suryana, N. (2013). Combining Particle Swarm Optimization based Feature Selection and Bagging Technique for Software Defect Prediction. International Journal of Software Engineering and Its Applications , 153-166.

World Health Organization (WHO). (2014). Retrieved Agustus 22, 2016, from Cancer: http://www.who.int/mediacentre/factsheets/fs297/en/

Wu, X. (2008). Top 10 algorithms in data mining. Knowledge Inference System. . IEEE ICDM Conference, 1-12.




DOI: https://doi.org/10.31311/ji.v4i2.2129

##submission.license.cc.by4.footer##

 dipublikasikan oleh LPPM UBSI
Jl. Kamal Raya No. 18 Cengkareng, Jakarta Barat