Analisis Perbandingan Algoritma Klasifikasi Data Mining Untuk Dataset Blogger Dengan Rapid Miner

Ardiyansyah Ardiyansyah, Panny Agustia Rahayuningsih, Reza Maulana

Abstract


Data mining merupakan sebuah proses untuk menganalisa sebuah kasus untuk menemukan performa terbaik dari algoritma yang diuji. Salah satu cara untuk mendapatkan informasi atau pola dari kumpulan data yang besar adalah dengan menggunakan teknik-teknik dalam  data mining. Ada banyak metode klasifikasi yang di gunakan untuk menghasilkan nilai akurasi yang akurat. Terdapat 5 algoritma klasifikasi yang digunakan dalam mengklasifikasi dataset blogger yaitu decision tree, Naïve bayes, k-nearest neighbour, ID3, dan CHAID. Dataset menggunakan data blogger dari UCI Machine Learning Repository.Blog adalah media yang bergantung pada teknologi informasi dan kemajuan teknologi.  Penelitian ini diuji Dengan menggunakan validasi 10-fold cross validation dan uji t-test. Sehingga hasil tertinggi dari nilai akurasi yang didapat adalah sebesar 85.00% untuk algoritma KNN. Sedangkan untuk nilai AUC algoritma CHAID yang memiliki hasil tertinggi yaitu sebesar 0.758. dan dari asil uji t-test yang dilakukan bahwa algoritma ID3,CHAID dan Naive Bayes merupakan algoritma dengan performa terbaik yang diterapkan pada dataset blogger. Sedangkan untuk algoritma KNN dan C45 merupakan algoritma dengan performa yang kurang baik dengan nilai AUC 0,500%.

Kata Kunci: Data Mining, Algoritma, Klasifikasi, Dataset Blogger


Keywords


Kata Kunci: Data Mining, Algoritma, Klasifikasi, Dataset Blogger

Full Text:

PDF

References


Adip Alkaromi M. Komparasi Algoritma Klasifikasi untuk Dataset Iris dengan Repid Miner. 2012.

D. Widiastuti, “Analisa Perbandingan Algoritma SVM, Naive Bayes, dan Decision Tree dalam Mengklasifikasikan Serangan (Attacks) pada Sistem Pendeteksi Intrusi,” 2012.

D. T. Larose, Discovering Knowledge in Data: an Introduction to Data Mining. John Wiley & Sons, 2005.

E. Prasetyo, Data Mining Konsep dan Aplikasi menggunakan Matlab.Yogyakarta: Andi Offset, 2012, p. 353.

Florin Gorunescu, Data Mining: Concepts, Model and Techniques, Prof. Janusz Kacprzyk and Prof. Lakhmi C. Jain, Eds. Berlin,

Gallacgher, CA. 2000. An Iterative Approach to Classification Analysis.

I. H. Witten, E. Frank, and M. A. Hall, Data Mining: Practical Machine Learning Tools and Techniques 3rd Edition. Elsevier, 2011.

J. Han and M. Kamber, Data Mining: Concepts and Techniques Second Edition. Elsevier, 2006.

J. Awwalu, A. Ghazvini, and A. A. Bakar, “Performance Comparison of Data Mining Algorithms: A Case Study on Car Evaluation Dataset.”

Juffinger,A., Lex, E., 2009, Cross language Blog Mining and Trend Visualization ,WWW 2009, 2009, Madrid, Spain.1149-1150.

Khafiizh Hastuti. Analisa Komparasi Algoritma Klasifikasi Data Mining untuk Prediksi Mahasiswa Non Aktif. ISBN 979-26-0255-0, 2012.

Obbie, "Penerapan Algoritma Klasifikasi Data Mining ID3 untuk Menentukan Penjurusan Siswa SMAN 6 Semarang

Rizal Amegia Saputra, “komparasi algoritma klasifikasi data mining untuk memprediksi penyakit tuberculosis (tb),” semin. nas. inov. dan tren snit, 2014.

Soleimanian Gharehchopogh, F., & Reza Khaze, S. (2012). Data Mining Application for Cyber Space Users Tendency in Blog Writing: A Case Study. International Journal of Computer Applications, 47(18), 975–888. https://doi.org/10.5120/7291-0509

Wyld,D., 2007, The Blogging Revolution: Government in the Age of Web 2.0 ,IBM Center for The Business of Government.

Wahono, R. S., Herman, N. S., & Ahmad, S. (2014). A comparison framework of classification models for software defect prediction. Advanced Science Letters, 20(10–12), 1945–1950. http://doi.org/10.1166/asl.2014.5640

X. Wu, V. Kumar, J. R. Quinlan, J. Ghosh, Q. Yang, H. Motoda, G. J. Mclachlan, A. Ng, B. Liu, P. S. Yu, Z. Z. Michael, S. David, and J. H. Dan, Top 10 algorithms in data mining. 2007, pp. 1–37.

Zafarani,R, Jashki, M.A, Baghi,H.R , Ghorbani,A., 2008, A Novel Approach for Social Behavior Analysis of the Blogosphere, springer-Verlag Berlin Heidelberg, S. Bergler (Ed.): Canadian AI, 356–367.




p-ISSN  2339-1928

e-ISSN 2579-633X


Editor's Address:

AMIK BSI Pontianak

Jl. Abdurrahman Saleh No.18 A Pontianak, Kalimantan Barat 78124

Telp : (0561)583924

Fax : (0561) 583934

Email : jurnalkhatulistiwainformatika@bsi.ac.id 

Jurnal Khatulistiwa Informatika Indexed by: