KOMPARASI KLASIFIKASI PADA PREDIKSI PENDAPATAN RUMAH TANGGA

Evy Priyanti

Abstract


Kebutuhan akan kehidupan sehari-hari tidak terlepas dari pendapatan yang dihasilkan, baik pendapatan harian, mingguan atau bulanan. Oleh karena itu prediksi pendapatan rumah tangga sangat penting dikarenakan akan membantu dalam menciptakan pendapatan yang lebih baik, dalam memprediksi suatu data dapat dilakukan dengan beberapa algoritma diantaranya dengan algoritma K-nearest neighbor dan algorima Neural Network. Pada penelitian kali ini akan dikomparasi bagaimana algoritma K-Nearest neighbor dengan Neural network dalam memprediksi pendapatan rumah tangga pada sensus yang dilakukan di Bereu pada tahun 1996. Algoritma K-Nearest neighbor menghasilkan nilai akurasi sebesar 70,49% sedangkan algoritma Neural Network menghasilkan akurasi sebesar 83,62%, hal ini membuktikan bahwa algoritma Neural Network dapat bekerja lebih baik dalam memprediksi pendapatan rumah tangga di Bereu yang dilakukan oleh Ronny Kohavi dan Barry Becker pada 1 mei 1996 yang terdiri dari 48842 dataset dan 14 atribut. Beberapa atribut menjadi faktor penentu dalam menciptakan pendapatan yang lebih tinggi, diantaranya status pernikahan yang utuh yang terdiri dari minimal suami dan istri dalam satu atap dan pendidikan yang tinggi mendapatkan peluang untuk mendapatkan penghasilan yang lebih tinggi dari pasangan itu sendiri yang nantinya dapat mempengaruhi pendapatan rumah tangga lebih dari $50.000/tahun. Selain itu faktor pengalaman bekerja juga menjadi salah satu faktor penentu tingginya pendapatan rumah tangga. Faktor ketidakharmonisan dalam rumah tangga juga menjadi salah satu fakto pendapatan yang kurang dari $50.000/tahun.


References


F. Nurwanto, I. Ardiyanto and S. Wibirama, "Light sport exercise detection based on smartwatch and smartphone using k-Nearest Neighbor and Dynamic Time Warping algorithm," 2016 8th International Conference on Information Technology and Electrical Engineering (ICITEE), Yogyakarta, 2016, pp. 1-5.

Gorunescu, Florin. (2011). Data Mining: Concepts, Models and Techniques. Verlag Berlin Heidelberg, Springer. Jerman.

Guillet, Fabrice. Hamilton, Howard J. (2007). Quality Measures in Data Mining. Verlag Berlin Heidelberg, Springer. Jerman.

Han,J& Kamber, Micheline. (2007). Data Mining Concepts, Models and Techniques. Second Edition, Morgan Kaufmann Publisher. Elsevier.

Heaton, Jeff. (2010). Programming Neural Networks With Encog 2 In Java. Heaton Research.Inc, USA.

Larose, D. (2005). Discovering Knowledge in Data. New Jersey, John Willey & Sons.Inc.

Liao, Warren. T. & Triantaphyllou.Evangelos. (2007). Recent Advances in Data Mining of Enterprise Data: Algorithms and Applications. Series: Computer and Operation Research. 6. 190.

Lim TS, Loh WY, Shih YS.(1999). A comparison of prediction accuracy, complexity, and training time of thirty-three old and new classification algorithms. Kluwer Academic Publishers: Boston.

Maimon, Oded& Rokach, Lior. (2010). Data Mining and Knowledge Discovery Handbook, Springer, New York.

Mihov, Valentin. (2015). Adult Income Data Set Analysis with IPython. Sofia University, Bulgaria.

Min, Hui Tsai, et al.(2010). Profiling U.S. Household Income. https://faculty.biu.ac.il/~yahavi1/Projects/CP2010T1_rep.pdf.

Myatt, Glenn J. (2007). Making sense of data : A Practical Guide to Exploratory data analysis and Data Mining. John Wiley & Sons Inc, New Jersey.

Priyanti, Evy.(2017).Implementasi Neural Network pada prediksi pendapatan rumah tangga. AMIK BSI. Swabumi.

Shukla, Anupam. Tiwari, Ritu. & Kala, Rahul. (2010). Real Life Application of Soft Computing.New York: Taylor and Francis Groups, LLC.

Siang, Jong Jek (2009). Jaringan Syaraf Tiruan dan Pemrogramannya menggunakan MATLAB. Penerbit Andi. Yogjakarta.

Singh Asmita, Malka N. Halgamuge, Rajasekaran Lakshmiganthan. (2017).Impact of Different Data Types on Classifier Performance of Random Forest, Naïve Bayes, and K-Nearest Neighbors Algorithms. School of Computing and Mathematics Charles Sturt University Melbourne, Australia. (IJACSA) International Journal of Advanced Computer Science and Applications

S. S. Nikam. A Comparative Study of Classification Techniques in Data Mining Algorithms. Orient.J. Comp. Sci. and Technol; 8(1), April 2015

Topiwalla, Mohammed. (2013). Machine Learning on UCI Adult data set using various classifier algoritms and scaling up the accuracy using extreme gradient boosting. University of SP Jain School of Global Management.

Vercellis,C. (2009). Business Intelligence: Data Mining and Optimization for Decision Making. Wiley.

Witten,I. Frank, E., & Hall. (2011). Data Mining: Practical Machine Learning and tools. Morgan Kaufmann Publisher, Burlington.




DOI: https://doi.org/10.31294/swabumi.v7i2.6529

INDEXING

 

 

 

    P-ISSN : 2355-990X                       E-ISSN: 2549-5178

                     

 

Dipublikasikan oleh LPPM Universitas Bina Sarana Informatika

Jl. Kramat Raya No.98, Kwitang, Kec. Senen, Kota Jakarta Pusat, DKI Jakarta 10450
Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License