Penerapan Information Retrieval dalam Sistem Analisis Kemiripan Proposal Skripsi menggunakan Cosine Similarity

Muhammad Dzikry Afandi, Ahmad Homaidi, Abd Ghofur, Ach Zubairi

Abstract


Di lingkungan akademik, konsep plagiarisme cukup sering dibahas, plagiarisme yang biasa dilakukan adalah plagiarisme terhadap karya tulis ilmiah. Masalah yang sama juga dihadapi oleh Universitas Ibrahimy Sukorejo khususnya Fakultas Sains dan Teknologi. Mahasiswa biasanya hanya mengubah tempat penelitian, hal ini tentunya mengkhawatirkan sebab tidak ada kebaharuan yang ditawarkan pada penelitian tersebut. Penelitian ini menawarkan sebuah sistem yang bisa menganalisa sejauh mana kemiripan dari proposal skripsi yang diajukan oleh mahasiswa. Sistem menerima masukan berupa judul dan ringkasan proposal skripsi yang akan diajukan. Sistem temu kembali atau information retrieval akan digunakan bersamaan dengan text mining. Penelitian ini meggunakan metode perangkingan cosine similarity yang sebelumnya dilakukan pembobotan term frequency-inverse document frequency. Hasilnya sistem mampu untuk mengenali masukan yang diberikan pengguna dan memberikan perangkingan sesuai dengan perhitungan yang dihasilkan. Pada pengujian sistem mendapatkan kemiripan sebesar 100% untuk query yang sama persis dengan dataset. Sedangkan pada query yang di dimasukkan agak mirip, sistem memberikan persentase sebesar 18.4%. Sistem juga bisa memberikan gambaran kepada panitia skripsi tentang penelitian yang akan dilakukan oleh mahasiswa

In academic circles, the concept of plagiarism is often discussed, the plagiarism that is usually done is plagiarism against scientific papers. The same problem is also faced by Ibrahimy Sukorejo University, especially the Faculty of Science and Technology. Students usually only change the place of research, this is of course worrying because there is no innovation offered in the research. This research offers a system that can analyze how far the thesis proposals submitted by students are similar. The system receives input in the form of a title and a summary of the thesis proposal to be submitted. Retrieval system or information retrieval will be used in conjunction with text mining. This study uses the cosine similarity ranking method, which was previously weighted by term frequency-inverse document frequency. As a result, the system is able to recognize the wishes given by the user and provide a ranking according to the resulting calculations. In testing, the system obtained a similarity of 100% for queries that were exactly the same as the dataset. Meanwhile, the query entered is somewhat similar, the system gives a percentage of 18.4%. The system can also provide an overview to the thesis committee about the research that will be carried out by students.


References


Ahmad, I., Borman, R. I., Caksana, G. G., & Fakhrurozi, J. (2021). Implementasi String Matching Dengan Algoritma Boyer-Moore Untuk Menentukan Tingkat Kemiripan Pada Pengajuan Judul Skripsi/TA Mahasiswa (Studi Kasus: Universitas XYZ). SINTECH (Science and Information Technology) Journal, 4(1), 53–58. https://doi.org/10.31598/sintechjournal.v4i1.699

Aisiah, A., & Firza, F. (2019). Kendala yang Dihadapi Mahasiswa Jurusan Sejarah dalam Menulis Proposal Skripsi. Diakronika, 18(2), 90. https://doi.org/10.24036/diakronika/vol18-iss2/70

Ariantini, D. A. R., Lumenta, A. S. M., & Jacobus, A. (2016). Pengukuran Kemiripan Dokumen Teks Bahasa Indonesia Menggunakan Metode Cosine Similarity. Jurnal Teknik Informatika, 9(1), 1–8. https://doi.org/10.35793/jti.9.1.2016.13752

Azis, M. A., Hamid, A., Fauzi, A., Yudhistira, Yulianto, E., Riyanto, V., Ridwansyah, & Sfenrianto. (2019). Information retrieval system in text-based skripsi document search file using vector space model method. Journal of Physics: Conference Series, 1367(1), 012016. https://doi.org/10.1088/1742-6596/1367/1/012016

Benard Magara, M., Ojo, S. O., & Zuva, T. (2018). A comparative analysis of text similarity measures and algorithms in research paper recommender systems. 2018 Conference on Information Communications Technology and Society (ICTAS), 1–5. https://doi.org/10.1109/ICTAS.2018.8368766

Cahyani, L., & Arif, M. (2022). Text Mining untuk Pengelompokan Skripsi di Prodi Pendidikan Informatika Universitas Trunojoyo Madura. Jurnal Ilmiah Edutic : Pendidikan Dan Informatika, 8(2), 97–108. https://doi.org/10.21107/edutic.v8i2.13020

Efendi, Z., & Mustakim, M. (2017). Text Mining Classification sebagai Rekomendasi Dosen Pembimbing Tugas Akhir Program Studi Sistem Informasi. Seminar Nasional Teknologi Informasi Komunikasi Dan Industri, 0(0), 235–242. http://ejournal.uin-suska.ac.id/index.php/SNTIKI/article/view/3273

Fauzi, A., & Ginabila, G. (2019). Information Retrieval System Pada File Pencarian Dokumen Tesis Berbasis Text Menggunakan Metode Vector Space Model. Jurnal Pilar Nusa Mandiri, 15(1), 41–46. https://doi.org/10.33480/pilar.v15i1.61

Fauzi, R., Iqbal, M., & Haryanti, T. (2022). Design and Implementation of a Final Project Plagiarism Detection System Using Cosine Similarity Method. IJAIT (International Journal of Applied Information Technology), 05(02), 1. https://doi.org/10.25124/ijait.v5i02.4146

Hadi, S. (2016). Pemeriksaan Keabsahan Data Penelitian Kualitatif Pada Skripsi [Examination of the Validity of Qualitative Research Data on Thesis]. Ilmu Pendidikan, 22(1), 21–22. https://doi.org/http://dx.doi.org/10.17977/jip.v22i1.8721

Hidayatullah, F., & dkk. (2016). Penerapan Text Mining dalam Klasifikasi Judul Skripsi. Seminar Nasional Aplikasi Teknologi Informasi (SNATi) Agustus, 1907–5022. https://journal.uii.ac.id/Snati/article/view/6232

Kambey, G. E. I., & Dkk. (2020). Penerapan Clustering pada Aplikasi Pendeteksi Kemiripan Dokumen Teks Bahasa Indonesia. Penerapan Clustering Pada Aplikasi Pendeteksi Kemiripan Dokumen Teks Bahasa Indonesia, 15(2), 75–82. https://ejournal.unsrat.ac.id/v3/index.php/informatika/article/view/28907

Kang, Y., Cai, Z., Tan, C.-W., Huang, Q., & Liu, H. (2020). Natural language processing (NLP) in management research: A literature review. Journal of Management Analytics, 7(2), 139–172. https://doi.org/10.1080/23270012.2020.1756939

Mawanta, I., Gunawan, T. S., & Wanayumini, W. (2021). Uji Kemiripan Kalimat Judul Tugas Akhir dengan Metode Cosine Similarity dan Pembobotan TF-IDF. JURNAL MEDIA INFORMATIKA BUDIDARMA, 5(2), 726. https://doi.org/10.30865/mib.v5i2.2935

Naf’an, M. Z., Burhanuddin, A., & Riyani, A. (2019). Penerapan Cosine Similarity dan Pembobotan TF-IDF untuk Mendeteksi Kemiripan Dokumen. Jurnal Linguistik Komputasional (JLK), 2(1), 23. https://doi.org/10.26418/jlk.v2i1.17

Park, K., Hong, J. S., & Kim, W. (2020). A Methodology Combining Cosine Similarity with Classifier for Text Classification. Applied Artificial Intelligence, 34(5), 396–411. https://doi.org/10.1080/08839514.2020.1723868

Rosid, M. A., Fitrani, A. S., Astutik, I. R. I., Mulloh, N. I., & Gozali, H.

A. (2020). Improving Text Preprocessing For Student Complaint Document Classification Using Sastrawi. IOP Conference Series: Materials Science and Engineering, 874(1), 012017. https://doi.org/10.1088/1757-899X/874/1/012017

Salloum, S. A., Al-Emran, M., Monem, A. A., & Shaalan, K. (2018). Using Text Mining Techniques for Extracting Information from Research Articles. In Studies in Computational Intelligence (Vol. 740, pp. 373–397). https://doi.org/10.1007/978-3-319-67056-0_18

Thakur, K., & Kumar, V. (2022). Application of Text Mining Techniques on Scholarly Research Articles: Methods and Tools. New Review of Academic Librarianship, 28(3), 279–302. https://doi.org/10.1080/13614533.2021.1918190

Via, Y. vita, & Mumpuni, R. (2019). Deteksi Kemiripan Dokumen Publikasi Skripsi Mahasiswa Menggunakan Algoritma Modifikasi Cosine Similarity. Journal of Information Engineering and Educational Technology, 3(2), 57–61. https://doi.org/10.26740/jieet.v3n2.p57-61

Wahid, D. H., & SN, A. (2016). Peringkasan Sentimen Esktraktif di Twitter Menggunakan Hybrid TF-IDF dan Cosine Similarity. IJCCS (Indonesian Journal of Computing and Cybernetics Systems), 10(2), 207. https://doi.org/10.22146/ijccs.16625

Wahyuni, R. T., Prastiyo, D., & Supraptono, E. (2017). Penerapan Algoritma Cosine Similarity dan Pembobotan TF-IDF pada Sistem Klasifikasi Dokumen Skripsi. Teknik Elektro, 9(1). https://doi.org/10.15294/jte.v9i1.10955

Wibowo, A. (2011). Mencegah dan Menanggulangi Plagiarisme di Dunia Pendidikan. 195–200. https://journal.fkm.ui.ac.id/kesmas/article/view/84/85

Yuliyanti, S., & Rizky. (2020). Implementasi Algoritma Rabin Karp Untuk Mendeteksi Kemiripan Dokumen Stmik Bandung. Jurnal Bangkit Indonesia, 10(02), 1. https://doi.org/10.52771/bangkitindonesia.v10i02.124

Zhou, H., Liu, B., & Liu, J. (2012). Research on Mechanism of the Information Retrieval Based on Ontology Label. Procedia Engineering, 29, 4259–4266. https://doi.org/10.1016/j.proeng.2012.01.654




DOI: https://doi.org/10.31294/swabumi.v12i1.17087

INDEXING

 

 

 

    P-ISSN : 2355-990X                       E-ISSN: 2549-5178

                     

 

Dipublikasikan oleh LPPM Universitas Bina Sarana Informatika

Jl. Kramat Raya No.98, Kwitang, Kec. Senen, Kota Jakarta Pusat, DKI Jakarta 10450
Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License