OPTIMASI ALGORITMA SIMPLIFIED LESK DENGAN SPACY UNTUK WORD SENSE DISAMBIGUATION PADA KALIMAT BAHASA INGGRIS
Sari
Word Sense Disambiguation (WSD) merupakan tantangan penting dalam
pemrosesan bahasa alami yang bertujuan untuk menentukan makna yang
benar dari kata yang ambigu dalam konteks kalimat. Dalam penelitian ini,
kami memperkenalkan sebuah pendekatan baru dalam peningkatan akurasi
WSD dalam bahasa Inggris dengan mengoptimalkan algoritma Lesk
menggunakan library Spacy. Algoritma Simplified Lesk telah dikenal
memiliki keterbatasan dalam pemrosesan kata-kata yang beragam dalam
kalimat. Spacy merupakan library natural language processing (NLP) yang
sangat powerful, terutama untuk pemrosesan bahasa Inggris. Tidak hanya
fungsi-fungsi dasar seperti tokenizer, library ini juga mendukung fungsi NLP
yang bergantung pada solusi berbasis machine learning seperti part-of-
speech (POS) tagging, Named entity recognition (NER), dan dependency
parsing. Penelitian sebelumnya berhasil menunjukkan nilai recall, precision,
dan f-measure masing-masing sebesar 40%, 40%, dan 40%. Dengan
memanfaatkan kemampuan Spacy, kami berhasil meningkatkan nilai recall,
precision, dan f-measure masing-masing sebesar 45%, 45%, dan 45% pada
sejumlah dataset uji.
Kata Kunci
Teks Lengkap:
PDFReferensi
Jurafsky, D., & Martin, J. H. (2019). Speech and
language processing (3rd ed.). Pearson.
Scarlini, B., Pasini, T., & Navigli, R. (2020).
Sense-Annotated Corpora for Word Sense
Disambiguation in Multiple Languages and
Domains. International Conference on
Language Resources and Evaluation.
Honnibal, M., & Montani, I. (2017). spacy 2:
Natural language understanding with Bloom
embeddings, convolutional neural networks
and incremental parsing.
Feinerer, I., & Hornik, K. (2020). wordnet:
WordNet Interface. Retrieved from
https://cran.r-
project.org/package=wordnet.
Nuhiu M, Ejupi S (2015) Ambiguity in English
and Albanian Sentences
Blevins, T., Joshi, M., & Zettlemoyer, L. (2021).
FEWS: Large-Scale, Low-Shot Word Sense
Disambiguation with the Dictionary. In
Proceedings of the 16th Conference of the
European Chapter of the Association for
Computational Linguistics.
Kumar, M., Mukherjee, P., Hendre, M., Godse, M.,
& Chakraborty, B. (2020). Adapted Lesk
Algorithm based Word Sense
Disambiguation using the Context
Information. International Journal of
Advanced Computer Science and
Applications, 11.
Basuki, S., Kholimi, A.S., Minarno, A.E., Sumadi,
F.D., & Effendy, M.R. (2019). Word Sense
Disambiguation (WSD) for Indonesian
Homograph Word Meaning Determination
by LESK Algorithm Application. 2019 12th
International Conference on Information &
Communication Technology and System
(ICTS), 8-15.
Afifah, Najlah and Yusliani, Novi and Arsalan,
Osvari (2021). Word Sense Disambiguation
Menggunakan Algoritma Simplified Lesk
Pada Kalimat Bahasa Inggris.
Torres-Ramos, Sulema & Román-Godínez,
Israel & Mendizabal-Ruiz, Gerardo. (2017).
An associative method for Lesk-based word
sense disambiguation. Revista Signos. 50.
-308.
DOI: https://doi.org/10.31294/jki.v12i1.21404
##submission.copyrightStatement##
Dipublikasikan oleh LPPM Universitas Bina Sarana Informatika
Email : jurnalkhatulistiwainformatika@bsi.ac.id
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License