OPTIMASI ALGORITMA SIMPLIFIED LESK DENGAN SPACY UNTUK WORD SENSE DISAMBIGUATION PADA KALIMAT BAHASA INGGRIS

NAHEL AL FATH ICHIDA

Sari


Word Sense Disambiguation (WSD) merupakan tantangan penting dalam
pemrosesan bahasa alami yang bertujuan untuk menentukan makna yang
benar dari kata yang ambigu dalam konteks kalimat. Dalam penelitian ini,
kami memperkenalkan sebuah pendekatan baru dalam peningkatan akurasi
WSD dalam bahasa Inggris dengan mengoptimalkan algoritma Lesk
menggunakan library Spacy. Algoritma Simplified Lesk telah dikenal
memiliki keterbatasan dalam pemrosesan kata-kata yang beragam dalam
kalimat. Spacy merupakan library natural language processing (NLP) yang
sangat powerful, terutama untuk pemrosesan bahasa Inggris. Tidak hanya
fungsi-fungsi dasar seperti tokenizer, library ini juga mendukung fungsi NLP
yang bergantung pada solusi berbasis machine learning seperti part-of-
speech (POS) tagging, Named entity recognition (NER), dan dependency
parsing. Penelitian sebelumnya berhasil menunjukkan nilai recall, precision,
dan f-measure masing-masing sebesar 40%, 40%, dan 40%. Dengan
memanfaatkan kemampuan Spacy, kami berhasil meningkatkan nilai recall,
precision, dan f-measure masing-masing sebesar 45%, 45%, dan 45% pada
sejumlah dataset uji.


Kata Kunci


WSD, NLP, Simplified LESK, Spacy

Teks Lengkap:

PDF

Referensi


Jurafsky, D., & Martin, J. H. (2019). Speech and

language processing (3rd ed.). Pearson.

Scarlini, B., Pasini, T., & Navigli, R. (2020).

Sense-Annotated Corpora for Word Sense

Disambiguation in Multiple Languages and

Domains. International Conference on

Language Resources and Evaluation.

Honnibal, M., & Montani, I. (2017). spacy 2:

Natural language understanding with Bloom

embeddings, convolutional neural networks

and incremental parsing.

Feinerer, I., & Hornik, K. (2020). wordnet:

WordNet Interface. Retrieved from

https://cran.r-

project.org/package=wordnet.

Nuhiu M, Ejupi S (2015) Ambiguity in English

and Albanian Sentences

Blevins, T., Joshi, M., & Zettlemoyer, L. (2021).

FEWS: Large-Scale, Low-Shot Word Sense

Disambiguation with the Dictionary. In

Proceedings of the 16th Conference of the

European Chapter of the Association for

Computational Linguistics.

Kumar, M., Mukherjee, P., Hendre, M., Godse, M.,

& Chakraborty, B. (2020). Adapted Lesk

Algorithm based Word Sense

Disambiguation using the Context

Information. International Journal of

Advanced Computer Science and

Applications, 11.

Basuki, S., Kholimi, A.S., Minarno, A.E., Sumadi,

F.D., & Effendy, M.R. (2019). Word Sense

Disambiguation (WSD) for Indonesian

Homograph Word Meaning Determination

by LESK Algorithm Application. 2019 12th

International Conference on Information &

Communication Technology and System

(ICTS), 8-15.

Afifah, Najlah and Yusliani, Novi and Arsalan,

Osvari (2021). Word Sense Disambiguation

Menggunakan Algoritma Simplified Lesk

Pada Kalimat Bahasa Inggris.

Torres-Ramos, Sulema & Román-Godínez,

Israel & Mendizabal-Ruiz, Gerardo. (2017).

An associative method for Lesk-based word

sense disambiguation. Revista Signos. 50.

-308.




DOI: https://doi.org/10.31294/jki.v12i1.21404

##submission.copyrightStatement##

p-ISSN 2339-1928

e-ISSN 2579-633X



Dipublikasikan oleh LPPM Universitas Bina Sarana Informatika

Email : jurnalkhatulistiwainformatika@bsi.ac.id

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License

 

Jurnal Khatulistiwa Informatika Indexed by:

Image result for logo index sinta