Identifikasi Similar Question dengan IndoBERT (Studi Kasus Dataset QAS Covid-19)
DOI:
https://doi.org/10.25124/logic.v2i1.7437Keywords:
pemrosesan bahasa alami, question similarity, IndoBERT, Covid-19Abstract
Question answering system (QAS) merupakan sebuah task pada bidang informatika, secara lebih spesifik yaitu pada bidang Natural Language Processing (NLP). Sebuah QAS menyediakan jawaban secara otomatis berdasarkan pertanyaan yang diberikan oleh pengguna. Salah satu bagian dari tahapan pemrosesan dalam QAS adalah identifikasi pertanyaan yang mirip (similar question identifition). Tahapan similar question identification bertujuan untuk mengidentifikasi pertanyaan yang mirip, sehingga didapatkan jawaban yang tepat. Pada penelitian ini, dilakukan identifikasi similar question pada dataset yang berisi pertanyaan seputar Covid-19. Identifikasi similar question diaplikasikan dengan memanfaatkan model IndoBERT, dimana diterapkan pengukuran similarity berdasarkan cosine similarity. Berdasarkan eksperimen yang dilakukan, diperoleh 197 dari total 611 pasang pertanyaan yang berhasil diidentifikasi kemiripannya. Analisis terhadap hasil identifikasi menunjukkan bahwa faktor yang memperngaruhi dalam kemiripan antar pertanyaan antara lain adalah panjang dari suatu kalimat yang dibandingkan, kata awal dari kalimat yang dibandingkan, dan relevansi antar beberapa kata yang terdeteksi memiliki kemiripan satu sama lain.
Downloads
Downloads
Published
Issue
Section
License
Authors who publish in this journal agree to the following rules:
- Authors retain copyright and give the journal the right of first publication, with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.
- Authors may enter separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., posting it to an institutional repository or publishing it in a book), with attribution to the journal's initial publication.
- Authors are permitted and recommended to post their work online (such as in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges as well as earlier and greater citation of published work.