Pelabelan Data Dengan Latent Dirichlet Allocation dan K-Means Clustering pada Data Twitter Menggunakan Bahasa Indonesian
DOI:
https://doi.org/10.25124/jett.v7i2.3442Abstract
Media sosoal telah cukup lama menjadi sumber utama untuk melakukan sentimen analisis terhadap suatu trend. Hal ini juga terjadi pada media sosial Twitter yang telah ada lebih dari satu dekade. Data yang bervolume besar pada twitter sangat bermanfaat untuk mencari sentimen. Akan tetapi data pada twitter umumnya merupakan data yang tidak berkategori. Meski terdapat metode unsupervised learning untuk melakukan pemberian label akan memberikan akurasi yang buruk. Menggunakan teknik Deep Learning membutuhkan komputasi yang sangat intens. Paper ini memberikan solusi pelabelan data dengan teknik mudah dankomputasi yang ringan menggunakan data dari twitter pada bahasa Indonesia. Teknik yang digunakan pada paper ini adalah k-means clustering dan Latent Dirichlet Allocation (LDA). Hasil dari percobaan menunjukan bahwa distribusi data pada tiap cluster masih sangat tidak seimbang.
Downloads
Downloads
Published
Issue
Section
License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
Copyright Notice
An author who publishes in the Jurnal Elektro dan Telekomunikasi Terapan agrees to the following terms:
- Author retains the copyright and grants the journal the right of first publication of the work simultaneously licensed under the Creative Commons Attribution-NonCommercial 4.0 International License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal
- Author is able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book) with the acknowledgement of its initial publication in this journal.
- Author is permitted and encouraged to post his/her work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of the published work (See The Effect of Open Access).
Read more about the Creative Commons Attribution-NonCommercial 4.0 International License. here: http://creativecommons.org/licenses/by-nc/4.0/.
Privacy Statement
The names and email addresses entered in this journal site will be used exclusively for the stated purposes of this journal and will not be made available for any other purpose or to any other party.