Media sosoal telah cukup lama menjadi sumber utama untuk melakukan sentimen analisis terhadap suatu trend. Hal ini juga terjadi pada media sosial Twitter yang telah ada lebih dari satu dekade. Data yang bervolume besar pada twitter sangat bermanfaat untuk mencari sentimen. Akan tetapi data pada twitter umumnya merupakan data yang tidak berkategori. Meski terdapat metode unsupervised learning untuk melakukan pemberian label akan memberikan akurasi yang buruk. Menggunakan teknik Deep Learning membutuhkan komputasi yang sangat intens. Paper ini memberikan solusi pelabelan data dengan teknik mudah dankomputasi yang ringan menggunakan data dari twitter pada bahasa Indonesia. Teknik yang digunakan pada paper ini adalah k-means clustering dan Latent Dirichlet Allocation (LDA). Hasil dari percobaan menunjukan bahwa distribusi data pada tiap cluster masih sangat tidak seimbang.
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
Copyright Notice
An author who publishes in the Jurnal Elektro dan Telekomunikasi Terapan agrees to the following terms:
Read more about the Creative Commons Attribution-NonCommercial 4.0 International License. here: http://creativecommons.org/licenses/by-nc/4.0/.
Privacy Statement
The names and email addresses entered in this journal site will be used exclusively for the stated purposes of this journal and will not be made available for any other purpose or to any other party.