Pelabelan Data Dengan Latent Dirichlet Allocation dan K-Means Clustering pada Data Twitter Menggunakan Bahasa Indonesian

Authors

  • Patrick Adolf Telnoni Universitas Telkom
  • Suryatiningsih , Universitas Telkom
  • Ely Rosely Universitas Telkom

DOI:

https://doi.org/10.25124/jett.v7i2.3442

Abstract

Media sosoal telah cukup lama menjadi sumber utama untuk melakukan sentimen analisis terhadap suatu trend. Hal ini juga terjadi pada media sosial Twitter yang telah ada lebih dari satu dekade. Data yang bervolume besar pada twitter sangat bermanfaat untuk mencari sentimen. Akan tetapi data pada twitter umumnya merupakan data yang tidak berkategori. Meski terdapat metode unsupervised learning untuk melakukan pemberian label akan memberikan akurasi yang buruk. Menggunakan teknik Deep Learning membutuhkan komputasi yang sangat intens. Paper ini memberikan solusi pelabelan data dengan teknik mudah dankomputasi yang ringan menggunakan data dari twitter pada bahasa Indonesia. Teknik yang digunakan pada paper ini adalah k-means clustering dan Latent Dirichlet Allocation (LDA). Hasil dari percobaan menunjukan bahwa distribusi data pada tiap cluster masih sangat tidak seimbang.

Downloads

Download data is not yet available.

Published

2021-03-03