Pengembangan Model Markov Tersembunyi untuk Pengenalan Kata Berbahasa Indonesia

  • Agus Buono

Abstract

Pada paper ini disajikan suatu penerapan model HMM sebagai pengenal kata dengan ekstraksi ciri
menggunakan teknik MFCC yang berbasis nilai power spektrum dari suara. Sistem yang dikembangkan
bersifat text dependent dan melibatkan 10 pembicara yang mengucapkan 18 jenis kata. Pada penelitian,
ada 3 jenis gugus data untuk melatih model HMM yang terdiri dari 4, 6 dan 8 hidden state, yaitu gugus
yang terdiri suara laki-laki saja, gugus yang terdiri dari suara perempuan saja, dan gugus yang terdiri
dari campuran suara laki-laki dan perempuan. Ada 4 jenis data uji, yaitu data uji suara laki-laki yang
disertakan pada model pelatihan, data uji suara perempuan yang disertakan pada model, data uji suara
laki-laki yang tidak disertakan pada model, dan data uji suara perempuan yang tidak disertakan pada
model. Hasil percobaan menunjukkan bahwa sistem dapat mengenali kata dengan sangat baik (sekitar
98%), kalau diucapkan oleh pembicara yang disertakan dalam pembuatan model. Sistem gagal
melakukan pengenalan untuk pembicara yang tidak disertakan dalam model pelatihan. Namun dengan
memperluas data pelatihan, hasil pengenalan meningkat sekitar 30 % dari sebelumnya. Dari aspek
jumlah hidden state, secara umum terlihat bahwa jumlah hidden 8 memberikan akurasi yang lebih baik
disbanding 4 atau 6.

Published
2017-04-11
How to Cite
BUONO, Agus. Pengembangan Model Markov Tersembunyi untuk Pengenalan Kata Berbahasa Indonesia. Proceeding; Vocational Education in IT Polytechnic; Competitive Advantage in ICT, [S.l.], apr. 2017. ISSN 2087-1562. Available at: <http://journals.telkomuniversity.ac.id/aptikom/article/view/641>. Date accessed: 18 nov. 2017.