Metrics

  • visibility 0 views
  • get_app 1 download

Pengenalan Suara Kosa Kata Terbatas Bahasa Jawa Tengah Menggunakan HTK

Teresya Solissa
Published 2020

Abstract

 Di era global saat ini, dimana berbagai bangsa dengan bahasa yang beragam akan hadir di negara ini. Untuk itu kebutuhan pengenalan bahasa sekarang semakin mendesak. Automatic Speech Recognition (ASR) sistem pengenalan suara yang dipakai untuk mengenali bahasa ini, bertujuan untuk menerjemahkan sinyal digital suara  kedalam bentuk teks. Prosses akan menggunakan Hidden Markov Toolkit (HTK) yang merupakan kumpulan program (library) untuk pengembangan ASR. Penulis menggunakan program Hvite dari HTK untuk mengenali bahasa Jawa Tengah dalam versi kosa kata terbatas. Lingkungan pemrograman sebagian besar berada  di lingkungan bash shell. Model akustik adalah berbasis fonetik dengan model HMM-GMM yang disediakan HTK. Pada awalnya tata bahasa disiapkan dengan menentukan wordlist dan kamus pengejaan. Selanjutnya membuat basis data suara menggunakan microphone dan sampel suara ini dalam format wav. Kemudian akan dibuat pelabelan untuk menandai subword atau phonem  menggunkan sofware SFS, tiap file suara ditampilkan berdasarka domain spektral. Langkah selanjutnya akan dilakukan ekastraksi Fitur. Model akustik diinisialisasi dengan menggunakan algoritma Viterbi dan pelatihan (training) HMM-GMM menggunakan  selanjutnya menggunakan algoritma Baum Welch. Setelah memperoleh model akustik, selanjutnya pengujian yaitu melihat tingkat akurasi.  Dari hasil  pengujian didapati bahwa program dapat mengenali 24 jenis perintah dari 72 sampel data suara dengan baik. Perintah ini untuk kendali alat elektronik dan switch lampu. Proses penerjemahan sampel suara ini ditampilkan dalam bentuk teks pada bash shell Cygwin. Dari hasil pengujian didapati  tingkat akurasi (Accuracy) yang baik 76,58% dan kebenaran (Correctness)  94.47%.

Full text

 

Metrics

  • visibility 0 views
  • get_app 1 download