Page 69 - MODUL INFORMATIKA BK,TIK, SK, JKI, AD
P. 69

Berpikir Komputasional    Dasar – Dasar Informatika   SMK Kelas X

                            d)  Kata-kata  spontan  :  Proses  pengidentifikasian  kata  yang  dapat  mengenal  kata-kata  yang

                                diucapkan secara spontan tanpa jeda waktu antar kata

                            e)  Verifikasi  atau  identifikasi  suara  :  Proses  pengidentifikasian  kata  yang  tidak  hanya  mampu
                                mengenal kata, namun juga mengidentifikasi siapa yang berbicara.





                            Proses  pengenalan  suara  tidak  hanya  dilengkapi  dengan  rekaman  data  di  pusat  data,  tetapi
                            banyak prosedur juga digunakan dalam proses pengenalan suara itu sendiri. Salah satu metode

                            yang diperkenalkan pada akhir tahun 1960-an adalah metode Hidden Markov Model, metode ini

                            merupakan model statistik dari rantai Markov. (Rabiner, Lawrence, 1989) dalam laporannya yang
                            berjudul “A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition”

                            menjelaskan  bahwa  proses  di  dunia  nyata  umumnya  menghasilkan  output  yang  dapat  diamati

                            yang  dapat  dicirikan  sebagai  sinyal.  Sinyal  dapat  diskrit  (huruf  dalam  alfabet)  atau  kontinu

                            (pengukuran suhu, musik). Sinyal bisa stabil (nilai statistik tidak berubah seiring waktu) atau tidak
                            stabil  (nilai  sinyal  berubah  seiring  waktu).  Dengan  memodelkan  sinyal  dengan  benar,

                            dimungkinkan  untuk  mensimulasikan  sumber  dan  sebanyak  mungkin  pelatihan  melalui  proses

                            simulasi.  Sehingga  model  tersebut  dapat  digunakan  dalam  sistem  prediksi,  sistem  deteksi  dan

                            sistem identifikasi.

                            Secara garis besar model signal  dapat  dikategorikan  menjadi  2  golongan  yaitu  model

                            deterministik  dan  model  statistikal.  Model  deterministik  menggunakan  nilai-nilai  properti  dari

                            sebuah  signal  seperti  amplitudo,  frekuensi,  fase  dari  gelombang  sinus.  Sedangkan  model
                            statistikal  menggunakan  nilai-nilai  statistik  dari  sebuah  signal  seperti  proses  Gaussian,  proses

                            Poisson, proses Markov, dan proses Hidden Markov.


                            Salah  satu  studi  pengenalan  suara  berdasarkan  nilai  statistik  suatu sinyal, yaitu investigasi

                            jaringan  syaraf  tiruan  murni,  yang  dilakukan  oleh  (Graves,  Mohamed  dan  Hinton,  2013),
                            menyatakan bahwa jaringan syaraf tiruan atau RNN merupakan kekuatan yang kuat. model untuk

                            proses pengenalan suara. Pelatihan seperti klasifikasi temporal koneksionis memungkinkan RNN

                            dilatih  untuk  menyelaraskan  input  dan  output  yang  tidak  diketahui.  Jaringan  saraf  memiliki

                            sejarah  panjang  pengenalan  suara,  dalam  kombinasi  dengan  HMM  (Hidden  Markov  Model)
                            peningkatan  dicapai  dalam  pemodelan  akustik  yang  dihasilkan  oleh  umpan  maju  yang  dalam.

                            .memungkinkan pelatihan RNN "end-to-end" untuk pengenalan suara dengan regularisasi, karena

                            temuan  menunjukkan  bahwa  memori  jangka  pendek  dalam  RNN  mencapai  tingkat  kesalahan
                            17,7% dalam TIMIT atau pengukuran unit dalam pengenalan suara.





                        2.  Proses Kerja Alat Speech Recognition


                            Alat pengenal ucapan memiliki empat tahapan dalam prosesnya, yaitu :


                            1)  Tahap penerimaan masukan, sumber suara diterima melalui media perantara.
                            2)  Tahap ekstraksi, penyimpanaan masukan yang berupa suara dan sekaligus pembuatan basis

                                data sebagai pola.

               38                                                                                           Informatika – SMK Kelas X
   64   65   66   67   68   69   70   71   72   73   74