Perbandingan Hasil Prediksi Durasi Fonem pada Bahasa Melayu Pontianak Berdasarkan Suku Kata Menggunakan Hidden Markov Model

Dublin Core

Title

Perbandingan Hasil Prediksi Durasi Fonem pada Bahasa Melayu Pontianak Berdasarkan Suku Kata Menggunakan Hidden Markov Model

Subject

Bahasa Melayu Pontianak, Durasi Fonem, Hidden Markov Model.

Description

TTS is a technology that commonly used for preserving languages. One of the most important
indicators to producing a good TTS speech is the right duration of phonemes. Phonemes
duration can be predicted by HMM. The prediction is built based on syllables with the aim to
reducing the size of the corpus. To predicting phonemes duration based on syllables, all the
sentences must be converted into syllable codes. Also, the variations of phonemes duration are
reduced by grouping them into 3 and 5 states. The tests carried out were comparison of
phonemes and sentences duration test. Both tests were operated with two n-gram modelling,
bigram and trigram. The test is preceded by determining the baseline score and then the next
test was carried by k-fold cross validation in two types of corpus data dividing, a corpus training
that contains 80% of corpus and a corpus training that contains 20% of corpus. The baseline
score for the comparison of phonemes duration test using 3 states duration, carried out by the
two n-gram models, both get 48%, while for the test using 5 states duration, each gets 48% and
69%. The baseline score of the comparison of sentences duration test using 3 states duration,
also carried out by the two n-gram models, respectively gets 21% and 19%, while for the test
using 5 states duration, gets 32% and 17% for each. Based on the test results using the k-fold
cross validation method, it can be concluded for the used of 80% corpus training, the results are
near the baseline score, while for the used of 20% corpus training the results are a little far from
the baseline score. From the overall results of the test, it can be concluded that based on the use
of the n-gram modelling, trigram get better results. Whereas, based on the use of the duration
states, the used of 3 states got better results.
ABSTRAK
TTS merupakan teknologi yang kerap dimanfaatkan untuk melestarikan eksistensi bahasa.
Salah satu indikator terpenting untuk menghasilkan ucapan TTS yang baik adalah durasi fonem
yang tepat. Durasi fonem dapat diprediksi dengan HMM. Prediksi dilakukan berdasarkan suku
kata untuk memperkecil korpus. Dalam melakukan prediksi durasi fonem berdasarkan suku
kata, korpus dikonversi ke dalam bentuk kode suku kata. Selain itu dilakukan reduksi variasi
fonem ke dalam pengelompokkan 3 dan 5 state. Pengujian yang dilakukan adalah pengujian
perbandingan durasi fonem dan kalimat, dengan model n-gram bigram dan trigram. Pengujian
didahului dengan penentuan nilai baseline, kemudian pengujian dengan k-fold cross validation
untuk dua jenis pembagian data, yaitu korpus latih berisi 80% korpus dan korpus latih berisi
20% korpus. Nilai baseline pada pengujian perbandingan durasi fonem untuk durasi 3 state
dengan kedua model n-gram mendapatkan hasil 48%, sedangkan untuk durasi 5 state masingmasing mendapatkan hasil 48% dan 69%. Nilai baseline pada pengujian perbandingan durasi
kalimat untuk durasi 3 state dengan kedua model n-gram, masing-masing mendapatkan hasil
21% dan 19%, sedangkan untuk durasi 5 state masing-masing mendapatkan hasil 32% dan 17%.
Dari hasil pengujian dengan k-fold cross validation diketahui bahwa dalam penggunaaan korpus
latih 80%, hasil yang didapatkan mendekati nilai baseline, sedangkan hasil pada penggunaan
korpus latih 20% menjauhi nilai baseline. Dari hasil keseluruhan pengujian dapat disimpulkan
berdasarkan model n-gram yang digunakan, trigram mendapatkan hasil yang lebih baik.
Sedangkan berdasarkan state durasi yang digunakan, 3 state mendapatkan hasil lebih baik

Creator

Luthfia Justisia Loebis, Arif Bijaksana Putra Negara, Novi Safriad

Publisher

Perpustakaan Horizon Karawang

Date

2020

Contributor

Fajar Bagus W

Format

PDF

Language

Indonesia

Type

Text

Files

Collection

Tags

,Repository, Repository Horizon University Indonesia, Repository Universitas Horizon Indonesia, Horizon.ac.id, Horizon University Indonesia, Universitas Horizon Indonesia, HorizonU, Repo Horizon , ,Repository, Repository Horizon University Indonesia, Repository Universitas Horizon Indonesia, Horizon.ac.id, Horizon University Indonesia, Universitas Horizon Indonesia, HorizonU, Repo Horizon , ,Repository, Repository Horizon University Indonesia, Repository Universitas Horizon Indonesia, Horizon.ac.id, Horizon University Indonesia, Universitas Horizon Indonesia, HorizonU, Repo Horizon ,

Citation

Luthfia Justisia Loebis, Arif Bijaksana Putra Negara, Novi Safriad, “Perbandingan Hasil Prediksi Durasi Fonem pada Bahasa Melayu Pontianak Berdasarkan Suku Kata Menggunakan Hidden Markov Model,” Repository Horizon University Indonesia, accessed April 3, 2025, https://repository.horizon.ac.id/items/show/3264.