Pengembangan Korpus Bahasa Minang pada Spell Error Corpus for Minang Language (SPEML)
Dublin Core
Title
Pengembangan Korpus Bahasa Minang pada Spell Error Corpus for Minang Language (SPEML)
Subject
Bahasa Minang, Kesalahan Ejaan, Korpus, SPECIL, SPEML
Description
Bahasa Minang merupakan bahasa daerah kelima dengan jumlah penutur terbanyak di Indonesia, namun minim sumber daya linguistik dan teknologi pemrosesan bahasa alami yang mendukung. Keterbatasan ini menyulitkan pengembangan aplikasi seperti mesin penerjemah dan pemeriksa ejaan otomatis. Saat ini hanya tersedia korpus kesalahan ejaan dalam Bahasa Indonesia dengan kesalahan hanya satu karakter pada setiap token. Korpus belum mencakup kesalahan penulisan kata serapan. Selain itu belum ada korpus khusus yang dikembangkan untuk kesalahan ejaan dalam bahasa daerah di Indonesia, termasuk Bahasa Minang. Penelitian ini bertujuan mengembangkan korpus kesalahan ejaan Bahasa Minang, yang dinamakan Spell Error Corpus for Minang Language (SPEML). SPEML mencakup kesalahan ejaan sampai dengan tiga karakter dan kesalahan penulisan kata serapan. Pengembangan SPEML melibatkan proses pengumpulan data korpus Bahasa Minang, data kata serapan yang sering digunakan, serta pembentukan korpus kesalahan ejaan. Kesalahan ejaan dibentuk dengan mengacak token secara sistematis pada satu karakter, dua karakter, hingga tiga karakter, disesuaikan dengan panjang token. Hasil penelitian ini berupa SPEML yang mampu mengklasifikasikan tujuh jenis kesalahan ejaan, yaitu: penyisipan karakter, penghapusan karakter, pindah posisi karakter, penggantian karakter, kesalahan tanda baca, kesalahan kata nyata, dan kesalahan penulisan kata serapan. Pengembangan SPEML menjadi langkah awal dalam mendukung pengembangan teknologi pemrosesan bahasa alami untuk bahasa daerah, khususnya Bahasa Minang.
Creator
Dewi Soyusiawatya,*, Abdul Fadlilb, Sunardic
Source
https://teknosi.fti.unand.ac.id/index.php/teknosi/issue/view/29
Publisher
universitas ahmad dahlan
Date
30 april 2025
Contributor
fajar bagus w
Format
PDF
Language
Indonesia
Type
Text
Files
Collection
Citation
Dewi Soyusiawatya,*, Abdul Fadlilb, Sunardic, “Pengembangan Korpus Bahasa Minang pada Spell Error Corpus for Minang Language (SPEML),” Repository Horizon University Indonesia, accessed May 18, 2025, https://repository.horizon.ac.id/items/show/8515.