Pengembangan Korpus Bahasa Minang pada Spell Error Corpus for Minang Language (SPEML)

Dublin Core

Title

Pengembangan Korpus Bahasa Minang pada Spell Error Corpus for Minang Language (SPEML)

Subject

Bahasa Minang, Kesalahan Ejaan, Korpus, SPECIL, SPEML

Description

Bahasa Minang merupakan bahasa daerah kelima dengan jumlah penutur terbanyak di Indonesia, namun minim sumber daya linguistik dan teknologi pemrosesan bahasa alami yang mendukung. Keterbatasan ini menyulitkan pengembangan aplikasi seperti mesin penerjemah dan pemeriksa ejaan otomatis. Saat ini hanya tersedia korpus kesalahan ejaan dalam Bahasa Indonesia dengan kesalahan hanya satu karakter pada setiap token. Korpus belum mencakup kesalahan penulisan kata serapan. Selain itu belum ada korpus khusus yang dikembangkan untuk kesalahan ejaan dalam bahasa daerah di Indonesia, termasuk Bahasa Minang. Penelitian ini bertujuan mengembangkan korpus kesalahan ejaan Bahasa Minang, yang dinamakan Spell Error Corpus for Minang Language (SPEML). SPEML mencakup kesalahan ejaan sampai dengan tiga karakter dan kesalahan penulisan kata serapan. Pengembangan SPEML melibatkan proses pengumpulan data korpus Bahasa Minang, data kata serapan yang sering digunakan, serta pembentukan korpus kesalahan ejaan. Kesalahan ejaan dibentuk dengan mengacak token secara sistematis pada satu karakter, dua karakter, hingga tiga karakter, disesuaikan dengan panjang token. Hasil penelitian ini berupa SPEML yang mampu mengklasifikasikan tujuh jenis kesalahan ejaan, yaitu: penyisipan karakter, penghapusan karakter, pindah posisi karakter, penggantian karakter, kesalahan tanda baca, kesalahan kata nyata, dan kesalahan penulisan kata serapan. Pengembangan SPEML menjadi langkah awal dalam mendukung pengembangan teknologi pemrosesan bahasa alami untuk bahasa daerah, khususnya Bahasa Minang.

Creator

Dewi Soyusiawatya,*, Abdul Fadlilb, Sunardic

Source

https://teknosi.fti.unand.ac.id/index.php/teknosi/issue/view/29

Publisher

universitas ahmad dahlan

Date

30 april 2025

Contributor

fajar bagus w

Format

PDF

Language

Indonesia

Type

Text

Files

Collection

Citation

Dewi Soyusiawatya,*, Abdul Fadlilb, Sunardic, “Pengembangan Korpus Bahasa Minang pada Spell Error Corpus for Minang Language (SPEML),” Repository Horizon University Indonesia, accessed May 18, 2025, https://repository.horizon.ac.id/items/show/8515.