Pembangunan Aplikasi Identifikasi Typographical Error Dokumen Berbahasa Indonesia Menggunakan Algoritma Jaro-Winkler Distance

Grelly Lucia Yovellia Londo, Yohanes Sigit Purnomo W.P., Martinus Maslim

Abstract


Teks adalah salah satu media yang digunakan manusia untuk berkomunikasi dan berinteraksi setiap hari, terutama di bidang pendidikan, misalnya dalam penulisan laporan tugas akhir. Hal yang paling umum dalam menulis teks adalah kesalahan ketik. Berdasarkan masalah ini, diperlukan suatu aplikasi untuk membantu mengidentifikasi kesalahan ketik dalam dokumen Bahasa Indonesia. Aplikasi yang dikembangkan menggunakan Laravel versi 5.8 untuk tampilan web dan Python versi 3 untuk memproses dataset dan membuat model serta layanan webnya. Model dibangun menggunakan modul NLTK dan implementasi algoritma Jaro-Winkler Distance menggunakan modul pylibjaro. Dataset menggunakan dataset sumber terbuka dalam bentuk daftar kata-kata dari Kamus Besar Bahasa Indonesia (KBBI). Aplikasi ini hanya mendukung file pdf. Hasil model diterapkan ke layanan web dengan output dalam bentuk data JSON. Data JSON berisi daftar kata-kata yang memiliki nilai benar atau salah, jumlah kata dokumen, jumlah kata yang benar, jumlah kata yang salah, dan waktu pelaksanaan program.

Kata-kata kunci: Teks, Dokumen, Bahasa Indonesia, Kesalahan Ketik, Jaro-Winkler Distance


Keywords


Bahasa Indonesia, Typographical Error, Jaro-Winkler Distance, Spelling Checker

References


[1] A. I. Fahma, I. Cholissodin, and R. S. Perdana, “Identifikasi Kesalahan Penulisan Kata ( Typographical Error ) pada Dokumen Berbahasa Indonesia Menggunakan Metode N-gram dan Levenshtein Distance,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 2, no. 1, pp. 53–62, 2018.

[2] Murtiningsih S.Pd, “Kesalahan Berbahasa Indonesia Mahasiswa S-1 PGSD STIKIP Nuuwar Fak-fak,” J. Penelit. Ilmu Pendidik., vol. 6, no. 1, pp. 74–82, 2013.

[3] M. Javed et al., “A Study of Students’ Assessment in Writing Skills of the English Language,” Int. J. Instr., vol. 6, no. 2, pp. 129–144, 2013.

[4] Y. Rochmawati and R. Kusumaningrum, “Studi Perbandingan Algoritma Pencarian String dalam Metode Approximate String Matching untuk Identifikasi Kesalahan Pengetikan Teks,” J. Buana Inform., vol. 7, no. 2, pp. 125–134, 2016.

[5] K. M. Suryaningrum and A. T, “Pengkoreksian dan Suggestion Word pada Keyword Menggunakan Algoritma Jaro-Winkler,” J. Teknol. Informasi-AITI, vol. 13, no. 2, pp. 169–181, 2016.

[6] J. Frando, I. Ruslianto, R. Hidayati, J. Rekayasa, and S. Komputer, “Penerapan Jaro Winkler Distance dalam Aplikasi Pengoreksi Kesalahan Penulisan Bahasa Indonesia Berbasis Web,” Coding J. Komput. dan Apl., vol. 07, no. 03, pp. 44–53, 2019.

[7] T. Maghfira, I. Cholissodin, and A. Widodo, “Deteksi Kesalahan Ejaan dan Penentuan Rekomendasi Koreksi Kata yang Tepat Pada Dokumen Jurnal JTIIK Menggunakan Dictionary Lookup dan Damerau-Levenshtein Distance,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 1, no. 6, pp. 498–506, 2017.

[8] W. W. A. Umboh, S. R. Sentinuwo, and A. M. Sambul, “Rancang Bangun Aplikasi Deteksi Kesalahan Penulisan Naskah Dokumen Skripsi,” E-Journal Tek. Inform., vol. 11, no. 1, 2017.

[9] C. I. Ratnasari, S. Kusumadewi, and L. Rosita, “A Non-Word Error Spell Checker for Patient Complaints in Bahasa Indonesia,” Int. J. Inf. Technol. Comput. Sci. Open Source, vol. 1, no. 1, pp. 18–21, 2017.

[10] M. M. Yulianto, R. Arifudin, and A. Alamsyah, “Autocomplete and Spell Checking Levenshtein Distance Algorithm To Getting Text Suggest Error Data Searching In Library,” Sci. J. Informatics, vol. 5, no. 1, p. 75, 2018.

[11] P. H. Hema and C. Sunitha, “Spell Checker for Non Word Error Detection : Survey,” Int. J. Adv. Res. Comput. Sci. Softw. Eng., vol. 5, no. 3, pp. 360–363, 2015.

[12] A. Prasetyo, W. M. Baihaqi, and I. S. Had, “Algoritma Jaro-Winkler Distance: Fitur Autocorrect dan Spelling Suggestion pada Penulisan Naskah Bahasa Indonesia di BMS TV,” J. Teknol. Inf. dan Ilmu Komput., vol. 5, no. 4, p. 435, 2018.

[13] H. Gueddah, A. Yousfi, and M. Belkasmi, “The filtered combination of the weighted edit distance and the Jaro-Winkler distance to improve spellchecking Arabic texts,” Proc. IEEE/ACS Int. Conf. Comput. Syst. Appl. AICCSA, vol. 2016-July, no. May 2019, 2016.

[14] Mutammimah, H. Sujaini, and R. D. Nyoto, “Analisis Perbandingan Metode Spelling Corrector Peter Norvig dan Spelling Checker BK-Trees pada Kata Berbahasa Indonesia,” J. Sist. dan Teknol. Inf., vol. 5, no. 1, pp. 1–5, 2016.

[15] R. Gadde and J. Kelly, “Using Multiprocessing to Make Python Code Faster,” Medium, 2018. [Online]. Available: https://medium.com/@urban_institute/using-multiprocessing-to-make-python-code-faster-23ea5ef996ba. [Accessed: 28-Jul-2019].


Full Text: PDF (Bahasa Indonesia)

DOI: 10.30595/juita.v8i1.6344

Refbacks

  • There are currently no refbacks.


Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

ISSN: 2579-8901