Implementasi Algoritma Rabin-Karp untuk Pendeteksi Plagiarisme pada Dokumen Tugas Mahasiswa

Asvarizal Filcha, Mardhiya Hayaty

Abstract


Perkembangan pada dunia teknologi informasi mengakibatkan perguruan tinggi mengurangi penggunaan kertas sehingga banyak tugas mahasiswa yang dikumpulkan dalam bentuk digital. Penggunaan digital menyebabkan semakin mudahnya mahasiswa untuk melakukan plagiarisme. Sehingga diperlukan sebuah sistem untuk melakukan pemeriksaan plagiarisme pada dokumen tugas antar mahasiswa dengan cepat dan tepat. Metode yang dapat digunakan adalah menggunakan algoritma Rabin-Karp. Algoritma Rabin-Karp memiliki keunggulan pencarian string dengan pola yang panjang. Algoritma Rabin-karp dalam sistem ini memiliki langkah - langkah text preprocessing yang terdiri case folding, tokenizing, punctuation removal, stopword removal dan stemming. Hasil dari text preprocessing inilah yang akan di proses menggunakan algoritma Rabin-karp. Hasil dari metode ini adalah nilai kemiripan dari tugas - tugas mahasiswa yang dihitung menggunakan dice coefficient. Perhitungan akurasi dengan melakukan 20 perbandingan antara sistem pendeteksi plagiarisme dan software Plagiarisme Checker X menggunakan confusion matrix menghasilkan tingkat keakuratan sebesar 90%.

Keywords


Rabin-Karp, plagiarisme, text preprocessing, dice coefficient.

References


[1] P. L. Yanuarista, H. W. Dwi, and D. Wulandari, “Analisis Plagiarisme Dalam Penulisan Skripsi Mahasiswa Program Studi S1 Pendidikan Ekonomi Pembangunan Tahun 2010 -2014 Universitas Negeri Malang,” J. Pendidik. Ekon., vol. 8, no. 1, pp. 36–47, 2015.

[2] N. Bansal, “An Elementary Algorithm for Pattern Matching,” Int. J. Comput. Sci. Eng. Commun., vol. 6, no. 1, pp. 1780–1787, 2018.

[3] D. D. Sinaga and S. Hansun, “Detection System Using Rabin-Karp,” Int. J. Innov. Comput. Inf. Control, vol. 14, no. 5, pp. 1893–1903, 2018.

[4] B. Leonardo and S. Hansun, “Text documents plagiarism detection using Rabin-Karp and Jaro-Winkler distance algorithms,” Indones. J. Electr. Eng. Comput. Sci., vol. 5, no. 2, pp. 462–471, 2017.

[5] N. P. Katariya and M. S. Chaudhari, “Text Preprocessing for Text Mining Using Side Information,” Int. J. Comput. Sci. Mob. Appl., vol. 3, pp. 3–7, 2015.

[6] R. K. Wibowo and K. Hastuti, “Penerapan Algoritma Winnowing Untuk Mendeteksi Kemiripan Teks pada Tugas Akhir Manusia,” Techno.COM, vol. 15, no. 4, pp. 303–311, 2016.

[7] A. Squicciarini, A. Tapia, and S. Stehle, “Sentiment analysis during Hurricane Sandy in emergency response,” Int. J. Disaster Risk Reduct., vol. 21, no. December 2016, pp. 213–222, 2017.

[8] A. Putera, U. Siahaan, S. Aryza, and E. Hariyanto, “Combination of levenshtein distance and rabin-karp to improve the accuracy of document equivalence level,” vol. 7, pp. 17–21, 2018.

[9] T. Mardiana, T. B. Adji, and I. Hidayah, “The Comparation of Distan ce-based Similarity Measure to Detection of Plagiarism in Indonesian Text,” Commun. Comput. Inf. Sci., vol. 516, no. March, 2015.

[10] S. Visa, B. Ramsay, A. Ralescu, and E. Van Der Knaap, “Confusion matrix-based feature selection,” CEUR Workshop Proc., vol. 710, pp. 120–127, 2011.


Full Text: PDF (Bahasa Indonesia)

DOI: 10.30595/juita.v7i1.4063

Refbacks

  • There are currently no refbacks.


Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

ISSN: 2579-8901