Klasifikasi Jenis Buku Berdasarkan Cover dan Judul Buku Menggunakan Metode Support Vector Machine dan Cosine Similarity
Abstract
Penelitian ini dibuat untuk mengklasifikasi jenis buku berdasarkan citra cover pada buku. Kategori buku yang digunakan dalam penelitian ini adalah Agama, Kesehatan, Pendidikan, Sastra dan Teknik. Permasalahan yang sering terjadi yaitu semakin banyaknya jenis buku maka akan semakin sulit dalam melakukan pengkategorian, maka memerlukan sebuah sistem untuk mengklasifikasi buku berdasarkan kategori secara otomatis. Penelitian ini melakukan ekstraksi fitur pada buku menggunakan metode Gray Level Co-occurance Matrix (GLCM). Metode tersebut mengekstraksi empat fitur yaitu Homogenity, Correlation, Energy dan Contras, ke empat fitur tersebut digunakan pada proses ekstraksi nilai pada citra. Setelah itu dilakukan proses klasifikasi jenis buku berdasarkan sampul dan judul buku dengan menerapkan metode Support Vector Machine (SVM) dan Cosine Similarity. Penerapan SVM untuk mengklasifikasikan jenis buku berdasarkan citra cover buku dan Cosine Similarity untuk mengukur tingkat kemiripan dari suatu dokumen dengan menggunakan judul buku. Pada proses pengujian dilakukan menggunakan metode Confusion Matrix untuk mendapatkan nilai akurasi. Objek penelitian ini adalah citra sampul buku di perpustakaan Universitas Ahmad Dahlan Kampus 4 dan Kampus 3. Tujuan dari penelitian ini menghasilkan suatu software untuk mengidentifikasi jenis buku berdasarkan judul dan gambar pada Sampul buku, sehingga pembaca lebih cepat tahu informasi jenis buku. Berdasarkan penelitian yang dilakukan metode Cosine Similarity menghasilkan nilai akurasi sebesar 93.3% dan metode Support Vector Machine menghasilkan nilai akurasi sebesar 86.67%. Dari pengujian yang dilakukan disimpulkan bahwa persentase yang didapat dari perbandingan citra sampul buku asli dengan hasil citra sampul buku yang didapat dari system telah diidentifikasi dengan baik menggunakan metode Cosine Similiairy. Hasil uji akurasi dengan metode Support Vector Machine menghasilkan nilai yang rendah. Sebagai salah satu penyebab jumlah data yang sedikit dengan model arsitektur VGG16 yang digunakan. Dengan demikian perlu diujicobakan dengan mengubah model arsitektur dengan model arsitektur lainnya, misalnya dengan Convolutional Neural Network atau Tranfer Learning.
Keywords
References
A. A. Puspitasari, E. Santoso, & Indriati. (2018). Klasifikasi Dokumen Tumbuhan Obat Menggunakan Metode Improved kNearest Neighbor. Jurnal Pengembangan Teknologi Informasi. dan Ilmu Komputer, vol. 2, no. 2 , pp. 486–492.
Bakti, L. D., Imran, B., Wahyudi, E., Arwidiyarti, D., Suryadi, E., Multazam, M., & Maspaeni. (2021). Data extraction of the gray level Co-occurrence matrix (GLCM) Feature on the fingerprints of parents and children in Lombok Island, Indonesia. Data in Brief-elsavier, 36.
Basuki, S. (1991). Pengantar Ilmu Perpustakaan. Jakarta: PT Gramedia.
Hall-Beyer, M. (2017). GLCM Texture: a tutorial. 17th International Symposium on Ballistics, 2(March), 267–274.
Kadir , A., & Susanto, A. (2013). Teori dan Aplikasi Pengolahan Citra (D. Hardjono, Ed.). . Yogyakarta: CV.ANDI OFFSET.
M. Habibi, & P. W. Cahyo. (2020). Journal Classification Based on Abstract Using Cosine Similarity and Support Vector. JISKA (Jurnal Inform. Sunan Kalijaga), vol. 4, no. 3, pp. 48, 2020.
Musrini B, M., Andriana, & Hidayat, A. S. (2017). Implementasi Algoritma GLCM Dan MED pada Aplikasi Pendeteksi Kolesterol Melalui Iris Mata. MIND Journal, 23 - 41.
Nuraedah, M. Bakri, , & A. A. Kasim. (2018). Quadratic support vector machine for the bomba traditional textile motif classification. Indones. J. Electr. Eng. Comput, 1004–1014.
P. dwi Nurfadila, A. P. Wibawa, & I. A. E. Zaeni. (2019). Journal Classification Using Cosine Similarity Method on Title and Abstract with Frequency-Based Stopword Removal. International Journal Artificial Intelligence Res. , vol. 3, No2.
R. A. Surya, A. Fadlil, & A. Yudhana. (2017). Ekstraksi Ciri Metode Gray Level Co-Occurrence Matrix ( GLCM ) dan Filter. Jurnal Informasi Pengemb. IT (JPIT), Vol. 02, No. 02, 23-26.
Rahman, M., Darmawidjadja, M., & Alamsah, D. (2017). Klasifikasi Untuk Diagnosa Diabetes Menggunakan Metode Bayesian Regularization Neural Network (RBNN). JURNAL INFORMATIKA, 36-45.
Sifeng Jing, Xiwei Liu, Xiaoyan Gong, Ying Tang, Gang Xionga, Sheng Liu, . . . Rongshan. Bi. (2022). Correlation analysis and text classification of chemical accident cases. Process Safety and Environmental Protection, 158, 698-710.
Susilowati, E., Sabariah, M. K., & Gozali, A. A. (2015). Implementasi Metode Support Vector Machine untuk Melakukan Klasifikasi Kemacetan Lalu Lintas Pada Twitter. Proceeding of Engineering, 2(1), 1478–1484.
Suyanto. (2018). Machine Learning: Tingkat Dasar dan Lanjut. Bandung: Informatika Bandung.
Sya’bani , M., & R. Umilasari,. (2018). Penerapan Metode Cosine Similarity dan Pembobotan TF / IDF pada Sistem Klasifikasi Sinopsis Buku di Perpustakaan Kejaksaan Negeri Jember,. Jastindo (Jurnal Sistem Teknologi Indonesia), vol. 3, no. 1, 31-42.
Widyaningsih. (2017). Identifikasi Kematangan Buah Apel Dengan Gray Level Co-Occurrence Matrix (GLCM). . Jurnal SAINTEKOM, , 6.
Winiarti, S., Andi Saputro, M. Y., & Sunardi. (2021). Deep Learning dalam Mengindetifikasi Jenis Bangunan Heritage. JURNAL MEDIA INFORMATIKA BUDIDARMA, Volume 5, Nomor 3, 831-837.
Winiarti, S., Pramono, H., & Pranolo, A. (2022). JARINA - Journal of Artificial Intelligence in Architecture, 1 No 1, 20-29.
Zhao , R., Ying, X., Ju Shuaichen, & LuYonghe. (2021). Patent text modeling strategy and its classification based on structural features. World Patent Information, 67.
DOI: 10.30595/sainteks.v19i1.13423
This work is licensed under a Creative Commons Attribution 4.0 International License.
ISSN: 2686-0546