Perbandingan Metode K-Nearest Neighbor dan Logistic Regression dalam Klasifikasi Dini Anemia Berdasarkan Parameter Hematologi Dasar

Authors

  • Aryanti Politeknik Negeri Sriwijaya
  • Feriska Putri Daviana
  • Nida Dhia Ulhaq
  • Muhammad Riswanto
  • Muhammad Dio AlfajrI
  • Nur Trisya Novita

DOI:

https://doi.org/10.30595/jrre.v7i2.27427

Keywords:

Anemia, Logistic Regression, K-Nearest Neighbor, Hematology data, Machine learning

Abstract

Anemia merupakan gangguan kesehatan yang masih menjadi tantangan besar di tengah masyarakat, Khususnya pada individu usia remaja dan perempuan. Deteksi dini menjadi langkah penting dalam upaya pencegahan dan penanganan anemia. Penelitian ini difokuskan pada analisis komparatif terhadap dua algoritma machine learning, yakni algoritma K-Nearest Neighbor (KNN) dan Logistic Regression, dalam melakukan klasifikasi dini anemia menggunakan parameter hematologi dasar, seperti Gender, Hemoglobin (Hb), Mean Corpuscular Volume (MCV), Mean Corpuscular Hemoglobin (MCH), dan Mean Corpuscular Hemoglobin Concentration (MCHC). Dataset yang digunakan bersumber dari platform Kaggle, dengan total 1.421 data pasien. Tahapan penelitian meliputi pra-pemrosesan data, pemisahan antara data pelatihan dan data pengujian. secara stratifikasi, pelatihan model, serta penilaian kinerja algoritma diukur menggunakan parameter evaluatif meliputi akurasi, precision, recall, F1-score, confusion matrix. Output didapatkan bahwa model KNN memperoleh akurasi 91,93%, precision 86,86%, recall 95,96%, dan F1-score 91,18%. Sementara itu, model Logistic Regression unggul dengan akurasi 98,94%, precision 97,63%, recall 100%, dan F1-score 98,80%. Berdasarkan hasil tersebut, Logistic Regression dinilai lebih akurat dan dapat diandalkan untuk deteksi dini anemia, khususnya dalam konteks layanan kesehatan primer berbasis data laboratorium sederhana.

References

[1] S. Buana, P. Devany, and A. G. Nugraheni, “Perbandingan Implementasi Metode K-Nearest Neighbor menggunakan Jarak Euclidean dan Manhattan pada Analisa Klasifikasi Penyakit Anemia,” vol. 4, no. 1, 2025.

[2] N. Laily, L. I. Cahyani, L. K. Abdullah, M. Mauliana, and S. Patria, “Kegiatan Pemberdayaan Remaja Melalui Penyuluhan dan Pembentukan Komunitas Remaja Sadar Anemia Terhadap Kepatuhan Mengkonsumsi Tablet Tambah Darah (TTD),” J. Abdi Masy. Indones., vol. 2, no. 3, pp. 1055–1060, 2022, doi: 10.54082/jamsi.373.

[3] R. Sari, Y. Septiasari, F. Fitriyana, and N. Saputri, “Pengaruh Konsumsi Telur Terhadap Peningkatan Kadar Hemoglobin Pada Remaja Putri Yang Mengalami Anemia,” J. Wacana Kesehat., vol. 5, no. 2, p. 574, 2021, doi: 10.52822/jwk.v5i2.151.

[4] Ermawati, R. Ibnas, and B. A. Kurniawan, “Klasifikasi Penderita Anemia Menggunakan Metode Regresi Logistik,” J. MSA ( Mat. dan Stat. serta Apl., vol. 11, no. 2, pp. 93–101, 2024, doi: 10.24252/msa.v11i2.45083.

[5] F. A. Kusuma, “Pemodelan Klasifikasi Anemia Aplastik Menggunakan Teknik Oversampling Dan K-Nearest Neighbors,” J. Inform. dan Tek. Elektro Terap., vol. 12, no. 3, 2024, doi: 10.23960/jitet.v12i3.4326.

[6] D. E. Yanti, L. Framesti, and A. Desiani, “JIP (Jurnal Informatika Polinema) PERBANDINGAN ALGORITMA C4.5 DAN SVM DALAM KLASIFIKASI PENYAKIT ANEMIA,” pp. 427–434, 2022, [Online]. Available: https://www.kaggle.com/datasets/biswaranjanrao/an

[7] S. Lonang, A. Yudhana, and M. K. Biddinika, “Analisis Komparatif Kinerja Algoritma Machine Learning untuk Deteksi Stunting,” J. Media Inform. Budidarma, vol. 7, no. 4, p. 2109, 2023, doi: 10.30865/mib.v7i4.6553.

[8] N. R. Febriyanti, K. Kusrini, and A. D. Hartanto, “Analisis Perbandingan Algoritma SVM, Random Forest dan Logistic Regression untuk Prediksi Stunting Balita,” Edumatic J. Pendidik. Inform., vol. 9, no. 1, pp. 149–158, 2025, doi: 10.29408/edumatic.v9i1.29407.

[9] C. Fan, M. Chen, X. Wang, J. Wang, and B. Huang, “A Review on Data Preprocessing Techniques Toward Efficient and Reliable Knowledge Discovery From Building Operational Data,” Front. Energy Res., vol. 9, no. March, pp. 1–17, 2021, doi: 10.3389/fenrg.2021.652801.

[10] I. O. Muraina, “Ideal Dataset Splitting Ratios in Machine Learning Algorithms: General Concerns for Data Scientists and Data Analysts,” 7th Int. MARDIN ARTUKLU Sci. Res. Conf., no. February, pp. 496–504, 2022, [Online]. Available: https://www.researchgate.net/publication/358284895

[11] T. Nurmayanti, D. Hartini, T. Rohana, S. Arum, P. Lestari, and D. Wahiddin, “Comparison of K-Nearest Neighbors and Convolutional Neural Network Algorithms in Potato Leaf Disease Classification,” J. Sist. Inf. dan Ilmu Komput. Prima, vol. 8, no. 1, pp. 360–372, 2024.

[12] N. D. Azzahra, A. Ambarwati, A. Desiani, S. I. Maiyanti, and I. Ramayanti, “Perbandingan Algoritma K-Nearest Neighbor Dan Logistic Regression Dalam Klasifikasi Penyakit Kanker Serviks,” Energy J. Ilm. Ilmu-Ilmu Tek., vol. 14, no. 1, pp. 1–8, 2024, doi: 10.51747/energy.v14i1.1843.

[13] M. Heydarian, T. E. Doyle, and R. Samavi, “MLCM: Multi-Label Confusion Matrix,” IEEE Access, vol. 10, pp. 19083–19095, 2022, doi: 10.1109/ACCESS.2022.3151048.

[14] Dimas Febri Kuncoro and Rian Ardianto, “Analisis Sel Darah Putih dengan Pendekatan Bioinformatika menggunakan Arsitektur MobileNetV2,” J. Ilmu Komput. dan Teknol., vol. 5, no. 1, pp. 31–37, 2024, doi: 10.35960/ikomti.v5i1.1469.

[15] J. Pratama, S. Nurmaini, and M. Fachrurrozi, “Deteksi struktur jantung pada anak menggunakan CNN arsitektur YOLO versi 5,” J. Jupiter, no. 2, pp. 635–646, 2024.

[16] Dede Husen, “Evaluasi Teknik Augmentasi Data Untuk Klasifikasi Tumor Otak Menggunakan Cnn Pada Citra Mri,” Tek. Teknol. Inf. dan Multimed., vol. 5, no. 2, pp. 219–228, 2024, doi: 10.46764/teknimedia.v5i2.220.

[17] I. Rizka Fadhillah, M. Muharrom Al Haromainy, and H. Maulana, “Implementasi Model Transfer Learning Efficientnet Untuk Pendeteksian Bahasa Isyarat Indonesia (Bisindo) Pada Perangkat Android,” JATI (Jurnal Mhs. Tek. Inform., vol. 8, no. 4, pp. 7816–7822, 2024, doi: 10.36040/jati.v8i4.10463.

[18] S. A. Wisak, N. A. Safirah, and Y. R. Kaesmetan, “Identifikasi Jenis Mangga Berdasarkan Ciri Daun Menggunakan Metode Cnn,” J. Sist. Inf. dan Inform., vol. 7, no. 2, pp. 121–129, 2024, doi: 10.47080/simika.v7i2.3295.

[19] E. Çiçekyurt, “Anemia Classification with EDA (100% Acc).” [Online]. Available: https://www.kaggle.com/code/emreiekyurt/anemia-classification-with-eda-100-acc/input

Downloads

Published

2025-12-17

How to Cite

Aryanti, Feriska Putri Daviana, Nida Dhia Ulhaq, Muhammad Riswanto, Muhammad Dio AlfajrI, & Nur Trisya Novita. (2025). Perbandingan Metode K-Nearest Neighbor dan Logistic Regression dalam Klasifikasi Dini Anemia Berdasarkan Parameter Hematologi Dasar. Jurnal Riset Rekayasa Elektro, 7(2), 251–258. https://doi.org/10.30595/jrre.v7i2.27427