Klasifikasi Kinerja Penjualan Produk Nike Menggunakan Algoritma Random Forest dengan Pendekatan Hold-Out dan K-Fold Cross Validation

Authors

  • Divta Khoirun Nisa Universitas Muhammadiyah Kudus
  • Fida Maisa Hana Universitas Muhammadiyah Kudus
  • Saiful Ulya Universitas Muhammadiyah Kudus

DOI:

https://doi.org/10.30595/sainteks.v23i1.29930

Keywords:

Random Forest, Klasifikasi Penjualan, Nike, Hold-Out, 10-Fold Cross Validation

Abstract

Dinamika industri ritel menuntut pemanfaatan data transaksi besar untuk pengambilan keputusan strategis. Penelitian ini bertujuan mengklasifikasi kinerja penjualan produk Nike ke dalam kategori rendah, sedang, dan tinggi menggunakan algoritma Random Forest. Penelitian ini memberikan kontribusi melalui pengujian model menggunakan dua pendekatan, yaitu Hold-Out dan K-Fold Cross Validation, untuk menjamin stabilitas performa. Dataset yang digunakan merupakan data sekunder dari Kaggle sebanyak 9.360 baris data transaksi Nike di Amerika Serikat periode 2020-2021. Tahapan penelitian meliputi preprocessing data melalui label encoding, pembagian data, pemodelan Random Forest, serta evaluasi menggunakan confusion matrix, hasil pengujian menunjukkan bahwa model memiliki performa yang sangat tinggi, dengan tingkat akurasi pada metode Hold-Out mencapai 98,13%. Sementara itu, pengujian menggunakan 10-Fold Cross Validation menghasilkan  akurasi tertinggi mencapai 94,39% pada fold ke-4. Secara keseluruhan, nilai weighted average precision, recall, dan F1-score mencapai 0,98 yang membuktikan efektivitas algoritma Random Forest dalam memberikan klasifikasi yang akurat. Temuan ini diharapkan dapat mendukung manajemen dalam pengambilan keputusan berbasis data di sektor ritel.

References

Cahyono, E.T. (2010) ‘Data mining: Solusi pengembangan pengetahuan berdasarkan basis data’, Teknomatika, 2(1), pp. 24–34. Available at: https://ejournal.unjaya.ac.id/index.php/teknomatika/article/view/355.

Danestiara, V.R. and Maulana, M.A. (2024) ‘Penerapan metode K-Nearest Neighbor untuk identifikasi produk Nike paling laris terjual’, In Search, 23(2), pp. 88–97. https://doi.org/10.37278/insearch.v23i2.1129.

Ginantra, N.L.W.S.R. et al. (2021) Data mining dan penerapan algoritma. Medan: Yayasan Kita Menulis.

Hafizh, M. and Nurdin, T. (2023) ‘Implementasi data mining menggunakan algoritma FP-Growth untuk menganalisis transaksi penjualan ekspor online’, Jurnal Teknologi dan Sistem Informasi Bisnis, 5(3), pp. 242–249. https://doi.org/10.47233/jteksis.v5i3.847.

Hayya’, M. (2025) ‘Perbandingan metode K-Nearest Neighbor (KNN) dan Random Forest dalam memprediksi harga rumah’, Sainteks, 22(1), pp. 99–108. https://doi.org/10.30595/sainteks.v22i1.25998.

Hidayat, R.A. (2025) ‘Implementasi algoritma Random Forest Regression untuk memprediksi penjualan produksi di supermarket’, Jurnal Sistem Informasi dan Sistem Komputer, 10(1), pp. 101–109. https://doi.org/10.51717/simkom.v10i1.703.

Indrawan, Y.W. (2025) Manajemen pemasaran ritel. Jakarta: Yayasan Putra Adi Dharma. Available at: https://journal.yayasanpad.org/index.php/ypadbook/article/view/328/221.

Lestari, E.S. (2022) ‘Penerapan Random Forest Regression untuk memprediksi harga jual rumah dan cosine similarity untuk rekomendasi rumah pada Provinsi Jawa Barat’, Jurnal Ilmiah FIFO, 14(2), pp. 131–146. https://doi.org/10.22441/fifo.2022.v14i2.003.

Oktafiani, R. and H.A. (2023) ‘Pengaruh komposisi split data terhadap performa klasifikasi penyakit kanker payudara menggunakan algoritma machine learning’, Jurnal Sains dan Informatika, 9(1), pp. 19–28. https://doi.org/10.34128/jsi.v9i1.622.

Posangi, T., Yasin, L. and Lumintang, V. (2023) ‘Implementasi algoritma Random Forest dengan forward selection untuk klasifikasi Indeks Pembangunan Manusia’, Jambura Journal of Probability and Statistics, 4(2), pp. 85–91. https://doi.org/10.37905/jjps.v4i2.18460.

Putra, Y.S. and Kurniawan, R. (2024) ‘Penerapan data mining menggunakan algoritma FP-Growth pada data penjualan sembako’, JATI (Jurnal Mahasiswa Teknik Informatika), 8(1), pp. 561–567. https://doi.org/10.36040/jati.v8i1.8391.

Suryanegara, G.A.B. and Mahendra, A. (2021) ‘Peningkatan hasil klasifikasi pada algoritma Random Forest untuk deteksi pasien penderita diabetes menggunakan metode normalisasi’, Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), 5(1), pp. 114–122. Available at: https://jurnal.iaii.or.id/.

Downloads

Published

2026-05-17

How to Cite

Nisa, D. K., Hana, F. M., & Ulya, S. (2026). Klasifikasi Kinerja Penjualan Produk Nike Menggunakan Algoritma Random Forest dengan Pendekatan Hold-Out dan K-Fold Cross Validation. Sainteks, 23(1), 79–92. https://doi.org/10.30595/sainteks.v23i1.29930

Issue

Section

Articles