Klasifikasi Donatur Pada Yayasan Jajan Pahala Menggunakan Algoritma Random Forest

Klasifikasi Donatur Pada Yayasan Jajan Pahala Menggunakan Algoritma Random Forest

Penulis

  • Nusa Seldi Wibisono Universitas Brawijaya
  • Satrio Agung Wicaksono
  • Nanang Yudi Setiawan

Kata Kunci:

donatur, data analisis, klasifikasi, Random Forest, Dashboard

Abstrak

Yayasan Jajan Pahala adalah salah satu yayasan yang bergerak pada bidang sosial, keagamaan, dan kemanusiaan  yang sudah ada sejak tahun 2015 dan resmi menjadi yayasan pada tahun 2019. Pada pelaksanaan kegiatan yang dilakukan, Yayasan Jajan Pahala mendapatkan data mengenai donasi yang dilakukan dan data informasi donatur yang berdonasi. Data tersebut hanya disimpan dan tidak ada analisis lebih jauh dari data yang diperoleh. Padahal, dari data yang didapatkan itu bisa diolah dan dianalisis menjadi informasi yang berguna untuk mendukung keputusan berdasarkan data. Salah satu bentuk analisis data adalah klasifikasi untuk mengelompokkan kelas dari data tersebut. Penulis bertujuan untuk menggunakan model klasifikasi pada data donatur untuk mengklasifikasikan apakah donatur akan rutin berdonasi atau hanya sekali berdonasi. Dari penerapan model klasifikasi tersebut akan dilihat bagaimana hasil evaluasinya. Algoritma yang digunakan pada klasifikasi adalah random forest dengan kombinasi cross-validation dan tuning hyperparameter. Data donatur yang digunakan sebanyak 227 data yang memuat mengenai informasi donatur. Dari penerapan model klasifikasi random forest didapatkan hasil akurasi pada V-fold Cross Validation sebesar 0,729 dengan parameter yang paling optimal pada mtry 13 dan min_n 20. Hasil evaluasi model dengan akurasi, presisi, recall, dan f-measure mendapatkan nilai secara berurutan sebesar 78%, 67%, 57%, dan 61%. Hasil ini mendeskripsikan bahwa performa model cukup baik.

Referensi

Amusa, L., North, D., & Zewotir, T. (2021). Optimal hyperparameter tuning of random forests for estimating causal treatment effects. Songklanakarin Journal of Science & Technology, 43(4).

Baskoro, B., Sriyanto, S., & Rini, L. S. (2021). Prediksi penerima beasiswa dengan menggunakan teknik data mining di Universitas Muhammadiyah Pringsewu. In Prosiding Seminar Nasional Darmajaya (Vol. 1, pp. 87-94).

Belgiu, M., & Drăguţ, L. (2016). Random forest in remote sensing: A review of applications and future directions. ISPRS journal of photogrammetry and remote sensing, 114, 24-31.

Chambers, J. M., Cleveland, W. S., Kleiner, B., & Tukey, P. A. (1983). Graphical methods for data analysis. Duxbury Press.

Cleveland, W. S. (1993). Visualizing data. Hobart Press.

Den Broeck, V., Cunningham, S. A., Eeckels, R., & Herbst, K. (2005). Data cleaning: Detecting, diagnosing, and editing data abnormalities. Africa Centre for Health and Population Studies.

Fernández-Delgado, M., Cernadas, E., Barro, S., & Amorim, D. (2014). Do we need hundreds of classifiers to solve real world classification problems? The journal of machine learning research, 15(1), 3133-3181.

Friedman, V. (2008). Data visualization and infographics. Tersedia di https://www.smashingmagazine.com/2008/01/monday-inspiration-data-visualization-and-infographics/ [Diakses 7 Februari 2024].

Gerson, R. F. (2001). Marketing management. Prentice Hall.

Han, J., Kamber, M., & Pei, J. (2012). Data mining: Concepts and techniques (3rd ed.). Morgan Kaufmann Publishers.

Isabona, J., Imoize, A. L., & Kim, Y. (2022). Machine learning-based boosted regression ensemble combined with hyperparameter tuning for optimal adaptive learning. Sensors (Basel, Switzerland, 22(10), 3776. https://doi.org/10.3390/s22103776.

Kuhn, M., & Johnson, K. (2019). Feature engineering and selection: A practical approach for predictive models. CRC Press.

Kuhn, M., & Silge, J. (2022). Tidy modeling with R. O'Reilly Media.

Kuhn, Max & Johnson, Kjell. (2013). Applied Predictive Modeling. 10.1007/978-1-4614-6849-3.

Kudyba, S. (2014). Big data, mining, and analytics. Auerbach Publications.

Mu’alim, F., & Hidayati, R. (2022). Implementasi metode random forest untuk penjurusan siswa di Madrasah Aliyah Negeri Sintang. JUPITER (Jurnal Penelitian Ilmu Dan Teknologi Komputer, 14(1), 116-125. https://doi.org/10.5281./4588/5.jupiter.2022.04.

Rahman, M. F., Alamsah, D., Darmawidjadja, M. I., & Nurma, I. (2017). Klasifikasi untuk diagnosa diabetes menggunakan metode Bayesian regularization neural network (RBNN). Jurnal Informatika, 11(1), 36.

Sarikaya, A., Correll, M., Bartram, L., Tory, M., & Fisher, D. (2019). What do we talk about when we talk about dashboards? IEEE Transactions on Visualization and Computer Graphics, 25(1), 682-692. https://doi.org/10.1109/TVCG.2018.2864903.

Setyohadi, D., Kristiawan, F., & Ernawati, E. (2017). Perbaikan performansi klasifikasi dengan preprocessing iterative partitioning filter algorithm. Telematika: Jurnal Informatika dan Teknologi Informasi, 14(1), 12-20. https://doi.org/10.31315/telematika.v14i01.1960.

Speiser, J. L., Durkalski, V. L., & Lee, W. M. (2015). Random forest classification of etiologies for an orphan disease. Statistics in medicine, 34(5), 887-899.

Tukey, J. W. (1962). The future of data analysis. Annals of Mathematical Statistics.

Viegas, F., & Wattenberg, M. (2011). How to make data look sexy. Tersedia di https://web.archive.org/web/20110506065701/http://articles.cnn.com/2011-04-19/opinion/sexy.data_1_visualization-21st-century-engagement?_s=PM%3AOPINION [Diakses 7 Februari 2024].

Zailani, A. U., & Hanun, N. L. (2020). Penerapan algoritma klasifikasi random forest untuk penentuan kelayakan pemberian kredit di Koperasi Mitra Sejahtera. Infotech: Journal of Technology Information, 6(1), 7-14.

Unduhan

Diterbitkan

16 Agu 2024

Cara Mengutip

Wibisono, N. S., Wicaksono, S. A. ., & Setiawan, N. Y. (2024). Klasifikasi Donatur Pada Yayasan Jajan Pahala Menggunakan Algoritma Random Forest. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 8(9). Diambil dari https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/14116

Terbitan

Bagian

Artikel
Loading...