Klasifikasi Donatur Pada Yayasan Jajan Pahala Menggunakan Algoritma Random Forest
Kata Kunci:
donatur, data analisis, klasifikasi, Random Forest, DashboardAbstrak
Yayasan Jajan Pahala adalah salah satu yayasan yang bergerak pada bidang sosial, keagamaan, dan kemanusiaan yang sudah ada sejak tahun 2015 dan resmi menjadi yayasan pada tahun 2019. Pada pelaksanaan kegiatan yang dilakukan, Yayasan Jajan Pahala mendapatkan data mengenai donasi yang dilakukan dan data informasi donatur yang berdonasi. Data tersebut hanya disimpan dan tidak ada analisis lebih jauh dari data yang diperoleh. Padahal, dari data yang didapatkan itu bisa diolah dan dianalisis menjadi informasi yang berguna untuk mendukung keputusan berdasarkan data. Salah satu bentuk analisis data adalah klasifikasi untuk mengelompokkan kelas dari data tersebut. Penulis bertujuan untuk menggunakan model klasifikasi pada data donatur untuk mengklasifikasikan apakah donatur akan rutin berdonasi atau hanya sekali berdonasi. Dari penerapan model klasifikasi tersebut akan dilihat bagaimana hasil evaluasinya. Algoritma yang digunakan pada klasifikasi adalah random forest dengan kombinasi cross-validation dan tuning hyperparameter. Data donatur yang digunakan sebanyak 227 data yang memuat mengenai informasi donatur. Dari penerapan model klasifikasi random forest didapatkan hasil akurasi pada V-fold Cross Validation sebesar 0,729 dengan parameter yang paling optimal pada mtry 13 dan min_n 20. Hasil evaluasi model dengan akurasi, presisi, recall, dan f-measure mendapatkan nilai secara berurutan sebesar 78%, 67%, 57%, dan 61%. Hasil ini mendeskripsikan bahwa performa model cukup baik.
Referensi
Amusa, L., North, D., & Zewotir, T. (2021). Optimal hyperparameter tuning of random forests for estimating causal treatment effects. Songklanakarin Journal of Science & Technology, 43(4).
Baskoro, B., Sriyanto, S., & Rini, L. S. (2021). Prediksi penerima beasiswa dengan menggunakan teknik data mining di Universitas Muhammadiyah Pringsewu. In Prosiding Seminar Nasional Darmajaya (Vol. 1, pp. 87-94).
Belgiu, M., & Drăguţ, L. (2016). Random forest in remote sensing: A review of applications and future directions. ISPRS journal of photogrammetry and remote sensing, 114, 24-31.
Chambers, J. M., Cleveland, W. S., Kleiner, B., & Tukey, P. A. (1983). Graphical methods for data analysis. Duxbury Press.
Cleveland, W. S. (1993). Visualizing data. Hobart Press.
Den Broeck, V., Cunningham, S. A., Eeckels, R., & Herbst, K. (2005). Data cleaning: Detecting, diagnosing, and editing data abnormalities. Africa Centre for Health and Population Studies.
Fernández-Delgado, M., Cernadas, E., Barro, S., & Amorim, D. (2014). Do we need hundreds of classifiers to solve real world classification problems? The journal of machine learning research, 15(1), 3133-3181.
Friedman, V. (2008). Data visualization and infographics. Tersedia di https://www.smashingmagazine.com/2008/01/monday-inspiration-data-visualization-and-infographics/ [Diakses 7 Februari 2024].
Gerson, R. F. (2001). Marketing management. Prentice Hall.
Han, J., Kamber, M., & Pei, J. (2012). Data mining: Concepts and techniques (3rd ed.). Morgan Kaufmann Publishers.
Isabona, J., Imoize, A. L., & Kim, Y. (2022). Machine learning-based boosted regression ensemble combined with hyperparameter tuning for optimal adaptive learning. Sensors (Basel, Switzerland, 22(10), 3776. https://doi.org/10.3390/s22103776.
Kuhn, M., & Johnson, K. (2019). Feature engineering and selection: A practical approach for predictive models. CRC Press.
Kuhn, M., & Silge, J. (2022). Tidy modeling with R. O'Reilly Media.
Kuhn, Max & Johnson, Kjell. (2013). Applied Predictive Modeling. 10.1007/978-1-4614-6849-3.
Kudyba, S. (2014). Big data, mining, and analytics. Auerbach Publications.
Mu’alim, F., & Hidayati, R. (2022). Implementasi metode random forest untuk penjurusan siswa di Madrasah Aliyah Negeri Sintang. JUPITER (Jurnal Penelitian Ilmu Dan Teknologi Komputer, 14(1), 116-125. https://doi.org/10.5281./4588/5.jupiter.2022.04.
Rahman, M. F., Alamsah, D., Darmawidjadja, M. I., & Nurma, I. (2017). Klasifikasi untuk diagnosa diabetes menggunakan metode Bayesian regularization neural network (RBNN). Jurnal Informatika, 11(1), 36.
Sarikaya, A., Correll, M., Bartram, L., Tory, M., & Fisher, D. (2019). What do we talk about when we talk about dashboards? IEEE Transactions on Visualization and Computer Graphics, 25(1), 682-692. https://doi.org/10.1109/TVCG.2018.2864903.
Setyohadi, D., Kristiawan, F., & Ernawati, E. (2017). Perbaikan performansi klasifikasi dengan preprocessing iterative partitioning filter algorithm. Telematika: Jurnal Informatika dan Teknologi Informasi, 14(1), 12-20. https://doi.org/10.31315/telematika.v14i01.1960.
Speiser, J. L., Durkalski, V. L., & Lee, W. M. (2015). Random forest classification of etiologies for an orphan disease. Statistics in medicine, 34(5), 887-899.
Tukey, J. W. (1962). The future of data analysis. Annals of Mathematical Statistics.
Viegas, F., & Wattenberg, M. (2011). How to make data look sexy. Tersedia di https://web.archive.org/web/20110506065701/http://articles.cnn.com/2011-04-19/opinion/sexy.data_1_visualization-21st-century-engagement?_s=PM%3AOPINION [Diakses 7 Februari 2024].
Zailani, A. U., & Hanun, N. L. (2020). Penerapan algoritma klasifikasi random forest untuk penentuan kelayakan pemberian kredit di Koperasi Mitra Sejahtera. Infotech: Journal of Technology Information, 6(1), 7-14.
Amusa, L., North, D., & Zewotir, T. (2021). Optimal hyperparameter tuning of random forests for estimating causal treatment effects. Songklanakarin Journal of Science & Technology, 43(4).
Baskoro, B., Sriyanto, S., & Rini, L. S. (2021). Prediksi penerima beasiswa dengan menggunakan teknik data mining di Universitas Muhammadiyah Pringsewu. In Prosiding Seminar Nasional Darmajaya (Vol. 1, pp. 87-94).
Belgiu, M., & Drăguţ, L. (2016). Random forest in remote sensing: A review of applications and future directions. ISPRS journal of photogrammetry and remote sensing, 114, 24-31.
Chambers, J. M., Cleveland, W. S., Kleiner, B., & Tukey, P. A. (1983). Graphical methods for data analysis. Duxbury Press.
Cleveland, W. S. (1993). Visualizing data. Hobart Press.
Den Broeck, V., Cunningham, S. A., Eeckels, R., & Herbst, K. (2005). Data cleaning: Detecting, diagnosing, and editing data abnormalities. Africa Centre for Health and Population Studies.
Fernández-Delgado, M., Cernadas, E., Barro, S., & Amorim, D. (2014). Do we need hundreds of classifiers to solve real world classification problems? The journal of machine learning research, 15(1), 3133-3181.
Friedman, V. (2008). Data visualization and infographics. Tersedia di https://www.smashingmagazine.com/2008/01/monday-inspiration-data-visualization-and-infographics/ [Diakses 7 Februari 2024].
Gerson, R. F. (2001). Marketing management. Prentice Hall.
Han, J., Kamber, M., & Pei, J. (2012). Data mining: Concepts and techniques (3rd ed.). Morgan Kaufmann Publishers.
Isabona, J., Imoize, A. L., & Kim, Y. (2022). Machine learning-based boosted regression ensemble combined with hyperparameter tuning for optimal adaptive learning. Sensors (Basel, Switzerland, 22(10), 3776. https://doi.org/10.3390/s22103776.
Kuhn, M., & Johnson, K. (2019). Feature engineering and selection: A practical approach for predictive models. CRC Press.
Kuhn, M., & Silge, J. (2022). Tidy modeling with R. O'Reilly Media.
Kuhn, Max & Johnson, Kjell. (2013). Applied Predictive Modeling. 10.1007/978-1-4614-6849-3.
Kudyba, S. (2014). Big data, mining, and analytics. Auerbach Publications.
Mu’alim, F., & Hidayati, R. (2022). Implementasi metode random forest untuk penjurusan siswa di Madrasah Aliyah Negeri Sintang. JUPITER (Jurnal Penelitian Ilmu Dan Teknologi Komputer, 14(1), 116-125. https://doi.org/10.5281./4588/5.jupiter.2022.04.
Rahman, M. F., Alamsah, D., Darmawidjadja, M. I., & Nurma, I. (2017). Klasifikasi untuk diagnosa diabetes menggunakan metode Bayesian regularization neural network (RBNN). Jurnal Informatika, 11(1), 36.
Sarikaya, A., Correll, M., Bartram, L., Tory, M., & Fisher, D. (2019). What do we talk about when we talk about dashboards? IEEE Transactions on Visualization and Computer Graphics, 25(1), 682-692. https://doi.org/10.1109/TVCG.2018.2864903.
Setyohadi, D., Kristiawan, F., & Ernawati, E. (2017). Perbaikan performansi klasifikasi dengan preprocessing iterative partitioning filter algorithm. Telematika: Jurnal Informatika dan Teknologi Informasi, 14(1), 12-20. https://doi.org/10.31315/telematika.v14i01.1960.
Speiser, J. L., Durkalski, V. L., & Lee, W. M. (2015). Random forest classification of etiologies for an orphan disease. Statistics in medicine, 34(5), 887-899.
Tukey, J. W. (1962). The future of data analysis. Annals of Mathematical Statistics.
Viegas, F., & Wattenberg, M. (2011). How to make data look sexy. Tersedia di https://web.archive.org/web/20110506065701/http://articles.cnn.com/2011-04-19/opinion/sexy.data_1_visualization-21st-century-engagement?_s=PM%3AOPINION [Diakses 7 Februari 2024].
Zailani, A. U., & Hanun, N. L. (2020). Penerapan algoritma klasifikasi random forest untuk penentuan kelayakan pemberian kredit di Koperasi Mitra Sejahtera. Infotech: Journal of Technology Information, 6(1), 7-14.
Unduhan
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2024 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
Artikel ini berlisensiCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.