Prediksi Kanker Paru-Paru menggunakan Algoritme Random Forest Decision Tree
Kata Kunci:
Klasifikasi, Kanker, Data Mining, Random Forest Decision Trees, Confusion Matrix, K-fold Cross ValidatonAbstrak
Teknologi telah berevolusi dari awal penciptaannya sampai sekarang dengan laju yang cepat. Salah satu aspek dari teknologi tersebut merupakan berkembanganya pertukaran data yang terjadi. Dengan skala pertukaran data yang besar tentu juga jumlah data yang berputar semakin besar. Untuk menggunakan dan menggali data tersebut menjadi informasi yang bisa digunakan terciptanya konsep Data Mining. Data Mining merupakan teknik untuk menemukan pola dan informasi dari data berjumlah besar. Data Mining bisa diimplementasikan pada banyak industri, salah satunya merupakan industri kesehatan. Penggunaan Data Mining untuk membantu riset dan penanganan kanker sedang sangat meningkat. Dengan munculnya penyakit kanker paru-paru di tubuh manusia terdapat beberapa gejala yang biasa dirasakan oleh kebanyakan pasien kanker paru-paru. Namun, gejala ini seringkali tidak dihiraukan dan tidak dicek oleh praktisi medis sehingga hanya 14% dari pasien yang didiagnosa kanker paru-paru sembuh dari penyakitnya lima tahun dari diagnosa. Menggunakan klasifikasi, terdapat cara untuk menganalisis data hasil gejala awal kanker paru-paru untuk menentukan class label dari hasil tersebut dengan tujuan membantu fasilitas kesehatan membuat keputusan medis terhadap calon pasien. Pada penelitian ini dilakukan implementasi klasifikasi menggunakan Random Forest, serta pengujian menggunakan Confusion Matrix dan f-Fold Cross Validation. Hasil dari pengujian menggunakan Confusion Matrix adalah ditemukan akurasi tertinggi sebesar 0,904 dan rata-rata akurasi sebesar 0,813. Hasil pengujian menggunakan K-fold Cross Validation adalah rata-rata akurasi tertinggi saat menggunakan 5-fold cross validation yaitu akurasi sebesar 0,889.
Referensi
Sholih, M. G., Perwitasari, D. A., Hendriani, R., Sukandar, H., Barliana, M. I., Suwantika, A., Diantini, A. (2019). Risk factors of Lung Cancer in Indonesia: a qualitative study. Journal of Advanced Pharmacy Education & Research, 41-45.
WHO. (2020, Januari 1). Retrieved from https://www.who.int/publications/m/item/cancer-idn-2020
Krishnaiah, V., Narsimha, D., & Chandra, D. (2013). Diagnosis of Lung Cancer Prediction System Using Data Mining Classification Techniques. International Journal of Computer Science and Information Technologies, Vol. 4 (1), 39-45.
Han, J., Kamber, M., & Pei, J. (2012). Data Mining: Concepts and Techniques. Waltham: Morgan Kaufmann Publishers.
Fadlilah, M. S., Wihandika, R. C., & Rahayudi, B. (2019). Klasifikasi Penurunan Fungsi Kognitif Pasien Stroke Menggunakan Metode Klasifikasi Random Forest. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol.3, 3005-3013.
Yun, H. (2021). Prediction model of algal blooms using logistic regression and confusion matrix. International Journal of Electrical and Computer Engineering (IJECE), 2407-2413.
Vabalas, A., Gowen, E., Poliakoff, E., & Casson, A. (2019, November 7). Machine learning algorithm validation with a limited sample size. PLoS ONE 14, p. 11.
WHO. (2021, December 13). Retrieved from https://www.who.int/news-room/fact-sheets/detail/cancer-in-children
Pusat Data dan Informasi. (2020, Oktober 16). Retrieved from www.pdpersi.co.id
Yang, H., & Chen, Y.-P. P. (2015). Data mining in lung cancer pathologic staging diagnosis: Correlation between clinical and pathology information. Expert Systems with Applications 42, 6168-6176.
Denisko, D., & Hoffman, M. M. (2018, February 20). Classification and interaction in random forests. PNAS, pp. 1690-1692.
Sholih, M. G., Perwitasari, D. A., Hendriani, R., Sukandar, H., Barliana, M. I., Suwantika, A., Diantini, A. (2019). Risk factors of Lung Cancer in Indonesia: a qualitative study. Journal of Advanced Pharmacy Education & Research, 41-45.
WHO. (2020, Januari 1). Retrieved from https://www.who.int/publications/m/item/cancer-idn-2020
Krishnaiah, V., Narsimha, D., & Chandra, D. (2013). Diagnosis of Lung Cancer Prediction System Using Data Mining Classification Techniques. International Journal of Computer Science and Information Technologies, Vol. 4 (1), 39-45.
Han, J., Kamber, M., & Pei, J. (2012). Data Mining: Concepts and Techniques. Waltham: Morgan Kaufmann Publishers.
Fadlilah, M. S., Wihandika, R. C., & Rahayudi, B. (2019). Klasifikasi Penurunan Fungsi Kognitif Pasien Stroke Menggunakan Metode Klasifikasi Random Forest. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol.3, 3005-3013.
Yun, H. (2021). Prediction model of algal blooms using logistic regression and confusion matrix. International Journal of Electrical and Computer Engineering (IJECE), 2407-2413.
Vabalas, A., Gowen, E., Poliakoff, E., & Casson, A. (2019, November 7). Machine learning algorithm validation with a limited sample size. PLoS ONE 14, p. 11.
WHO. (2021, December 13). Retrieved from https://www.who.int/news-room/fact-sheets/detail/cancer-in-children
Pusat Data dan Informasi. (2020, Oktober 16). Retrieved from www.pdpersi.co.id
Yang, H., & Chen, Y.-P. P. (2015). Data mining in lung cancer pathologic staging diagnosis: Correlation between clinical and pathology information. Expert Systems with Applications 42, 6168-6176.
Denisko, D., & Hoffman, M. M. (2018, February 20). Classification and interaction in random forests. PNAS, pp. 1690-1692.
Unduhan
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2023 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
Artikel ini berlisensiCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.