Prediksi Kanker Paru-Paru menggunakan Algoritme Random Forest Decision Tree

Prediksi Kanker Paru-Paru menggunakan Algoritme Random Forest Decision Tree

Penulis

  • Rafly Dwi Marzuq Fakultas Ilmu Komputer, Universitas Brawijaya
  • Satrio Agung Wicaksono Fakultas Ilmu Komputer, Universitas Brawijaya
  • Nanang Yudi Setiawan Fakultas Ilmu Komputer, Universitas Brawijaya

Kata Kunci:

Klasifikasi, Kanker, Data Mining, Random Forest Decision Trees, Confusion Matrix, K-fold Cross Validaton

Abstrak

Teknologi telah berevolusi dari awal penciptaannya sampai sekarang dengan laju yang cepat. Salah satu aspek dari teknologi tersebut merupakan berkembanganya pertukaran data yang terjadi. Dengan skala pertukaran data yang besar tentu juga jumlah data yang berputar semakin besar. Untuk menggunakan dan menggali data tersebut menjadi informasi yang bisa digunakan terciptanya konsep Data Mining. Data Mining merupakan teknik untuk menemukan pola dan informasi dari data berjumlah besar. Data Mining bisa diimplementasikan pada banyak industri, salah satunya merupakan industri kesehatan. Penggunaan Data Mining untuk membantu riset dan penanganan kanker sedang sangat meningkat. Dengan munculnya penyakit kanker paru-paru di tubuh manusia terdapat beberapa gejala yang biasa dirasakan oleh kebanyakan pasien kanker paru-paru. Namun, gejala ini seringkali tidak dihiraukan dan tidak dicek oleh praktisi medis sehingga hanya 14% dari pasien yang didiagnosa kanker paru-paru sembuh dari penyakitnya lima tahun dari diagnosa. Menggunakan klasifikasi, terdapat cara untuk menganalisis data hasil gejala awal kanker paru-paru untuk menentukan class label dari hasil tersebut dengan tujuan membantu fasilitas kesehatan membuat keputusan medis terhadap calon pasien. Pada penelitian ini dilakukan implementasi klasifikasi menggunakan Random Forest, serta pengujian menggunakan Confusion Matrix dan f-Fold Cross Validation. Hasil dari pengujian menggunakan Confusion Matrix adalah ditemukan akurasi tertinggi sebesar 0,904 dan rata-rata akurasi sebesar 0,813. Hasil pengujian menggunakan K-fold Cross Validation adalah rata-rata akurasi tertinggi saat menggunakan 5-fold cross validation yaitu akurasi sebesar 0,889.

Referensi

Sholih, M. G., Perwitasari, D. A., Hendriani, R., Sukandar, H., Barliana, M. I., Suwantika, A., Diantini, A. (2019). Risk factors of Lung Cancer in Indonesia: a qualitative study. Journal of Advanced Pharmacy Education & Research, 41-45.

WHO. (2020, Januari 1). Retrieved from https://www.who.int/publications/m/item/cancer-idn-2020

Krishnaiah, V., Narsimha, D., & Chandra, D. (2013). Diagnosis of Lung Cancer Prediction System Using Data Mining Classification Techniques. International Journal of Computer Science and Information Technologies, Vol. 4 (1), 39-45.

Han, J., Kamber, M., & Pei, J. (2012). Data Mining: Concepts and Techniques. Waltham: Morgan Kaufmann Publishers.

Fadlilah, M. S., Wihandika, R. C., & Rahayudi, B. (2019). Klasifikasi Penurunan Fungsi Kognitif Pasien Stroke Menggunakan Metode Klasifikasi Random Forest. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol.3, 3005-3013.

Yun, H. (2021). Prediction model of algal blooms using logistic regression and confusion matrix. International Journal of Electrical and Computer Engineering (IJECE), 2407-2413.

Vabalas, A., Gowen, E., Poliakoff, E., & Casson, A. (2019, November 7). Machine learning algorithm validation with a limited sample size. PLoS ONE 14, p. 11.

WHO. (2021, December 13). Retrieved from https://www.who.int/news-room/fact-sheets/detail/cancer-in-children

Pusat Data dan Informasi. (2020, Oktober 16). Retrieved from www.pdpersi.co.id

Yang, H., & Chen, Y.-P. P. (2015). Data mining in lung cancer pathologic staging diagnosis: Correlation between clinical and pathology information. Expert Systems with Applications 42, 6168-6176.

Denisko, D., & Hoffman, M. M. (2018, February 20). Classification and interaction in random forests. PNAS, pp. 1690-1692.

Unduhan

Diterbitkan

10 Okt 2023

Cara Mengutip

Marzuq, R. D., Wicaksono, S. A., & Setiawan, N. Y. (2023). Prediksi Kanker Paru-Paru menggunakan Algoritme Random Forest Decision Tree. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 7(7), 3448–3456. Diambil dari https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/12964

Terbitan

Bagian

Artikel
Loading...