Seleksi Fitur Information Gain untuk Klasifikasi Penyakit Jantung Menggunakan Kombinasi Metode K-Nearest Neighbor dan Naive Bayes
Kata Kunci:
penyakit jantung, seleksi fitur, Information Gain, klasifikasi, K-Nearest Neighbor, Naïve BayesAbstrak
Penyakit jantung merupakan salah satu penyakit tidak menular yang dapat menyebabkan kematian. Penyakit ini terjadi karena adanya penyempitan pada pembuluh darah sehingga menyebabkan fungsi jantung terganggu. Angka kematian akibat penyakit jantung diperkirakan terus meningkat oleh Kementrian Kesehatan Republik Indonesia pada tahun 2030 hingga mencapai 23,3 juta penduduk. Hal tersebut perlu diantisipasi karena jumlah dokter penyakit jantung di Indonesia masih sangat minim. Penelitian ini mengusulkan penerapan seleksi fitur Information Gain dengan kombinasi K-Nearest Neighbor (KNN) dan Naive Bayes untuk mengatasi masalah efektifitas dan akurasi dalam klasifikasi penyakit jantung. Algoritme Information Gain digunakan untuk mengurangi dimensi atribut untuk mendapatkan atribut-atribut yang relevan. Setelah proses seleksi fitur Information Gain selesai, proses selanjutnya adalah melakukan klasifikasi menggunakan KNN untuk atribut-atribut numerik dan Naive Bayes untuk atribut-atribut kategoris. Hasil penelitian ini menunjukkan nilai akurasi sebesar 92,31% pada saat pengujian sebaran kelas seimbang menggunakan 6 fitur dengan nilai K=25 dan pada saat pengujian sebaran kelas tidak seimbang menggunakan 4 fitur dengan nilai K=35. Berdasarkan hasil tersebut dapat disimpulkan bahwa algoritme seleksi fitur Information Gain dengan kombinasi KNN dan Naive Bayes dapat digunakan untuk klasifikasi penyakit jantung.