Klasifikasi Jenis Kanker Berdasarkan Struktur Protein Menggunakan Metode Neighbor Weighted K-Nearest Neighbor (NWKNN)
Kata Kunci:
klasifikasi, kanker, susunan protein, metode NWKNN, classification, cancer, protein sequence, NWKNN methodAbstrak
Kanker ialah penyakit tidak menular dengan jumlah pengidap yang besar di dunia. Kanker menjadi penyakit paling mematikan ke-7 di Indonesia. Umumnya kanker terjadi karena adanya mutasi gen yang menyebabkan adanya perubahan pada bentuk protein, salah satunya terjadi pada protein 53 (p53). Mutasi gen p53 ini sering ditemukan pada kanker manusia. Dari permasalahan ini diperlukan sebuah sistem untuk mengklasifikasikan jenis kanker. Salah satu metode yang dapat digunakan untuk klasifikasi adalah metode Neighbor Weighted K-Nearest Neighbor (NWKNN). Data yang digunakan dalam penelitian ini ialah 752 data sekuens protein dengan panjang sekuens adalah 393. Kelas klasifikasi yang digunakan berupa data bukan kanker, kanker payudara, kanker usus dan kanker paru-paru. NWKNN ialah peningkatan dari metode K-Nearest Neighbor (KNN) dengan tambahan perhitungan bobot kelas dalam perhitungan skor kelas klasifikasinya. Pengujian dilakukan dengan membagi dataset menjadi data latih dan data uji dengan varian perbandingan data latih dan data uji sebesar 90%:10%, 80%:20%, 70%:30%, 60%:40, 50%:50, 40%:60%, 30%:70%, 20%:80%, 10%:90% dari dataset. Hasil pengujian menunjukkan bahwa variasi perbandingan 80%:20% dengan K=8 dan E=3 menghasilkan akurasi tertinggi, yaitu 80.666%.