Klasifikasi Dokumen Abstrak Skripsi Berdasarkan Fokus Penelitian di Bidang Komputasi Cerdas Menggunakan BM25 dan K-Nearest Neighbor
Kata Kunci:
klasifikasi, text mining, BM25, K-Nearest Neighbor, dokumen abstrak skripsiAbstrak
Salah satu proses yang dapat dilakukan di text mining adalah pengelompokan dokumen teks. Permasalahan yang berkaitan dengan pengelompokan dokumen teks ditemukan di perguruan tinggi khususnya di ruang baca Fakultas Ilmu Komputer Universitas Brawijaya (FILKOM UB). Permasalahannya adalah belum adanya proses pengelompokan dokumen skripsi secara otomatis. Pengelompokan dokumen skripsi di ruang baca FILKOM UB masih belum tertata sesuai dengan fokus penelitian yang ada. Pengelompokan tersebut dapat diselesaikan menggunakan metode BM25 dan K-Nearest Neighbor. Proses yang dilakukan adalah melakukan pre-processing dokumen, perhitungan score BM25 tiap dokumen, dan proses klasifikasi menggunakan algoritme K-Nearest Neighbor. Proses pengujian pada penelitian ini menggunakan k-fold sebanyak 10. Setiap pengujian menggunakan data testing sebanyak 31 dokumen dan data training sebanyak 300 dokumen. Hasil rata-rata yang diperoleh pada tiap pengujian menghasilkan hasil terbaik pada nilai k=11 dengan nilai f-measure sebesar 0,9092, recall sebesar 0,9087, dan precision sebesar 0,9265. Nilai k yang semakin besar mengakibatkan proses klasifikasi berjalan kurang maksimal karena menghasilkan nilai f-measure yang semakin kecil.