Implementasi Metode Text Mining dan K-Means Clustering untuk Pengelompokan Dokumen Skripsi (Studi Kasus: Universitas Brawijaya)
Kata Kunci:
k-means clustering, silhouette coefficient, clustering dokumen, text miningAbstrak
Penelitian atau tugas akhir merupakan syarat kelulusan mahasiswa. Setiap tahun penelitian menjadi bertambah dan memungkinkan mahasiswa mengambil topik yang sama atau hampir serupa. Melalui penelitian ini dikembangkan sebuah aplikasi untuk mengelompokkan laporan skripsi mahasiswa. Hasil dari pengelompokan laporan skripsi ini akan memperlihatkan bagaimana pola kemiripan dan keterkaitan antar penelitian dari waktu ke waktu. Hasil dari pengelompokan ini juga menunjukkan kapan tema penelitian mahasiswa menjadi bervariasi dan kapan tema penelitian menjadi kurang bervariasi. Laporan penelitian mahasiswa atau biasa disebut dengan laporan skripsi dapat dikelompokkan berdasarkan tema, objek maupun metode dari penelitian tersebut. Proses ekstraksi dokumen skripsi ini dilakukan dengan memanfaatkan teknologi dari text mining. Lalu untuk proses pengelompokan dokumen skripsi ini dilakukan dengan menggunakan metode k-means clustering pada sekumpulan dokumen skripsi dengan mengambil abstrak, kata kunci dan daftar isi sebagai informasi penting yang dapat mewakili isi dari dokumen. Lalu dokumen akan dilakukan preprocessing terlebih dahulu dengan menggunakan metode text mining. Untuk tahap preprocessing dibagi menjadi beberapa bagian, yakni tokenisasi, filtering, stemming dan term weighting. Setelah dokumen melewati tahap preprocessing, maka dokumen dapat dikelompokkan dengan menggunakan metode dari k-means clustering. Pada penelitian ini uji coba dilakukan dengan memasukkan jumlah cluster yang bervariasi. Dari hasil analisis dengan memasukkan nilai cluster yang berbeda telah didapatkan nilai optimal dengan memasukkan jumlah dengan nilai silhouette yang dihasilkan 0,483695522.