Implementasi Metode Improved K-Means untuk Mengelompokkan Dokumen Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
Kata Kunci:
praproses teks, vector space model, pembobotan kata, klasterisasi, improved k-meansAbstrak
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer (J-PTIIK) merupakan jurnal keilmuan di bidang komputer yang memuat tulisan ilmiah hasil penelitian mahasiswa/i FILKOM Universitas Brawijaya yang diterbitkan secara berkala. J-PTIIK merupakan dokumen jurnal yang memiliki topik jurnal berada dalam bidang teknologi informasi dan ilmu komputer. Pada saat ini J-PTIIK dikelompokkan berdasarkan arsip volume dan nomor terbit jurnal. Untuk memudahkan identifikasi topik jurnal yang terdapat pada J-PTIIK, maka dokumen J-PTIIK dapat dikelompokkan berdasarkan kemiripan topik yang terdapat dalam J-PTIIK. Pengelompokan dokumen J-PTIIK dibuat dengan menggunakan metode improved k-means. Metode improved k-means merupakan teknik klasterisasi unsupervised dengan penentuan centroid awal klaster diperoleh dengan cara menggabungkan metode optimasi jarak dan densitas. Praproses dokumen dan pembentukan vector space model untuk melakukan pembobotan kata dilakukan terlebih dahulu sebelum mengelompokkan dokumen J-PTIIK. Berdasarkan hasil pengujian, pengelompokan dokumen J-PTIIK memperoleh hasil silhouette coefficient optimal sebesar 0,026574 pada k = 19 dan α = 0,50. Hasil pengujian purity optimal diperoleh sebesar 0,738197 pada k = 23 dan α = 0,50. Hasil penelitian menunjukkan penggunaan metode improved k-means memiliki silhouette coefficient yang lebih baik dibandingkan metode k-means, dengan nilai rata-rata silhouette coefficient pada metode improved k-means sebesar 0,016457654 dan metode k-means sebesar 0,011820563.