Pengelompokan Artikel Berbahasa Indonesia Dengan Menggunakan Reduksi Fitur Information Gain Thresholding Dan K-Means

Pengelompokan Artikel Berbahasa Indonesia Dengan Menggunakan Reduksi Fitur Information Gain Thresholding Dan K-Means

Penulis

  • Novia Agusvina Fakultas Ilmu Komputer, Universitas Brawijaya
  • Indriati Indriati Fakultas Ilmu Komputer, Universitas Brawijaya
  • Nurudin Santoso Fakultas Ilmu Komputer, Universitas Brawijaya

Kata Kunci:

artikel online, reduksi fitur, information gain thresholding, pengelompokan, K-Means

Abstrak

Semakin banyaknya artikel yang tersebar di situs internet, menyulitkan pengguna dalam menemukan artikel yang diinginkan. Salah satu penyedia layanan artikel  online adalah Kompas.com. Untuk menghadapi persaingan antar industri media massa, langkah yang dilakukan Kompas.com adalah memberikan fitur yang memudahkan pengguna, seperti fitur rekomendasi artikel terkait. Namun, dalam penerapannya Kompas.com masih kurang maksimal sehingga tetap kalah dengan media massa online lainnya. Pada penelitian ini, peneliti mengimplementasikan metode reduksi fitur Information Gain Thresholding dan K-Means untuk membuat kelompok artikel terkait. Tujuan dari penelitian ini adalah untuk memperbaiki sistem artikel terkait dari Kompas.com. Dalam pengimplementasian digunakan bahasa java. Pada tahap awal dilakukan preprocessing untuk mengurangi gangguan dalam data, selanjutnya dilakukan reduksi fitur untuk mengurangi fitur yang digunakan agar proses kebih cepat, kemudian dilakukan pembobotan sebagai dasar untuk menghitung jarak antar dokumen, setelah menemukan nilai jarak awal atau centroid , pengelompokan dapat dilakukan. Hasil menunjukan bahwa pengelompokan artikel dengan metode Information Gain Thresholding dan K-Means mampu menghasilkan kelompok dokumen yang baik dengan nilai silhouette coefiecient sebesar 0.9595  dan purity measure sebesar  0.75 dengan penggunaan 3 cluster dan batas ambang untuk reduksi fitur terbaik adalah 0.04 dengan nilai kemurnian data jauh lebih baik dibandingkan tanpa reduksi fitur.

Unduhan

Diterbitkan

14 Feb 2018

Cara Mengutip

Agusvina, N., Indriati, I., & Santoso, N. (2018). Pengelompokan Artikel Berbahasa Indonesia Dengan Menggunakan Reduksi Fitur Information Gain Thresholding Dan K-Means. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 2(10), 3822–3828. Diambil dari https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/2762

Terbitan

Bagian

Artikel
Loading...