Pengelompokan Dokumen Petisi Online Di Situs Change.Org Menggunakan Algoritme Hierarchical Clustering UPGMA
Kata Kunci:
PENGELOMPOKAN DOKUMEN, CHANGE.ORG, UPGMA, SINGULAR VALUE DECOMPOSITION, LATENT SEMANTIC INDEXING, SILHOUETTE COEFFICIENT, COPHENETIC CORRELATION COEFFICIENTAbstrak
Change.org merupakan salah satu website yang sering digunakan oleh masyarakat untuk sarana penyampaian petisi dan kampanye sosial secara online. Kampanye lewat media sosial terbukti dapat menghasilkan perubahan. Aliran informasi petisi online yang berupa dokumen diperbarui setiap harinya dalam jumlah yang besar, membuat clustering dokumen menjadi sangat penting. Clustering dokumen adalah proses pengelompokan dokumen yang memiliki kesamaan topik. Tujuannya untuk membagi dokumen berdasarkan kesamaan, sehingga memudahkan dalam proses pencarian. Metode yang digunakan adalah hierarchical clustering UPGMA atau Unweighted Pair-Group Method using Arithmetic averages dengan menambahkan reduksi fitur menggunakan metode latent semantic indexing hasil pemecahan matrik singular value decomposition. Hasil penelitian menyimpulkan bahwa latent semantic indexing dapat mengatasi permasalahan pada data berdimensi tinggi. Data yang digunakan berjumlah 100 petisi. Dari hasil pengujian performansi menggunakan cophenetic correlation coefficient diperoleh nilai cophenetic sebesar 0,75959 pada rank matrik LSI sebanyak 10% dan silhouette coefficient sebesar 0,36862 dengan jumlah cluster sebanyak 2 cluster.