Analisis Clustering Topik Survey menggunakan Algoritme K-Means (Studi Kasus: Kudata)
Kata Kunci:
kudata, survey, scraping, k-means, cluster, topikAbstrak
Kudata merupakan salah satu platform yang menyediakan layanan untuk menghubungkan pembuat survey yang ingin mencari responden. Pada permasalahan perusahaan ini tidak dapat diketahui untuk topik survey, karena platform yang digunakan Kudata, yakni Google Forms, yang menimbulkan data tidak terstruktur dalam internal database Sehingga, peneliti melakukan penelitian terkait permasalahan Kudata dalam melakukan beberapa pengembangan bisnis, seperti melakukan kategori survey, membuat template survey, dan mengetahui topik survey yang banyak digunakan oleh pengguna, serta tren waktu ke waktu pada topik survey. Metode pada penelitian ini menggunakan scraping untuk mengumpulkan data instrumen survey, meliputi deskripsi, pertanyaan dan kombinasi keduanya pada setiap formulir di Google Forms, serta hasilnya mendapatkan 1913 data URL dan kemudian dilakukan penerapan skenario pengujian, yang dilakukan dengan membagi dataset utama menjadi 3 rentang waktu (setiap 6 bulan) dan membagi kembali dataset tersebut menjadi 3 instrumen penting survey (deskripsi, pertanyaan dan kombinasi keduanya). Selain itu, penelitian ini menggunakan text representation dengan metode TF-IDF (Term Frequency-Inverse Document Frequency) dan reduksi dimensi menggunakan PCA (Principal Component Analysis), serta menggunakan Silhouette Score untuk menghasilkan cluster secara optimal dalam algoritme K-means. Sehingga, penelitian ini menghasilkan rekomendasi dan tren topik survey. Terdapat 16 rekomendasi topik yang sering digunakan dan 4 topik unik yang diidentifikasi dalam seluruh skenario pengujian.
Referensi
Averina, A., Hadi, H., & Siswantoro, J. (2022). Analisis Sentimen Multi-Kelas Untuk Film Berbasis Teks Ulasan Menggunakan Model Regresi Logistik. TEKNIKA, 123-128.
Berry, M. W., & Kogan, J. (2010). Text Mining: Applications and Theory. United Kingdom: Wiley.
Chen, Z. L. (2022). Research and Application of Clustering Algorithm for Text Big Data. Computational Intelligence and Neuroscience, 1-8.
Handoyo, R., Rumami M, R., & Nasution, S. M. (2014). PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN. JSM STMIK Mikroskil, 73-82.
Harahap, B. (2019). Penerapan Algoritma K-Means Untuk Menentukan Bahan Bangunan Laris (Studi Kasus Pada UD. Toko Bangunan YD Indarung). Regional Development Industry & Health Science, Technology and Art of Life, 394-403.
Indraloka, D. S., & Santosa, B. (2017). Penerapan Text Mining untuk Melakukan Clustering Data Tweet Shopee Indonesia. JURNAL SAINS DAN SENI ITS, 51-56.
Josi, A., Abdillah, L. A., & Suryayusra. (2022). PENERAPAN TEKNIK WEB SCRAPING PADA MESIN PENCARI ARTIKEL ILMIAH. UNIVERSITAS BINA DARMA, 159-164.
Jumeilah, F. S. (2017). Penerapan Support Vector Machine (SVM) untuk Pengkategorian Penelitian. JURNAL RESTI (Rekayasa Sistem dan Teknologi Informasi), 19-25.
Kodinariya, T. M., & Makwana, D. R. (2013). Review on determining number of cluster in K-Means clustering. International Journal of Advance Research in Computer Science and Management Studies, 90-95.
Maryanto, B. (2017). BIG DATA DAN PEMANFAATANNYA DALAM BERBAGAI SEKTOR. Media Informatika, 14-19.
Maulida. (2020). TEKNIK PENGUMPULAN DATA DALAM METODOLOGI PENELITIAN. Jurnal Ilmiah Islam dan Sosial, 32-39.
Munawar, & Silitonga, Y. R. (2019). SISTEM PENDETEKSI BERITA HOAX DI MEDIA SOSIAL DENGAN TEKNIK DATA MINING SCIKIT LEARN. Jurnal Ilmu Komputer, 173-179.
Perkovic, L. (2012). Introduction to Computing Using Python: an Application Development Focus. Hoboken: J. Wiley & Sons.
Putri, E. K., & Setiadi, T. (2014). PENERAPAN TEXT MINING PADA SISTEM KLASIFIKASI EMAIL SPAM MENGGUNAKAN NAIVE BAYES. Jurnal Sarjana Teknik Informatika, 73-83.
Rosell, M. (2009). Text Clustering Exploration. Stockholm: Universitetsservice US AB.
Saitta, S., Raphael, B., & Smith, I. (2008). A Comprehensive Validity Index for Clustering. Intelligent Data Analysis, Vol. 12, No. 6, 529-548.
Sammut, C., & Webb, G. I. (2011). Encyclopedia of Machine Learning. Boston: Springer.
Setiawan, D. F., Tristiyanto, & Hijriani, A. (2020). APLIKASI WEB SCRAPING DESKRIPSI PRODUK. Jurnal TEKNOINFO, 41-47.
Solikin, A. F., Kusrini, & Wibowo, F. W. (2021). Evaluasi Cluster Data Interkomparasi Anak Timbangan Dengan Algoritma Self Organizing Maps. SISFOTENIKA, 208-219.
Turland, M. (2010). php|architect's Guide to Web Scraping. Toronto: Marco Tabini & Associates, Inc.
Tutupary, S. E., & Aldianto, L. (2014). THE BENEFITS OF MANAGEMENT INFORMATION SYSTEM ON THE EFFECTIVENESS AND EFFICIENCY OF THE ONLINE BUSINESS. JOURNAL OF BUSINESS AND MANAGEMENT, 835-849.
Witten , I. H., Frank, E., & Hall, M. A. (2011). Data Mining: Practical Machine Learning Tools and Techniques. Massachusetts: Morgan Kaufmann.
Yudiarta, N. G., Sudarma, M., & Ariastina, W. G. (2018). Penerapan Metode Clustering Text Mining Untuk Pengelompokan Berita Pada Unstructured Textual Data. Majalah Ilmiah Teknologi Elektro, 339-344.
Averina, A., Hadi, H., & Siswantoro, J. (2022). Analisis Sentimen Multi-Kelas Untuk Film Berbasis Teks Ulasan Menggunakan Model Regresi Logistik. TEKNIKA, 123-128.
Berry, M. W., & Kogan, J. (2010). Text Mining: Applications and Theory. United Kingdom: Wiley.
Chen, Z. L. (2022). Research and Application of Clustering Algorithm for Text Big Data. Computational Intelligence and Neuroscience, 1-8.
Handoyo, R., Rumami M, R., & Nasution, S. M. (2014). PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN. JSM STMIK Mikroskil, 73-82.
Harahap, B. (2019). Penerapan Algoritma K-Means Untuk Menentukan Bahan Bangunan Laris (Studi Kasus Pada UD. Toko Bangunan YD Indarung). Regional Development Industry & Health Science, Technology and Art of Life, 394-403.
Indraloka, D. S., & Santosa, B. (2017). Penerapan Text Mining untuk Melakukan Clustering Data Tweet Shopee Indonesia. JURNAL SAINS DAN SENI ITS, 51-56.
Josi, A., Abdillah, L. A., & Suryayusra. (2022). PENERAPAN TEKNIK WEB SCRAPING PADA MESIN PENCARI ARTIKEL ILMIAH. UNIVERSITAS BINA DARMA, 159-164.
Jumeilah, F. S. (2017). Penerapan Support Vector Machine (SVM) untuk Pengkategorian Penelitian. JURNAL RESTI (Rekayasa Sistem dan Teknologi Informasi), 19-25.
Kodinariya, T. M., & Makwana, D. R. (2013). Review on determining number of cluster in K-Means clustering. International Journal of Advance Research in Computer Science and Management Studies, 90-95.
Maryanto, B. (2017). BIG DATA DAN PEMANFAATANNYA DALAM BERBAGAI SEKTOR. Media Informatika, 14-19.
Maulida. (2020). TEKNIK PENGUMPULAN DATA DALAM METODOLOGI PENELITIAN. Jurnal Ilmiah Islam dan Sosial, 32-39.
Munawar, & Silitonga, Y. R. (2019). SISTEM PENDETEKSI BERITA HOAX DI MEDIA SOSIAL DENGAN TEKNIK DATA MINING SCIKIT LEARN. Jurnal Ilmu Komputer, 173-179.
Perkovic, L. (2012). Introduction to Computing Using Python: an Application Development Focus. Hoboken: J. Wiley & Sons.
Putri, E. K., & Setiadi, T. (2014). PENERAPAN TEXT MINING PADA SISTEM KLASIFIKASI EMAIL SPAM MENGGUNAKAN NAIVE BAYES. Jurnal Sarjana Teknik Informatika, 73-83.
Rosell, M. (2009). Text Clustering Exploration. Stockholm: Universitetsservice US AB.
Saitta, S., Raphael, B., & Smith, I. (2008). A Comprehensive Validity Index for Clustering. Intelligent Data Analysis, Vol. 12, No. 6, 529-548.
Sammut, C., & Webb, G. I. (2011). Encyclopedia of Machine Learning. Boston: Springer.
Setiawan, D. F., Tristiyanto, & Hijriani, A. (2020). APLIKASI WEB SCRAPING DESKRIPSI PRODUK. Jurnal TEKNOINFO, 41-47.
Solikin, A. F., Kusrini, & Wibowo, F. W. (2021). Evaluasi Cluster Data Interkomparasi Anak Timbangan Dengan Algoritma Self Organizing Maps. SISFOTENIKA, 208-219.
Turland, M. (2010). php|architect's Guide to Web Scraping. Toronto: Marco Tabini & Associates, Inc.
Tutupary, S. E., & Aldianto, L. (2014). THE BENEFITS OF MANAGEMENT INFORMATION SYSTEM ON THE EFFECTIVENESS AND EFFICIENCY OF THE ONLINE BUSINESS. JOURNAL OF BUSINESS AND MANAGEMENT, 835-849.
Witten , I. H., Frank, E., & Hall, M. A. (2011). Data Mining: Practical Machine Learning Tools and Techniques. Massachusetts: Morgan Kaufmann.
Yudiarta, N. G., Sudarma, M., & Ariastina, W. G. (2018). Penerapan Metode Clustering Text Mining Untuk Pengelompokan Berita Pada Unstructured Textual Data. Majalah Ilmiah Teknologi Elektro, 339-344.
Unduhan
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2023 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
Artikel ini berlisensiCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.