Analisis Sentimen Data Ulasan Pengguna Aplikasi TIX ID di Indonesia pada Google Play Store menggunakan Support Vector Machine
Kata Kunci:
Analisis Sentimen, Scraping, Text Preprocessing, TF-IDF, Support Vector Machine, Google Play StoreAbstrak
Review pada Google Play Store merupakan salah satu fitur yang digunakan untuk memberikan suatu penilaian terhadap suatu aplikasi. TIX ID merupakan salah satu perusahaan layanan atau aplikasi pemesanan tiket film bioskop secara online yang dibuat oleh PT Nusantara Elang Sejahtera. Aplikasi ini memberikan layanan seperti memesan tiket film dari bioskop favorit, memilih film online untuk dibeli atau disewa, dan membeli voucher untuk menonton film streaming online. Namun rating yang disertai dengan berbagai ulasan bukan berarti bahwa keinginan atau masalah pengguna terpenuhi dan berhenti untuk melakukan evaluasi dalam peningkatan pelayanan kepada pengguna. Untuk itu diperlukan analisis sentimen yang dapat mengklasifikasikan review sebagai sentimen pengguna. Dalam penelitian ini dilakukan tahap scraping untuk pengumpulan data ulasan pengguna aplikasi, dilanjutkan tahap text preprocessing untuk mengolah data dengan menyeleksi data dan mengubahnya menjadi data yang lebih terstruktur. Data hasil text preprocessing dilakukan pembobotan kata dengan menggunakan metode Term Frequency - Inverse Document Frequency (TF-IDF). Kemudian dilakukan klasifikasi sentimen menggunakan algoritma Support Vector Machine (SVM). Hasil terbaik yang didapatkan dengan algoritma SVM untuk pengujian sentimen 2 kelas dengan data tidakseimbang dengan data positif 274 dan data negatif 100 menggunakan nilai data latih dan data uji 90%:10%, total data dengan 374 data, mengunakan parameter nilai C = 10, percobaan cross validation K=10 dan penggunaan kernel linear. Hasil yang didapatkan untuk nilai rata - rata accuracy 91%, presicion 94%, recall 83% dan f-measure 86%. Hasil terbaik yang didapatkan dengan algoritma SVM untuk pengujian sentimen 2 kelas dengan data seimbang dengan data positif 150 dan data negatif 150 menggunakan nilai data latih dan data uji 90%:10%, total data dengan 300 data, mengunakan parameter nilai C = 0.5, percobaan cross validation K=10 dan penggunaan kernel linear. Hasil pengujian pada data seimbang mendapatkan hasil akurasi tertinggi yakni 94%, precision 94%, recall 94% dan f-measure 94% pada metode Support Vector Machine klasifikasi 2 sentimen.