Analisis Sentimen Ulasan Aplikasi Mobile menggunakan Algoritma Gabungan Naive Bayes dan C4.5 berbasis Normalisasi Kata Levenshtein Distance
Kata Kunci:
analisis sentimen, aplikasi mobile, Naive Bayes, C45, Levenstein DistanceAbstrak
Google Play Store telah menjadi tempat pasar digital terbesar dengan lebih dari 10 juta produk didalamnya. Para pengembang aplikasi menjadikan kolom ulasan produk yang tersedia di Google Play Store menjadi salah satu cara untuk mengetahui kepuasan pengguna. Tapi tidak semua ulasan di aplikasi memiliki keselarasan antara rating dengan komentar, terdapat ulasan yang ambigu, yaitu ulasan yang ditandai oleh rating dan sentimen komentarnya tidak sama. Machine Learning (ML) telah sangat berguna dalam bidang analisis sentimen. Salah satu metode yang handal dan mudah digunakan adalah Naive Bayes. Metode C4.5 juga sangat populer dalam menyelesaikan permasalahan decesion tree yang dimana akan digunakan untuk proses klasifikasi sentimen. Sedangkan metode Levenshtein Disance digunakan untuk membandingkan antara dua buah string untuk proses normalisasi kata. Alur metode dimulai dengan memproses teks awal dataset dengan Levenstein Distance, kemudian dataset akan dibagi dua untuk proses klasifikasi Naive Bayes dan C4.5. Dataset beratribut sentimen teks dan teks ulasan akan diproses oleh metode Naive Bayes sedangkan rating dan sentiment teks akan diproses oleh C4.5. Hasil pengujian dengan metode evaluasi 10-Fold adalah 85,3%. Sedangkan klasifikasi sentimen tanpa menggunakan Levenshtein Distance adalah 85,6% selisih 0,3% menjadikan metode Levenshtein Distance tidak begitu signifikan mempengaruhi hasil klasifikasi. Hasil pengujian lainnya dengan penerapan batas limit Edit Distance 1, 2, 3 dan 4 masing-masing adalah 86,9%., 85,9%., 87,1% dan 86,1%. Pengujian algoritma Naive Bayes tanpa C4.5 dalam mengklasifikasi teks ulasan memiliki hasil 85,3% selaras dengan pengujian sebelumnya. Hasil pengujian ini menggambarkan efektifitas program ini dalam klasifikasi sentiment aplikasi mobile.