Analisis Sentimen Terhadap Kenaikan Cukai Rokok pada Media Sosial Twitter menggunakan Algoritma Naive Bayes Classifier
Kata Kunci:
Analisis sentimen, Kenaikan cukai rokok , Naive Bayes, Twitter, SMOTE.Abstrak
Media sosial merupakan wadah untuk masyarakat dalam menyampaikan pendapat, dan juga kritik. Media sosial yang sering digunakan masyarakat Indonesia untuk menyampaikan pendapat adalah Twitter. Twitter dapat menjadi wadah masyarakat Indonesia untuk menyampaikan pendapat serta aspirasi mereka terhadap suatu hal, seperti kebijakan yang dibuat oleh pemerintah. Salah satu kebijakan yang menuai perbincangan masyarakat di media sosial Twitter adalah kenaikan cukai rokok sebesar rata-rata 10% mulai tahun 2023. Kebijakan tersebut menuai pro dan kontra dari masyarakat, oleh karena itu dapat dilakukan analisis terhadap sentimen masyarakat terhadap kebijakan kenaikan cukai rokok. Penelitian ini akan menganalisis sentimen masyarakat yang tertampung dalam tweet soal kenaikan cukai rokok ke dalam klasifikasi sentimen positif dan negatif. Proses klasifikasi diimplementasikan pada Google Colaboratory dengan algoritme Naive Bayes Classifier. Proses dalam analisis sentimen meliputi pengumpulan data, pelabelan manual, text preprocessing, pembobotan TF-IDF, balancing data dengan Synthetic Minority Oversampling Technique (SMOTE), validasi data menggunakan k-fold cross validation, dan pengujian hasil klasifikasi dengan confusion matrix. Hasil akurasi terbaik sebesar 74% yang didapat dengan menggunakan data balance hasil SMOTE dengan perbandingan data latih:data uji sebesar 90%:10%, text preprocessing, pembobotan TF-IDF, dan menggunakan Multinomial Naive Bayes. Score cross validation tertinggi yang didapat yaitu 78% dengan rata-rata 73%. Berdasarkan hasil tersebut, Naive Bayes Classifier cukup baik sebagai alternatif untuk analisis sentimen.