Pemanfaatan Spark untuk Analisis Sentimen Mengenai Netralitas Berita dalam Membahas Pemilu Presiden 2019 Menggunakan Metode Naive Bayes Classifier
Utilization of Spark for Sentiment Analysis Regarding News Neutrality for Discussing the 2019 Presidential Election Using the Naive Bayes Classifier Method
Kata Kunci:
Analisis Sentimen, Confusion Matrix, Naive Bayes Classifier, SparkAbstrak
Sebuah berita yang aktual dan netral merupakan harapan dari masyarakat selaku penerima informasi dari media penyampaian berita. Terutama dalam masa Pemilihan Umum di Indonesia, masih ada berita-berita yang disampaikan secara berpihak atau tidak aktual. Hal tersebut pun membuat masyarakat masih berpandangan bahwa banyak berita yang memiliki unsur keberpihakan dalam memberikan informasi. Maka dari itu, penelitian ini melakukan analisis sentimen berita dari berbagai portal berita yang membahas Pemilu tahun 2019 di Indonesia. Data pada penelitian ini diambil dari berbagai portal berita dan masing-masing portal berita mengambil 20 hingga 25 berita, sehingga akan menghasilkan data yang begitu banyak hingga 100 data. Pada penelitian ini memanfaatkan Resilient Distributed Dataset (RDD) yang dimiliki oleh Spark sebagai tipe data dalam mengklasifikasi sentimen berita. Metode yang digunakan untuk mengklasifikasi sentimen sebuah data (pada kasus ini adalah teks berita) yaitu Naive Bayes Classifier. Metode Naive Bayes memiliki kemampuan yang baik dalam mengklasifikasi sebuah data besar yang tidak terstruktur, serta memiliki model yang sederhana. Penelitian ini menggunakan tabel Confusion Matrix sebagai tabel evaluasi dari hasil klasifikasi sentimen berita, dengan menghitung nilai evaluasi seperti akurasi, presisi, recall, dan F-Measure. Berdasarkan berbagai pengujian dan skenario yang telah dilakukan, nilai evaluasi terbaik dihasilkan pada pengujian menggunakan K-Fold Cross Validation dengan nilai K=10. Pada pecahan (fold) ke-8 menghasilkan nilai akurasi sebesar 100%, presisi sebesar 100%, recall sebesar 100%, dan F-Measure sebesar 100%.