Penerapan Analisis Sentimen untuk Menilai Suatu Produk pada Twitter Berbahasa Indonesia dengan Metode Naive Bayes Classifier dan Information Gain

Penerapan Analisis Sentimen untuk Menilai Suatu Produk pada Twitter Berbahasa Indonesia dengan Metode Naive Bayes Classifier dan Information Gain

Penulis

  • Ahmad Wildan Attabi' Fakultas Ilmu Komputer, Universitas Brawijaya
  • Lailil Muflikhah Fakultas Ilmu Komputer, Universitas Brawijaya
  • Mochammad Ali Fauzi Fakultas Ilmu Komputer, Universitas Brawijaya

Kata Kunci:

Analisis Sentimen, Naive Bayes, Information Gain, Twitter, Mustika Ratu

Abstrak

Twitter memiliki peran besar dalam mempengaruhi aspek dari segi sosial, komunikasi, psikologi, marketing, dan politik. Kiriman Tweet komentar atau opini secara tidak langsung akan menjadi sebuah review terhadap penilaian pada suatu produk tersebut. Salah satu sektor produk yang sangat diminati oleh banyak orang saat ini adalah produk kecantikan dan perawatan kulit. Mereka mencari produk yang memiliki kualitas terbaik dengan cara melihat pendapat dari orang lain, sehingga mereka memiliki gambaran yang mempengaruhi minat mereka atas pendapat orang lain yang disampaikan lewat Twitter terkait hasilnya setelah memakai produk tersebut. Analisis sentimen dapat membantu dalam menganalisis dan mengklasifikasikan menjadi kelas positif dan kelas negatif dari pendapat orang yang ada di twitter terkait produk yang bersangkutan untuk dicari nilai kecenderungan pasarnya dan kualitas produk pada pandangan publik. Opini dan komentar terkait produk Mustika Ratu dipilih untuk mewakili obyek penelitian ini, dengan alasan pertumbuhan ekonomi dan banyaknya pengguna dari Musitka ratu yang merupakan perusahaan di bidang perawatan kulit dan kecantikan. Metode Naive Bayes Classifier dipilih untuk alasan kemudahan dalam implementasinya, dan memiliki performa cepat dalam melatih, sedangkan penambahan Information Gain diperlukan untuk proses seleksi fitur dengan mengurangi keberadaan kata yang tidak relevan pada data yang digunakan. Pengujian dilakukan dengan jumlah data sebanyak 200 (100 dokumen positif, dan 100 dokumen negatif) menggunakan kisaran nilai threshold : 0, 0.01, 0.02, 0.03, 0.04, 0.05, 0.06, 0.07, 0.08, 0.09, dan 0.10. Hasil yang diperoleh terdapat peningkatan akurasi dengan selisih 4%, nilai rata-rata akurasi jika tanpa menggunakan metode Information Gain (threshold 0) sebesar 70%, sedangkan dengan menggunakan metode Information Gain (threshold 0.01) sebesar 74%. Hal ini dipengaruhi oleh beberapa faktor diantaranya jumlah data latih dan persebaran jenis kata pada data latih dokumen positif maupun dokumen negatif. Nilai akurasi yang paling tinggi didapatkan pada K1 (threshold 0.02), kemudian K5, K6 (threshold 0.01), dan K7 (threshold 0.02 dan 0,08) dengan presentase 85%, sedangkan pada k bagian tertentu dengan threshold tertentu memperoleh titik terendah sebesar 50%.

Unduhan

Diterbitkan

23 Apr 2018

Cara Mengutip

Attabi', A. W., Muflikhah, L., & Fauzi, M. A. (2018). Penerapan Analisis Sentimen untuk Menilai Suatu Produk pada Twitter Berbahasa Indonesia dengan Metode Naive Bayes Classifier dan Information Gain. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 2(11), 4548–4554. Diambil dari https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/2984

Terbitan

Bagian

Artikel
Loading...