Klasifikasi Pertanyaan COVID-19 Bahasa Indonesia menggunakan Naive Bayes

Klasifikasi Pertanyaan COVID-19 Bahasa Indonesia menggunakan Naive Bayes

Penulis

  • Glenn Jonathan Satria Fakultas Ilmu Komputer, Universitas Brawijaya
  • Putra Pandu Adikara Fakultas Ilmu Komputer, Universitas Brawijaya
  • Randy Cahya Wihandika Fakultas Ilmu Komputer, Universitas Brawijaya

Kata Kunci:

Naive Bayes, Preprocessing, Klasifikasi Pertanyaan

Abstrak

Question Answering (QA) adalah sistem yang dapat memberikan jawaban dari pertanyaan yang diberikan oleh pengguna. Dalam QA terdapat satu tugas yang bernama analisis pertanyaan. Analisis pertanyaan berguna untuk memilih tipe pertanyaan apa yang diberikan pengguna melalui query. Analisis pertanyaan bisa dicari menggunakan klasifikasi. Penelitian ini menggunakan Naive Bayes sebagai metode klasifikasi. Selain itu, digunakan beberapa proses dalam pemrosesan bahasa alami seperti ekstraksi fitur kata tanya dan preprocessing yang berisi data cleaning, stemming, stopword removal, dan tokenization. Tahap selanjutnya adalah membangun model klasifikasi melalui data latih yang berisi 16 kategori pertanyaan. Berdasarkan hasil pengujian dengan 2 skenario yaitu menggunakan preprocessing dan tidak menggunakan preprocessing, menghasilkan nilai akurasi menggunakan preprocessing sebesar 0,58634. Pengujian tanpa menggunakan preprocessing menghasilkan nilai akurasi sebesar 0,65060. Penggunaan preprocessing dalam klasifikasi pertanyaan berpengaruh negatif karena berhubungan dengan konteks pertanyaan yang diberikan.

Unduhan

Diterbitkan

22 Dec 2021

Cara Mengutip

Satria, G. J., Adikara, P. P., & Wihandika, R. C. (2021). Klasifikasi Pertanyaan COVID-19 Bahasa Indonesia menggunakan Naive Bayes. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 6(1), 148–153. Diambil dari https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/10382

Terbitan

Bagian

Artikel
Loading...