Klasifikasi Pertanyaan COVID-19 Bahasa Indonesia menggunakan Naive Bayes
Kata Kunci:
Naive Bayes, Preprocessing, Klasifikasi PertanyaanAbstrak
Question Answering (QA) adalah sistem yang dapat memberikan jawaban dari pertanyaan yang diberikan oleh pengguna. Dalam QA terdapat satu tugas yang bernama analisis pertanyaan. Analisis pertanyaan berguna untuk memilih tipe pertanyaan apa yang diberikan pengguna melalui query. Analisis pertanyaan bisa dicari menggunakan klasifikasi. Penelitian ini menggunakan Naive Bayes sebagai metode klasifikasi. Selain itu, digunakan beberapa proses dalam pemrosesan bahasa alami seperti ekstraksi fitur kata tanya dan preprocessing yang berisi data cleaning, stemming, stopword removal, dan tokenization. Tahap selanjutnya adalah membangun model klasifikasi melalui data latih yang berisi 16 kategori pertanyaan. Berdasarkan hasil pengujian dengan 2 skenario yaitu menggunakan preprocessing dan tidak menggunakan preprocessing, menghasilkan nilai akurasi menggunakan preprocessing sebesar 0,58634. Pengujian tanpa menggunakan preprocessing menghasilkan nilai akurasi sebesar 0,65060. Penggunaan preprocessing dalam klasifikasi pertanyaan berpengaruh negatif karena berhubungan dengan konteks pertanyaan yang diberikan.