Analisis Sentimen terhadap Karyawan Dirumahkan pada Media Sosial Twitter menggunakan Fitur N-Gram dan Pembobotan Augmented TF - IDF Probability dengan K-Nearest Neighbour
Kata Kunci:
analisis sentimen, unigram, bigram, Augmented TF, IDF Probability, KNNAbstrak
Analisis sentimen adalah metode yang umum digunakan untuk menemukan emosi dalam sebuah kalimat berdasarkan isinya. Analisis sentimen adalah salah satu metode text mining dan menggunakan proses preprocessing teks yang diikuti dengan proses yang disebut pemerataan kata. Jumlah kasus virus corona atau COVID 19 di Indonesia melebihi 6.000 hingga Sabtu sore (18 April 2020). Sebanyak 11 daerah di Indonesia telah menerapkan PSBB dengan DKI Jakarta sebagai kota pertama. Banyak perusahaan yang secara permanen memutuskan hubungan kerja dengan karyawannya karena pandemi virus corona. Ada pemecatan sementara, pemecatan sementara, pekerjaan paruh waktu, pemotongan upah, dll. Ada beberapa tahapan dalam penelitian ini. Yaitu, pemrosesan awal dokumen, penggunaan fungsi unigram dan bigram, dan pembobotan kata dengan probabilitas TF-IDF yang diperluas, diungkapkan oleh metode K-nearest neighbor. 250 data latih dan 100 data uji akan digunakan sebagai data. Hasil terbaik dari penelitian ini pada nilai unigram K = 3 yaitu akurasi 0,68, akurasi 0,415, memori 0,404, dan pengukuran 0,406. Untuk nilai bigram, presisi 0,776, presisi 0,591, recall 0,408, dan fmess 0,437. Pemilihan istilah unigram dan bigram berpengaruh signifikan terhadap hasil penelitian ini. Seperti yang Anda lihat, hasil dari setiap nilai evaluasi yang dilakukan menunjukkan perbedaan nilai yang cukup besar.