Klasifikasi Tweet Berbahasa Indonesia Berisi Ujaran Kebencian Menggunakan Metode Improved K-Nearest Neighbor dengan Pembobotan BM25F

Klasifikasi Tweet Berbahasa Indonesia Berisi Ujaran Kebencian Menggunakan Metode Improved K-Nearest Neighbor dengan Pembobotan BM25F

Penulis

  • Nurdifa Febrianti Fakultas Ilmu Komputer, Universitas Brawijaya
  • Indriati Indriati Fakultas Ilmu Komputer, Universitas Brawijaya
  • Muhammad Tanzil Furqon Fakultas Ilmu Komputer, Universitas Brawijaya

Kata Kunci:

Ujaran Kebencian, Tweet, Hashtag, Improved K-Nearest Neighbor, BM25F

Abstrak

Ujaran kebencian ialah tindakan kebencian verbal yang menargetkan sekelompok orang atau bagian dari komunitas tertentu. Di Indonesia, ujaran kebencian semakin banyak ditemukan, terutama pada media sosial berbasis utama teks seperti Twitter. Sehingga menginspirasi ditulisnya penelitian ini, untuk mengidentifikasi ujaran kebencian di Twitter dengan klasifikasi tweet, khususnya yang berbahasa Indonesia.  Penulis memilih menggunakan Improved K-Nearest Neighbor dengan menggunakan pembobotan kata BM25F, yaitu pembobotan yang mempertimbangkan field/stream dalam dokumen. Sehingga tweet yang dipilih sebagai dokumen latih dan dokumen uji penelitian, terdiri atas 2 stream, yaitu tweet dan hashtag atau tagar (tanda pagar). Dilakukan pengujian K-Fold Cross Validation (dengan K = 5) terhadap parameter k untuk klasifikasi IKNN, bs, vs, dan k1 untuk pembobotan BM25F, dengan 400 dokumen latih dan 100 dokumen uji. Hasil pengujian menunjukkan bahwa penentuan nilai bobot stream pada BM25F cukup mempengaruhi hasil klasifikasi IKNN. Sedangkan hasil akhir terbaik untuk F-Measure, Accuracy, Precision, dan Recall dari rerata 5-Fold Cross Validation yang didapatkan ialah 79,77% , 68,80%, 68,80%, dan 89,92% dengan k = 70,  bs= 0,6, v1 = 2,  v2= 5 dan  k1= 2 sebagai nilai terbaik untuk masing-masing parameternya.

Unduhan

Diterbitkan

17 Jan 2020

Cara Mengutip

Febrianti, N., Indriati, I., & Furqon, M. T. (2020). Klasifikasi Tweet Berbahasa Indonesia Berisi Ujaran Kebencian Menggunakan Metode Improved K-Nearest Neighbor dengan Pembobotan BM25F. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 3(10), 9941–9949. Diambil dari https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/6556

Terbitan

Bagian

Artikel
Loading...