Peringkasan Literatur Ilmu Komputer Bahasa Indonesia Berbasis Fitur Statistik dan Linguistik menggunakan Metode Gaussian Naïve Bayes

##plugins.themes.bootstrap3.article.main##

Muhammad Fhadli Mochammad Ali Fauzi Tri Afirianto

Abstrak

Di tengah era dengan kebutuhan data yang besar ini, peringkasan teks merupakan suatu kebutuhan. Dengan peringkasan teks, setiap orang bisa mendapatkan informasi yang mendeskripsikan keseluruhan data teks yang besar hanya dengan beberapa kalimat. Permasalahan dalam peringkasan teks adalah kualitas hasil ringkasan. Salah satu metode untuk meringkas teks yang dikenal adalah metode TF-IDF, metode ini merupakan metode peringkasan dengan pendekatan statistik. Pendekatan lain untuk meringkas teks adalah pendekatan linguistik. Pada umunya, ringkasan dari sebuah teks terdiri atas kalimat-kalimat yang memiliki fitur-fitur linguistik seperti jumlah kata, jumlah kata kunci, dan posisi kalimat pada teks asli. Fitur-fitur tersebut dapat digunakan untuk mengklasifikasikan suatu kalimat baru kedalam kelas ringkasan atau kelas bukan ringkasan. Hasil peringkasan diperoleh dari kumpulan kalimat pada kelas ringkasan. Pada penelitian ini, penulis melakukan penggabungan fitur statistik dan fitur linguistik untuk melakukan peringkasan teks. Hasil pengujian penelitian ini menunjukkan peringkasan dengan fitur statistik dan linguistik menggunakan metode Naïve Bayes memiliki nilai rata-rata f- score 0,206538 dan nilai rata-rata relative utility 0,116657.

##plugins.themes.bootstrap3.article.details##

Cara Sitasi
Fhadli, M., Fauzi, M., & Afirianto, T. Peringkasan Literatur Ilmu Komputer Bahasa Indonesia Berbasis Fitur Statistik dan Linguistik menggunakan Metode Gaussian Naïve Bayes. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 1, no. 4, p. 307-319, mei 2017. ISSN 2548-964X. Tersedia pada: <http://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/100>. Tanggal Akses: 30 mar. 2020
Bagian
Artikel