Peringkasan Teks Otomatis Pada Artikel Berita Hiburan Berbahasa Indonesia Menggunakan Metode BM25
Kata Kunci:
peringkasan teks otomatis, text mining, bm25, compression rateAbstrak
Salah satu kegiatan yang paling sering dilakukan pengguna internet Indonesia adalah membaca berita. Lebih dari 50% pengguna internet Indonesia memanfaatkan internet untuk membaca berita. Namun, masalah akan muncul apabila isi dari artikel adalah teks yang panjang sehingga pembacanya membutuhkan waktu untuk membaca dan memahami isi dari artikel tersebut. Salah satu cara agar pengguna tetap dapat membaca dan memahami isi artikel dengan cepat adalah dengan membaca ringkasannya. Maka dari itu diperlukan sistem peringkas teks otomatis secara ekstratif pada artikel berita hiburan dengan tujuan menekankan informasi utama dan membantu pembaca memperoleh informasi utama dari teks dengan cepat tanpa perlu membaca seluruh isi teks atau dokumen. Penelitian ini menggunakan metode BM25 yang merupakan metode pembobotan kalimat yang mengurutkan kalimat berdasarkan term yang muncul pada setiap kalimat dalam dokumen. BM25 menggunakan pembobotan tf idf untuk pembobotan kata dan hubungan antara term dan tiap kalimat dalam dokumen dipengaruhi oleh parameter bebas k1 dan b. Berdasarkan hasil pengujian didapatkan bahwa peringkasan teks dengan metode BM25 memperoleh nilai rata-rata precision, recall, dan f-measure terbaik saat nilai compression rate yang digunakan adalah 30%. Dimana nilai rata-rata precision, recall, dan f-measure secara berurutan adalah sebesar 0,730, 0,738, dan 0,734.