Pencarian Berita Berbahasa Indonesia Menggunakan Metode BM25
Kata Kunci:
berita, mesin pencari, text mining, sistem temu kembali informasi, BM25Abstrak
Perkembangan teknologi yang semakin pesat berdampak pada meningkatnya penggunaan internet sebagai sumber penyedia informasi online dari seluruh dunia. Dalam pencarian informasi pengguna menggunakan bantuan sebuah mesin pencari (search engine). Perkembangan tersebut juga membuat penyimpanan dokumen secara digital meningkat. Berita merupakan sumber informasi mengenai suatu peristiwa atau pendapat yang memiliki nilai penting dan menarik untuk dipublikasikan secara luas melalu media massa. Tidak terbatasnya jangkauan pembaca serta efisiensi waktulah yang membuat berbagai media pemberitaan beralih menjadi media online. Information retrieval bertujuan untuk menghasilkan dokumen yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis berdasarkan keyword pada query yang diberikan oleh pengguna. Penerapan information retrieval diharapkan mampu mempermudah pencarian informasi serta mendapatkan hasil yang akurat. BM25 merupakan sebuah sistem dalam proses pemeringkatan yang digunakan untuk mengurutkan hasil kecocokan (similarity) terhadap seluruh dokumen training berdasarkan query yang dicari. Metode BM25 dikategorikan sebagai metode terbaik dalam kelas best match. Pengujian dilakukan berdasarkan nilai precision @k dan nilai r-precision terhadap 12 query. Hasil pengujian nilai precision @k terbaik pada saat nilai k=5, yakni dengan nilai 0,83. Sedangkan hasil pengujian nilai r-precision terbaik dengan nilai 1.