Pemerolehan Informasi Artikel terkait Covid-19 dengan menggunakan Metode Vector Space Model dan Word2Vec untuk Query Expansion
Kata Kunci:
pemerolehan informasi, artikel berita COVID-19, TF-IDF, vector space model, word2vec, query expansionAbstrak
COVID-19 telah mengguncang kondisi dunia sejak akhir tahun 2019. Masih banyak masyarakat yang kurang sadar akan risiko COVID-19 meskipun informasi yang diperbaharui. Untuk mencegah mendapatkan informasi yang salah, diperlukan akses yang terpercaya. Jumlah informasi yang disediakan dalam sebuah akses informasi juga tidak sedikit. Dari permasalahan tersebut, diperlukan sistem yang dapat mempermudah masyarakat dalam mencari informasi yang diinginkan dalam akses informasi yang disediakan. Sistem yang cocok digunakan salah satunya adalah pemerolehan informasi artikel COVID-19 berdasarkan kata kunci yang diberikan oleh pengguna. Metode yang dapat digunakan untuk membangun sistem pemerolehan informasi artikel adalah Vector Space Model yang dikombinasikan dengan Query Expansion menggunakan Word2Vec. Tahapan dari sistem pemerolehan informasi artikel adalah melakukan pre-processing dataset, pembobotan kata, pelatihan model Word2Vec, melakukan Query Expansion, menghitung kemiripan dokumen dengan query, pengurutan dokumen artikel. Proses akan menghasilkan 10 dokumen artikel berita terkait COVID-19 yang memiliki kemiripan isi berita dengan kata kunci dari pengguna. Hasil pengujian yang mendapatkan nilai precision@10 dan recall@10 terbaik pada saat sistem menggunakan parameter nilai hidden neuron untuk pelatihan Word2Vec sebanyak 500 dan jumlah kata yang ditambahkan pada tahap Query Expansion sebanyak 40.