Klasifikasi Dokumen Tumbuhan Obat Menggunakan Metode Improved K-Nearest Neighbor

##plugins.themes.bootstrap3.article.main##

Arinda Ayu Puspitasari Edy Santoso Indriati Indriati

Abstrak

Tingkat pemanfaatan tumbuhan obat yang semakin tinggi memicu banyaknya penelitian terhadap tumbuhan obat. Penelitian-penelitian tersebut tentu memerlukan dokumentasi yang berisi informasi tentang tumbuhan obat. Dokumentasi yang banyak dan tersebar menyebabkan kesulitan dalam pencarian informasi seputar tumbuhan obat. Untuk mengatasi permasalahan tersebut dibutuhkan sebuah sistem yang dapat mengklasifikasikan dokumen tumbuhan obat secara otomatis agar pencarian informasi terkait dapat dilakukan dengan lebih efektif dan efisien. Salah satu metode yang sering digunakan dalam klasifikasi teks adalah k-Nearest Neighbor, tetapi memiliki kelemahan pada akurasi karena penggunaan nilai k yang sama pada semua kategori. Nilai k adalah jumlah data latih terdekat terhadap data uji. Untuk mengatasi permasalahan tersebut digunakan metode Improved k-Nearest Neighbour di mana nilai k akan disesuaikan dengan jumlah data latih yang dimiliki setiap kategori. Dari hasil pengujian pengaruh pertambahan nilai k diperoleh rata-rata F1-measure sebesar 70,99%. Pengujian variasi data latih menunjukkan bahwa semakin besar jumlah data latih maka semakin tinggi nilai rata-rata akurasinya, sedangkan untuk pengujian data latih tidak seimbang diperoleh nilai F1-measure data latih seimbang 1,9% lebih baik dari data latih tidak seimbang.

##plugins.themes.bootstrap3.article.details##

Cara Sitasi
Puspitasari, A., Santoso, E., & Indriati, I. Klasifikasi Dokumen Tumbuhan Obat Menggunakan Metode Improved K-Nearest Neighbor. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 2, no. 2, p. 486-492, agu. 2017. ISSN 2548-964X. Tersedia pada: <http://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/862>. Tanggal Akses: 20 okt. 2019
Bagian
Artikel