Klasifikasi Sinopsis Novel berdasarkan Jenis Genre menggunakan Multi-class Support Vector Machine dan Chi-square
Kata Kunci:
Klasifikasi, Text Mining, Chi-square, Support Vector Machine, Sinopsis NovelAbstrak
Novel merupakan salah satu bentuk karya sastra populer yang terkenal dan dibaca secara luas di seluruh dunia. Novel umumnya panjang dan memiliki banyak jenis genre. Namun kebanyakan novel memiliki sampul yang sederhana dan hanya memiliki judul yang singkat dan sinopsis. Minimnya informasi genre pada sampul mengakibatkan susah untuk mengetahui genre sebuah novel. Dari permasalahan tersebut, dikembangkan sistem klasifikasi novel dengan memanfaatkan informasi sinopsis novel menggunakan Algoritme Multi-class Support Vector Machine (SVM) dengan pendekatan One-Against-All. Pendekatan TF-IDF dan Chi-square juga digunakan untuk memberi bobot dan menyeleksi fitur. Dua kernel SVM, yaitu kernel linear dan kernel gaussian diimplementasikan dalam penelitian ini untuk mendapatkan akurasi klasifikasi terbaik. 240 teks sinopsis yang dibagi dalam 4 jenis genre, yaitu horror, romantis, sci-fi, dan sejarah digunakan sebagai dataset pelatihan dan pengujian. Pengujian dilakukan dengan mengubah jenis kernel, nilai threshold Chi-square, dan parameter sequential training untuk mendapatkan nilai akurasi klassifikasi terbaik. Hasil pengujian menunjukkan bahwa nilai akurasi klasifikasi tertinggi sebesar 94,58% didapatkan pada threshold Chi-square sebesar 80%, SVM dengan kernel linear, parameter sequential training lambda (λ) = 0,5, gamma (γ) = 0,05, complexity (C) = 1, epsilon (ε) = 0,0001, dan jumlah iterasi maksimum adalah 100 iterasi.