Analisis Sentimen berbasis Aspek terhadap Ulasan Hotel Tentrem Yogyakarta menggunakan Algoritma Random Forest Classifier
Kata Kunci:
Analisis Sentimen, Web Scraping, Data Mining, Random ForestAbstrak
Perkembangan pariwisata mengalami peningkatan kunjungan yang linier dengan industri perhotelan di Indonesia. Salah satu hotel bintang lima yang populer adalah Hotel Tentrem Yogyakarta. Banyaknya data ulasan hotel tersebut membuat pengunjung bingung untuk mengambil keputusan secara tepat. Analisis sentimen dapat mengatasi masalah tersebut dengan cara mengolah data teks ulasan yang tidak berstruktur menjadi informasi yang bernilai positif, negatif ataupun netral. Kategori aspek juga dilakukan agar pengunjung lebih mudah dalam mencari ulasan sesuai dengan tujuannya. Aspek yang digunakan pada penelitian ini yaitu aspek kamar, aspek pelayanan, aspek lokasi, aspek kolam renang, dan aspek gym. Data ulasan hotel diperoleh dengan teknik scraping menggunakan Webscraper.io pada situs Tripadvisor. Klasifikasi dilakukan menggunakan algoritma Random Forest Classifier dan pembobotan kata Term Frequency-Inverse Document Frequency (TF-IDF). Setelah dilakukan analisa pengujian, aspek yang digunakan hanya aspek kamar karena memilki proporsi sentimen yang seimbang dibanding aspek lainnya. Proporsi sentimen dinilai penting dalam klasifikasi sentimen. Pengujian dilakukan berdasarkan skenario parameter jumlah tree dan kedalaman tree. Jumlah tree yang digunakan pada penelitian ini sebanyak 300 dan kedalaman tree 10. Hasil pengujian membuktikan bahwa semakin besar jumlah tree dan kedalaman tree maka semakin baik hasil prediksi. Hasil klasifikasi terbaik kedua parameter terhadap aspek kamar yaitu 90% untuk nilai akurasi dan skor f1-nya.