Komparasi Metode Data Mining Support Vector Machine dengan Naive Bayes untuk Klasifikasi Status Kualitas Air
Kata Kunci:
kualitas air, Support Vector Machine,, Naive Bayes, K-Fold Cross Validation, Threshold, C, γ, λ, iterasi maksimal, σAbstrak
Air terbentuk dari senyawa kimia yang memiliki fungsi yang sangat penting untuk makhluk hidup dalam melangsungkan kehidupannya. Dalam dunia ini diketahui bahwa wiayah air lebih luas daripada wilayah daratan, dimana wilayah air sekitar 71% dari daratan dan mengelilingnya. Air yang dimaksud dalam hal ini termasuk salju dan uap pada udara, air rawa, air pada tanah, danau, sungai, dan air laut. Dalam menentukan klasifikasi dari sebuah kualitas air digunakan metode Support Vector Machine dan Naive Bayes. Metode ini dipilih karena penelitian sebelumnya menghasilkan nilai akurasi tinggi. Adapun parameter-parameter yang digunakan adalah derajat keasaman (pH), TDS, NO2, NO3, kesadahan, khlorida, mangan. Metode Suppord Vector Machine dan Naive Bayes akan memberikan keluaran hasil perbandingan akurasi antara kedua metode tersebut. Pengujian pada sistem dilakukan dengan menggunakan pengujian K-Fold Cross Valadation dengan mendapatakan hasil akurasi tertinggi ketika K=9 untuk metode Support Vector Machine dan K=5 untuk metode Naive Bayes. Pengujian parameter untuk metode Support Vector Machine mendapatkan akurasi tertinggi ketika nilai thresholdnya , C=3, =0,01, =2,5, nilai iterasi maksimal=1, =0,1. Dari pengujian tersebut didapatkanlah hasil akurasi untuk metode Support Vector Machine sebesar 78,70% dan metode Naive Bayes sebesar 85,70%. Dari hasil yang didapatkan klasifikasi status kualitas air yang paling bagus adalah metode Naive Bayes dibandingkan dengan metode Support Vector Machine dikarenakan rata-rata akurasi dari metode Naive Bayes lebih tinggi.