Analisis Sentimen Opini Masyarakat Terhadap Fenomena TikTokShop di Indonesia Menggunakan Metode K-Nearest Neighbor berbasis N-gram dengan Seleksi Fitur Information Gain
Kata Kunci:
Analisis Sentimen, K-Nearest Neighbor, N-Gram, Information Gain, TikTokShopAbstrak
TikTokShop merupakan fitur terbaru yang diperkenalkan dalam platform TikTok. Di tengah popularitasnya yang sedang melonjak pemerintah Indonesia secara mendadak mengambil keputusan untuk menutup akses ke fitur ini. Keputusan ini telah menyebabkan masyarakat memiliki pandangan tersendiri terhadap suatu kebijakan pemerintah baik itu positif (mendukung) ataupun negatif (menyangkal). Opini masyarakat terhadap TikTokShop tersebar luas di media sosial, termasuk dalam kolom komentar pada platform youtube yang sangat masif diperbincangkan. Analisis Sentimen menjadi kunci untuk memahami pandangan mendalam masyarakat terhadap kebijakan ini. Analisis Sentimen pada penelitian ini menggunakan kombinasi metode K-Nearest Neighbors (KNN) berbasis N-Gram dan Information Gain sebagai seleksi fitur. Fitur N-Gram yang digunakan dalam penelitian ini adalah fitur Unigram, Bigram dan Gabungan Unigram-Bigram. Berdasarkan pengujian yang telah dilakukan, didapatkan hasil bahwa nilai terbaik terdapat pada fitur Unigram dan nilai threshold yang digunakan adalah 100%, menghasilkan akurasi sebesar 89%, dengan recall 89%, Precision sebesar 89.00%, dan F-Measure sebesar 89.00%. Berdasarkan temuan tersebut, dapat disimpulkan bahwa dalam menganalisis sentimen opini masyarakat Indonesia terhadap TikTokShop, metode K-Nearest Neighbor (KNN) dengan fitur Unigram dan tanpa seleksi fitur Information Gain memberikan hasil terbaik.
Referensi
Cholissodin, I., & Soebroto, A. (2019). Buku Ajar AI, Machine Learning & Deep Learning.
Chormunge, S., & Jena, S. (2016). Efficient Feature Subset Selection Algorithm for High Dimensional Data. International Journal of Electrical and Computer Engineering (IJECE), 6, 1880–1888. https://doi.org/10.11591/ijece.v6i4.9800
Chuzaimah Zulkifli, U. (2018). Pengembangan Modul PreprocessingTeks untuk Kasus Formalisasi dan Pengecekan Ejaan Bahasa Indonesia pada Aplikasi Web Mining Simple Solution (WMSS). Jurnal Matematika Statistika Dan Komputasi, 15(2). https://doi.org/10.20956/jmsk.v15i2.5718
Cunningham, P., & Delany, S. J. (2021). K-Nearest Neighbour Classifiers-A Tutorial. In ACM Computing Surveys (Vol. 54, Issue 6). Association for Computing Machinery. https://doi.org/10.1145/3459665
Fauzi, M. A., Utomo, D. C., Pramukantoro, E. S., & Setiawan, B. D. (2017). Automatic essay scoring system using N-GRAM and cosine similarity for gamification based elearning. ACM International Conference Proceeding Series, Part F1312(October), 151–155. https://doi.org/10.1145/3133264.3133303
Huq, M. R., Ali, A., & Rahman, A. (2017). Sentiment Analysis on Twitter Data using KNN and SVM. International Journal of Advanced Computer Science and Applications, 8(6). https://doi.org/10.14569/ijacsa.2017.080603
Indriati, I.-, Rahayudi, B., & Dewi, C. (2021). Analisis Sentimen Mengenai Moda Raya Terpadu (MRT) Jakarta dengan Metode BM25 dan K-Nearest Neighbor. Jurnal Teknologi Informasi Dan Ilmu Komputer, 8(2). https://doi.org/10.25126/jtiik.2021824508
Indriati, I., & Ridok, A. (2016a). SENTIMENT ANALYSIS FOR REVIEW MOBILE APPLICATIONS USING NEIGHBOR METHOD WEIGHTED K-NEAREST NEIGHBOR (NWKNN). Journal of Enviromental Engineering and Sustainable Technology, 3(1). https://doi.org/10.21776/ub.jeest.2016.003.01.4
Indriati, I., & Ridok, A. (2016b). Sentiment Analysis for Review Mobile Applications Using Neighbor Method Weighted K-Nearest Neighbor (Nwknn). Journal of Enviromental Engineering and Sustainable Technology, 3(1), 23–32. https://doi.org/10.21776/ub.jeest.2016.003.01.4
Jodha, R., Sanjay Bc, G., & Chowdhary, K. R. (2018). Text Classification using KNN with different Feature Selection Methods. International Journal of Research, 9(1).
Liu, B. (2012). Sentiment analysis and opinion mining. Springer.
Muthia, D. A. (2016). Opinion Mining Pada Review Buku Menggunakan Algoritma Naive Bayes. Jurnal TEKNIK KOMPUTER, II(1), 1–8.
Nafan, M. Z., & Amalia, A. E. (2019). Kecenderungan Tanggapan Masyarakat terhadap Ekonomi Indonesia berbasis Lexicon Based Sentiment Analysis. JURNAL MEDIA INFORMATIKA BUDIDARMA. https://doi.org/10.30865/mib.v3i4.1283
Nurjanah, W. E., Perdana, R. S., & Fauzi, M. A. (2017). Analisis Sentimen Terhadap Tayangan Televisi Berdasarkan Opini Masyarakat pada Media Sosial Twitter menggunakan Metode K-Nearest Neighbor dan Pembobotan Jumlah Retweet. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer (J-PTIIK) Universitas Brawijaya, 1(12), 1750–1757.
Oktaviani Putri, F., & Cahya Wihandika, R. (2020). Analisis Sentimen pada Ulasan Pengguna MRT Jakarta Menggunakan Metode Neighbor-Weighted K-Nearest Neighbor dengan Seleksi Fitur Information Gain. J-Ptiik.Ub.Ac.Id, 4(7).
Onantya, I. D., Indriati, & Adikara, P. P. (2019). Analisis Sentimen Pada Ulasan Aplikasi BCA Mobile Menggunakan BM25 Dan Improved K-Nearest Neighbor. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 3(3), 2575–2580.
Pramono, F., Didi Rosiyadi, & Windu Gata. (2019). Integrasi N-gram, Information Gain, Particle Swarm Optimation di Naïve Bayes untuk Optimasi Sentimen Google Classroom. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 3(3), 383–388. https://doi.org/10.29207/resti.v3i3.1119
Pristiyanti, R. I., Fauzi, M. A., & Muflikhah, L. (2018). Sentiment Analysis Peringkasan Review Film Menggunakan Metode Information Gain dan K-Nearest Neighbor. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer (J-PTIIK) Universitas Brawijaya, 2(3).
Rosiyana, R. N., Agustin, M., Kalka Iskandar, I., & Luckyardi, S. (2021). A NEW DIGITAL MARKETING AREA FOR E-COMMERCE BUSINESS. In International Journal of Research and Applied Technology (Vol. 1, Issue 2).
Sabily, A. F., Adikara, P. P., & Fauzi, M. A. (2019). Analisis Sentimen Pemilihan Presiden 2019 pada Twitter menggunakan Metode Maximum Entropy. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 3(5), 4204–4209.
Saputri, R. P., Winahju, W. S., Fithriasari, K., Statistika, D., Matematika, F., & Data, S. (2019). Klasifikasi Sentimen Wisatawan Candi Borobudur pada Situs TripAdvisor Menggunakan Support Vector Machine dan K-Nearest Neighbor. 8(2).
Singh, R. H., Maurya, S., Tripathi, T., Narula, T., & Srivastav, G. (2020). Movie Recommendation System using Cosine Similarity and KNN. International Journal of Engineering and Advanced Technology, 9(5), 556–559. https://doi.org/10.35940/ijeat.e9666.069520
Suyanto. (2017). DATA MINING: untuk klasfikasi dan klasterisasi data. Informatika.
Tempola, F., Muhammad, M., & Khairan, A. (2018). Perbandingan Klasifikasi Antara KNN dan Naive Bayes pada Penentuan Status Gunung Berapi dengan K-Fold Cross Validation. Jurnal Teknologi Informasi Dan Ilmu Komputer, 5(5). https://doi.org/10.25126/jtiik.201855983
Uǧuz, H. (2011). A two-stage feature selection method for text categorization by using information gain, principal component analysis and genetic algorithm. Knowledge-Based Systems, 24(7). https://doi.org/10.1016/j.knosys.2011.04.014
Wang, Q., Guan, Y., Wang, X. L., & Xu, Z. M. (2006). A Novel Feature Selection Method Based on Category Information Analysis for Class Prejudging in Text Classification. International Journal of Computer Science and Network Security, 6(1a).
Windisch, G., & Csink, L. (2005). Language identification using global statistics of natural languages. Proceedings of the 2nd Romanian-Hungarian Joint Symposium on Applied Computational Intelligence (SACI), 243--255.
Cholissodin, I., & Soebroto, A. (2019). Buku Ajar AI, Machine Learning & Deep Learning.
Chormunge, S., & Jena, S. (2016). Efficient Feature Subset Selection Algorithm for High Dimensional Data. International Journal of Electrical and Computer Engineering (IJECE), 6, 1880–1888. https://doi.org/10.11591/ijece.v6i4.9800
Chuzaimah Zulkifli, U. (2018). Pengembangan Modul PreprocessingTeks untuk Kasus Formalisasi dan Pengecekan Ejaan Bahasa Indonesia pada Aplikasi Web Mining Simple Solution (WMSS). Jurnal Matematika Statistika Dan Komputasi, 15(2). https://doi.org/10.20956/jmsk.v15i2.5718
Cunningham, P., & Delany, S. J. (2021). K-Nearest Neighbour Classifiers-A Tutorial. In ACM Computing Surveys (Vol. 54, Issue 6). Association for Computing Machinery. https://doi.org/10.1145/3459665
Fauzi, M. A., Utomo, D. C., Pramukantoro, E. S., & Setiawan, B. D. (2017). Automatic essay scoring system using N-GRAM and cosine similarity for gamification based elearning. ACM International Conference Proceeding Series, Part F1312(October), 151–155. https://doi.org/10.1145/3133264.3133303
Huq, M. R., Ali, A., & Rahman, A. (2017). Sentiment Analysis on Twitter Data using KNN and SVM. International Journal of Advanced Computer Science and Applications, 8(6). https://doi.org/10.14569/ijacsa.2017.080603
Indriati, I.-, Rahayudi, B., & Dewi, C. (2021). Analisis Sentimen Mengenai Moda Raya Terpadu (MRT) Jakarta dengan Metode BM25 dan K-Nearest Neighbor. Jurnal Teknologi Informasi Dan Ilmu Komputer, 8(2). https://doi.org/10.25126/jtiik.2021824508
Indriati, I., & Ridok, A. (2016a). SENTIMENT ANALYSIS FOR REVIEW MOBILE APPLICATIONS USING NEIGHBOR METHOD WEIGHTED K-NEAREST NEIGHBOR (NWKNN). Journal of Enviromental Engineering and Sustainable Technology, 3(1). https://doi.org/10.21776/ub.jeest.2016.003.01.4
Indriati, I., & Ridok, A. (2016b). Sentiment Analysis for Review Mobile Applications Using Neighbor Method Weighted K-Nearest Neighbor (Nwknn). Journal of Enviromental Engineering and Sustainable Technology, 3(1), 23–32. https://doi.org/10.21776/ub.jeest.2016.003.01.4
Jodha, R., Sanjay Bc, G., & Chowdhary, K. R. (2018). Text Classification using KNN with different Feature Selection Methods. International Journal of Research, 9(1).
Liu, B. (2012). Sentiment analysis and opinion mining. Springer.
Muthia, D. A. (2016). Opinion Mining Pada Review Buku Menggunakan Algoritma Naive Bayes. Jurnal TEKNIK KOMPUTER, II(1), 1–8.
Nafan, M. Z., & Amalia, A. E. (2019). Kecenderungan Tanggapan Masyarakat terhadap Ekonomi Indonesia berbasis Lexicon Based Sentiment Analysis. JURNAL MEDIA INFORMATIKA BUDIDARMA. https://doi.org/10.30865/mib.v3i4.1283
Nurjanah, W. E., Perdana, R. S., & Fauzi, M. A. (2017). Analisis Sentimen Terhadap Tayangan Televisi Berdasarkan Opini Masyarakat pada Media Sosial Twitter menggunakan Metode K-Nearest Neighbor dan Pembobotan Jumlah Retweet. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer (J-PTIIK) Universitas Brawijaya, 1(12), 1750–1757.
Oktaviani Putri, F., & Cahya Wihandika, R. (2020). Analisis Sentimen pada Ulasan Pengguna MRT Jakarta Menggunakan Metode Neighbor-Weighted K-Nearest Neighbor dengan Seleksi Fitur Information Gain. J-Ptiik.Ub.Ac.Id, 4(7).
Onantya, I. D., Indriati, & Adikara, P. P. (2019). Analisis Sentimen Pada Ulasan Aplikasi BCA Mobile Menggunakan BM25 Dan Improved K-Nearest Neighbor. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 3(3), 2575–2580.
Pramono, F., Didi Rosiyadi, & Windu Gata. (2019). Integrasi N-gram, Information Gain, Particle Swarm Optimation di Naïve Bayes untuk Optimasi Sentimen Google Classroom. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 3(3), 383–388. https://doi.org/10.29207/resti.v3i3.1119
Pristiyanti, R. I., Fauzi, M. A., & Muflikhah, L. (2018). Sentiment Analysis Peringkasan Review Film Menggunakan Metode Information Gain dan K-Nearest Neighbor. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer (J-PTIIK) Universitas Brawijaya, 2(3).
Rosiyana, R. N., Agustin, M., Kalka Iskandar, I., & Luckyardi, S. (2021). A NEW DIGITAL MARKETING AREA FOR E-COMMERCE BUSINESS. In International Journal of Research and Applied Technology (Vol. 1, Issue 2).
Sabily, A. F., Adikara, P. P., & Fauzi, M. A. (2019). Analisis Sentimen Pemilihan Presiden 2019 pada Twitter menggunakan Metode Maximum Entropy. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 3(5), 4204–4209.
Saputri, R. P., Winahju, W. S., Fithriasari, K., Statistika, D., Matematika, F., & Data, S. (2019). Klasifikasi Sentimen Wisatawan Candi Borobudur pada Situs TripAdvisor Menggunakan Support Vector Machine dan K-Nearest Neighbor. 8(2).
Singh, R. H., Maurya, S., Tripathi, T., Narula, T., & Srivastav, G. (2020). Movie Recommendation System using Cosine Similarity and KNN. International Journal of Engineering and Advanced Technology, 9(5), 556–559. https://doi.org/10.35940/ijeat.e9666.069520
Suyanto. (2017). DATA MINING: untuk klasfikasi dan klasterisasi data. Informatika.
Tempola, F., Muhammad, M., & Khairan, A. (2018). Perbandingan Klasifikasi Antara KNN dan Naive Bayes pada Penentuan Status Gunung Berapi dengan K-Fold Cross Validation. Jurnal Teknologi Informasi Dan Ilmu Komputer, 5(5). https://doi.org/10.25126/jtiik.201855983
Uǧuz, H. (2011). A two-stage feature selection method for text categorization by using information gain, principal component analysis and genetic algorithm. Knowledge-Based Systems, 24(7). https://doi.org/10.1016/j.knosys.2011.04.014
Wang, Q., Guan, Y., Wang, X. L., & Xu, Z. M. (2006). A Novel Feature Selection Method Based on Category Information Analysis for Class Prejudging in Text Classification. International Journal of Computer Science and Network Security, 6(1a).
Windisch, G., & Csink, L. (2005). Language identification using global statistics of natural languages. Proceedings of the 2nd Romanian-Hungarian Joint Symposium on Applied Computational Intelligence (SACI), 243--255.
Unduhan
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2024 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
Artikel ini berlisensiCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.