Sistem Deteksi Deteksi Depresi Melalui Pengenalan Pola Suara Dengan Mengimplementasikan Metode Voice Quality Analysis
Kata Kunci:
Voice Quality Analysis, Depresi, CNN, Raspberry Pi 4Abstrak
Komunikasi adalah aspek penting dalam kehidupan manusia, dengan ucapan menjadi cara utama untuk mengekspresikan emosi. Emosi berperan krusial dalam interaksi sosial, dan kemampuan mendeteksi emosi seperti depresi melalui suara dapat membantu memahami kondisi mental seseorang. Depresi adalah gangguan suasana hati yang ditandai dengan perasaan sedih mendalam dan kehilangan minat terhadap aktivitas sehari-hari, yang dapat menurunkan produktivitas, mengganggu hubungan sosial, dan menyebabkan keinginan bunuh diri. Menurut Riset Kesehatan Dasar 2018, lebih dari 19 juta penduduk Indonesia berusia lebih dari 15 tahun mengalami gangguan mental emosional, dengan lebih dari 12 juta di antaranya mengalami depresi. Oleh karena itu, pengembangan teknologi pendeteksi emosi depresi berbasis suara sangat penting. Penelitian ini bertujuan mengembangkan sistem pendeteksi depresi berbasis suara menggunakan metode Voice Quality Analysis (VQA) dengan parameter jitter, shimmer, dan Harmonics-to-Noise Ratio (HNR). Metodologi penelitian meliputi analisis, perancangan, implementasi, dan pengujian sistem deteksi depresi menggunakan Raspberry Pi 4B. Hasil pengujian menunjukkan bahwa sistem mampu mengklasifikasikan suara depresi dengan akurasi 97% dan F1-score 97%. Implementasi pada perangkat keras juga menunjukkan hasil baik, dengan tingkat keberhasilan prediksi suara non-depresi sebesar 85% dan suara depresi sebesar 75%. Penelitian ini diharapkan dapat berkontribusi dalam pengembangan teknologi deteksi emosi, khususnya dalam mendeteksi depresi melalui analisis kualitas suara.
Referensi
Ahmed, M. A. (2021). Design and Development of Audio Processing and Speech Recognition Algorithm. 2021 Seventh International Conference on Aerospace Science and Engineering (ICASE), 1–7. https://doi.org/10.1109/ICASE54940.2021.9904277
Asiaee, M., Vahedian-azimi, A., Atashi, S. S., & Keramatfar, A. (2021). Voice Quality Evaluation in Patients With COVID-19 : An Acoustic Analysis. Journal of Voice, 36(6), 879.e13-879.e19. https://doi.org/10.1016/j.jvoice.2020.09.024
Barsties, B., Mayer, J., & Watts, C. R. (2023). Advances in Clinical Voice Quality Analysis with VOXplot. 1–10.
Dua, S., Kumar, S. S., Albagory, Y., Ramalingam, R., Dumka, A., Singh, R., Rashid, M., Gehlot, A., Alshamrani, S. S., & Alghamdi, A. S. (2022). Developing a Speech Recognition System for Recognizing Tonal Speech Signals Using a Convolutional Neural Network. Ml.
Hadi, I., Usman, R. D., Rosyanti, L., Keperawatan, J., Kendari, P. K., Kendari, P. K., Kendari, P. K., & Kendari, P. K. (2017). Gangguan Depresi Mayor: Mini Review. 9.
Hema, C., Pedro, F., & Marquez, G. (2023). Emotional speech Recognition using CNN and Deep learning techniques. Applied Acoustics, 211, 109492. https://doi.org/10.1016/j.apacoust.2023.109492
Jalali-najafabadi, F., Gadepalli, C., Jarchi, D., & Cheetham, B. M. G. (2021). Acoustic analysis and digital signal processing for the assessment of voice quality. Biomedical Signal Processing and Control, 70(June), 103018. https://doi.org/10.1016/j.bspc.2021.103018
Jiang, J. Z. W., & Liu, G. (2020). Exercise , brain plasticity , and depression. April, 885–895. https://doi.org/10.1111/cns.13385
Julian, T. S., Utaminingrum, F., & Syauqy, D. (2022). Sistem Voice Command pada Kursi Roda Pintar menggunakan MFCC dan CNN berbasis Jetson TX2. 6(11), 5505–5510.
Li, K. A. I., & Lu, X. (2023). Contributions of Jitter and Shimmer in the Voice for Fake Audio Detection. IEEE Access, 11(June), 84689–84698. https://doi.org/10.1109/ACCESS.2023.3301616
Liang, Y. (2023). An Analysis of Voice Quality of Chinese Patients with Depression. October 2019. https://doi.org/10.1109/O-COCOSDA46868.2019.9060848
P, I. W. S. E., Wijaya, A. Y., & Soelaiman, R. (2016). Klasifikasi Citra Menggunakan Convolutional Neural Network ( CNN ) pada Caltech 101. 5(1).
Pratiwi, W. B., Aranta, A., & Nugraha, G. S. (2023). Analisis Kebutuhan Dataset Algoritma Speech to Text Bahasa Sasak Menggunakan Perbandingan Data Suara Bahasa Inggris Pada Metode CNN Analysis of Sasak Language Speech to Text Algorithm Dataset Requirements Using. 7(2), 165–173.
Putri, T. B., Saidah, S., Hidayat, B., Qothrunnada, F., Telekomunikasi, T., & Telkom, U. (2023). Deteksi Emosi Berdasarkan Sinyal Suara Manusia Menggunakan Discrete Wavelet Transform ( DWT ) Dengan Klasifikasi Support Vector Machine ( SVM ). 3(1), 1–10.
Roco-videla, Á. (2023). Variation of the acoustic parameters : f 0 , jitter , shimmer and alpha ratio in relation with different. 74. https://doi.org/10.1016/j.otoeng.2022.10.004
Shao, R., He, P., Ling, B., Tan, L., Xu, L., Hou, Y., Kong, L., & Yang, Y. (2020). Prevalence of depression and anxiety and correlations between depression , anxiety , family functioning , social support and coping styles among Chinese medical students. 1–19.
Via, W. (2021). Implementasi Ekstraksi Fitur untuk Klasifikasi Suara Urban Menggunakan Deep Learning. 3(1), 10–17.
Ahmed, M. A. (2021). Design and Development of Audio Processing and Speech Recognition Algorithm. 2021 Seventh International Conference on Aerospace Science and Engineering (ICASE), 1–7. https://doi.org/10.1109/ICASE54940.2021.9904277
Asiaee, M., Vahedian-azimi, A., Atashi, S. S., & Keramatfar, A. (2021). Voice Quality Evaluation in Patients With COVID-19 : An Acoustic Analysis. Journal of Voice, 36(6), 879.e13-879.e19. https://doi.org/10.1016/j.jvoice.2020.09.024
Barsties, B., Mayer, J., & Watts, C. R. (2023). Advances in Clinical Voice Quality Analysis with VOXplot. 1–10.
Dua, S., Kumar, S. S., Albagory, Y., Ramalingam, R., Dumka, A., Singh, R., Rashid, M., Gehlot, A., Alshamrani, S. S., & Alghamdi, A. S. (2022). Developing a Speech Recognition System for Recognizing Tonal Speech Signals Using a Convolutional Neural Network. Ml.
Hadi, I., Usman, R. D., Rosyanti, L., Keperawatan, J., Kendari, P. K., Kendari, P. K., Kendari, P. K., & Kendari, P. K. (2017). Gangguan Depresi Mayor: Mini Review. 9.
Hema, C., Pedro, F., & Marquez, G. (2023). Emotional speech Recognition using CNN and Deep learning techniques. Applied Acoustics, 211, 109492. https://doi.org/10.1016/j.apacoust.2023.109492
Jalali-najafabadi, F., Gadepalli, C., Jarchi, D., & Cheetham, B. M. G. (2021). Acoustic analysis and digital signal processing for the assessment of voice quality. Biomedical Signal Processing and Control, 70(June), 103018. https://doi.org/10.1016/j.bspc.2021.103018
Jiang, J. Z. W., & Liu, G. (2020). Exercise , brain plasticity , and depression. April, 885–895. https://doi.org/10.1111/cns.13385
Julian, T. S., Utaminingrum, F., & Syauqy, D. (2022). Sistem Voice Command pada Kursi Roda Pintar menggunakan MFCC dan CNN berbasis Jetson TX2. 6(11), 5505–5510.
Li, K. A. I., & Lu, X. (2023). Contributions of Jitter and Shimmer in the Voice for Fake Audio Detection. IEEE Access, 11(June), 84689–84698. https://doi.org/10.1109/ACCESS.2023.3301616
Liang, Y. (2023). An Analysis of Voice Quality of Chinese Patients with Depression. October 2019. https://doi.org/10.1109/O-COCOSDA46868.2019.9060848
P, I. W. S. E., Wijaya, A. Y., & Soelaiman, R. (2016). Klasifikasi Citra Menggunakan Convolutional Neural Network ( CNN ) pada Caltech 101. 5(1).
Pratiwi, W. B., Aranta, A., & Nugraha, G. S. (2023). Analisis Kebutuhan Dataset Algoritma Speech to Text Bahasa Sasak Menggunakan Perbandingan Data Suara Bahasa Inggris Pada Metode CNN Analysis of Sasak Language Speech to Text Algorithm Dataset Requirements Using. 7(2), 165–173.
Putri, T. B., Saidah, S., Hidayat, B., Qothrunnada, F., Telekomunikasi, T., & Telkom, U. (2023). Deteksi Emosi Berdasarkan Sinyal Suara Manusia Menggunakan Discrete Wavelet Transform ( DWT ) Dengan Klasifikasi Support Vector Machine ( SVM ). 3(1), 1–10.
Roco-videla, Á. (2023). Variation of the acoustic parameters : f 0 , jitter , shimmer and alpha ratio in relation with different. 74. https://doi.org/10.1016/j.otoeng.2022.10.004
Shao, R., He, P., Ling, B., Tan, L., Xu, L., Hou, Y., Kong, L., & Yang, Y. (2020). Prevalence of depression and anxiety and correlations between depression , anxiety , family functioning , social support and coping styles among Chinese medical students. 1–19.
Via, W. (2021). Implementasi Ekstraksi Fitur untuk Klasifikasi Suara Urban Menggunakan Deep Learning. 3(1), 10–17.
Unduhan
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2024 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
Artikel ini berlisensiCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.