Penerapan Short Time Fourier Transform pada MFCC untuk Sistem Pengenalan Ucapan Tingkat Stres
Kata Kunci:
Suara, Stres, Aplikasi Android, CNN, Short-Time Fourier TransformAbstrak
Stres adalah suatu emosi pada kondisi yang tidak nyaman oleh seseorang karena tekanan yang melampaui kemampuan sesorang dari faktor internal dan eksternal, sehingga dapat berdampak buruk di kehidupan sehari-hari. Oleh karena itu, diperlukan alat yang dapat melakukan proses screening secara dini kepada pengguna, ketika seseorang atau diri sendiri sedang mengalami stres atau tidak sebagai tindakan pencegahan akibat stres lebih lanjut. Penelitian ini menggunakan ekstraksi fitur MFCC dengan penerapan Algoritma Short Time Fourier Transform dan klasifikasi CNN untuk sistem pengenalan tingkat stres melalui ucapan berbasis aplikasi Android. Sistem ini mengenali tingkat stres berdasarkan suara melalui mikrofon MEMS, lalu data suara tersebut diunggah ke server dan diproses data tersebut dan ditampilkan hasil prediksi tingkat stres pada layar ponsel. Hasil dari pengujian dengan menggunakan 20 kali pengujian suara secara acak pada sistem dikatakan cukup efektif dalam memprediksi tingkat stres tinggi dan rendah suara pengguna dengan akurasi 70%, sedangkan rata-rata waktu komputasi secara keseluruhan saat proses pengujian didapatkan selama 5,95 detik. Sistem aplikasi menyediakan fungsi real-time dan fitur ramah pengguna yang dapat diakses dengan mudah melalui aplikasi yang terhubung ke database server. Sistem ini dapat memantau tingkat stres pengguna dengan mudah dan memberikan solusi deteksi stres yang optimal.
Referensi
Achmad, Y., Wihandika, R.C. and Dewi, C. (2019) ‘Klasifikasi emosi berdasarkan ciri wajah wenggunakan convolutional neural network’, Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, 3(11), pp. 10595–10604.
Ali, S. et al. (2021). ‘Mel Frequency Cepstral Coefficient: A Review’. Tersedia di: https://doi.org/10.4108/eai.27-2-2020.2303173.
Aljufri, M. N., & Prasetio, B. H., (2023). Sistem Deteksi Tingkat Stress Menggunakan Suara dengan Metode Jaringan Saraf Tiruan dan Ekstraksi Fitur MFCC berbasis Raspberry Pi. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, 6(11), pp. 5278-5285.
Barlian Henryranu Prasetio, D. S. (2022). Hilbert-Huang Mel Frequency Cepstral Coefficient for Speech Stress Recognition System.
Elbir, A. et al. (2018) ‘Short Time Fourier Transform based music genre classification’, 2018 Electric Electronics, Computer Science, Biomedical Engineerings’ Meeting, EBBT 2018, pp. 1–4 .Tersedia di: https://doi.org/10.1109/EBBT.2018.8391437.
Elfaki, A. et al. (2021) ‘Using the Short-Time Fourier Transform and ResNet to Diagnose Depression from Speech Data’, 2021 IEEE International Conference on Computing, ICOCO 2021, pp. 372–376. Available at: https://doi.org/10.1109/ICOCO53166.2021.9673562.
Hafidh, M., Maulana, W. and Widasari, E.R. (2023) ‘Sistem Deteksi Stres berdasarkan Detak Jantung dan Kelenjar Keringat menggunakan Metode K-Nearest Neighbours’, 7(3), pp. 1108–1115. Available at: http://j-ptiik.ub.ac.id.
Hazmar, L. O. A., & Prasetio, B. H., (2023). “Sistem Pengenalan Tingkatan Emosi Ketakutan Melalui Ucapan menggunakan Ekstraksi Gammatone-Frequency Cepstral Coefficients dan Klasifikasi Random Forest Classifier berbasis Raspberry Pi 4". Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 7(2), 1003–1011.
Huang, J, Chen, B, Yao, B, & He, W. (2019). ECG arrhythmia classification using STFT-based spectrogram and convolutional neural network, IEEE access, ieeexplore.ieee.org
Jayasree, D. D., (2007). Classification of power quality disturbance signals using FFT, STFT, wavelet transforms and neural networks-a comparative analysis. International Conference on Computational Intelligence and Multimedia Applications, Volume 1, pp. 335-340.
Julian, T. S., Utaminingrum, F. dan Syauqy, D. (2023). ‘Sistem Voice Command pada Kursi Roda Pintar menggunakan MFCC dan CNN berbasis Jetson TX2’, Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, 6(11), hlm. 5505–5510.
Lazzuardhy, D. A., & Prasetio, B. H., (2023). Sistem Pengenalan Intensitas Emosi Sedih melalui Ucapan menggunakan Ekstraksi Bark-Frequency Cepstral Coefficient dan K-Nearest Neighbor berbasis Raspberry Pi 4. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 6(11), pp. 5560–5568.
Moh Muslim (2020) ‘Moh . Muslim : Manajemen Stress pada Masa Pandemi Covid-19 ” 193’, Jurnal Manajemen Bisnis, 23(2), pp. 192–201.
Sharifuddin, M.S.I., Nordin, S. and Ali, A.M. (2019) ‘Voice control intelligent wheelchair movement using CNNs’, Proceedings - 2019 1st International Conference on Artificial Intelligence and Data Sciences, AiDAS 2019, pp. 40–43. Tersedia di : https://doi.org/10.1109/AiDAS47888.2019.8970865.
Swain, M., Routray, A. and Kabisatpathy, P. (2018) ‘Databases, features and classifiers for speech emotion recognition: a review’, International Journal of Speech Technology, 21(1), pp. 93–120. Available at: https://doi.org/10.1007/s10772-018-9491-z.
Wang, L.H. et al. (2017) ‘Motor Fault Diagnosis Based on Short-time Fourier Transform and Convolutional Neural Network’, Chinese Journal of Mechanical Engineering (English Edition), 30(6), pp. 1357–1368. Available at: https://doi.org/10.1007/s10033-017-0190-5.
Achmad, Y., Wihandika, R.C. and Dewi, C. (2019) ‘Klasifikasi emosi berdasarkan ciri wajah wenggunakan convolutional neural network’, Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, 3(11), pp. 10595–10604.
Ali, S. et al. (2021). ‘Mel Frequency Cepstral Coefficient: A Review’. Tersedia di: https://doi.org/10.4108/eai.27-2-2020.2303173.
Aljufri, M. N., & Prasetio, B. H., (2023). Sistem Deteksi Tingkat Stress Menggunakan Suara dengan Metode Jaringan Saraf Tiruan dan Ekstraksi Fitur MFCC berbasis Raspberry Pi. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, 6(11), pp. 5278-5285.
Barlian Henryranu Prasetio, D. S. (2022). Hilbert-Huang Mel Frequency Cepstral Coefficient for Speech Stress Recognition System.
Elbir, A. et al. (2018) ‘Short Time Fourier Transform based music genre classification’, 2018 Electric Electronics, Computer Science, Biomedical Engineerings’ Meeting, EBBT 2018, pp. 1–4 .Tersedia di: https://doi.org/10.1109/EBBT.2018.8391437.
Elfaki, A. et al. (2021) ‘Using the Short-Time Fourier Transform and ResNet to Diagnose Depression from Speech Data’, 2021 IEEE International Conference on Computing, ICOCO 2021, pp. 372–376. Available at: https://doi.org/10.1109/ICOCO53166.2021.9673562.
Hafidh, M., Maulana, W. and Widasari, E.R. (2023) ‘Sistem Deteksi Stres berdasarkan Detak Jantung dan Kelenjar Keringat menggunakan Metode K-Nearest Neighbours’, 7(3), pp. 1108–1115. Available at: http://j-ptiik.ub.ac.id.
Hazmar, L. O. A., & Prasetio, B. H., (2023). “Sistem Pengenalan Tingkatan Emosi Ketakutan Melalui Ucapan menggunakan Ekstraksi Gammatone-Frequency Cepstral Coefficients dan Klasifikasi Random Forest Classifier berbasis Raspberry Pi 4". Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 7(2), 1003–1011.
Huang, J, Chen, B, Yao, B, & He, W. (2019). ECG arrhythmia classification using STFT-based spectrogram and convolutional neural network, IEEE access, ieeexplore.ieee.org
Jayasree, D. D., (2007). Classification of power quality disturbance signals using FFT, STFT, wavelet transforms and neural networks-a comparative analysis. International Conference on Computational Intelligence and Multimedia Applications, Volume 1, pp. 335-340.
Julian, T. S., Utaminingrum, F. dan Syauqy, D. (2023). ‘Sistem Voice Command pada Kursi Roda Pintar menggunakan MFCC dan CNN berbasis Jetson TX2’, Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, 6(11), hlm. 5505–5510.
Lazzuardhy, D. A., & Prasetio, B. H., (2023). Sistem Pengenalan Intensitas Emosi Sedih melalui Ucapan menggunakan Ekstraksi Bark-Frequency Cepstral Coefficient dan K-Nearest Neighbor berbasis Raspberry Pi 4. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 6(11), pp. 5560–5568.
Moh Muslim (2020) ‘Moh . Muslim : Manajemen Stress pada Masa Pandemi Covid-19 ” 193’, Jurnal Manajemen Bisnis, 23(2), pp. 192–201.
Sharifuddin, M.S.I., Nordin, S. and Ali, A.M. (2019) ‘Voice control intelligent wheelchair movement using CNNs’, Proceedings - 2019 1st International Conference on Artificial Intelligence and Data Sciences, AiDAS 2019, pp. 40–43. Tersedia di : https://doi.org/10.1109/AiDAS47888.2019.8970865.
Swain, M., Routray, A. and Kabisatpathy, P. (2018) ‘Databases, features and classifiers for speech emotion recognition: a review’, International Journal of Speech Technology, 21(1), pp. 93–120. Available at: https://doi.org/10.1007/s10772-018-9491-z.
Wang, L.H. et al. (2017) ‘Motor Fault Diagnosis Based on Short-time Fourier Transform and Convolutional Neural Network’, Chinese Journal of Mechanical Engineering (English Edition), 30(6), pp. 1357–1368. Available at: https://doi.org/10.1007/s10033-017-0190-5.
Unduhan
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2024 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
Artikel ini berlisensiCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.