Sistem Pengenalan Suara pada Lingkungan Bising untuk Kursi Roda Pintar menggunakan MFCC dan ResNet50V2
Kata Kunci:
Disabilitas Ganda, Kursi Roda, Klasifikasi Suara, ResNet50v2, Mel Frequency Cepstral CoefficientsAbstrak
Badan Pusat Statistik Indonesia (BPS) 2022 mengemukakan bahwa penyandang disabilitas di Indonesia pada tahun 2022 berjumlah kurang lebih 900.000 jiwa termasuk penyandang disabilitas ganda. Terdapat penelitian yang mengangkat tema sistem navigasi otonom pada kursi roda yang dilakukan oleh Alqadri dan Utaminingrum (2023). Namun sistem tersebut masih memerlukan input dari keyboard sehingga belum dapat menyelesaikan permasalahan yang dialami penyandang disabilitas ganda. Oleh sebab itu, diperlukan pengembangan input alternatif lainnya yang dapat mengurangi interaksi fisik pengguna dengan sistem, salah satunya adalah dengan menggunakan suara. Sistem pengenalan suara sendiri memiliki beberapa rintangan yang perlu dihadapi, salah satunya adalah noise yang dapat mengurangi keandalan sistem. Oleh sebab itu, diperlukan pengembangan sistem pengenalan suara yang mampu beroperasi pada lingkungan bising dengan menggunakan metode noise reduction Spectral Gating, ekstraksi ciri MFCC dan model deep learning ResNet50v2. Berdasarkan pengujian yang dilakukan, diketahui bahwa epoch ke-37 merupakan epoch terbaik yang digunakan untuk melatih model. Selain itu, diketahui bahwa rata-rata waktu komputasi sistem adalah sebesar 2385.2 ms. Kemudian berdasarkan pengujian oleh 5 subjek, diketahui bahwa rata-rata akurasi pada ruang hening dan bising secara berturut-turut sebesar 91% dan 81%.
Referensi
Abdulghani, M. M., Walters, W. L., & Abed, K. H. (2022, 12 16). Autonomous Voice Recognition Wheelchair Control System. International Conference on Computational Science and Computational Intelligence (CSCI). 10.1109/CSCI58124.2022.00043
Alqadri, A. M., & Utaminingrum, F. (2023). Pengenalan Papan Nama Ruangan untuk Kendali Kursi Roda Pintar menggunakan YOLOv7-Tiny dan EasyOCR berbasis TX2. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, 7(5), 2227-2231. https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/12625
Badan Pusat Statistik Indonesia (2022). Jumlah Penduduk Berumur 5 Tahun ke Atas yang Mengalami Kesulitan Mengurus Diri Sendiri menurut Kelompok Umur, Daerah Perkotaan/Perdesaan, Jenis Kelamin, dan Sebab Kesulitan Mengurus Diri Sendiri, di INDONESIA - Dataset - Long Form ... (2022). Sensus BPS. Retrieved December 20, 2023, from https://sensus.bps.go.id/topik/tabular/sp2022/153/0/0
Hershey, S., Chaudhuri, S., Ellis, D. P. W., Gemmeke, J. F., Jansen, A., & Channing, R. (2017, June 19). CNN architectures for large-scale audio classification. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 131-135. https://doi.org/10.1109/ICASSP.2017.7952132
Indrabayu, ArenI, I. S., Bustamin, A., & Irianty, R. (2020, 10 7). Tinjauan Potensi Aplikasi Cerdas untuk Kalangan Difabel. Prosiding Seminar Nasional Teknik Elektro dan Informatika (SNTEI) 2020, 84-89. http://jurnal.poliupg.ac.id/index.php/sntei/article/view/2152
Kiapuchinski, D. M., Lima, C. R. E., & Kaestner, C. A. A. (2012). Spectral Noise Gate Technique Applied to Birdsong Preprocessing on Embedded Unit. 2012 IEEE International Symposium on Multimedia, 24-27. https://doi.org/10.1109/ISM.2012.12
Kumar, N., Kaushal, R., Agarwal, S., & Singh, Y. B. (2022, 3 9). CNN based approach for Speech Emotion Recognition Using MFCC, Croma and STFT Hand-crafted features. 2021 3rd International Conference on Advances in Computing, Communication Control and Networking (ICACCCN), 981-985. https://doi.org/10.1109/ICAC3N53548.2021.9725750
Radissa, V. S., Wibowo, H., Humaedi, S., & Irfan, M. (2020, 7). PEMENUHAN KEBUTUHAN DASAR PENYANDANG DISABILITAS PADA MASA PANDEMI COVID-19. Jurnal Pekerjaan Sosial, 3(1), 61-69. https://jurnal.unpad.ac.id/focus/article/view/28735/13688
Ramos, M. A., & Mosleh, A. (2021, 11 22). Human Role in Failure of Autonomous Systems: A Human Reliability Perspective. Annual Reliability and Maintainability Symposium (RAMS). https://doi.org/10.1109/RAMS48097.2021.9605790
Abdulghani, M. M., Walters, W. L., & Abed, K. H. (2022, 12 16). Autonomous Voice Recognition Wheelchair Control System. International Conference on Computational Science and Computational Intelligence (CSCI). 10.1109/CSCI58124.2022.00043
Alqadri, A. M., & Utaminingrum, F. (2023). Pengenalan Papan Nama Ruangan untuk Kendali Kursi Roda Pintar menggunakan YOLOv7-Tiny dan EasyOCR berbasis TX2. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, 7(5), 2227-2231. https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/12625
Badan Pusat Statistik Indonesia (2022). Jumlah Penduduk Berumur 5 Tahun ke Atas yang Mengalami Kesulitan Mengurus Diri Sendiri menurut Kelompok Umur, Daerah Perkotaan/Perdesaan, Jenis Kelamin, dan Sebab Kesulitan Mengurus Diri Sendiri, di INDONESIA - Dataset - Long Form ... (2022). Sensus BPS. Retrieved December 20, 2023, from https://sensus.bps.go.id/topik/tabular/sp2022/153/0/0
Hershey, S., Chaudhuri, S., Ellis, D. P. W., Gemmeke, J. F., Jansen, A., & Channing, R. (2017, June 19). CNN architectures for large-scale audio classification. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 131-135. https://doi.org/10.1109/ICASSP.2017.7952132
Indrabayu, ArenI, I. S., Bustamin, A., & Irianty, R. (2020, 10 7). Tinjauan Potensi Aplikasi Cerdas untuk Kalangan Difabel. Prosiding Seminar Nasional Teknik Elektro dan Informatika (SNTEI) 2020, 84-89. http://jurnal.poliupg.ac.id/index.php/sntei/article/view/2152
Kiapuchinski, D. M., Lima, C. R. E., & Kaestner, C. A. A. (2012). Spectral Noise Gate Technique Applied to Birdsong Preprocessing on Embedded Unit. 2012 IEEE International Symposium on Multimedia, 24-27. https://doi.org/10.1109/ISM.2012.12
Kumar, N., Kaushal, R., Agarwal, S., & Singh, Y. B. (2022, 3 9). CNN based approach for Speech Emotion Recognition Using MFCC, Croma and STFT Hand-crafted features. 2021 3rd International Conference on Advances in Computing, Communication Control and Networking (ICACCCN), 981-985. https://doi.org/10.1109/ICAC3N53548.2021.9725750
Radissa, V. S., Wibowo, H., Humaedi, S., & Irfan, M. (2020, 7). PEMENUHAN KEBUTUHAN DASAR PENYANDANG DISABILITAS PADA MASA PANDEMI COVID-19. Jurnal Pekerjaan Sosial, 3(1), 61-69. https://jurnal.unpad.ac.id/focus/article/view/28735/13688
Ramos, M. A., & Mosleh, A. (2021, 11 22). Human Role in Failure of Autonomous Systems: A Human Reliability Perspective. Annual Reliability and Maintainability Symposium (RAMS). https://doi.org/10.1109/RAMS48097.2021.9605790
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2024 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
Artikel ini berlisensiCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.