Sistem Pengenalan Suara pada Lingkungan Bising untuk Kursi Roda Pintar menggunakan MFCC dan ResNet50V2

Sistem Pengenalan Suara pada Lingkungan Bising untuk Kursi Roda Pintar menggunakan MFCC dan ResNet50V2

Penulis

  • Kevin Danudoro Fakultas Ilmu Komputer, Universitas Brawijaya
  • Fitri Utaminingrum Fakultas Ilmu Komputer, Universitas Brawijaya

Kata Kunci:

Disabilitas Ganda, Kursi Roda, Klasifikasi Suara, ResNet50v2, Mel Frequency Cepstral Coefficients

Abstrak

Badan Pusat Statistik Indonesia (BPS) 2022 mengemukakan bahwa penyandang disabilitas di Indonesia pada tahun 2022 berjumlah kurang lebih 900.000 jiwa termasuk penyandang disabilitas ganda. Terdapat penelitian yang mengangkat tema sistem navigasi otonom pada kursi roda yang dilakukan oleh Alqadri dan Utaminingrum (2023). Namun sistem tersebut masih memerlukan input dari keyboard sehingga belum dapat menyelesaikan permasalahan yang dialami penyandang disabilitas ganda. Oleh sebab itu, diperlukan pengembangan input alternatif lainnya yang dapat mengurangi interaksi fisik pengguna dengan sistem, salah satunya adalah dengan menggunakan suara. Sistem pengenalan suara sendiri memiliki beberapa rintangan yang perlu dihadapi, salah satunya adalah noise yang dapat mengurangi keandalan sistem. Oleh sebab itu, diperlukan pengembangan sistem pengenalan suara yang mampu beroperasi pada lingkungan bising dengan menggunakan metode noise reduction Spectral Gating, ekstraksi ciri MFCC dan model deep learning ResNet50v2. Berdasarkan pengujian yang dilakukan, diketahui bahwa epoch ke-37 merupakan epoch terbaik yang digunakan untuk melatih model. Selain itu, diketahui bahwa rata-rata waktu komputasi sistem adalah sebesar 2385.2 ms. Kemudian berdasarkan pengujian oleh 5 subjek, diketahui bahwa rata-rata akurasi pada ruang hening dan bising secara berturut-turut sebesar 91% dan 81%.

Referensi

Abdulghani, M. M., Walters, W. L., & Abed, K. H. (2022, 12 16). Autonomous Voice Recognition Wheelchair Control System. International Conference on Computational Science and Computational Intelligence (CSCI). 10.1109/CSCI58124.2022.00043

Alqadri, A. M., & Utaminingrum, F. (2023). Pengenalan Papan Nama Ruangan untuk Kendali Kursi Roda Pintar menggunakan YOLOv7-Tiny dan EasyOCR berbasis TX2. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, 7(5), 2227-2231. https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/12625

Badan Pusat Statistik Indonesia (2022). Jumlah Penduduk Berumur 5 Tahun ke Atas yang Mengalami Kesulitan Mengurus Diri Sendiri menurut Kelompok Umur, Daerah Perkotaan/Perdesaan, Jenis Kelamin, dan Sebab Kesulitan Mengurus Diri Sendiri, di INDONESIA - Dataset - Long Form ... (2022). Sensus BPS. Retrieved December 20, 2023, from https://sensus.bps.go.id/topik/tabular/sp2022/153/0/0

Hershey, S., Chaudhuri, S., Ellis, D. P. W., Gemmeke, J. F., Jansen, A., & Channing, R. (2017, June 19). CNN architectures for large-scale audio classification. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 131-135. https://doi.org/10.1109/ICASSP.2017.7952132

Indrabayu, ArenI, I. S., Bustamin, A., & Irianty, R. (2020, 10 7). Tinjauan Potensi Aplikasi Cerdas untuk Kalangan Difabel. Prosiding Seminar Nasional Teknik Elektro dan Informatika (SNTEI) 2020, 84-89. http://jurnal.poliupg.ac.id/index.php/sntei/article/view/2152

Kiapuchinski, D. M., Lima, C. R. E., & Kaestner, C. A. A. (2012). Spectral Noise Gate Technique Applied to Birdsong Preprocessing on Embedded Unit. 2012 IEEE International Symposium on Multimedia, 24-27. https://doi.org/10.1109/ISM.2012.12

Kumar, N., Kaushal, R., Agarwal, S., & Singh, Y. B. (2022, 3 9). CNN based approach for Speech Emotion Recognition Using MFCC, Croma and STFT Hand-crafted features. 2021 3rd International Conference on Advances in Computing, Communication Control and Networking (ICACCCN), 981-985. https://doi.org/10.1109/ICAC3N53548.2021.9725750

Radissa, V. S., Wibowo, H., Humaedi, S., & Irfan, M. (2020, 7). PEMENUHAN KEBUTUHAN DASAR PENYANDANG DISABILITAS PADA MASA PANDEMI COVID-19. Jurnal Pekerjaan Sosial, 3(1), 61-69. https://jurnal.unpad.ac.id/focus/article/view/28735/13688

Ramos, M. A., & Mosleh, A. (2021, 11 22). Human Role in Failure of Autonomous Systems: A Human Reliability Perspective. Annual Reliability and Maintainability Symposium (RAMS). https://doi.org/10.1109/RAMS48097.2021.9605790

Diterbitkan

04 Mar 2024

Cara Mengutip

Danudoro, K., & Utaminingrum, F. (2024). Sistem Pengenalan Suara pada Lingkungan Bising untuk Kursi Roda Pintar menggunakan MFCC dan ResNet50V2. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 8(2). Diambil dari https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/13351

Terbitan

Bagian

Artikel
Loading...