Kendali Kursi Roda Pintar Berdasarkan Suara pada Lingkungan Bising menggunakan GFCC dan ResNet50 berbasis TX2
Kata Kunci:
Disabilitas Tunadaksa, Kursi Roda, Klasifikasi Suara, resnet50, Gammatone Frequency Cepstral CoefficientsAbstrak
Pada tahun 2023, sebanyak 22,97 juta jiwa atau sekitar 8,5% dari jumlah penduduk di Indonesia merupakan penyandang disabilitas (Kementerian Koordinator Bidang Pembangunan Manusia dan Kebudayaan Republik Indonesia, 2023). Penyandang disabilitas tunadaksa yang memiliki kelumpuhan pada bagian tangan maupun kaki akan kesulitan dalam menggerakkan kursi roda secara mandiri. Hal ini disebabkan kursi roda yang ada dipasaran hanya memfasilitasi penyandang disabilitas yang dapat mengendalikan kursi rodanya secara mandiri menggunakan tangan. Maka dibutuhkan kursi roda yang dapat dikendalikan tanpa menggunakan tangan, salah satu solusinya memanfaatkan perintah suara untuk mengendalikan kursi roda secara mandiri. Oleh sebab itu, penulis mengusulkan sistem kendali kursi roda pintar menggunakan perintah suara. Selain itu, agar meningkatkan mobilitas pengguna kursi roda maka perintah suara akan melakukan klasifikasi pada lingkungan bising menggunakan fitur ekstraksi Gammatone-Frequency Cepstral Coefficients (GFCC) dan klasifikasi ResNet50. Adapun hasil akurasi integrasi dilakukan oleh 3 subjek dilingkungan hening dan 3 subjek dilingkungan bising. Hasil yang diperoleh terhadap pengujian lima kelas yaitu maju, mundur, kanan, kiri, berhenti menunjukkan bahwa pengujian pada lingkungan hening memperoleh rata-rata akurasi 88% dan pada lingkungan bising memperoleh rata-rata akurasi 80%.
Referensi
S. Hershey et al., "CNN architectures for large-scale audio classification," 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), New Orleans, LA, USA, 2017, pp. 131-135, doi: 10.1109/ICASSP.2017.7952132.
L. O. A. Hazmar dan B. H. Prasetio, “Sistem Pengenalan Tingkatan Emosi Ketakutan Melalui Ucapan menggunakan Ekstraksi Gammatone-Frequency Cepstral Coefficients dan Klasifikasi Random Forest Classifier berbasis
T. S. Julian, F. Utaminingrum, dan D. Syauqy, “Sistem Voice Command pada KursiRoda Pintar menggunakan MFCC dan CNN berbasis Jetson TX2”, J-PTIIK, vol.6, no. 11, hlm. 5505–5510, Feb 2023.
X. Zhao and D. Wang, "Analyzing noise robustness of MFCC and GFCC features inspeaker identification," 2013 IEEE International Conference on Acoustics,Speech and Signal Processing, Vancouver, BC, Canada, 2013, pp. 7204-7208, doi: 10.1109/ICASSP.2013.663906
S. Hershey et al., "CNN architectures for large-scale audio classification," 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), New Orleans, LA, USA, 2017, pp. 131-135, doi: 10.1109/ICASSP.2017.7952132.
L. O. A. Hazmar dan B. H. Prasetio, “Sistem Pengenalan Tingkatan Emosi Ketakutan Melalui Ucapan menggunakan Ekstraksi Gammatone-Frequency Cepstral Coefficients dan Klasifikasi Random Forest Classifier berbasis
T. S. Julian, F. Utaminingrum, dan D. Syauqy, “Sistem Voice Command pada KursiRoda Pintar menggunakan MFCC dan CNN berbasis Jetson TX2”, J-PTIIK, vol.6, no. 11, hlm. 5505–5510, Feb 2023.
X. Zhao and D. Wang, "Analyzing noise robustness of MFCC and GFCC features inspeaker identification," 2013 IEEE International Conference on Acoustics,Speech and Signal Processing, Vancouver, BC, Canada, 2013, pp. 7204-7208, doi: 10.1109/ICASSP.2013.663906
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2024 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
Artikel ini berlisensiCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.