Penerapan Adaptive Framing pada Generator Koefisien Frekuensi Mel untuk Sistem Klasifikasi Tipe Vokal
Kata Kunci:
Adaptive Framing, CNN, MFCC, Raspberry Pi, Tipe VokalAbstrak
Tipe vokal manusia: Sopran, Alto, Tenor, dan Bass seringkali diidentifikasi melalui interaksi dengan alat musik seperti piano dan bimbingan dari ahli vokal. Pendekatan ini kurang praktis dan memiliki keterbatasan dalam portabilitas serta aksesibilitas. Penelitian ini bertujuan untuk mengatasi keterbatasan tersebut dengan mengembangkan alat berupa sistem penerapan Mel-Frequency Cepstral Coefficients (MFCC) dan Convolutional Neural Network (CNN). Penelitian ini menggunakan pendekatan Adaptive Framing pada MFCC untuk meningkatkan hasil ekstraksi fitur suara. Sistem dibuat di dalam Raspberry Pi 4B dengan input mini usb microphone dan output LCD 3.5 Inch. Sistem yang telah dikembangkan menunjukkan kinerja yang baik dari segi fungsionalitas, mulai dari tahap inisialisasi (booting) hingga menghasilkan output klasifikasi tipe vokal manusia pada Raspberry Pi. Nilai akurasi pengujian model dengan menggunakan algoritma CNN adalah sebesar 94,5%. Hal tersebut menandakan model yang dibuat memiliki akurasi yang baik untuk diimplementasikan. Pada pengujian alat, hasil yang didapat untuk melakukan klasifikasi tipe vokal manusia adalah sebesar 65%. Sistem ini memenuhi kebutuhan penentuan tipe vokal tanpa ketergantungan pada ahli vokal, portabilitas tinggi, dan dapat digunakan dalam berbagai konteks.
Referensi
Ahmed, S. F., Jaffari, R., Ahmed, S. S., Jawaid, M., & Talpur, S. (2022). An MFCC-based Secure Framework for Voice Assistant Systems. 2022 International Conference on Cyber Warfare and Security, ICCWS 2022 - Proceedings, 57–61. https://doi.org/10.1109/ICCWS56285.2022.9998446
Ajinurseto, G., Bakrim, L. O., & Islamuddin, N. (2023). Penerapan Metode Mel Frequency Cepstral Coefficients pada Sistem Pengenalan Suara Berbasis Desktop. Infomatek, 25(1), 11–20. https://doi.org/10.23969/infomatek.v25i1.6109
Alfujri, M. N., & Prasetio, B. H. (2022). SISTEM DETEKSI TINGKAT STRESS MENGGUNAKAN SUARA DENGAN METODE JARINGAN SARAF TIRUAN DAN EKSTRAKSI FITUR MFCC BERBASIS RASPBERRY PI. Fakultas Ilmu Komputer, Universitas Brawijaya.
Fabiana, R. A., Prasetio, B. H., & Setiawan, E. (2022). SISTEM IDENTIFIKASI KESEHATAN PENCERNAAN BERDASARKAN SUARA USUS MENGGUNAKAN CONVOLUTIONAL NEURAL NETWORK. Fakultas Ilmu Komputer, Universitas Brawijaya.
Hendry Setiawan, Windra Swastika, Ossie Leona, & Oesman Hendra Kelana. (2018). Aransemen Nada Alto, Tenor, dan Bass Menggunakan Algoritma Genetika. Teknik Informatika, Universitas Ma Chung.
Jayadi, A., Prasetio, B. H., & Akbar, S. R. (2022). SISTEM DETEKSI PENYAKIT FLU MENGGUNAKAN SUARA BATUK MENGGUNAKAN MFCC DAN KNN PADA RASPBERRY PI. Fakultas Ilmu Komputer, Universitas Brawijaya.
Kulkarni, A., Naik, V., Varpe, D. M., Atre, M., & Kumavat, S. (2023). Insect Sound Recognition Using MFCC and CNN. Research Square. https://doi.org/10.21203/rs.3.rs-3506774/v1
Mokoagow, J. N., Kaunang, M., & Hartati, R. S. (2023). ANALISIS PEMBELAJARAN TEKNIK VOKAL DALAM PADUAN SUARA. KOMPETENSI: Jurnal Ilmiah Bahasa Dan Seni , 3(10).
Pajankar, A., & Joshi, A. (2022). Convolutional Neural Networks. In Hands-on Machine Learning with Python (pp. 261–284). Apress. https://doi.org/10.1007/978-1-4842-7921-2_14
Pratama, K. B., Suyanto, S., & Rachmawati, E. (2021). Human Vocal Type Classification using MFCC and Convolutional Neural Network. International Conference on Communication and Information Technology, ICICT 2021, 43–48. https://doi.org/10.1109/ICICT52195.2021.9568474
Qian, Q., Zhou, S., Song, M., Cui, Y., & Wang, H. (2022). VICTOR: An Adaptive Framing-based Speech Content Authentication and Recovery Algorithm. 2022 IEEE 24th Int Conf on High Performance Computing & Communications; 8th Int Conf on Data Science & Systems; 20th Int Conf on Smart City; 8th Int Conf on Dependability in Sensor, Cloud & Big Data Systems & Application (HPCC/DSS/SmartCity/DependSys), 1649–1654. https://doi.org/10.1109/HPCC-DSS-SmartCity-DependSys57074.2022.00250
Sasilo, A. A., Saputra, R. A., & Ningrum, I. P. (2022). Sistem Pengenalan Suara Dengan Metode Mel Frequency Cepstral Coefficients Dan Gaussian Mixture Model. Komputika : Jurnal Sistem Komputer, 11(2), 203–210. https://doi.org/10.34010/komputika.v11i2.6655
Shao, Y., Wu, J., Ma, S., Xia, S., Lin, J., Zhang, Z., & Feng, Y. (2023). Multi-signal Joint HVCB Fault Diagnosis Research Based on Adaptive Framing MFCC Feature Extraction Method. IEEE Sensors Journal. https://doi.org/10.1109/JSEN.2023.3323674
Wang, Y., Lu, X., & Shi, D. (2022). MFCC-based deep convolutional neural network for audio depression recognition. 2022 International Conference on Asian Language Processing, IALP 2022, 162–166. https://doi.org/10.1109/IALP57159.2022.9961267
Zgank, A. (2022). Reduced MFCC Feature Extraction Dimension for Acoustic Classification of Bee Swarm Activity. 14th International Conference ELEKTRO, ELEKTRO 2022 - Proceedings. https://doi.org/10.1109/ELEKTRO53996.2022.9803441
Ahmed, S. F., Jaffari, R., Ahmed, S. S., Jawaid, M., & Talpur, S. (2022). An MFCC-based Secure Framework for Voice Assistant Systems. 2022 International Conference on Cyber Warfare and Security, ICCWS 2022 - Proceedings, 57–61. https://doi.org/10.1109/ICCWS56285.2022.9998446
Ajinurseto, G., Bakrim, L. O., & Islamuddin, N. (2023). Penerapan Metode Mel Frequency Cepstral Coefficients pada Sistem Pengenalan Suara Berbasis Desktop. Infomatek, 25(1), 11–20. https://doi.org/10.23969/infomatek.v25i1.6109
Alfujri, M. N., & Prasetio, B. H. (2022). SISTEM DETEKSI TINGKAT STRESS MENGGUNAKAN SUARA DENGAN METODE JARINGAN SARAF TIRUAN DAN EKSTRAKSI FITUR MFCC BERBASIS RASPBERRY PI. Fakultas Ilmu Komputer, Universitas Brawijaya.
Fabiana, R. A., Prasetio, B. H., & Setiawan, E. (2022). SISTEM IDENTIFIKASI KESEHATAN PENCERNAAN BERDASARKAN SUARA USUS MENGGUNAKAN CONVOLUTIONAL NEURAL NETWORK. Fakultas Ilmu Komputer, Universitas Brawijaya.
Hendry Setiawan, Windra Swastika, Ossie Leona, & Oesman Hendra Kelana. (2018). Aransemen Nada Alto, Tenor, dan Bass Menggunakan Algoritma Genetika. Teknik Informatika, Universitas Ma Chung.
Jayadi, A., Prasetio, B. H., & Akbar, S. R. (2022). SISTEM DETEKSI PENYAKIT FLU MENGGUNAKAN SUARA BATUK MENGGUNAKAN MFCC DAN KNN PADA RASPBERRY PI. Fakultas Ilmu Komputer, Universitas Brawijaya.
Kulkarni, A., Naik, V., Varpe, D. M., Atre, M., & Kumavat, S. (2023). Insect Sound Recognition Using MFCC and CNN. Research Square. https://doi.org/10.21203/rs.3.rs-3506774/v1
Mokoagow, J. N., Kaunang, M., & Hartati, R. S. (2023). ANALISIS PEMBELAJARAN TEKNIK VOKAL DALAM PADUAN SUARA. KOMPETENSI: Jurnal Ilmiah Bahasa Dan Seni , 3(10).
Pajankar, A., & Joshi, A. (2022). Convolutional Neural Networks. In Hands-on Machine Learning with Python (pp. 261–284). Apress. https://doi.org/10.1007/978-1-4842-7921-2_14
Pratama, K. B., Suyanto, S., & Rachmawati, E. (2021). Human Vocal Type Classification using MFCC and Convolutional Neural Network. International Conference on Communication and Information Technology, ICICT 2021, 43–48. https://doi.org/10.1109/ICICT52195.2021.9568474
Qian, Q., Zhou, S., Song, M., Cui, Y., & Wang, H. (2022). VICTOR: An Adaptive Framing-based Speech Content Authentication and Recovery Algorithm. 2022 IEEE 24th Int Conf on High Performance Computing & Communications; 8th Int Conf on Data Science & Systems; 20th Int Conf on Smart City; 8th Int Conf on Dependability in Sensor, Cloud & Big Data Systems & Application (HPCC/DSS/SmartCity/DependSys), 1649–1654. https://doi.org/10.1109/HPCC-DSS-SmartCity-DependSys57074.2022.00250
Sasilo, A. A., Saputra, R. A., & Ningrum, I. P. (2022). Sistem Pengenalan Suara Dengan Metode Mel Frequency Cepstral Coefficients Dan Gaussian Mixture Model. Komputika : Jurnal Sistem Komputer, 11(2), 203–210. https://doi.org/10.34010/komputika.v11i2.6655
Shao, Y., Wu, J., Ma, S., Xia, S., Lin, J., Zhang, Z., & Feng, Y. (2023). Multi-signal Joint HVCB Fault Diagnosis Research Based on Adaptive Framing MFCC Feature Extraction Method. IEEE Sensors Journal. https://doi.org/10.1109/JSEN.2023.3323674
Wang, Y., Lu, X., & Shi, D. (2022). MFCC-based deep convolutional neural network for audio depression recognition. 2022 International Conference on Asian Language Processing, IALP 2022, 162–166. https://doi.org/10.1109/IALP57159.2022.9961267
Zgank, A. (2022). Reduced MFCC Feature Extraction Dimension for Acoustic Classification of Bee Swarm Activity. 14th International Conference ELEKTRO, ELEKTRO 2022 - Proceedings. https://doi.org/10.1109/ELEKTRO53996.2022.9803441
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2024 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
Artikel ini berlisensiCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.