Penerapan Adaptive Framing pada Generator Koefisien Frekuensi Mel untuk Sistem Klasifikasi Tipe Vokal

Penerapan Adaptive Framing pada Generator Koefisien Frekuensi Mel untuk Sistem Klasifikasi Tipe Vokal

Penulis

  • Riki Boy Panggabean Fakultas Ilmu Komputer, Universitas Brawijaya
  • Barlian Henryranu Prasetio Fakultas Ilmu Komputer, Universitas Brawijaya

Kata Kunci:

Adaptive Framing, CNN, MFCC, Raspberry Pi, Tipe Vokal

Abstrak

Tipe vokal manusia: Sopran, Alto, Tenor, dan Bass seringkali diidentifikasi melalui interaksi dengan alat musik seperti piano dan bimbingan dari ahli vokal. Pendekatan ini kurang praktis dan memiliki keterbatasan dalam portabilitas serta aksesibilitas. Penelitian ini bertujuan untuk mengatasi keterbatasan tersebut dengan mengembangkan alat berupa sistem penerapan Mel-Frequency Cepstral Coefficients (MFCC) dan Convolutional Neural Network (CNN). Penelitian ini menggunakan pendekatan Adaptive Framing pada MFCC untuk meningkatkan hasil ekstraksi fitur suara. Sistem dibuat di dalam Raspberry Pi 4B dengan input mini usb microphone dan output LCD 3.5 Inch. Sistem yang telah dikembangkan menunjukkan kinerja yang baik dari segi fungsionalitas, mulai dari tahap inisialisasi (booting) hingga menghasilkan output klasifikasi tipe vokal manusia pada Raspberry Pi. Nilai akurasi pengujian model dengan menggunakan algoritma CNN adalah sebesar 94,5%. Hal tersebut menandakan model yang dibuat memiliki akurasi yang baik untuk diimplementasikan. Pada pengujian alat, hasil yang didapat untuk melakukan klasifikasi tipe vokal manusia adalah sebesar 65%. Sistem ini memenuhi kebutuhan penentuan tipe vokal tanpa ketergantungan pada ahli vokal, portabilitas tinggi, dan dapat digunakan dalam berbagai konteks.

Referensi

Ahmed, S. F., Jaffari, R., Ahmed, S. S., Jawaid, M., & Talpur, S. (2022). An MFCC-based Secure Framework for Voice Assistant Systems. 2022 International Conference on Cyber Warfare and Security, ICCWS 2022 - Proceedings, 57–61. https://doi.org/10.1109/ICCWS56285.2022.9998446

Ajinurseto, G., Bakrim, L. O., & Islamuddin, N. (2023). Penerapan Metode Mel Frequency Cepstral Coefficients pada Sistem Pengenalan Suara Berbasis Desktop. Infomatek, 25(1), 11–20. https://doi.org/10.23969/infomatek.v25i1.6109

Alfujri, M. N., & Prasetio, B. H. (2022). SISTEM DETEKSI TINGKAT STRESS MENGGUNAKAN SUARA DENGAN METODE JARINGAN SARAF TIRUAN DAN EKSTRAKSI FITUR MFCC BERBASIS RASPBERRY PI. Fakultas Ilmu Komputer, Universitas Brawijaya.

Fabiana, R. A., Prasetio, B. H., & Setiawan, E. (2022). SISTEM IDENTIFIKASI KESEHATAN PENCERNAAN BERDASARKAN SUARA USUS MENGGUNAKAN CONVOLUTIONAL NEURAL NETWORK. Fakultas Ilmu Komputer, Universitas Brawijaya.

Hendry Setiawan, Windra Swastika, Ossie Leona, & Oesman Hendra Kelana. (2018). Aransemen Nada Alto, Tenor, dan Bass Menggunakan Algoritma Genetika. Teknik Informatika, Universitas Ma Chung.

Jayadi, A., Prasetio, B. H., & Akbar, S. R. (2022). SISTEM DETEKSI PENYAKIT FLU MENGGUNAKAN SUARA BATUK MENGGUNAKAN MFCC DAN KNN PADA RASPBERRY PI. Fakultas Ilmu Komputer, Universitas Brawijaya.

Kulkarni, A., Naik, V., Varpe, D. M., Atre, M., & Kumavat, S. (2023). Insect Sound Recognition Using MFCC and CNN. Research Square. https://doi.org/10.21203/rs.3.rs-3506774/v1

Mokoagow, J. N., Kaunang, M., & Hartati, R. S. (2023). ANALISIS PEMBELAJARAN TEKNIK VOKAL DALAM PADUAN SUARA. KOMPETENSI: Jurnal Ilmiah Bahasa Dan Seni , 3(10).

Pajankar, A., & Joshi, A. (2022). Convolutional Neural Networks. In Hands-on Machine Learning with Python (pp. 261–284). Apress. https://doi.org/10.1007/978-1-4842-7921-2_14

Pratama, K. B., Suyanto, S., & Rachmawati, E. (2021). Human Vocal Type Classification using MFCC and Convolutional Neural Network. International Conference on Communication and Information Technology, ICICT 2021, 43–48. https://doi.org/10.1109/ICICT52195.2021.9568474

Qian, Q., Zhou, S., Song, M., Cui, Y., & Wang, H. (2022). VICTOR: An Adaptive Framing-based Speech Content Authentication and Recovery Algorithm. 2022 IEEE 24th Int Conf on High Performance Computing & Communications; 8th Int Conf on Data Science & Systems; 20th Int Conf on Smart City; 8th Int Conf on Dependability in Sensor, Cloud & Big Data Systems & Application (HPCC/DSS/SmartCity/DependSys), 1649–1654. https://doi.org/10.1109/HPCC-DSS-SmartCity-DependSys57074.2022.00250

Sasilo, A. A., Saputra, R. A., & Ningrum, I. P. (2022). Sistem Pengenalan Suara Dengan Metode Mel Frequency Cepstral Coefficients Dan Gaussian Mixture Model. Komputika : Jurnal Sistem Komputer, 11(2), 203–210. https://doi.org/10.34010/komputika.v11i2.6655

Shao, Y., Wu, J., Ma, S., Xia, S., Lin, J., Zhang, Z., & Feng, Y. (2023). Multi-signal Joint HVCB Fault Diagnosis Research Based on Adaptive Framing MFCC Feature Extraction Method. IEEE Sensors Journal. https://doi.org/10.1109/JSEN.2023.3323674

Wang, Y., Lu, X., & Shi, D. (2022). MFCC-based deep convolutional neural network for audio depression recognition. 2022 International Conference on Asian Language Processing, IALP 2022, 162–166. https://doi.org/10.1109/IALP57159.2022.9961267

Zgank, A. (2022). Reduced MFCC Feature Extraction Dimension for Acoustic Classification of Bee Swarm Activity. 14th International Conference ELEKTRO, ELEKTRO 2022 - Proceedings. https://doi.org/10.1109/ELEKTRO53996.2022.9803441

Diterbitkan

19 Feb 2024

Cara Mengutip

Panggabean, R. B., & Prasetio, B. H. (2024). Penerapan Adaptive Framing pada Generator Koefisien Frekuensi Mel untuk Sistem Klasifikasi Tipe Vokal. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 8(2). Diambil dari https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/13361

Terbitan

Bagian

Artikel
Loading...