Monocular Depth Estimation pada Scene dalam Ruangan menggunakan U-Net dengan ResNet
Kata Kunci:
Computer Vision, Deep Learning, Residual Networks, U-Net, Monocular Depth EstimationAbstrak
Sistem mengemudi otonom telah menjadi topik yang menarik perhatian dalam bidang akademisi, industri, dan militer pada beberapa tahun terakhir. Sensor aktif seperti Light Detection and Ranging (LiDAR) umumnya dapat digunakan untuk mengukur jarak terhadap suatu objek, namun biaya dan komputasi yang diperlukan sangat besar. Untuk memperoleh biaya yang relatif lebih rendah maka kamera monokular menjadi solusinya. Berdasarkan penelitian sebelumnya, pengestimasian nilai kedalaman pada citra yang berasal dari kamera monokular dengan metode Deep Neural Networks (DNN) terbukti mampu bekerja dengan baik. Arsitektur DNN U-Net dengan menggunakan Residual Network (ResNet) pada bagian encoder digunakan pada penelitian ini. Proses pelatihan, validasi, dan pengujian model dilakukan pada dataset DIODE: A Dense Indoor and Outdoor Depth Dataset dengan total 8899 data. Pada tahap pelatihan dan validasi model dilakukan dengan menggunakan optimasi Adam. Penelitian ini memperoleh model terbaik dengan menggunakan nilai learning rate sebesar 1e-3 dan bobot pada fungsi loss sebesar 0.3. Model ini memperoleh metrik evaluasi yang mampu menyaingi penelitian sebelumnya dengan nilai RMSE sebesar 0.2272, REL sebesar 1.3676, akurasi dengan threshold 1.25 sebesar 56.22%, akurasi dengan threshold 1.252 sebesar 78.97%, dan akurasi dengan threshold 1.253 sebesar 89.29%. Pengujian inferensi model memperoleh jumlah frames per second (FPS) pada rentang 5-12 FPS.