Sistem Tanya Jawab Closed-Domain terhadap Dokumen Fatwa menggunakan Retrieval Augmented Generation dan Large Language Model
Kata Kunci:
retrieval augmented generation, large language model, fatwa, syariahAbstrak
Agama Islam menjunjung tinggi kesesuaian antara hukum serta prinsip syariah dengan pengambilan keputusan dan tanggapan seorang Muslim terhadap setiap masalah atau fenomena sosial yang terjadi. Permasalahan dan berbagai fenomena sosial baru seiring berkembangnya teknologi serta peradaban memunculkan kebutuhan fatwa sebagai dasar pengambilan keputusan seorang Muslim dalam menghadapi kedua hal tersebut. Berbagai figur religi serta Majelis Ulama Indonesia (MUI) berupaya memenuhi permintaan ini dengan sejumlah aktivitas dakwah, namun permintaan masif dan berulang dari masyarakat memunculkan risiko penyampaian materi dakwah secara dangkal, inkonsistensi materi terhadap sumber, misinformasi, dan minimnya etika dalam menyampaikan materi. Solusi yang diusulkan dalam penelitian ini berupa rancangan sistem tanya jawab yang menghasilkan jawaban komprehensif berdasarkan dokumen fatwa yang sudah ada. Solusi ini dapat diwujudkan menggunakan rangka kerja Retrieval Augmented Generation (RAG) yang terdiri dari Large Language Model (LLM) sebagai generator, yaitu penghasil jawaban, serta retriever sebagai pencari dokumen sumber dari jawaban. Untuk memastikan sistem dapat membentuk jawaban dengan kemiripan yang tinggi terhadap dokumen fatwa, penelitian ini juga membandingkan metode pencarian untuk information retrieval seperti cosine similarity dan Maximum Inner Product Search (MIPS). Hasil pengujian terhadap komponen retriever menunjukkan bahwa metode pencarian cosine similarity dan MIPS mencapai nilai kinerja terbaik pada setiap metrik pada jumlah K sebanyak 25, salah satunya F1-Score@K dengan nilai 0,52. Nilai rerata terbaik dari dua metrik kinerja generator tercapai dengan integrasi RAG, yaitu 0,67 untuk P-BERT dan 0,63 untuk F-BERT.
Referensi
Awass, O., 2019. Fatwa, Discursivity, and the Art of Ethical Embedding. Journal of the American Academy of Religion, 87(3), pp.765–790. https://doi.org/10.1093/jaarel/lfz031.
Hariri, F.R., 2021. Implementation of Fuzzy C-Means for Clustering the Majelis Ulama Indonesia (MUI) Fatwa Documents. Jurnal Online Informatika, 6(1), p.79. https://doi.org/10.15575/join.v6i1.591.
Hirschman, L. dan Gaizauskas, R., 2001. Natural language question answering: the view from here. Natural Language Engineering, 7(4), pp.275–300. https://doi.org/10.1017/S1351324901002807.
Kashish, P., Mohammed Arshad, S., N, S., and Department of Electronics and Communication BNMIT Bangalore, Karnataka State, India, 2022. VOICE ENBALED Q & A SYSTEM. International Journal of Engineering Applied Sciences and Technology, 7(7), pp.78–85. https://doi.org/10.33564/IJEAST.2022.v07i07.015.
Kim, S.H., Schramm, S., Wihl, J., Raffler, P., Tahedl, M., Canisius, J., Luiken, I., Endrös, L., Reischl, S., Marka, A., Walter, R., Schillmaier, M., Zimmer, C., Wiestler, B. dan Hedderich, D.M., 2024. Boosting LLM-Assisted Diagnosis: 10-Minute LLM Tutorial Elevates Radiology Residents’ Performance in Brain MRI Interpretation. https://doi.org/10.1101/2024.07.03.24309779.
Lewis, P., Perez, E., Piktus, A., Petroni, F., Karpukhin, V., Goyal, N., Küttler, H., Lewis, M., Yih, W., Rocktäschel, T., Riedel, S. dan Kiela, D., 2021. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. Available at: <http://arxiv.org/abs/2005.11401> [Diakses 27 September 2024].
Munshi, A.A., Al Sabban, W.H., Farag, A.T., Rakha, O.E., Al Sallab, A. dan Alotaibi, M., 2022. Automated Islamic Jurisprudential Legal Opinions Generation Using Artificial Intelligence. Pertanika Journal of Science and Technology, 30(2), pp.1135–1156. https://doi.org/10.47836/pjst.30.2.16.
Salim, D.P., 2022. Islamic political supports and voting behaviors in majority and minority Muslim Provinces in Indonesia. Indonesian Journal of Islam and Muslim Societies, 12(1), pp.85–110. https://doi.org/10.18326/ijims.v12i1.85-110.
Saragih, A.F.F., Sagala, R.F. dan Effendi, E., 2023. Peran Media Sosial Dalam Membangun Dakwah Islam yang Efektif. Khidmatussifa: Journal of Islamic Studies, 2(1), pp.31–41. https://doi.org/10.56146/khidmatussifa.v2i1.57.
Sebihi, A., Moazzam, A., 2024. ISLAM IN THE DIGITAL AGE: NAVIGATING FAITH AND TECHNOLOGY. EPRA International Journal of Research & Development (IJRD), pp.77–80. https://doi.org/10.36713/epra15075.
Singhal, A., n.d. Modern Information Retrieval: A Brief Overview.
Sokolova, M. dan Lapalme, G., 2009. A systematic analysis of performance measures for classification tasks. Information Processing & Management, 45(4), pp.427–437. https://doi.org/10.1016/j.ipm.2009.03.002.
Yung, H., 2003. Islam in South East Asia and Christian Mission. Transformation. [online] https://doi.org/10.1177/026537880302000406.
Zhang, T., Kishore, V., Wu, F., Weinberger, K.Q. dan Artzi, Y., 2020. BERTScore: Evaluating Text Generation with BERT. Available at: <http://arxiv.org/abs/1904.09675> [Diakses 28 Oktober 2024]
Awass, O., 2019. Fatwa, Discursivity, and the Art of Ethical Embedding. Journal of the American Academy of Religion, 87(3), pp.765–790. https://doi.org/10.1093/jaarel/lfz031.
Hariri, F.R., 2021. Implementation of Fuzzy C-Means for Clustering the Majelis Ulama Indonesia (MUI) Fatwa Documents. Jurnal Online Informatika, 6(1), p.79. https://doi.org/10.15575/join.v6i1.591.
Hirschman, L. dan Gaizauskas, R., 2001. Natural language question answering: the view from here. Natural Language Engineering, 7(4), pp.275–300. https://doi.org/10.1017/S1351324901002807.
Kashish, P., Mohammed Arshad, S., N, S., and Department of Electronics and Communication BNMIT Bangalore, Karnataka State, India, 2022. VOICE ENBALED Q & A SYSTEM. International Journal of Engineering Applied Sciences and Technology, 7(7), pp.78–85. https://doi.org/10.33564/IJEAST.2022.v07i07.015.
Kim, S.H., Schramm, S., Wihl, J., Raffler, P., Tahedl, M., Canisius, J., Luiken, I., Endrös, L., Reischl, S., Marka, A., Walter, R., Schillmaier, M., Zimmer, C., Wiestler, B. dan Hedderich, D.M., 2024. Boosting LLM-Assisted Diagnosis: 10-Minute LLM Tutorial Elevates Radiology Residents’ Performance in Brain MRI Interpretation. https://doi.org/10.1101/2024.07.03.24309779.
Lewis, P., Perez, E., Piktus, A., Petroni, F., Karpukhin, V., Goyal, N., Küttler, H., Lewis, M., Yih, W., Rocktäschel, T., Riedel, S. dan Kiela, D., 2021. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. Available at: <http://arxiv.org/abs/2005.11401> [Diakses 27 September 2024].
Munshi, A.A., Al Sabban, W.H., Farag, A.T., Rakha, O.E., Al Sallab, A. dan Alotaibi, M., 2022. Automated Islamic Jurisprudential Legal Opinions Generation Using Artificial Intelligence. Pertanika Journal of Science and Technology, 30(2), pp.1135–1156. https://doi.org/10.47836/pjst.30.2.16.
Salim, D.P., 2022. Islamic political supports and voting behaviors in majority and minority Muslim Provinces in Indonesia. Indonesian Journal of Islam and Muslim Societies, 12(1), pp.85–110. https://doi.org/10.18326/ijims.v12i1.85-110.
Saragih, A.F.F., Sagala, R.F. dan Effendi, E., 2023. Peran Media Sosial Dalam Membangun Dakwah Islam yang Efektif. Khidmatussifa: Journal of Islamic Studies, 2(1), pp.31–41. https://doi.org/10.56146/khidmatussifa.v2i1.57.
Sebihi, A., Moazzam, A., 2024. ISLAM IN THE DIGITAL AGE: NAVIGATING FAITH AND TECHNOLOGY. EPRA International Journal of Research & Development (IJRD), pp.77–80. https://doi.org/10.36713/epra15075.
Singhal, A., n.d. Modern Information Retrieval: A Brief Overview.
Sokolova, M. dan Lapalme, G., 2009. A systematic analysis of performance measures for classification tasks. Information Processing & Management, 45(4), pp.427–437. https://doi.org/10.1016/j.ipm.2009.03.002.
Yung, H., 2003. Islam in South East Asia and Christian Mission. Transformation. [online] https://doi.org/10.1177/026537880302000406.
Zhang, T., Kishore, V., Wu, F., Weinberger, K.Q. dan Artzi, Y., 2020. BERTScore: Evaluating Text Generation with BERT. Available at: <http://arxiv.org/abs/1904.09675> [Diakses 28 Oktober 2024]
Unduhan
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2025 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer

Artikel ini berlisensiCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.