Image of Dataset Pedoman Disambiguasi Entitas Bernama (Entity linking) Dengan Pemanfaatan Daftar Ektraksi Entitas Bernama
Pada Penelitian IndQNER

Text

Dataset Pedoman Disambiguasi Entitas Bernama (Entity linking) Dengan Pemanfaatan Daftar Ektraksi Entitas Bernama Pada Penelitian IndQNER



Indonesia, sebagai negara dengan populasi terbesar keempat di dunia, memiliki mayoritas penduduk yang menganut agama Islam. Di era teknologi, muncul Chat-GPT, kecerdasan buatan yang mampu menjawab pertanyaan dan berkomunikasi seperti manusia. Namun, Munas Alim Ulama NU 2023 mengharamkan penggunaan kecerdasan buatan untuk meminta fatwa terkait keagamaan, menggarisbawahi kebutuhan akan Chat-GPT "Islami" yang memiliki otoritas dalam bidang keagamaan. Untuk mendukung hal tersebut, diperlukan basis pengetahuan yang relevan dari Al-Qur'an dan hadis. Salah satu proses kunci dalam pembentukan basis pengetahuan tersebut adalah disambiguasi entitas bernama. Namun, hingga saat ini, belum tersedia dataset pedoman untuk disambiguasi entitas bernama pada terjemahan Al-Quran bahasa Indonesia. Penulis mengatasi kekosongan ini dengan membangun dataset pedoman disambiguasi entitas bernama dengan memanfaatkan penelitian sebelumnya yaitu , dataset pedoman IndQNER dalam konteks proses pengenalan entitas bernama pada 8 surat di terjemahan Al-Quran bahasa Indonesia , dataset pedoman yang dibuat disebut sebagai IndQEL (Entity linking Benchmark Dataset from the Indonesian Translation of the Quran). Metodologi penelitian mencakup ekstraksi entitas bernama dari dataset IndQNER, proses pelabelan, evaluasi pelabelan, dan eksperimen pada sistem disambiguasi entitas bernama multilingual. Hasil eksperimen menunjukkan bahwa IndQEL menjadi metrik evaluasi yang efektif untuk sistem disambiguasi entitas bernama pada terjemahan Al-Qur’an Berbahasa Indonesia. MAG menghasilkan 1933 link dari 2456 entitas bernama dan 523 entitas tanpa link (Not In Lexicon/NIL) pada dataset IndQEL. WAT menunjukkan kinerja terbaik dengan nilai recall 0.7486, precision 0.7681, dan F1 0.7573. Dengan adanya IndQEL, satu langkah penting dalam membangun basis pengetahuan relevan untuk bidang keislaman telah terpenuhi, mendorong penelitian lebih lanjut dalam pengembangan sistem disambiguasi entitas bernama pada terjemahan Al-Qur’an Berbahasa Indonesia.
vii
Kata Kunci : Basis Pengetahuan, Disambiguasi Entitas Bernama, Dataset Pedoman, IndQNER, IndQEL, Sistem Disambiguasi Entitas Bernama Multilingual


Ketersediaan

#
Perpustakaan FST (Skripsi) TI 345 2024
TI0345
Tersedia

Informasi Detail

Judul Seri
-
No. Panggil
TI 345 2024
Penerbit Prodi TI Sains Teknologi UIN JKT : Jakarta, Ciputat.,
Deskripsi Fisik
xvi, 132 hlm; 28 cm.
Bahasa
Bahasa Indonesia
ISBN/ISSN
-
Klasifikasi
345
Tipe Isi
-
Tipe Media
-
Tipe Pembawa
-
Edisi
-
Subjek
-
Info Detail Spesifik
-
Pernyataan Tanggungjawab

Versi lain/terkait

Tidak tersedia versi lain




Informasi


Akses Katalog Publik Daring - Gunakan fasilitas pencarian untuk mempercepat penemuan data katalog