Image of Perbandingan kinerja algoritma support vector machine, naïve bayes, dan convolutional neural networks untuk authorship attribution pada tweet berbahasa Indonesia

Text

Perbandingan kinerja algoritma support vector machine, naïve bayes, dan convolutional neural networks untuk authorship attribution pada tweet berbahasa Indonesia



Authorship Attribution dapat digunakan untuk mengidentifikasi karakteristik penulis dalam tweet berbahasa Indonesia menggunakan metode-metode klasifikasi. Dalam penelitian ini, dibandingkan efektivitas kinerja tiga algoritma klasifikasi: Support Vector Machine, Naïve Bayes, dan Convolutional Neural Network. Fitur stylometry dan char-n-grams digunakan pembobot dalam proses klasifikasi. Fitur stylometry meliputi ciri leksikal dan sintaktikal, sementara fitur char-n-grams meliputi ciri bigram, trigram, dan 4-gram. Dataset yang digunakan terdiri dari 15.000 tweet berbahasa Indonesia dari 5 kelas akun yang dikumpulkan menggunakan scrapper. Sebanyak 10.000 tweet digunakan sebagai data latih, sedangkan 5.000 tweet digunakan sebagai data uji. Pengujian ketiga algoritma klasifikasi dilakukan pada dataset yang sama dengan evaluasi kinerja menggunakan metrik akurasi. Hasil penelitian menunjukkan bahwa Support Vector Machine memiliki performa terbaik pada bobot fitur char-n-grams dan gabungan dengan akurasi masing-masing sebesar 58.96% dan 59.96%, serta menuduki peringkat kedua dalam bobot fitur stylometry dengan akurasi sebesar 50.04%. Convolutional Neural Network hanya unggul dalam bobot fitur stylometry dengan akurasi sebesar 50.44%, dan menempati peringkat kedua dalam bobot fitur char-n-grams dan gabungan dengan akurasi masing-masing sebesar 55.82% dan 59.42%. Naïve Bayes berada pada peringkat terakhir dengan akurasi terendah pada setiap bobot fitur, yaitu 40.46% pada bobot fitur stylometry, 50.86% pada bobot fitur char-n-grams, dan 51.02% pada bobot fitur gabungan.
Kata Kunci : Authorship attribution, stylometry, char-n-grams, Support Vector Machine, Naïve Bayes, Convolutional Neural Network


Ketersediaan

#
Perpustakaan FST (SKRIPSI) TI 352 2023
TI352
Tersedia

Informasi Detail

Judul Seri
-
No. Panggil
TI352
Penerbit Prodi TI Sains Teknologi UIN JKT : Jakarta, Ciputat.,
Deskripsi Fisik
xvii, 99 hlm; 28 cm.
Bahasa
Bahasa Indonesia
ISBN/ISSN
-
Klasifikasi
TI352
Tipe Isi
-
Tipe Media
-
Tipe Pembawa
-
Edisi
-
Subjek
Info Detail Spesifik
-
Pernyataan Tanggungjawab

Versi lain/terkait

Tidak tersedia versi lain




Informasi


Akses Katalog Publik Daring - Gunakan fasilitas pencarian untuk mempercepat penemuan data katalog