Detail Cantuman
Pencarian SpesifikText
Perbandingan kinerja algoritma support vector machine, naïve bayes, dan convolutional neural networks untuk authorship attribution pada tweet berbahasa Indonesia
Authorship Attribution dapat digunakan untuk mengidentifikasi karakteristik penulis dalam tweet berbahasa Indonesia menggunakan metode-metode klasifikasi. Dalam penelitian ini, dibandingkan efektivitas kinerja tiga algoritma klasifikasi: Support Vector Machine, Naïve Bayes, dan Convolutional Neural Network. Fitur stylometry dan char-n-grams digunakan pembobot dalam proses klasifikasi. Fitur stylometry meliputi ciri leksikal dan sintaktikal, sementara fitur char-n-grams meliputi ciri bigram, trigram, dan 4-gram. Dataset yang digunakan terdiri dari 15.000 tweet berbahasa Indonesia dari 5 kelas akun yang dikumpulkan menggunakan scrapper. Sebanyak 10.000 tweet digunakan sebagai data latih, sedangkan 5.000 tweet digunakan sebagai data uji. Pengujian ketiga algoritma klasifikasi dilakukan pada dataset yang sama dengan evaluasi kinerja menggunakan metrik akurasi. Hasil penelitian menunjukkan bahwa Support Vector Machine memiliki performa terbaik pada bobot fitur char-n-grams dan gabungan dengan akurasi masing-masing sebesar 58.96% dan 59.96%, serta menuduki peringkat kedua dalam bobot fitur stylometry dengan akurasi sebesar 50.04%. Convolutional Neural Network hanya unggul dalam bobot fitur stylometry dengan akurasi sebesar 50.44%, dan menempati peringkat kedua dalam bobot fitur char-n-grams dan gabungan dengan akurasi masing-masing sebesar 55.82% dan 59.42%. Naïve Bayes berada pada peringkat terakhir dengan akurasi terendah pada setiap bobot fitur, yaitu 40.46% pada bobot fitur stylometry, 50.86% pada bobot fitur char-n-grams, dan 51.02% pada bobot fitur gabungan.
Kata Kunci : Authorship attribution, stylometry, char-n-grams, Support Vector Machine, Naïve Bayes, Convolutional Neural Network
Ketersediaan
Informasi Detail
Judul Seri |
-
|
---|---|
No. Panggil |
TI352
|
Penerbit | Prodi TI Sains Teknologi UIN JKT : Jakarta, Ciputat., 2023 |
Deskripsi Fisik |
xvii, 99 hlm; 28 cm.
|
Bahasa |
Bahasa Indonesia
|
ISBN/ISSN |
-
|
Klasifikasi |
TI352
|
Tipe Isi |
-
|
Tipe Media |
-
|
---|---|
Tipe Pembawa |
-
|
Edisi |
-
|
Subjek | |
Info Detail Spesifik |
-
|
Pernyataan Tanggungjawab |
Siti Ummi Masruroh
|
Versi lain/terkait
Tidak tersedia versi lain
Informasi
Akses Katalog Publik Daring - Gunakan fasilitas pencarian untuk mempercepat penemuan data katalog