Implementasi n-Gram dalam Analisis Sentimen Masyarakat DIY terhadap PSBB Jawa-Bali Jilid II Menggunakan Naive Bayes Classifier

Authors

  • Syifa Ayu Anjani Universitas Islam Indonesia
  • Achmad Fauzan Universitas Islam Indonesia

DOI:

https://doi.org/10.29313/statistika.v21i2.294

Keywords:

Analisis Sentimen, Naïve Bayes Classifier, PSBB Jawa-Bali, Twitter Crawling

Abstract

Coronavirus Disease (COVID-19) telah menyebar dengan sangat cepat ke seluruh dunia, termasuk Indonesia. Dalam upaya pencegahan penularan COVID-19, pemerintah menerapkan Pembatasan Sosial Berskala Besar (PSBB) di seluruh provinsi di Pulau Jawa dan Bali dari tanggal 26 Januari 2021 s.d. 8 Februari 2021. Pemberlakuan PSBB Jawa-Bali menimbulkan tanggapan positif maupun negatif dari masyarakat dalam media sosial twitter, khususnya masyarakat yang berlokasi di Daerah Istimewa Yogyakarta. Sehingga penting untuk dilakukan analisis terhadap tanggapan tersebut agar dapat mengetahui secara umum hal apa yang sering dikeluhkan masyarakat DIY terkait PSBB Jawa-Bali jilid II dan menjadi bahan evaluasi bagi pemerintah DIY dalam menjalankan kebijakan PSBB yang telah dibuat. Penelitian ini menggunakan teknik crawling untuk memperoleh data tweet (tanggapan) masyarakat dalam twitter. Kemudian, dilakukan preprocessing pada data agar siap untuk dianalisis. Tokenization dilakukan menggunakan metode n-gram, yang terdiri dari unigram, bigram, dan trigram. Selanjutnya, data diklasifikasikan berdasarkan kategori sentimen positif dan sentimen negatif menggunakan Naïve Bayes Classifier (NBC). Setelah itu akan dilakukan evaluasi pada hasil klasifikasi menggunakan confusion matrix yang akan menghasilkan nilai akurasi. Berdasarkan hasilnya, klasifikasi dengan NBC memiliki tingkat akurasi sebesar 82,14%. Klasifikasi dengan NBC dan unigram menghasilkan akurasi sebesar 83,04%, dengan bigram menghasilkan akurasi sebesar 80,36%, dan dengan trigram menghasilkan akurasi sebesar 82,14%.

References

Darmawidjadja, M. I., Alamsah, D., & Rahman, M. F. (2017). KLASIFIKASI UNTUK DIAGNOSA DIABETES MENGGUNAKAN METODE BAYESIAN REGULARIZATION NEURAL NETWORK (RBNN). Jurnal Informatika, 41.

Fitriyani, & Arifin, T. (2020). PENERAPAN WORD N-GRAM UNTUK SENTIMENT ANALYSIS REVIEW MENGGUNAKAN METODE SUPPORT VECTOR MACHINE. Jurnal Sistem Informasi, 610-621.

Han, J., Kamber, M., & Pei, J. (2012). Data Mining Concepts and Techniques. USA: Elsevier Inc.

Larose, D. T. (2005). Discovering Knowledge in Data. USA: John Wiley & Sons, Inc.

Larose, D. T. (2006). Data Mining Methods and Models. USA: John Wiley & Sons Inc.

Liu, B. (2015). Sentiment Analysis. USA: Cambridge University.

Luthfi, E. T., & Kusrini. (2009). Algoritma Data Mining. Yogyakarta: Andi offset.

Melita, R., Amrizal, V., Suseno, H. B., & Dirjam, T. (2018). PENERAPAN METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) DAN COSINE SIMILARITY PADA SISTEM TEMU KEMBALI INFORMASI UNTUK MENGETAHUI SYARAH HADITS BERBASIS WEB. Jurnal Teknik Informatika, 149.

Nugraha, F. A., Harani, N. H., & Habibi, R. (2020). Analisis Sentimen Terhadap Pembatasan Sosial Menggunakan Deep Learning. Bandung: Kreatif Industri Nusantara.

Nugroho, A. (2018). Analisis Sentimen Pada Media Sosial Twitter Menggunakan Naive Bayes Classifier Dengan Ekstrasi Fitur N-Gram. Jurnal Sains Komputer & Informatika, 200-209.

Nugroho, A., & Santoso, E. B. (2019). Analisis Sentimen Calon Presiden Indonesia 2019 Berdasarkan Komentar Publik di Facebook. Jurnal Eksplora Informatika, 63.

Pintoko, B. M., & L., K. M. (2018). Analisis Sentimen Jasa Transportasi Online pada Twitter Menggunakan Metode Naive Bayes Classifier. e-Proceeding of Engineering, 8122

Prasetyo, E. (2012). Data Mining Konsep dan Aplikasi Menggunakan Matlab. Yogyakarta: Andi.

Saleh, A. (2015). Implementasi Metode Klasifikasi Naïve Bayes Dalam Memprediksi Besarnya Penggunaan Listrik Rumah Tangga. Citec Journal, 209-210.

Septiani, L., & Sibaroni, Y. (2019). Sentiment Analysis Terhadap Tweet Bernada Sarkasme Berbahasa Indonesia. Jurnal Linguistik Komputasional, 62.

Setiawan, D. (2009). Panduan Praktis Mengoptimalkan Twitter. Jakarta: PT TransMedia.

Tan, P. N., Steinbach, M., & Kumar, V. (2006). Introduction to Data Mining. USA: Addison-Wesley.

Tuhuteru, H. (2020). Analisis Sentimen Masyarakat Terhadap Pembatasan Sosial Berskala Besar Menggunakan Algoritma Support Vector Machine. Information System Development, 3.

Ulwan, M. N. (2016). Pattern Recognition Pada Unstructured Data Teks Menggunakan Support Vector Machine Dan Association. Yogyakarta: Program Studi Statistika FMIPA UII.

Zaman, B., Hariyanti, E., & Purwanti, E. (2015). Sistem Deteksi Bahasa pada Dokumen Menggunakan N-Gram. Jurnal Multinetics, 22.

Downloads

Published

2021-11-21

Issue

Section

Articles