Studi Komparasi Regresi Logistik Biner dan K-Nearest Neighbor Pada Kasus Prediksi Curah Hujan
DOI:
https://doi.org/10.29313/statistika.v24i1.2739Keywords:
Regresi Logistik Biner, KNN, Curah HujanAbstract
ABSTRAK
Perubahan iklim yang sedang terjadi di berbagai belahan dunia sebagai akibat dari pemanasan global telah menyebabkan ketidakpastian cuaca. Salah satu perubahan yang dirasakan adalah intensitas curah hujan. Hal ini mengakibatkan prediksi akan curah hujan menjadi penting untuk dilakukan. Ada beberapa teknik analisis data yang digunakan untuk prediksi curah hujan, diantaranya klasifikasi. Pada penelitian ini, dengan menggunakan variabel temperatur, kelembapan, lamanya penyinaran, dan kecepatan angin, akan dilakukan prediksi terhadap klasifikasi curah hujan di Kota Bogor. Model yang digunakan adalah Regresi Logistik Biner dan K-Nearest Neighbor. K yang digunakan pada model K-Nearest Neighbor yaitu 1 hingga 18. Untuk membandingkan kedua model, dibentuk confusion matrix yang selanjutnya digunakan untuk menghitung akurasi model. Akurasi model Regresi Logistik Biner sebesar 92,746%, adapun akurasi model K-Nearest Neighbor adalah sebesar 94,81865%. Dengan demikian, pada penelitian ini model K-Nearest Neighbor lebih baik dibandingkan model Regresi Logistik Biner.
ABSTRACT
Climate change due to global warming occurring in all parts of the world makes the weather unpredictable. One of the changes felt is the intensity of rainfall. This makes it important to predict rainfall. There are several data analysis techniques used to predict rainfall, including classification. In this research, using the variables temperature, humidity, duration of sunlight, and wind speed, predictions will be made on the classification of rainfall in the city of Bogor. The models used are Binary Logistic Regression and K-Nearest Neighbor. The K used in the K-Nearest Neighbor model is 1 to 18. To compare the two models, a confusion matrix is formed and then used to calculate the model accuracy. The accuracy of the Binary Logistic Regression model is 92.746%, while the accuracy of the K-Nearest Neighbor model is 94,81865%. Thus, in this research the K-Nearest Neighbor model is better than the Binary Logistic Regression model.
References
BMKG. (2011). Evaluasi cuaca dan sifat hujan Bulan Agustus 2011 serta prakiraan cuaca dan sifat hujan Bulan September 2011, Bulletin Metereologi. Badan Metereologi Klimatologi dan Geofisika Stasiun Metereologi Otorita Batam, 1, p. 39.
Fallo, S.I. (2021). Support Vector Machine, Naive Bayes Classifier, dan Regresi Logistik Ordinal dalam Prediksi Cuaca. Universitas Gadjah Mada.
James, G. et al. (2017). An Introduction to Statistical Learning with Applications in R. Available at: https://doi.org/10.1007/978-1-4614-7138-7_8.
Jayanti, R.D. and Noeryanti (2014) ‘Apilkasi Metode K-Nearest Neighbor dan Analisis Diskriminan untuk Analisis Resiko Kredit pada Koperasi Simpan Pinjam di Kopinkra Sumber Rejeki’, Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST), pp. 275–284.
Rahmawati, F. and Suratman, R.Y. (2022). Performa Regresi Ridge dan Regresi Lasso pada Data dengan Multikolinearitas, Leibniz: Jurnal Matematika, 2(2), pp. 1–10. Available at: https://doi.org/10.59632/leibniz.v2i2.176.
Ridwan, M. and Sunendiari, S. (2021). Mendeteksi dan Mengatasi Multikolinieritas pada Data Penelitian Diabetes Melitus Wanita Suku Indian Tahun 2018, Prosiding Statistika, pp. 64–70. Available at: https://karyailmiah.unisba.ac.id/index.php/statistika/article/view/25565.
Rismia, E.R., Widiharih, T. and Santoso, R. (2021). Klasifikasi Regresi Logistik Multinomial Dan Fuzzy K-Nearest Neighbor (Fk-Nn) Dalam Pemilihan Metode Kontrasepsi Di Kecamatan Bulakamba, Kabupaten Brebes, Jawa Tengah, Jurnal Gaussian, 10(4), pp. 476–487. Available at: https://doi.org/10.14710/j.gauss.v10i4.33095.
Sepang, F., Komalig, H. and Hatidja, D. (2012). Penerapan Regresi Logistik untuk Menentukan Faktor-Faktor yang Mempengaruhi Pemilihan Jenis Alat Kontrasepsi di Kecamatan Modayag Barat, do. Jurnal MIPA Unsrat Online, 1(1), pp. 1–5.
Susilokarti, D. et al. (2015). Identifikasi Perubahan Iklim Berdasarkan Data Curah Hujan di Wilayah Selatan Jatiluhur Kabupaten Subang, Jawa Barat, Jurnal Agritech, 35(01), p. 98. Available at: https://journal.ugm.ac.id/agritech/article/view/13038/15155.
Tampil, Y., Komaliq, H. and Langi, Y. (2017). Analisis Regresi Logistik Untuk Menentukan Faktor-Faktor Yang Mempengaruhi Indeks Prestasi Kumulatif (IPK) Mahasiswa FMIPA Universitas Sam Ratulangi Manado, d’CARTESIAN, 6(2), pp. 56–62. Available at: https://doi.org/10.35799/dc.6.2.2017.17023.
Utami, I.T., Fadjryani and Daniaty, F.F.D. (2020). Perbandingan Klasifikasi Status Pendonor Darah dengan Menggunakan Regresi Logistik dan K-Nearest Neighbor’, Jurnal.Stis.Ac.Id, V.12.1.202. Available at: https://jurnal.stis.ac.id/index.php/jurnalasks/article/view/217%0Ahttps://jurnal.stis.ac.id/index.php/jurnalasks/article/download/217/83.