Klasifikasi Status Indeks Desa Membangun Jawa Barat Menggunakan Algoritma XGBoost
DOI:
https://doi.org/10.29313/jrs.v4i2.5011Keywords:
Indeks Desa Membangun, Klasifikasi, XGBoostAbstract
Abstract. Based on data from Statistics Indonesia 2020 shows that rural areas in West Java have an average poverty rate of 10,64%, which is higher than urban areas at 7,79%. To establish a measurable and sustainable village, the Ministry of Villages, Development of Disadvantaged Regions, and Transmigration of the Republic of Indonesia developed a composite index to determine the progress and independence of a village, called the Village Development Index. To overcome the time challenge in classifying Village Development Index in West Java with a very large number of villages, an effective algorithm is needed. Therefore, this research applied an ensemble algorithm which is called XGBoost. XGBoost was chosen because it can handle the complexity of large datasets with imbalanced data classes and can prevent overfitting. In addition, hyperparameter tuning is conducted to improve the model’s performance. The aim of this research is to determine how accurately the XGBoost algorithm can classifying the Village Development Index and to contribute positively to the development of strategies for village in West Java. Based on the analysis conducted on Village Development Index data in West Java 2020 using 52 variables with 4.249 training data and 1.063 testing data, the XGBoost model has been formed. The analysis results show that the accuracy, precision, recall and f1-score are 89%, 84%, 72% and 76% respectively. The high accuracy obtained indicates that the XGBoost model that is built can classify Village Development Index well and can be implemented.
Abstrak. Data Badan Pusat Statistik tahun 2020 menunjukkan bahwa rata-rata wilayah perdesaan di Jawa Barat memiliki persentase kemiskinan sebesar 10,64% yang lebih tinggi dari wilayah perkotaan sebesar 7,79%. Dalam upaya melaksanakan pembangunan desa yang terukur dan berkelanjutan, Kementerian Desa, Pembangunan Daerah Tertinggal, dan Transmigrasi Republik Indonesia menyusun suatu indeks komposit untuk menentukan status kemajuan dan kemandirian suatu desa yang disebut Indeks Desa Membangun (IDM). Untuk mengatasi tantangan waktu dalam pengklasifikasian status IDM di Jawa Barat dengan jumlah desa yang sangat besar, diperlukan algoritma lain yang lebih efektif. Oleh karena itu, penelitian ini menerapkan algoritma ensemble, yaitu XGBoost. XGBoost dipilih karena mampu mengatasi kompleksitas dataset besar dengan kelas data yang tidak seimbang dan dapat mencegah overfitting. Selain itu, dilakukan hyperparameter tuning untuk meningkatkan performa model. Tujuan dari penelitian ini yaitu melihat seberapa akurat algoritma XGBoost dalam mengklasifikasikan status IDM dan diharapkan dapat memberikan kontribusi positif terhadap pengembangan strategi pembangunan di Jawa Barat. Berdasarkan analisis yang dilakukan pada data status IDM di Provinsi Jawa Barat tahun 2020 menggunakan 52 variabel dengan data training sebanyak 4.249 dan data testing sebanyak 1.063, telah dibentuk model XGBoost. Hasil analisis menunjukkan bahwa nilai accuracy, precision, recall, dan f1-score masing-masing sebesar 89%, 84%, 72%, dan 76%. Nilai accuracy yang diperoleh sudah tinggi sehingga model XGBoost yang dibangun sudah dapat mengklasifikasikan status IDM dengan baik dan dapat diimplementasikan.
References
E. Setyowati, “Tata Kelola Pemerintahan Desa pada Perbedaan Indeks Desa Membangun (IDM): Studi Tiga Desa di Kabupaten Malang,” 2019.
A. S. Budiman and N. Hajarisman, “Analisis Mediasi Multipel Paralel Kausal Step pada Data Stunting menurut Kabupaten/Kota,” Jurnal Riset Statistika, pp. 31–40, Jul. 2024, doi: 10.29313/jrs.v4i1.3860.
RPJMN, “Lampiran Peraturan Presiden Republik Indonesia Nomor 18 Tahun 2020 Tentang Rencana Pembangunan Jangka Menengah Nasional 2020-2024 Narasi Republik Indonesia,” 2020.
Permendes, “Permendesa Nomor 2 Tahun 2016,” 2016.
F. Xaverius, “Perkembagan Desa Berdasarkan Indeks Desa Membangun di Kabupaten Mempawah,” vol. 7, no. 1, pp. 10–20, 2021.
T. S. Lestari and D. A. N. Sirodj, “Klasifikasi Penipuan Transaksi Kartu Kredit Menggunakan Metode Random Forest,” Jurnal Riset Statistika, vol. 1, no. 2, pp. 160–167, Feb. 2022, doi: 10.29313/jrs.v1i2.525.
S. Bahri, “Implementasi Data Mining untuk Memprediksi Keterlambatan Jam Masuk Kerja Menggunakan Algoritma Klasifikasi,” vol. 1, no. 1, pp. 11–20, 2020.
Desi Permatasari and Suliadi, “Algoritma Pemilihan Variabel untuk Klasifikasi dan Penerapannya pada Klasifikasi Desa-Kelurahan,” Jurnal Riset Statistika, pp. 49–56, Jul. 2024, doi: 10.29313/jrs.v4i1.3876.
F. R. Noor and D. A. N. Sirodj, “Penerapan Support Vector Machine untuk Klasifikasi Opini Masyarakat Terhadap Isu Bullying,” Jurnal Riset Statistika, pp. 57–66, Jul. 2024, doi: 10.29313/jrs.v4i1.3877.
J. M. A. S. Dachi, “Analisis Perbandingan Algoritma XGBoost dan Algoritma Random Forest Ensemble Learning pada Klasifikasi Keputusan Kredit,” Jurnal Riset Rumpun Matematika dan Ilmu Pengetahuan Alam (JURRIMIPA), vol. 2, no. 2, 2023, doi: 10.55606/jurrimipa.v2i2.1336.
Tasya Azzahra, “Pemodelan Regresi Hurdle Negative Binomial pada Jumlah Kasus Difteri Jawa Barat 2020,” Jurnal Riset Statistika, pp. 125–130, Dec. 2023, doi: 10.29313/jrs.v3i2.3014.
P. D. Inas Azizah, “Penerapan Probabilistic Neural Network pada Klasifikasi Berat Bayi Baru Lahir,” Jurnal Riset Statistika, vol. 1, no. 2, pp. 152–159, Feb. 2022, doi: 10.29313/jrs.v1i2.524.