Penentuan Jumlah Cluster Optimum Menggunakan Davies Bouldin Index dalam Pengelompokan Wilayah Kemiskinan di Indonesia

Authors

  • Nanda Shalsadilla Universitas Tanjungpura
  • Shantika Martha Universitas Tanjungpura
  • Hendra Perdana Universitas Tanjungpura
  • Neva Satyahadewi Universitas Tanjungpura, Indonesia
  • Evy Sulistianingsih Universitas Tanjungpura, Indonesia

DOI:

https://doi.org/10.29313/statistika.v23i1.1743

Keywords:

ward, cluster optimum, davies bouldin index

Abstract

Abstrak

Kemiskinan merupakan suatu permasalahan yang sampai saat ini masih menjadi fokus pemerintah terutama pasca pandemi Covid-19. Permasalahan terkait kemiskinan dapat diatasi apabila pemerintah mengusung program pengentasan kemiskinan yang direalisasikan secara efektif dan efisien. Tujuan penelitian ini adalah mengelompokkan provinsi di Indonesia berdasarkan indikator kemiskinan serta menentukan jumlah cluster optimum yang terbentuk. Analisis cluster merupakan teknik multivariat yang dapat digunakan untuk tujuan pengelompokan. Dengan analisis cluster seluruh provinsi yang ada di Indonesia dapat dikelompokkan berdasarkan kesamaan karakteristik yang dimiliki sehingga kedaruratan dan kebutuhan tiap cluster dapat diketahui. Ward merupakan salah satu metode dalam analisis cluster yang mengelompokkan objek dengan meminimalisir variasi antar objek dalam satu cluster. Selanjutnya, penentuan jumlah cluster optimum penting dilakukan agar seluruh provinsi di Indonesia dapat dikelompokkan dengan tepat. Davies Bouldin Index (DBI) merupakan suatu metode yang menentukan banyaknya cluster optimum berdasarkan kedekatan objek terhadap centroidnya dalam satu cluster dan jarak antar centroid cluster. Data yang digunakan merupakan data 10 indikator kemiskinan untuk setiap provinsi di Indonesia tahun 2021. Berdasarkan penelitian yang telah dilakukan banyaknya cluster optimum yang terbentuk untuk mengelompokkan provinsi di Indonesia berdasarkan indikator kemiskinan adalah berjumlah 5 cluster dengan nilai validitas DBI yang diperoleh sebesar 1,1420 yang merupakan nilai validitas terkecil dari jumlah cluster lainnya. Cluster 1 dengan tingkat kemiskinan tertinggi beranggotakan 3 provinsi yaitu Nusa Tenggara Timur, Papua Barat, dan Papua, cluster 2 beranggotakan 10 provinsi, cluster 3 beranggotakan 11 provinsi, cluster 4 beranggotakan 9 provinsi, dan cluster 5 dengan tingkat kemiskinan terendah beranggotakan 1 provinsi yaitu DKI Jakarta.

Abstract

Poverty has been an issue that received significant government attention, particularly in response to the Covid-19 pandemic. The study aimed to classify Indonesian provinces based on poverty indicators and determine the optimal number of clusters. Cluster analysis, a multivariate technique, was employed to group provinces based on their similaritycharacteristics, facilitating the identification of specific needs and emergencies within each cluster. The Ward method, a clustering technique, minimized variations between objects within a cluster during the grouping process. Determining the correct number of clusters was crucial to ensure accurate provincial classification. The Davies Bouldin Index (DBI) was used to determine the optimum number of clusters by assessing the proximity of objects to their centroids and the inter-centroid distances. The dataset consisted of 10 poverty indicators for each province in Indonesia in 2021. The research findings revealed that the optimum number of clusters for classifying provinces based on poverty indicators was five, with a DBI value of 1.1420, the lowest among other cluster configurations. Cluster 1, characterized by the highest poverty rate, comprised three provinces: East Nusa Tenggara, Papua, and West Papua. Cluster 2encompassed ten provinces, while cluster 3 consisted of eleven provinces. Cluster 4 comprised nine provinces, and cluster 5, characterized by the lowest poverty rate, consisted of a single province: DKI Jakarta.

References

Amida, O. V. and Sitorus, J. R. (2020). Penerapan Regresi Logistik Biner Multilevel dalam Analisis Pengaruh Karakteristik Individu, Rumah Tangga, dan Wilayah Terhadap Status Kemiskinan Balita di Kepulauan Maluku dan Pulau Papua. Seminar Nasional Official Statistics 2020. Jakarta: Politeknik Statistika STIS, pp. 967-977.
Badan Pusat Statistik. (2022). Statistik Indonesia 2022. Jakarta: Badan Pusat Statistik.
Dani, A. T., Wahyuningsih, S. and Rizki, N. A. (2019). Penerapan Hierarchical Clustering Metode Agglomerative pada Data Runtun Waktu. Jambura Journal of Mathematics, 1 (2), pp. 64 - 78.
Davies, D. L. and Bouldin, D. W. (1979). A Cluster Separation Measure. IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-1 (2), pp. 224 - 227.
Gunawan, I. (2016). Pengantar Statistika Inferensial. Jakarta: Raja Grafindo Persada.
Imasdiani, Purnamasari, I. and Amijaya, F. D. (2022). Perbandingan Hasil Analisis Cluster dengan Menggunakan Metode Average Linkage dan Metode Ward (Studi Kasus: Kemiskinan di Provinsi Kalimantan Timur Tahun 2018). EKSPONENSIAL, 13 (1), pp. 9-18.
Karnelia, L., Kusnandar, D. and Martha, S., 2020. Pembentukan Cluster Optimum Berdasarkan Metode Hierarki Divisive. Bimaster: Buletin Ilmiah Matematika, Statistika dan Terapannya, 9(4), pp. 483 - 488.
Orisa, M. (2022). Optimasi Cluster pada Algoritma K-Means. Prosiding SENIATI. Malang: Institut Teknologi Nasional Malang, pp. 430-437.
Sakdiyah, S. and Subekti, R. (2018). Optimalisasi Jumlah Kelompok pada Metode Single Linkage dan Complete Linkage Menggunakan Indeks Davies Bouldin. JKTM: Jurnal Kajian dan Terapan Matematika, 7 (1), pp. 20 - 30.
Saputri, D. U., Hidayat, T. and Masturoh, S. (2022). Pengelompokkan Kebutuhan Air Bersih di Indonesia Periode 2012-2017 Menggunakan Algoritma K-Means. SISFOTENIKA, 12 (2), pp. 203 - 212.

Downloads

Published

2023-06-30

Issue

Section

Articles