Penentuan Jumlah Klaster Optimal Menggunakan Cluster Validity Index Pada Metode Fuzzy C-Means Clustering
DOI:
https://doi.org/10.29313/statistika.v22i2.1581Keywords:
indikator kesejahteraan rakyat, fuzzy c-means, cluster validity indexAbstract
Kesejahteraan merupakan salah satu tujuan utama pemerintah di Indonesia yang telah tertulis secara jelas dalam pembukaan UUD 1945 alinea ke-4. Namun, pandemi COVID-19 di Indonesia sejak awal tahun 2020 berdampak pada peningkatan kemiskinan, termasuk di Jawa Timur. Akibat meningkatnya kemiskinan, berbagai bidang di dalam indikator kesejahteraan di Jawa Timur mengalami penurunan pada tahun 2020. Untuk meningkatkan kesejahteraan, dibutuhkan data yang akurat dan tepat sasaran, yaitu dengan melakukan penelitian analisis klaster, tepatnya metode Fuzzy C-Means Clustering. Dengan metode Fuzzy C-Means Clustering, akan dicari jumlah klaster untuk data indikator kesejahteraan rakyat di Jawa Timur.Namun, dalam menjalankan metode Fuzzy C-Means, peneliti harus menetukan jumlah klaster terlebih dahulu, sehingga jika peneliti asal dalam menentukannya maka akan berdampak pada hasil klaster yang tidak optimal, serta mengakibatkan pengambilan keputusan dan kesimpulan yang salah oleh peneliti, akibatnya hal tersebut menjadi kelemahan dari metode Fuzzy C-Means Clustering. Jumlah klaster yang optimal ditentukan dengan Cluster Validity Index. Untuk mendapatkan jumlah klaster yang optimal, algoritma pada metode Fuzzy C-Means harus dijalankan berkali-kali untuk setiap jumlah klaster yang telah ditentukan oleh peneliti, kemudian hasil atau outputnya diterapkan ke Cluster Validity Index. Cluster Validity Index yang digunakan dalam penelitian ini adalah Pantition Entropy Index, Partition Coefficient Index, Xie Beni Index, Modifed Partition Coefficient Index dan Fukuyama-Sugeno Index. Berdasarkan hasil analisis data, seluruh Cluster Validity Index menunjukkan jumlah klaster sebanyak 2 klaster sebagai jumlah klaster yang paling optimal untuk data indikator kesejahteraan rakyat di Jawa Timur pada tahun 2020.
References
Bank Indonesia (2021) Laporan Perekonomian Provinsi Jawa Timur Februari 2021. Surabaya. Available at: https://www.bi.go.id/id/publikasi/laporan/lpp/Pages/Laporan-Perekonomian-Provinsi-Jawa-Timur-Februari-2021.aspx.
Bezdek, J. C. (1973) ‘Cluster validity with fuzzy sets’, Journal of Cybernetics, 3(3), pp. 58–73. doi: 10.1080/01969727308546047.
Bezdek, J. C. (1981) Pattern Recognition with Fuzzy Objective Function Algorithms. 1st edn. New York: Plenum Press. doi: 10.1007/978-1-4757-0450-1.
BPS Provinsi Jawa Timur (2021) Statistik Kesejahteraan Rakyat Provinsi Jawa Timur Tahun 2021. Surabaya: BPS Provinsi Jawa Timur.
Cebeci, Z. (2020) ‘fcvalid: An R Package for Internal Validation of Probabilistic and Possibilistic Clustering’, Sakarya University Journal of Computer and Information Sciences, 3(1), pp. 11–26. doi: 10.35377/saucis.03.01.664560.
Dave, R. N. (1996) ‘Validating fuzzy partitions obtained through c-shells clustering’, Pattern Recognition Letters, 17(6), pp. 613–623. doi: 10.1016/0167-8655(96)00026-8.
Febrianti, F., Hafiyusholeh, M. and Asyhar, A. H. (2016) ‘Perbandingan Pengklusteran Data Iris Menggunakan Metode K-Means Dan Fuzzy C-Means’, Jurnal Matematika ‘MANTIK’, 2(1), p. 7. doi: 10.15642/mantik.2016.2.1.7-13.
Ferraro, M. B. and Giordani, P. (2015) ‘A Toolbox for Fuzzy Clustering Using the R Programming Language’, Fuzzy Sets and Systems, 279, pp. 1–16. doi: https://doi.org/10.1016/j.fss.2015.05.001.
Haqiqi, B. N. and Kurniawan, R. (2015) ‘Analisis Perbandingan Metode Fuzzy C-Means Dan Subtractive Fuzzy C-Means’, Media Statistika, 8(2), pp. 59–67. doi: 10.14710/medstat.8.2.59-67.
Karti, H. S. and Irhamah (2013) ‘Pengelompokan Kabupaten / Kota di Provinsi Jawa Timur Berdasarkan Indikator Pendidikan SMA / SMK / MA dengan Metode C-Means dan Fuzzy C-Means’, Jurnal Sains dan Seni Pomits, 2, pp. 288–293.
Kusumadewi, S. and Purnomo, H. (2013) Aplikasi Logika Fuzzy Untuk Pendukung Keputusan. 2nd edn. Yogyakarta: Graha Ilmu.
Liu, Y. et al. (2019) ‘A Validity Index for Fuzzy Clustering Based on Bipartite Modularity’, Journal of Electrical and Computer Engineering, 9, pp. 1–9. doi: 10.1155/2019/2719617.
Mashfuufah, S. and Istiawan, D. (2018) ‘Penerapan Partition Entropy Index , Partition Coefficient Index dan Xie Beni Index untuk Penentuan Jumlah Klaster Optimal pada Algoritma Fuzzy C-Means dalam Pemetaan Tingkat Kesejahteraan Penduduk Jawa Tengah’, in The 7th University Research Colloqium 2018. Surakarta: STIKES PKU Muhammadiyah Surakarta, pp. 51–60.
Muslimatin, B. (2011) Perbandingan Metode K-Means dan Metode Fuzzy C-Means (FCM) untuk Clustering Data (Studi Kasus pada Data Saham Harian PT. Astra, Tbk.). Universitas Islam Negeri Maulana Malik Ibrahim.
Rizal, A. S. and Hakim, R. B. F. (2015) ‘Metode K-Means Cluster Dan Fuzzy C-Means Cluster (Studi Kasus: Indeks Pembangunan Manusia Di Kawasan Indonesia Timur Tahun 2012)’, Prosiding Seminar Nasional Matematika dan Pendidikan Matematika UMS 2015, pp. 643–657. Available at: https://publikasiilmiah.ums.ac.id/xmlui/handle/11617/5803.
Wang, W. and Zhang, Y. (2007) ‘On Fuzzy Cluster Validity Indices’, Fuzzy Sets and Systems, 158(19), pp. 2095–2117. doi: 10.1016/j.fss.2007.03.004.
Wu, C. H. et al. (2015) ‘A New Fuzzy Clustering Validity Index With a Median Factor for Centroid-Based Clustering’, IEEE Transactions on Fuzzy Systems, 23(3), pp. 701–718. doi: 10.1109/TFUZZ.2014.2322495.
Zarandi, M. H. F., Sotudian, S. and Castillo, O. (2021) ‘A New Validity Index for Fuzzy-Possibilistic C-Means Clustering’, Scientia Iranica, 28(4), pp. 2277–2293. doi: 10.24200/SCI.2021.50287.1614.