Klasifikasi Penyakit Diabetes Retinopati Menggunakan Support Vector Machine dengan Algoritma Grid Search Cross-validation
DOI:
https://doi.org/10.29313/jrs.v3i1.1945Keywords:
Diabetes Retinopati, Grid Search Cross-validation, Support Vector MachineAbstract
Abstract. Accuracy in determining the object in the appropriate class is a challenge in the classification method. Support Vector Machine is a classification method that is capable of classifying data that does not go through the learning stage and is able to produce a classification model even though there is relatively little data training while still producing good accuracy. The classification performance improvement produced by the SVM method is determined from the parameter settings. Therefore, the grid search algorithm is used to find the optimal parameters. The problem of diabetic retinopathy is important because it is one of the causes of total blindness in several countries. This study aims to apply the SVM method by applying the grid search cross-validation algorithm. Grid search is a method of financing combination models and hyperparameters by testing a single combination of models and validating each combination. The grid search method is paired with cross-validation to obtain the best model in classifying disease status in diabetic retinopathy patients. By using a linear kernel and 5-fold cross-validation, the results obtained for 30 models. The best model for cases of diabetes retinopathy classification is obtained from the cost parameter 10 of 74.8%.
Abstrak. Ketepatan dalam menentukan objek pada kelas yang sesuai merupakan tantangan pada metode klasifikasi. Support Vector Machine menjadi metode klasifikasi yang mampu melakukan klasifikasi untuk data yang tidak melewati tahap pembelajaran dan mampu menghasilkan model klasifikasi meskipun data training relatif sedikit dengan tetap menghasilkan akurasi yang baik. Peningkatan performa klasifikasi yang dihasilkan oleh metode SVM ditentukan dari pengaturan parameter. Oleh karena itu, algoritma grid search digunakan untuk melihat parameter yang optimal. Masalah diabetes retinopati menjadi penting karena menjadi salah satu penyebab kebutaan total di beberapa negara. Penelitian ini bertujuan untuk menerapkan metode SVM dengan menerapkan algoritma grid search cross-validation. Grid search merupakan metode penentuan kombinasi model dan hyperparameter dengan melakukan uji coba satu persatu kombinasi model dan melakukan validasi pada setiap kombinasi. Metode grid search dipasangkan dengan cross-validation untuk mendapatkan model terbaik dalam mengklasifikasikan status penyakit pada pasien diabetes retinopati. Dengan menggunakan kernel linear serta 5-fold cross-validation diperoleh hasil sebanyak 30 model. Model terbaik untuk kasus klasifikasi penyakit diabetes retinopati ini didapatkan dari parameter cost 10 sebesar 74,8%.
References
J. Han, M. Kamber, and J. Pei, Data mining: Data mining concepts and techniques, 3rd ed. San Francisco: Morgan Kaufmann Publishers, 2012.
M. Bramer, Principles of Data Mining. Springer, 2007.
J. Han and M. Kamber, Data mining: Data mining concepts and techniques, 2nd ed. San Francisco: Morgan Kaufmann Publishers, 2006.
Anita, A. Wicaksono, and T. N. Padilah, “Pengaruh Jumlah Record Dataset Terhadap Algoritma Klasifikasi Berdasarkan Data Customer Churn,” Jurnal Ilmiah Informatika, vol. 6, no. 1, pp. 1–10, Jun. 2021, doi: 10.35316/jimi.v6i1.1223.
D. Kerami and H. Murfi, “KAJIAN KEMAMPUAN GENERALISASI SUPPORT VECTOR MACHINE DALAM PENGENALAN JENIS SPLICE SITES PADA BARISAN DNA,” MAKARA of Science Series, vol. 8, no. 3, pp. 89–95, Oct. 2010, doi: 10.7454/mss.v8i3.451.
A. M. Puspitasari, D. E. Ratnawati, and A. W. Widodo, “Klasifikasi Penyakit Gigi Dan Mulut Menggunakan Metode Support Vector Machine,” Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 2, no. 2, pp. 802–810, 2018, [Online]. Available: http://j-ptiik.ub.ac.id
Irawadi and S. Sunendiari, “Penerapan dan Perbandingan Tiga Metode Analisis Pohon Keputusan pada Klasifikasi Penderita Kanker Payudara,” Jurnal Riset Statistika, vol. 1, no. 1, pp. 19–27, Jul. 2021, doi: 10.29313/jrs.v1i1.22.
A. Zakrani, A. Najm, and A. Marzak, “Support Vector Regression Based on Grid-Search Method for Agile Software Effort Prediction,” in 2018 IEEE 5th International Congress on Information Science and Technology (CiSt), IEEE, Oct. 2018, pp. 1–6. doi: 10.1109/CIST.2018.8596370.
S. Frangky Handono, F. Tri Anggraeny, and B. Rahmat, “IMPLEMENTASI CONVOLUTIONAL NEURAL NETWORK (CNN) UNTUK DETEKSI RETINOPATI DIABETIK,” Jurnal Informatika dan Sistem Informasi (JIFoSI), vol. 1, no. 1, pp. 669–678, 2020.
C. Cortes and V. Vapnik, “Support-vector networks,” Mach Learn, vol. 20, no. 3, pp. 273–297, Sep. 1995, doi: 10.1007/BF00994018.
T. V Rampisela and Z. Rustam, “Classification of Schizophrenia Data Using Support Vector Machine (SVM),” J Phys Conf Ser, vol. 1108, Nov. 2018, doi: 10.1088/1742-6596/1108/1/012044.
M. S. Sari, D. Safitri, and S. Sugito, “KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM),” Jurnal Gaussian, vol. 3, no. 4, pp. 751–760, Oct. 2014.
B. Santosa, Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis. Yogyakarta: Graha Ilmu, 2007.
S. R. Gunn, “Support Vector Machines for Classification and Regression,” 1998.
A. Toha, P. Purwono, and W. Gata, “Model Prediksi Kualitas Udara dengan Support Vector Machines dengan Optimasi Hyperparameter GridSearch CV,” Buletin Ilmiah Sarjana Teknik Elektro, vol. 4, no. 1, pp. 12–21, May 2022, doi: 10.12928/biste.v4i1.6079.
Y. Widyaningsih, G. P. Arum, and K. Prawira, “APLIKASI K-FOLD CROSS VALIDATION DALAM PENENTUAN MODEL REGRESI BINOMIAL NEGATIF TERBAIK,” BAREKENG: Jurnal Ilmu Matematika dan Terapan, vol. 15, no. 2, pp. 315–322, Jun. 2021, doi: 10.30598/barekengvol15iss2pp315-322.
R. D. Septiana, A. B. Susanto, and T. Tukiyat, “Analisis Sentimen Vaksinasi Covid-19 Pada Twitter Menggunakan Naive Bayes Classifier Dengan Feature Selection Chi-Squared Statistic dan Particle Swarm Optimization,” Jurnal SISKOM-KB (Sistem Komputer dan Kecerdasan Buatan), vol. 5, no. 1, pp. 49–56, Sep. 2021, doi: 10.47970/siskom-kb.v5i1.228.