Penerapan Algoritma Naïve Bayes Classifier dalam Memprediksi Status Keberlanjutan Polis Nasabah Asuransi PT.X
DOI:
https://doi.org/10.29313/jrs.v1i2.435Keywords:
Klasifikasi, Nave Bayes, Prediksi Perpanjangan Polis Jaminan KesehatanAbstract
Abstract. This article discusses the classification in predicting the sustainability status of the health insurance customer policy of PT. X uses the Naïve Bayes Classifier Algorithm. In predicting the Naive Bayes Classifier Algorithm, it uses the concepts and theories of data mining in the literature related to insurance by calculating the probability of each class of variables using the Bayes theorem in describing the performance of a model or algorithm specifically using the Confusion Matrix. To be able to predict the decisions of health insurance customers in the policy sustainability status, a method of data analysis of registered insurance customers is needed. The data used is data obtained from the insurance company PT. X. The data contains customer information data in the form of 9 variables (Policy Number, Smoking Status, Gender, Age, Marital Status, Dependents, Monthly Premiums, Current Status / whether or not premium payments and insurance policy renewal status). The results of the application of the Naïve Bayes Classifier Algorithm show that the algorithm is quite good in predicting the status of the policy extension of the insured health insurance PT. X, with an average accuracy of 85.82%, an average precision of 96.10% and an average recall of 93.55.
Abstrak. Artikel ini membahas tentang klasifikasi dalam memprediksi status keberlanjutan polis nasabah asuransi kesehatan PT. X menggunakan Algoritma Nave Bayes Classifier. Dalam memprediksi Algoritma Naive Bayes Classifier menggunakan konsep dan teori data mining dalam literatur yang berhubungan dengan asuransi dengan menghitung probabilitas setiap kelas variabel menggunakan teorema Bayes dalam menggambarkan kinerja suatu model atau algoritma secara khusus menggunakan Confusion Matrix . Untuk dapat memprediksi keputusan nasabah asuransi kesehatan dalam status kesinambungan polis, diperlukan suatu metode analisis data nasabah asuransi yang terdaftar. Data yang digunakan adalah data yang diperoleh dari perusahaan asuransi PT. X. Data tersebut berisi data informasi nasabah berupa 9 variabel (Nomor Polis, Status Merokok, Jenis Kelamin, Usia, Status Perkawinan, Tanggungan, Premi Bulanan, Status Lancar/tidaknya pembayaran premi dan status perpanjangan polis asuransi). Hasil penerapan Algoritma Naïve Bayes Classifier menunjukkan bahwa algoritma tersebut cukup baik dalam memprediksi status perpanjangan polis dari tertanggung asuransi kesehatan PT. X, dengan rata-rata akurasi 85,82%, presisi rata-rata 96,10% dan rata-rata recall 93,55.