Penerapan dan Perbandingan Tiga Metode Analisis Pohon Keputusan pada Klasifikasi Penderita Kanker Payudara
DOI:
https://doi.org/10.29313/jrs.v1i1.22Keywords:
Exhaustive CHAID, CART, Kanker PayudaraAbstract
Abstract. Today there is a considerable amount of work dealing with decision trees, especially in survival analysis (Ibrahim et al, 2008). Cases classified as survival analysis, like cancer patients. This study discusses the application of data mining which is to obtain diagnostic results. The classification technique uses information obtained from medical records of breast cancer patients in Yugoslavia. A method for answering these problems through decision tree analysis using the CHAID, Exhaustive CHAID and CART methods. Empirically aiming to compare performance of three decision tree classification methods so that the best method is obtained. It was concluded that best method used in applying to the classification of breast cancer sufferers was the CART method because it was able to get the most significant variables at most four, namely inv-node, tumor size, deg-malig and breast parts. Then it has a total accuracy rate with highest value of 84.9 percent and has a total error rate with lowest value of 15.1 percent.
Abstrak. Dewasa ini ada cukup banyak pekerjaan yang berurusan dengan pohon keputusan, terutama dalam analisis survival (Ibrahim dkk, 2008). Kasus yang tergolong analisis survival seperti penderita penyakit kanker. Penelitian ini membahas mengenai penerapan data mining yang digunakan untuk mendapatkan hasil diagnostik. Pendekatan teknik klasifikasi dengan menggunakan informasi yang diperoleh pada rekam medis data penderita kanker payudara di Yugoslavia. Salah satu metode untuk menjawab permasalahan tersebut melalui analisis pohon keputusan dengan metode CHAID, Exhaustive CHAID dan CART. Secara empiris bertujuan untuk membandingkan kinerja tiga metode pengklasifikasi pohon keputusan agar didapatkan metode manakah yang terbaik. Maka disimpulkan bahwa metode terbaik yang digunakan dalam penerapan pada klasifikasi penderita kanker payudara adalah metode CART sebab mampu mendapatkan variabel signifikan yang paling banyak ada empat, yakni inv-node, ukuran tumor, deg-malig dan bagian payudara. Kemudian memiliki tingkat akurasi total dengan nilai tertinggi sebesar 84.9 persen dan memiliki total tingkat kesalahan dengan nilai yang terendah sebesar 15.1 persen.