Pemilihan Model Terbaik pada Generalized Poisson Regression Menggunakan Akaike Information Criterion

Authors

  • Rut Esra Universitas Mulawarman
  • Darnah Andi Nohe
  • M Fathurahman

DOI:

https://doi.org/10.29313/statistika.v23i1.1925

Keywords:

AIC, GPR, Overdispersion, Data Count, Tuberkulosis Paru

Abstract

ABSTRAK

Poisson regression merupakan salah satu model regresi yang dapat digunakan untuk menganalisis hubungan antara variabel respon yang berupa data count dengan variabel prediktor berupa data count, kontinu, kategorik atau campuran dengan syarat terjadi equidispersion yaitu nilai variansi dari variabel respon harus sama dengan nilai rata-ratanya. Namun yang sering terjadi adalah pelanggaran terhadap equidispersion. Generalized Poisson Regression (GPR) adalah suatu model regresi yang digunakan untuk menganalisis hubungan antara variabel respon yang berupa data count dengan satu atau lebih variabel prediktor dan mengalami underdispersion, equidispersion, atau overdispersion. Data tuberkulosis paru (TB paru) di Indonesia tahun 2020 mengalami overdispersion, sehingga GPR adalah metode yang cocok untuk memodelkan data tersebut. Tujuan penelitian ini adalah untuk mendapatkan model GPR terbaik pada data jumlah kasus TB paru di Indonesia tahun 2020 dan mengetahui faktor-faktor yang memengaruhinya. Hasil analisis menunjukkan bahwa terdapat lima belas model GPR yang terbentuk dari empat variabel prediktor yang berpengaruh terhadap jumlah kasus TB paru di Indonesia tahun 2020. Model GPR terbaik berdasarkan nilai Akaike Information Criterion (AIC) terkecil adalah model dengan empat variabel yang berpengaruh yaitu kepadatan penduduk, jumlah penduduk miskin, persentase lantai rumah tidak kedap air, dan persentase tempat pengelolaan pangan yang memenuhi syarat.

ABSTRACT

Poisson regression is a regression model that can be used to analyze the relationship between response variables in the form of count data and predictor variables in the form of count, continuous, categorical or mixed data with the condition that equidispersion occurs, namely the variance value of the response variable must be equal to the average value. However, what often happens is that the variance value is greater than the average value or is called overdispersion. Generalized Poisson Regression (GPR) is a regression model used to analyze the relationship between response variables in the form of count data and one or more predictor variables and occure underdispersion, equidispersion or overdispersion. Data for pulmonary tuberculosis in Indonesia in 2020 occured overdispersion, so GPR is a suitable method to model the data. The purpose of this study was to obtain the best GPR model and to obtain the factors that significantly influence the number of pulmonary tuberculosis cases in Indonesia in 2020. The results of the analysis show that there are fifteen GPR models formed from four predictor variables that affect the number of pulmonary tuberculosis cases in Indonesia in 2020. The best GPR model based on the smallest Akaike Information Criterion (AIC) value is a model with four influential variables, namely population density, number of poor people, percentage of house floors that are not waterproof, and percentage of food management places that meet the requirements.

References

Agresti, A. (2002). Categorial Data Analysis. Second Edition. New York: John Wiley & Sons.

Asriyanti, R., Yahya, I., Abapihi, B., WIbawa, Gusti Ngurah A., Rasdiyanah, dan Laome, L. (2022). Penerapan Regresi Nonparametrik Spline Dalam Memodelkan Faktor-Faktor Yang Mempengaruhi Jumlah Kasus Tuberkulosis DI Sulawesi Tenggara. Makalah dipresentasikan dalam Seminar Nasional Sains dan Terapan VI, Program Studi Statistika FMIPA Universitas Halu Oleo, Manado, 25 April.

Astuti, C. C., Sumarminingsih, E. & Soehono, L. A. (2013). Perbandingan Generalized Poisson Regression dan Negative Binomial Regression Untuk Data Overdispersi Dan Underdispersi Pada Regresi Poisson. Jurnal Mahasiswa Statistik, 1(2), 105-108.

Aulele, S. N. (2012). Pemodelan Jumlah Kematian Bayi di Provinsi Maluku Tahun 2010 Dengan Menggunakan Regresi Poisson. Jurnal Barekeng, 6(2), 23-27.

Cahyandari, R. (2014). Pengujian Overdispersi Pada Model Regresi Poisson. Statistika, Issue Statistika, 14(2), 69-76.

Darnah. (2011). Mengatasi Overdispersi pada Model Regresi Poisson dengan Generalized Poisson Regression I. Jurnal Eksponensial, 2,5-10.

Darnah. (2016). Modelling of Filariasis in East Java with Poisson Regression and Generalized Poisson Regression Models. AIP Conference Proceedings, 1723, 50-62.

Darnah, Utoyo, M. I. & Chamidah, N. (2019). Modeling of Maternal Mortality and Infant Mortality Cases in East Kalimantan using Poisson Regression Approach Based on Local Linear Estimator. IOP Conference Series: Earth and Environmental Science, 243, 1-7.

Fadmi, F. R. (2015). Prediksi Jumlah Kasus Baru Kusta dengan Metode Geographically Weighted Poisson Regression (GWPR). Jurnal Biometrika dan Kependudukan, 4, 14-24.

Fathurahman, M. (2009). Pemilihan Model Regresi Terbaik Menggunakan Metode Akaike's Information Criterion dan Schwarz Information Criterion. Jurnal Informatika Mulawarman, 4, 37-41.

Fitrial, N. H. & Fatikhurrizqi, A. (2020). Pemodelan Jumlah Kasus Covid-19 di Indonesia dengan Pendekatan Regresi Poisson dan Regresi Binomial Negatif. Makalah dipresentasikan dalam Seminar Nasional Official Statistics, Politeknik Statistika STIS, Jakarta, 23-24 September. 6, 65-72.

Hilbe, J. M. (2011). Negative Binomial Regression. Second Edition. Cambridge: Cambridge University Press.

Hocking, R. (1996). Methods and Applications of Linear Models. New York: John Wiley and Sons, Inc.

Irwan & Sari, D. (2013). Pemodelan Regresi Poisson dan Binomial Negatif pada Kasus Kecelakaan Kendaraan Bermotor di Lalu Lintas Sumatera Barat. Makalah dipresentasikan dalam Seminar Nasional Matematika dan Pendidikan Matematika 2013, Jurusan Pendidikan Matematika FMIPA Universitas Negeri Yogyakarta, Yogyakarta, 9 November.

Ismail, N. & Jemain, A. A. (2007). Handling Overdispersion with Negative Binomial and Generalized Poisson Regression Model. Malaysia: Causalty Actuarial Society Forum. Kementrian Kesehatan RI. (2014). Pedoman Nasional Penanggulangan Tuberkulosis. Jakarta: Kementrian Kesehatan RI.

Lestari, R. D., Wulandari, S. P. & Purhadi. (2014). Pemodelan Faktor-Faktor yang Mempengaruhi Jumlah Kasus Penyakit Tuberkulosis di Jawa Timur dengan Pendekatan Generalized Poisson Regression dan Geographically Weighted Poisson Regression. Jurnal Seni dan Seni Pomits, 3, 188-193.

Lungan, R., (2006). Aplikasi Statistika dan Hitung Peluang. Yogyakarta: Graha Ilmu.

Mariana, D. & Chairani, M. (2017). Kepadatan Hunian, Ventilasi dan Pencahayaan Terhadap Kejadian TB Paru di Wilayah Kerja Puskesmas Binanga Kabupaten Mamuju Sulawesi Barat. Jurnal Kesehatan Manarang, 3, 75-80.

Masfian, I., Yuniarti, D. & Hayati, M. N. (2016). Penerapan Generalized Poisson Regression I Untuk Mengatasi Overdispersi Pada Regresi Poisson (Studi Kasus: Pemodelan Jumlah Kasus Kanker Serviks di Provinsi Kalimantan Timur). Jurnal Eksponensial, 7(1), 59-65.

Mawardi, Sambera, R. & Hamisah, I. (2019). Studi Hubungan Antara Faktor Lingkungan Fisik Rumah Dengan Penderita TB Paru BTA di Aceh Selatan. Jurnal Serambi Engineering, 4(1), 406-415.

Myers, R. (1990). Classical and Model Regression with Aplication, Second Edition. Boston: PWSKENT Publiching Company.

Naben, A. X., Suhartono & Nurjazuli. (2013). Kebiasaan Tinggal di Rumah Etnis Timor Sebagai Faktor Risiko Tuberkulosis Paru. Jurnal Kesehatan Lingkungan Indonesia, 12(1), 10-21.

Nohe, D. A. (2013). Biostatistika 1. Jakarta Barat: Halaman Moeka Publishing. Perdana, A. & Putra, S. (2018). Hubungan Faktor Lingkungan Fisik Rumah terhadap Kejadian TB Paru di Wilayah Kerja Puskesmas Panjang. Jurnal Kesehatan, 9(1), 46-50.

Priyatno, D. (2013). Analisis Korelasi, Regresi dan Multivariate dengan SPSS. Yogyakarta: Gava Media.

Rashwan, N. A. & Kamel, M. M. (2011). Using Generalized Poisson Log Linear Regression Models in Analyzing Two-Way Contingency Tables. Applied Mathematical Sciences, 5(5), 213-222.

Safrida, N., Ispriyanti, D. & Widiharih, T. (2013). Aplikasi Model Regresi Poisson Tergeneralisasi Pada Kasus Angka Kematian Bayi Di Jawa Tengah Tahun 2007. Jurnal Gaussian, 2(4), 361-368.

Saputro, D. R. S., Susanti, A. & Pratiwi, N. B. I. (2021). The Handling of Overdispersion on Poisson Regression Model with The Generalized Poisson Regression Model. Makalah dipublikasikan dalam The Third International Conference On Mathematics: Education, Theory And Application, Surakarta, 20 Oktober, 2326, 1-8.

Simarmata, R. T. & Ispriyanti, D. (2011). Penanganan Overdispersi Pada Model Regresi Poisson Menggunakan Model Regresi Binomial Negatif. Media Statistika, 4(2), 95-104.

Suyani, D., Putri, S. M., Nahdiyani, F., Ramadini, E. S., Rizky, N. T., Fadila, E. N. & Nisa, D. M. (2020). Peningkatan Kepemilikan Rumah Sehat di Rt 01 dan 03 Dusun Modalan Kecamatan Banguntapan Bantul. Jurnal Pemberdayaan: Publikasi Hasil Pengabdian Kepada Masyarakat, 4(2), 191-196.

Walpole, R. (1995). Pengantar Statistika. Jakarta: PT Gramedia Pustaka Umum. Wasilaine, T. L., Talakua, M. W. & Lesnussa, Y. A. (2014). Model Regresi Ridge Untuk Mengatasi Model Regresi Linier Berganda Yang Mengandung Multikolinieritas (Studi Kasus: Data Pertumbuhan Bayi di Kelurahan Namaelo RT 001, Kota Masohi). Jurnal Barekeng, 8(1), 31-37.

World Health Organization. (2018). Global Tuberculosis Report 2017. Perancis: WHO Press.

World Health Organization. (2021). Global Tuberculosis Report 2020. Perancis: WHO Press.

Yotenka, R. & Banapon, A. (2019). Modelling the Number of Tuberculosis (TB) Cases in Indonesia using Poisson Regression and Negative Binomial Regression. Makalah dipresentasikan dalam International Seminar on Science and Technology (ISSTEC 2019), Jakarta

Downloads

Published

2023-06-30

Issue

Section

Articles