PERBANDINGAN ANALISIS PROPENSITY SCORE MATCHING DAN REGRESI LOGISTIK
Analisis regresi merupakan salah satu piranti analisis yang dapat menjelaskan determinan dan besar pengaruh yang ditimbulkan oleh satu atau lebih determinan terhadap variabel terikat. Ada dua macam metoda regresi meliputi: 1) Regresi linier yang digunakam pada variabel outcome skala kontinyu. 2) Regresi logistik yang digunakan pada variabel outcome skala binari atau dikotomus.
Regresi logistik berguna untuk membuat berbagai modeling statistik dan sering digunakan pada berbagai rancangan penelitian. Regresi logistik sering digunakan karena nilai fungsi logistik yang berkisar antara 0 sampai dengan 1 dapat menggambarkan probabilitas yang dikenal sebagai risiko individu untuk terkena penyakit.
Penelitian yang bertujuan melihat pengaruh pajanan terhadap outcome idealnya membandingkan subyek ketika terpajan dengan subyek ketika tidak terpajan dalam waktu yang bersamaan yang disebut counterfactual framework tersebut tetapi hal tersebut tidak bisa dilakukan. Ada metode analisis yang disebut metode Propensity Score Matching (PSM) yang melakukan matching melalui nilai propensity subyek yang terpajan dan subyek tidak terpajan. Nilai propensity merupakan nilai probabilitas subyek jika tidak terpajan. Pada kenyataannya subyek yang mengalami outcome positive adalah yang terpajan. Nilai propensity dapat digunakan untuk menurunkan pengaruh bias seleksi dalam pemberian pajanan.
Setelah melakukan analisis regresi logistik dan analisis propensity score matching, dilakukan nilai OR dari persamaan regresi logistik tanpa interaksi dengan nilai OR yang didapat dari analisis propensity score matching. memperlihatkan bukan saja ada perbedaan nilai OR dari hasil analisis regresi logistik dengan nilai OR hasil analisis dengan metode PSM yang tidak terlalu besar dan lebih kecil daripada nilai OR dari analisis regresi logistik.
Nilai Odds Ratio yang dibandingkan adalah nilai Odds Ratio model akhir pada analisis regresi, sehingga variabel-variabel akan sama antara regresi logistik dengan PSM. Biasanya Model yang digunakan adalah model tanpa interaksi, dan bisa disesuaikan dengan kemampuan peneliti.
Pada awal pemilihan variabel dilakukan pemilihan variabel yang dapat menjadi kandidat model dengan regresi logistik. Variabel-variabel yang menjadi kandidat model kemudian dilakukan uji confounding sesuai rule of thumb perubahan OR 10% antara sebelum dan sesudah variabel dikeluarkan.
Analisis multivariat yang konvensional bukan merupakan metode ideal untuk melihat efek pajanan pada studi observasional. Hal ini terjadi karena ketika terdapat perbedaan yang besar pada distribusi covariat antara kelompok terpajan dan tidak terpajan, hanya dilakukan adjusment pada perbedaan ini dengan menggunakan teknik analisis multivariat yang konvensional. Adjusment ini kurang dapat menjaga keseimbangan dalam kelompok dan memunculkan kembali bias yang akan membatasi validitas kesimpulan tentang determinan. Salah satu analisis multivariat yang sering digunakan adalah regresi. Standar output dari software modelling dalam regresi pada umumnya masih kurang sensitif menilai perbedaan. Hal ini akan dapat menyebabkan hasil yang kurang valid.
Pada analisis PSM variabel yang digunakan berdasarkan variabel yang menjadi model akhir pada regresi logistik terlihat ada kesepadanan. Hal ini dapat dibuktikan dengan grafik overlap and common support yang dapat menggambarkan hasil pemadanan yang semakin tumpang tindih (overlap) berarti semakin banyak responden yang dapat dipadankan. Selain gambaran pemadanan, hasil analisis PSM memperlihatkan rata-rata efek pajanan terhadap outcome yang dilihat dari nilai effect. Penilaian besarnya OR dilakukan berdasarkan nilai mean of matched treated dan mean of matched treated yang jika dibandingkan merupakan nilai Ratio Risk dengan penghitungan tabel 2×2 didapatkan nilai Odds Ratio yang akan dibandingkan dengan nilai OR yang didapatkan dari hasil analisis regresi logistik.
Apabila Perbedaan antara OR dari analisis regresi logistik (OR=0,99) dari analisis PSM (OR = 0,97) tidak terlalu besar. Hal tersebut dimungkinkan karena variasi variabel kovariat terutama kelompok terpajan tidak terlalu besar sehingga dengan adjusment pada regresi logistik keseimbangan variasi dalam kelompok tersebut dapat dijaga. Selain itu, perbedaan yang tidak terlalu besar disebabkan juga oleh pengaruh variabel confounder yang kecil. Nilai OR PSM yang lebih kecil hal ini terjadi mungkin karena pemadanan nilai probabilitas pada dua kelompok akan lebih meminimalkan variasi dalam kelompok sehingga akan berpengaruh pada nilai OR yang didapatkan.
Dalam operasionalisasi pengolahan data efek suatu pajanan atau model faktor risiko, pada analisis PSM lebih sederhana, sehingga hanya memerlukan beberapa langkah dibandingkan dengan regresi logistik. Demikian juga intepretasi hasil analisis teknik PSM lebih sederhana karena hanya melihat beberapa poin. Berdasarkan penjelasan diatas, akan lebih baik jika analisis yang digunakan untuk melihat efek suatu pajanan adalah teknik PSM, karena pemadanan nilai probablilitas akan meminimalkan bias seleksi pajanan sehingga estimasi pengaruh pajanan terhadap outcome semakin tepat.
Namun, keterbatasan pada analisis PSM adalah bahwa pemadanan nilai probabilitas membutuhkan sampel yang relatif lebih besar, karena sampel yang sedikit sangat berisiko tidak sepadan, sehingga tidak terjadi tumpang tindih antara kelompok terpajan dengan kelompok tidak terpajan. Analisis propensity score matching merupakan jenis analisis data kategori, tetapi kurang tepat digunakan pada konsep model determinan yang beberapa variabel independen mempunyai kedudukan yang sama.
Analisis propensity score matching bertujuan melihat pengaruh sebuah predictor terhadap outcome dapat menurunkan bias pada model faktor risiko, tetapi kurang tepat jika digunakan pada konsep model determinan.
Pada data observasional yang ingin melihat efek pajanan terhadap outcome sebaiknya menggunakan analisis propensity score matching. Analisis regresi logistik sebaiknya digunakan untuk kerangka konsep model determinan karena beberapa variabel independen mempunyai kedudukan yang sama sehingga tidak bisa dilihat pengaruh satu variabel independen terhadap dependen.
Referensi : Sudarmanto G, Analisis regresi linear ganda dengan SPSS, Edisi pertama, Graha Ilmu, Yogyakarta, , 2005. Kleinbaum DG, Klein M, Logistic regression : A self-learning text, 2 nd.ed, Springer verlag, New York, 2002, h. 4-7, 164-82, 15.
Hosmer DW, Lemeshow S, Applied logistic regression, 2nd ed, New York, John wiley & sons.Inc, 2000, 95. 16. Oakes JM, Kaufman JS, Methods in social epidemiology, 1st ed, San Francisco, Jossy-Bass A wiley Imrint, 2006, 377.
Waras Budi Utomo, http://journal.fkm.ui.ac.id/kesmas/article/view/248.
WB Utomo :https://media.neliti.com/media/publications/39681-ID-perbandingan-analisis-regresi-logistik-dengan-analisis-propensity-score-matching.pdf