Analisis Propensity Score Matching(PSM)
ANALISIS PROPENSITY SCORE MATCHING
Ahli-ahli epidemiologi sangat memahami bahwa dalam penelitian observasional masih ada masalah dalam menarik kesimpulan yang disebabkan oleh adanya bias karena potensial confounding, dimana dengan kondisi ini sebenarnya masih kurang tepat jika dua keadaan dibandingkan walaupun telah dilakukan adjusment melalui regresi karena masih ada potensi bias. Dalam melihat efek dari pajanan pada studi observasi perlu mempertimbangkan adanya bias dan akan sulit untuk menghilangkan bias jika hanya dengan menggunakan teknik analisis yang standar.
Teknik analisis yang menggunakan propensity score dalam studi observasi dapat melakukan adjusment pada covariat pada dua kelompok dan dapat mengurangi bias lebih baik dibandingkan dengan teknik modelling pada analisis multivariat yang konvensional.
Definisi
Propensity Score Matching Method ( PSM ) diperkenalkan oleh Rosenbaum dan Rubin tahun 1983. Propensity dikenal sebagai probabilitas dari terpajan atau yang mendapat perlakuan (atau keduanya). Dengan mengestimasi propensity score , kita akan memadankan subjek dikeduanya (terpajan dan kondisi tidak terpajan) menggunakan nilai propensity scorenya .
Alasan penggunaan Propensity Score
Propensity Score dinyatakan dapat digunakan utk mengurangi bias dan meningkatkan presisi ketika melakukan estimasi efek dari pajanan pada studi observasional. Teknik analisis ini melakukan matching melalui nilai propensity dari subjek yang terpajan dan subyek tidak terpajan. Nilai propensity merupakan nilai probabilitas subyek jika tidak terpajan, yang ada kenyataannya subyek adalah dalam keadaan terpajan. Nilai propensity dapat digunakan untuk menurunkan pengaruh dari potensial confounder.
Langkah dalam PSM
– Estimasi Propensity Score
Dalam melakukan estimasi propensity score ada hal yang harus dilakukan, yang pertama adalah terkait dengan model yang akan digunakan untuk mengestimasi, yang kedua adalah variabel yang dimasukkan kedalam model.
Pemilihan Algoritma Pemadanan (matching)
1. Nearest Neighbour
Matching pada kelompok tidak terpajan diambil dari subyek yang memiliki nilai propensity score terdekat dengan nilai propensity score subyek pada kelompok terpajan. Dapat dilakukan dengan metode tanpa atau dengan pengembalian. Keuntungannya adalah padanan pasti ada untuk semua subyek pada kelompok perlakuan . Kerugiannya adalah dapat terjadi matching sangat berbeda dengan subyek yang dipadankan (propensity scorenya berbeda jauh).
2. Caliper & Radius
Sama dengan nearest neighbour tetapi diberikan batas tertentu pada propensity score caliper . Radius sama dengan caliper tetapi semua subyek dari kelompok tidak terpajan yang nilai propensity score dalam caliper diambil sebagai padanan
3.Stratifikasi
Pada tiap strata dilakukan perhitungan average treatment affect on treated (ATT). ATT untuk seluruh populasi dihitung berdasarkan ATT rata-rata dari tiap strata.
4.Kernel & Local Linear Regression
Menggunakan seluruh subjek pada kelompok pembanding dengan pembobotan. Pembobotan sebanding dengan beda nilai propensity score subjek pada kelompok perlakuan dengan padanannya pada kelompok pembanding.
5.Pembobotan
Setelah nilai propensity score diketahui, kita dapat secara langsung membedakan bobot antara rata-rata outcome pada individu terpajan dan tidak terpajan.
Overlap & Common Support
Langkah penting untuk melihat overlap dan common support antara kelompok terpajan dengan kelompoktidak terpajan pada saat dibandingkan dengan melihat distribusi keduanya.
Uji Kualitas Pemadanan
Dilakukan dengan membandingkan distribusi covariat X sebelum dan sesudah dilakukan pemadanan. Digunakan perhitungan standardized difference untuk tiap covariat X sebelum dan sesudah pemadanan. Kualitas pemadanan dapat dihitung dengan persentase reduksi bias.
Edisi REVISI klik https://syehaceh.wordpress.com/2021/01/10/analisis-propensity-score-matching-psm/
#############################
ANALISIS PROPENSITY SCORE MATCHING (PSM) edisi REVISI (27 Januari 2021)
Ahli-ahli epidemiologi sangat memahami bahwa dalam penelitian observasional masih ada masalah dalam menarik kesimpulan yang disebabkan oleh adanya bias karena potensial confounding, dimana dengan kondisi ini sebenarnya masih kurang tepat jika dua keadaan dibandingkan walaupun telah dilakukan adjusment melalui regresi karena masih ada potensi bias. Dalam melihat efek dari pajanan pada studi observasi perlu mempertimbangkan adanya bias dan akan sulit untuk menghilangkan bias jika hanya dengan menggunakan teknik analisis yang standar.
Salah satu metode analisis yang dapat digunakan dalam penelitian evaluasi dampak suatu kebijakan adalah metode propensity score matching. Menurut Heckman et al. (1997) metode matching memungkinkan kita mengurangi bias secara substansial tetapi tidak serta merta menghilangkannya. Metode matching yang umum digunakan adalah propensity score matching (PSM). Propensity Score adalah sebuah metode probabilitas bersyarat dari perlakuan tertentu yang dapat meminimalisir bias dengan menyesuaikan skor propensity berdasarkan kovariat yang sama antara kelompok perlakuan dan kelompok kontrol (Rosenbaum dan Rubin, 1983).
Teknik analisis yang menggunakan propensity score dalam studi observasi dapat melakukan adjusment pada covariat pada dua kelompok dan dapat mengurangi bias lebih baik dibandingkan dengan teknik modelling pada analisis multivariat yang konvensional.
Definisi
Propensity Score Matching Method ( PSM ) diperkenalkan oleh Rosenbaum dan Rubin tahun 1983. Propensity dikenal sebagai probabilitas dari terpajan atau yang mendapat perlakuan (atau keduanya). Dengan mengestimasi propensity score , kita akan memadankan subjek dikeduanya (terpajan dan kondisi tidak terpajan) menggunakan nilai propensity scorenya .
Alasan penggunaan Propensity Score
Propensity Score dinyatakan dapat digunakan utk mengurangi bias dan meningkatkan presisi ketika melakukan estimasi efek dari pajanan pada studi observasional. Teknik analisis ini melakukan matching melalui nilai propensity dari subjek yang terpajan dan subyek tidak terpajan. Nilai propensity merupakan nilai probabilitas subyek jika tidak terpajan, yang ada kenyataannya subyek adalah dalam keadaan terpajan. Nilai propensity dapat digunakan untuk menurunkan pengaruh dari potensial confounder.
Salah satu metode analisis yang dapat digunakan dalam penelitian evaluasi dampak suatu kebijakan adalah metode propensity score matching. Menurut Heckman et al. (1997) metode matching memungkinkan kita mengurangi bias secara substansial tetapi tidak serta merta menghilangkannya. Metode matching yang umum digunakan adalah propensity score matching (PSM). Propensity Score adalah sebuah metode probabilitas bersyarat dari perlakuan tertentu yang dapat meminimalisir bias dengan menyesuaikan skor propensity berdasarkan kovariat yang sama antara kelompok perlakuan dan kelompok kontrol (Rosenbaum dan Rubin, 1983).
Menurut Sianesi (2006 dalam Sulistyaningrum, 2016) terdapat dua asumsi yang harus dipenuhi ketika melakukan pengujian menggunakan PSM untuk mendapatkan kelompok kontrol yang sama yaitu Conditional Independent Asumption (CIA) dan Common Support.
Model memenuhi CIA jika outcome yang akan diberikan dari kelompok perlakuan tidak dipengaruhi variabel lain selain variabel treatment, artinya hasil intervensi bukan pengaruh faktor lain di luar intervensi. Seperti pada penelitian ini, model dikatakan memenuhi CIA apabila persentase penduduk miskin dari kelompok yang menerima program pembangunan infrastruktur perdesaan tidak dipengaruhi oleh faktor-faktor lain kecuali program itu sendiri.
Asumsi yang kedua adalah model harus memenuhi common support. Common Support adalah suatu kondisi ketika nilai density kelompok perlakuan dan kelompok kontrol terjadi overlap (perpotongan). Daerah common support merepresentasikan adanya kesamaan karakteristik antara kedua kelompok berdasarkan kesamaan distribusi nilai propensity-nya.
5 ( lima) Langkah dalam PSM
A.Estimasi Propensity Score
Dalam melakukan estimasi propensity score ada hal yang harus dilakukan, yang pertama adalah terkait dengan model yang akan digunakan untuk mengestimasi, yang kedua adalah variabel yang dimasukkan kedalam model.
Menurut Caliendo dan Kopeinig (2008), ada dua langkah yang harus dilakukan ketika memperkirakan Propensity Score yaitu: memilih model dan memilih variabel yang harus dimasukkan dalam model. Penelitian ini menggunakan model logit. Pemilihan variabel harus mengacu pada teori ekonomi dan penelitian terdahulu yang telah ditemukan.
B.Pemilihan Algoritma Pemadanan (matching)
Memilih Matching Algorithm
Matching Algorithm terdiri dari 5 yaitu: Nearest Neighbour (NN); Caliper dan Radius; Stratification dan Interval; Kernel and Local Linear; dan Weighting. Tidak ada metode yang lebih unggul diantara semua metode matching. Hal ini disebabkan oleh adanya trade off antara bias dan variansi yang akan memengaruhi estimasi nilai ATT (Caliendo dan Kopeinig, 2008).
1. Nearest Neighbour (NN)
Matching pada kelompok tidak terpajan diambil dari subyek yang memiliki nilai propensity score terdekat dengan nilai propensity score subyek pada kelompok terpajan. Dapat dilakukan dengan metode tanpa atau dengan pengembalian. Keuntungannya adalah padanan pasti ada untuk semua subyek pada kelompok perlakuan . Kerugiannya adalah dapat terjadi matching sangat berbeda dengan subyek yang dipadankan (propensity scorenya berbeda jauh).
2. Caliper & Radius
Sama dengan nearest neighbour tetapi diberikan batas tertentu pada propensity score caliper . Radius sama dengan caliper tetapi semua subyek dari kelompok tidak terpajan yang nilai propensity score dalam caliper diambil sebagai padanan
3.Stratification dan Interval
Pada tiap strata dilakukan perhitungan average treatment affect on treated (ATT). ATT untuk seluruh populasi dihitung berdasarkan ATT rata-rata dari tiap strata.
4.Kernel & Local Linear Regression
Menggunakan seluruh subjek pada kelompok pembanding dengan pembobotan. Pembobotan sebanding dengan beda nilai propensity score subjek pada kelompok perlakuan dengan padanannya pada kelompok pembanding.
5. Weighting (Pembobotan)
Setelah nilai propensity score diketahui, kita dapat secara langsung membedakan bobot antara rata-rata outcome pada individu terpajan dan tidak terpajan.
C. Overlap & Common Support
Langkah penting untuk melihat overlap dan common support antara kelompok terpajan dengan kelompoktidak terpajan pada saat dibandingkan dengan melihat distribusi keduanya.
Memeriksa Common Support
Common Support merupakan salah satu asumsi yang dipenuhi dalam PSM. Karena itu langkah ini sangat penting dalam pencocokan estimasi. Apakah terjadi tumpang tindih (overlap) antara kelompok perlakuan dan kontrol. Dengan begitu dapat dipastikan bahwa kecocokan untuk kelompok yang diintervensi dan kelompok yang tidak diintervensi dapat ditemukan.
D. Uji Kualitas Pemadanan
Dilakukan dengan membandingkan distribusi covariat X sebelum dan sesudah dilakukan pemadanan. Digunakan perhitungan standardized difference untuk tiap covariat X sebelum dan sesudah pemadanan. Kualitas pemadanan dapat dihitung dengan persentase reduksi bias.
Langkah ini harus dilakukan untuk menilai kualitas pencocokan. Uji yang dilakukan antara lain uji bias terstandar, uji beda sebelum dan sesudah pencocokan (t-test), dan uji kualitas penggabungan variabel dalam sampel yang dicocokkan (F-test/Hotelling Test). Jika tidak terdapat perbedaan (menerima H0) berarti sampel yang digunakan memiliki kualitas matching yang baik. Jika kualitas pencocokan buruk atau masih ada perbedaan, lebih baik untuk mengulang langkah yang sama sampai kualitas pencocokan memuaskan.
E. Mengestimasi Standar Error dan Analisis Sensitifitas.
Menurut Rosenbaum dan Rubin (1983) dan Rosenbaum (2005), analisis sensitifitas harus dilakukan berulang untuk melihat sensitifitas dari hasil temuan terhadap hidden bias, yaitu bias yang terjadi akibat adanya variabel lain di luar model yang belum dimasukkan tetapi memiliki pengaruh terhadap variabel dalam model. Untuk menganalisis sensitifitas penelitian ini menggunakan Wilcoxon’s signed-rank test yang merupakan salah satu metode analisis sensitifitas yang dikembangkan oleh Rosenbaum (2005).
Referensi:
Caliendo, M. dan Kopeinig, S., 2008. Some Practical Guidence for the Implementation of Propensity Score Matching. Journal of Economic Surveys, Vol.22, No.1: 31–72.
Heckman J., Ichimura, H., Smith, J., dan Todd, P. 1997. Matching As An Econometric Evaluation Estimator: Evidence from Evaluating a Job Training Programme. Review of Economic Studies, Vol.64, 605-654.
Khandker, S.R., Koolwal, G.B., dan Samad, H.A. 2010. Handbook on Impact Evaluation: Quantitative Methods and Practices. World Bank. Washington D.C.
Rosenbaum, P. R., dan Rubin, D., 1983. The Central Role of the Propensity Score in Observational Studies for Causal Effects. Biometrica, Vol.70, No.1: 41-45.
Rosenbaum, P.R. 2005. Sensitivity analysis in observational studies. Encyslopedia of Statistics in Behavioral Science, Vol.4, 1809-1814.
Sulistyaningrum, Eny. 2016. Impact Evaluation Of The School Operational Assistance Program (BOS) Using The Matching Method. Journal of Indonesian Economy and Business. Vol.31, No.1: 33-62.