ANALISA MULTIPLE REGRESION DENGAN STATA 9.0
A.Analisis Univariat
Tabel 1.
sum
Variable | Obs Mean Std. Dev. Min Max
————-+——————————————————–
caseid | 654 327.5 188.9378 1 654
subjid | 654 37169.57 23690.86 201 90001
age | 654 9.931193 2.953935 3 19
fev | 654 2.63678 .8670591 .791 5.793
height | 654 61.14358 5.703513 46 74
————-+——————————————————–
sex | 654 .5137615 .5001931 0 1
smoke | 654 .0993884 .2994118 0 1
Pada hasil diatas,dapat dilihat deskripsi responden,yaitu :responden berjumlah 654 orang,rata-rata umur responden 9,93 tahun,standar deviasi 2,95 thn,umur termuda 3 tahun dan yang tertua umur 19 tahun.Dari variable height/tinggi,rata-rata tinggi responden 61,14 inci,standar deviasi 5,70 inci,yang paling rendah tingginya 46 inci dan paling tinggi 74 inci.Untuk variable outcome fev dapat kita lihat rata-rata kekuatan fev adalah 2,64 lt/det,standar deviasi 0,87 lt/det,fev yang paling rendah 0,791 lt/det dan yang paling tinggi 5,793 lt/det.Sedangkan untuk variable sex/jenis kelamin dan smoke/merokok datanya dalam bentuk katagorik.Sex dikategorikan menjadi 0 = perempuan dan 1 = laki-laki,sedangkan smoke,0 = tidak merokok dan 1 = merokok.Pada nilai observasi terlihat semua berjumlah 654,berarti tidak ada data yang missing.
B. Analisis dengan Stepwise Regression
Hasil dibawah ini(tabel 2 s/d tabel 5)adalah hasil analisa regresi dengan metode stepwise/pr(.1),dengan cara memasukkan satu persatu variable prediktornya.Kita mencoba lebih dulu memasukkan variable age.Setiap memasukkan variable selanjutnya kita melihat perubahan nilai beta 1,dalam hal ini yang menjadi beta 1 adalah nilai coefisien age pada tabel uji t.Apabila nilai beta 1( age ) berubah 20% atau lebih saat dimasukkan variable lain ke model,ini berarti ada asosiasi atau variable tersebut berpengaruh terhadap model regresi.
Tabel 2.
. sw,pr(.1):reg fev age
begin with full model
p < 0.1000 for all terms in model
Source | SS df MS Number of obs = 654
————-+—————————— F( 1, 652) = 872.18
Model | 280.919154 1 280.919154 Prob > F = 0.0000
Residual | 210.000679 652 .322086931 R-squared = 0.5722
————-+—————————— Adj R-squared = 0.5716
Total | 490.919833 653 .751791475 Root MSE = .56753
——————————————————————————
fev | Coef. Std. Err. t P>|t| [95% Conf. Interval]
————-+—————————————————————-
age | .222041 .0075185 29.53 0.000 .2072777 .2368043
_cons | .4316481 .0778954 5.54 0.000 .278692 .5846042
——————————————————————————
Tabel 3.
. sw,pr(.1):reg fev age height
begin with full model
p < 0.1000 for all terms in model
Source | SS df MS Number of obs = 654
————-+—————————— F( 2, 651) = 1067.96
Model | 376.244941 2 188.122471 Prob > F = 0.0000
Residual | 114.674892 651 .176151908 R-squared = 0.7664
————-+—————————— Adj R-squared = 0.7657
Total | 490.919833 653 .751791475 Root MSE = .4197
——————————————————————————
fev | Coef. Std. Err. t P>|t| [95% Conf. Interval]
————-+—————————————————————-
age | .0542807 .0091061 5.96 0.000 .0363998 .0721616
height | .1097118 .0047162 23.26 0.000 .100451 .1189726
_cons | -4.610466 .2242706 -20.56 0.000 -5.050847 -4.170085
——————————————————————————
Tabel 4.
. sw,pr(.1):reg fev age height sex
begin with full model
p < 0.1000 for all terms in model
Source | SS df MS Number of obs = 654
————-+—————————— F( 3, 650) = 744.63
Model | 380.271883 3 126.757294 Prob > F = 0.0000
Residual | 110.647951 650 .170227616 R-squared = 0.7746
————-+—————————— Adj R-squared = 0.7736
Total | 490.919833 653 .751791475 Root MSE = .41259
——————————————————————————
fev | Coef. Std. Err. t P>|t| [95% Conf. Interval]
————-+—————————————————————-
age | .0613638 .0090694 6.77 0.000 .043555 .0791726
height | .1045596 .0047557 21.99 0.000 .0952213 .113898
sex | .1611121 .033125 4.86 0.000 .0960672 .2261569
_cons | -4.44856 .222966 -19.95 0.000 -4.88638 -4.010739
——————————————————————————
Tabel 5.
. sw,pr(.1):reg fev age height sex smoke
begin with full model
p = 0.1414 >= 0.1000 removing smoke
Source | SS df MS Number of obs = 654
————-+—————————— F( 3, 650) = 744.63
Model | 380.271883 3 126.757294 Prob > F = 0.0000
Residual | 110.647951 650 .170227616 R-squared = 0.7746
————-+—————————— Adj R-squared = 0.7736
Total | 490.919833 653 .751791475 Root MSE = .41259
——————————————————————————
fev | Coef. Std. Err. t P>|t| [95% Conf. Interval]
————-+—————————————————————-
age | .0613638 .0090694 6.77 0.000 .043555 .0791726
height | .1045596 .0047557 21.99 0.000 .0952213 .113898
sex | .1611121 .033125 4.86 0.000 .0960672 .2261569
_cons | -4.44856 .222966 -19.95 0.000 -4.88638 -4.010739
Tabel 6
. sw,pr(.1):reg fev age smoke
begin with full model
p < 0.1000 for all terms in model
Source | SS df MS Number of obs = 654
————-+—————————— F( 2, 651) = 443.25
Model | 283.058247 2 141.529123 Prob > F = 0.0000
Residual | 207.861587 651 .319295832 R-squared = 0.5766
————-+—————————— Adj R-squared = 0.5753
Total | 490.919833 653 .751791475 Root MSE = .56506
——————————————————————————
fev | Coef. Std. Err. t P>|t| [95% Conf. Interval]
————-+—————————————————————-
age | .2306046 .0081844 28.18 0.000 .2145336 .2466755
smoke | -.2089949 .0807453 -2.59 0.010 -.3675476 -.0504421
_cons | .3673731 .0814357 4.51 0.000 .2074647 .5272814
——————————————————————————
Dengan melihat hasil-hasil tabel diatas dapat terlihat bahwa pada table 2 nilai coefisien age ( beta 1) adalah 0,222.Pada table 3 dimasukkan variable height nilai coefisien age berubah menjadi 0,054 dan juga nilai R squarenya berubah dari 0,572 (57,2%) menjadi 0,766 ( 76,6 % ).Masuknya variable height memberikan perubahan nilai coefisien age lebih dari 10%,dengan memperhatikan perubahan ini berarti variable height mempunyai pengaruh yang sangat signifikan terhadap model regresi atau fev.
Pada table 4,dimasukkan variable sex ke dalam model regresi.Pada table ini dapat kita lihat perubahan nilai coefisien age ( beta 1) dari 0,054 menjadi 0,061 dan nilai R square dari 0,776 ( 76,6% ) menjadi 0,774 ( 77,4% ).Perubahan nilai age melebihi 10%,ini berarti variable sex mempunyai pengaruh terhadap fev/model tersebut.
Selanjutnya dimasukkan variable smoke,hasilnya pada tabel 5 terlihat bahwa variable smoke dikeluarkan secara otomatis,dikarenakan nilai t test melebihi dari 0.1 dan nilai coefisien age tetap 0,061 ,berarti variable smoke tidak berpengaruh terhadap model regresi atau tidak memiliki asosiasi.
Hal yang sama dapat juga kita lihat pada table 6,dimana disini kita coba setelah dimasukkan variable age seperti table 2,lalu dimasukkan variable smoke.Hasilnya kita bandingkan antara table 2 dengan table 6.Ternyata nilai coefisien age ( beta 1 ) berubah tidak signifikan tidak berubah melebihi 10 %,yaitu dari 0,22 menjadi 0,23 dan nilai R square berubah dari 57,2% menjadi 57,6%.Ini juga membuktikan bahwa variable smoke tidak berpengaruh atau tidak memiliki asosiasi terhadap model atau fev.
Tabel 7
. sw,pr(.1):reg fev height age
begin with full model
p < 0.1000 for all terms in model
Source | SS df MS Number of obs = 654
————-+—————————— F( 2, 651) = 1067.96
Model | 376.244941 2 188.122471 Prob > F = 0.0000
Residual | 114.674892 651 .176151908 R-squared = 0.7664
————-+—————————— Adj R-squared = 0.7657
Total | 490.919833 653 .751791475 Root MSE = .4197
——————————————————————————
fev | Coef. Std. Err. t P>|t| [95% Conf. Interval]
————-+—————————————————————-
height | .1097118 .0047162 23.26 0.000 .100451 .1189726
age | .0542807 .0091061 5.96 0.000 .0363998 .0721616
_cons | -4.610466 .2242706 -20.56 0.000 -5.050847 -4.170085
——————————————————————————
Tabel 8
. sw,pr(.1):reg fev height age smoke
begin with full model
p < 0.1000 for all terms in model
Source | SS df MS Number of obs = 654
————-+—————————— F( 3, 650) = 715.69
Model | 376.837002 3 125.612334 Prob > F = 0.0000
Residual | 114.082831 650 .175512048 R-squared = 0.7676
————-+—————————— Adj R-squared = 0.7665
Total | 490.919833 653 .751791475 Root MSE = .41894
——————————————————————————
fev | Coef. Std. Err. t P>|t| [95% Conf. Interval]
————-+—————————————————————-
height | .1090947 .0047196 23.12 0.000 .0998272 .1183622
age | .059741 .0095634 6.25 0.000 .0409621 .07852
smoke | -.1102319 .0600175 -1.84 0.067 -.2280834 .0076196
_cons | -4.616007 .2238833 -20.62 0.000 -5.055629 -4.176385
——————————————————————————
Untuk membuktikan bahwa variable smoke tidak berpengaruh pada model,dapat kita lihat juga hasil analisis table 7 dan table 8.Pada table 7 pertama dimasukkan adalah variable height,nilai coefisien height(beta 1) adalah 0,109,selanjutnya pada table 8 dimasukkan variable smoke.Setelah dimasukkan variable smoke hasil analisis terlihat bahwa coefisien height berubah sangat sedikit,bahkan dianggap tidak berubah.Ini membuktikan bahwa variable smoke tidak berpengaruh terhadap fev dengan metode stepwise (pr 0.1).
. sw reg fev age height sex smoke,pr(.1)
begin with full model
p = 0.1414 >= 0.1000 removing smoke
Source | SS df MS Number of obs = 654
————-+—————————— F( 3, 650) = 744.63
Model | 380.271883 3 126.757294 Prob > F = 0.0000
Residual | 110.647951 650 .170227616 R-squared = 0.7746
————-+—————————— Adj R-squared = 0.7736
Total | 490.919833 653 .751791475 Root MSE = .41259
——————————————————————————
fev | Coef. Std. Err. t P>|t| [95% Conf. Interval]
————-+—————————————————————-
age | .0613638 .0090694 6.77 0.000 .043555 .0791726
height | .1045596 .0047557 21.99 0.000 .0952213 .113898
sex | .1611121 .033125 4.86 0.000 .0960672 .2261569
_cons | -4.44856 .222966 -19.95 0.000 -4.88638 -4.010739
——————————————————————————
Setelah dilakukan analisis dengan metode stepwise regression/ sw,pr (.1),hasil analisis dapat kita simpulkan bahwa variable smoke dikeluarkan dari model regresi dikarenakan nilai t test < 0,1. Pada nilai t test menunjukkan semua variable yang masuk kedalam model regresi.Jadi variable prediktor yang masuk kedalam model regresi adalah :age,height dan sex.
Tabel ANOVA digunakan untuk menguji persamaan regresi atau model,pada hasil diatas Nilai F test menunjukkan nilai 0.0001 dengan degrees of freedom 3 dan 650 ,ini berarti pada nilai alpha 0.05 variabel age,height dan sex secara signifikan dapat memprediksi variable fev,atau secara statistic Ho ( Ho= pada regresi ditolak karena nilai F<= 0.05.(beta variabel-variabel prediktor tidak sama dengan nol).Kesimpulan ada hubungan linier antara fev dengan age,height dan sex.
Nilai koefisien determinan (R Square) menunjukkan nilai 0,7746 artinya bahwa model regresi yang diperoleh dapat menjelaskan 77,5% variasi variabel outcome.Atau dengan kata lain variabel age,height dan sex dapat menjelaskan variasi variabel fev sebesar 77,5%.Jadi model ini sangat baik,karena di bidang kesehatan masyarakat dikatakan baik bila nilai R-Square minimal sekitar 60%.
Sedangkan nilai adj-R square berhubungan dengan sample size,apabila nilai R square hampir sama dengan nilai adj R square berarti sampelnya cukup untuk model regresi ini.
Dari table diatas dapat diperoleh persamaan garis regresi,yaitu :
FEV= -4,449 + 0,0614*AGE + 0,105*HEIGHT + 0,1611*SEX
Dengan model persamaan ini kita dapat memperkirakan fev dengan menggunakan variable age,height dan sex.Bila nilai koefisien Beta positif menunjukkan hubungan yang positif,dan bila koefisien Beta negative menunjukkan hubungan negative.Nilai koefisien Beta juga dapat digunakan untuk mengetahui variable mana yang paling besar peranannya/pengaruhnya dalam menentukan variable outcome.Semakin besar nilai beta semakin besar pengaruhnya.Pada hasil diatas yang paling besar pengaruhnya adalah sex/jenis kelamin.
bwaaaahhh ini apa toh?? ^ga ngerti yang beginian^ 😳
Mohon tanggapannya: Syntax untuk analisis data RKD (riskesdas), menggunakan analisis complex karena disain sampling nya PPS, jadi ada strata, psu, dst. Mohon informasi, jikalau pernah mendapatkan pembelajaran syntax survei. Apa perbedaan makna ke 4 syntax dibawah ini. Apakah syntax terakhir akan mempengaruhi hasil riset nantinya, ataukah keseluruhannya diterapkan secara simultan untuk pengkondisian data yang akan di analisis.
. svyset psu [pweight = inflate],strata(strata)
pweight: inflate
VCE: linearized
Single unit: missing
Strata 1: strata
SU 1: psu
FPC 1:
. svyset [pweight = inflate ],strata(strata)
pweight: inflate
VCE: linearized
Single unit: missing
Strata 1: strata
SU 1:
FPC 1:
. svyset psu [pweight = inflate],psu(psu)
pweight: inflate
VCE: linearized
Single unit: missing
Strata 1:
SU 1: psu
FPC 1:
. svyset [pweight = inflate],strata(strata)
pweight: inflate
VCE: linearized
Single unit: missing
Strata 1: strata
SU 1:
FPC 1:
. svyset psu [pweight = inflate],strata(strata)
pweight: inflate
VCE: linearized
Single unit: missing
Strata 1: strata
SU 1: psu
FPC 1:
Sebagaimana diketahui untuk survey data sheet dilakukan pembobotan, karena sampel yg diambil tidak secara SRS, oleh karena itu dilakukan bobot normalisasi. Untuk variabel bobot/weight, variabel bobot sudah disiapkan oleh Riskesdas, yang ada didalam data set nya dimana untuk riskesdas per kab/kota per provinsi, untuk analisis seluruh indonesia bobot ini hrs dinormalisasi. Normalisasi bobot dilakukan supaya total sampelnya tidak berubah, tetap sama dengan total sampel responden dalam data.
Terimakasih