Multinomial logistisk regression | Stata kommenteret output
On januar 28, 2022 by adminDenne side viser et eksempel på en multinomial logistisk regressionsanalyse med fodnoter, der forklarer outputtet. Dataene blev indsamlet på 200 gymnasieelever og er scoringer på forskellige tests, herunder et videospil og et puslespil. Udfaldsmålet i denne analyse er den foretrukne smag af is – vanilje, chokolade eller jordbær – ud fra hvilken vi vil se, hvilke sammenhænge der er med scoringer i videospil (video), scoringer i puslespil (puslespil) og køn (kvinde). Vores responsvariabel, ice_cream, vil blive behandlet som kategorisk under den antagelse, at niveauerne af ice_cream ikke har nogen naturlig orden, og vi vil lade Stata vælge referencegruppen. I vores eksempel vil dette være vanilje. Som standard vælger Stata den hyppigst forekommende gruppe som referencegruppe. I den første halvdel af denne side fortolkes koefficienterne i form af multinomiale log-odds (logits). Disse vil ligge tæt på, men ikke være lig med de log-odds, der opnås i en logistisk regression med to niveauer af udfaldsvariablen. I den anden halvdel fortolkes koefficienterne i form af relative risikokvoter.
use https://stats.idre.ucla.edu/stat/stata/output/mlogit, clear
Hvor regressionen udføres, kan det at få en frekvens af isvarianterne i dataene give oplysninger om valget af en referencegruppe.
tab ice_cream favorite flavor of ice cream | Freq. Percent Cum. ------------+----------------------------------- chocolate | 47 23.50 23.50 vanilla | 95 47.50 71.00 strawberry | 58 29.00 100.00 ------------+----------------------------------- Total | 200 100.00
Vanilje er den hyppigst forekommende issmag og vil være referencegruppen i dette eksempel.
mlogit ice_cream video puzzle femaleIteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485Multinomial logistic regression Number of obs = 200 LR chi2(6) = 33.10 Prob > chi2 = 0.0000Log likelihood = -194.03485 Pseudo R2 = 0.0786------------------------------------------------------------------------------ ice_cream | Coef. Std. Err. z P>|z| -------------+----------------------------------------------------------------chocolate | video | -.0235647 .0209747 -1.12 0.261 -.0646744 .017545 puzzle | -.0389243 .0195165 -1.99 0.046 -.0771759 -.0006726 female | .8166202 .3909813 2.09 0.037 .050311 1.582929 _cons | 1.912256 1.127256 1.70 0.090 -.2971258 4.121638-------------+----------------------------------------------------------------strawberry | video | .022922 .0208718 1.10 0.272 -.0179861 .0638301 puzzle | .0430036 .0198894 2.16 0.031 .0040211 .081986 female | -.032862 .3500153 -0.09 0.925 -.7188793 .6531553 _cons | -4.057323 1.222939 -3.32 0.001 -6.45424 -1.660407------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)
Iteration Loga
Iteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485
a. Iterationslogbog – Dette er en liste over log-sandsynlighederne ved hver iteration. Husk, at multinomial logistisk regression, ligesom binær og ordnet logistisk regression, anvender maximum likelihood-estimation, som er en iterativ procedure. Den første iteration (kaldet iteration 0) er log-sandsynligheden for den “nulte” eller “tomme” model; dvs. en model uden prædiktorer. Ved den næste iteration medtages prædiktor(er) i modellen. Ved hver iteration øges log-sandsynligheden, fordi målet er at maksimere log-sandsynligheden. Når forskellen mellem de på hinanden følgende iterationer er meget lille, siges modellen at have “konvergeret”, iterationen stopper, og resultaterne vises. Yderligere oplysninger om denne proces for binære resultater findes iRegression Models for Categorical and Limited Dependent Variables af J. Scott Long (side 52-61).
Modeloversigt
Multinomial logistic regression Number of obsc = 200 LR chi2(6)d = 33.10 Prob > chi2e = 0.0000Log likelihood = -194.03485b Pseudo R2f = 0.0786
b. Log Likelihood – Dette er den log sandsynlighed for den tilpassede model. Den bruges i Likelihood Ratio Chi-Square-testen af, om alle prædiktorers regressionskoefficienter i modellen samtidig er nul, og i test af indlejrede modeller.
c. Number of obs – Dette er antallet af observationer, der anvendes i den multinomiale logistiske regression. Det kan være mindre end antallet af tilfælde i datasættet, hvis der er manglende værdier for nogle variabler i ligningen. Som standard foretager Stata en listevis sletning af ufuldstændige tilfælde.
d. LR chi2(6) – Dette er Likelihood Ratio (LR) Chi-Square-testen for, at for begge ligninger (chokolade i forhold til vanilje og jordbær i forhold til vanilje), at mindst en af prædiktorernes regressionskoefficient ikke er lig nul. Tallet i parentesen angiver frihedsgraderne for den Chi-Square-fordeling, der anvendes til at teste LR Chi-Square-statistikken, og det er defineret ved antallet af estimerede modeller (2) gange antallet af prædiktorer i modellen (3). LR Chi-Square-statistikken kan beregnes ved -2*( L(nulmodel) – L(tilpasset model))) = -2*((-210,583) – (-194,035)) = 33,096, hvor L(nulmodel) er fra loglikelihood med kun responsvariablen i modellen (Iteration 0) og L(tilpasset model) er loglikelihood fra den sidste iteration (under forudsætning af at modellen konvergerede) med alle parametre.
e. Prob > chi2 – Dette er sandsynligheden for at få en LR-teststatistik, der er lige så ekstrem som eller mere ekstrem end den observerede statistik under nulhypotesen; nulhypotesen er, at alle regressionskoefficienter på tværs af begge modeller samtidig er lig med nul. Med andre ord er det sandsynligheden for at få denne chi-square-statistik (33,10) eller en mere ekstrem, hvis der faktisk ikke er nogen effekt af de prædiktive variabler. Denne p-værdi sammenlignes med et specificeret alfa-niveau, vores villighed til at acceptere en type I-fejl, som typisk er fastsat til 0,05 eller 0,01. Den lille p-værdi fra LR-testen, <0,00001, ville få os til at konkludere, at mindst en af regressionskoefficienterne i modellen ikke er lig med nul. Parameteren for den chi-kvadratfordeling, der anvendes til at teste nulhypotesen, er defineret ved frihedsgraderne i den forudgående linje, chi2(6).
f. Pseudo R2 – Dette er McFaddens pseudo R-kvadrat. Logistisk regression har ikke en ækvivalent til R-kvadratet, som findes i OLS-regression; mange har dog forsøgt at finde på en sådan. Der findes en lang række forskellige pseudo-R-kvadratstatistikker. Da denne statistik ikke betyder det, som R-kvadrat betyder i OLS-regression (den andel af variansen af responsvariablen, der forklares af prædiktorerne), foreslår vi, at denne statistik fortolkes med stor forsigtighed.
Parameterestimater
------------------------------------------------------------------------------ ice_creamg | Coef.h Std. Err.j zk P>|z|k l-------------+----------------------------------------------------------------chocolate | video | -.0235647 .0209747 -1.12 0.261 -.0646744 .017545 puzzle | -.0389243 .0195165 -1.99 0.046 -.0771759 -.0006726 female | .8166202 .3909813 2.09 0.037 .050311 1.582929 _cons | 1.912256 1.127256 1.70 0.090 -.2971258 4.121638-------------+----------------------------------------------------------------strawberry | video | .022922 .0208718 1.10 0.272 -.0179861 .0638301 puzzle | .0430036 .0198894 2.16 0.031 .0040211 .081986 female | -.032862 .3500153 -0.09 0.925 -.7188793 .6531553 _cons | -4.057323 1.222939 -3.32 0.001 -6.45424 -1.660407------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)i
g. ice_cream – Dette er responsvariablen i den multinomiale logistiske regression. Under ice_cream er der to replikater af prædiktorvariablerne, som repræsenterer de to modeller, der er estimeret: chokolade i forhold til vanilje og jordbær i forhold til vanilje.
h og i. Coef. og referencegruppe – Dette er henholdsvis de estimerede multinomiale logistiske regressionskoefficienter og referencegruppeniveauet for modellen. Et vigtigt træk ved den multinomiale logitmodel er, at den estimerer k-1 modeller, hvor k er antallet af niveauer for udfaldsvariablen. I dette tilfælde indstillede Stata som standard vanilje som referencegruppe og estimerede derfor en model for chokolade i forhold til vanilje og en model for jordbær i forhold til vanilje. Da parameterestimaterne er relative til referencegruppen, er standardfortolkningen af den multinomiale logit, at for en enhedsændring i prædiktorvariablen forventes logitten for udfald m i forhold til referencegruppen at ændre sig med dens respektive parameterestimat (som er i log-odds-enheder), idet variablerne i modellen holdes konstante.
chokolade i forhold til vanilje
video – Dette er det multinomiale logit-estimat for en stigning på én enhed i videoscore for chokolade i forhold til vanilje, idet de andre variabler i modellen holdes konstante. Hvis en forsøgsperson øger sin videoscore med ét point, forventes det multinomiale logodds for at foretrække chokolade frem for vanilje at falde med 0,024 enhed, mens alle andre variabler i modellen holdes konstante.
puslespil – Dette er det multinomiale logit-estimat for en stigning på én enhed i puslespilsscore for chokolade i forhold til vanilje, idet de andre variabler i modellen holdes konstante. Hvis en forsøgsperson øger sin puslespilsscore med et point, forventes det multinomiale logodds for at foretrække chokolade frem for vanilje at falde med 0,039 enhed, mens alle andre variabler i modellen holdes konstante.
kvinde – Dette er det multinomiale logit-estimat, der sammenligner kvinder med mænd for chokolade i forhold til vanilje, idet de andre variabler i modellen holdes konstante. Den multinomiale logit for kvinder i forhold til mænd er 0,817 enhed højere for at foretrække chokolade frem for vanilje, idet alle andre forudsigelsesvariabler i modellen holdes konstante. Med andre ord er der større sandsynlighed for, at kvinder end mænd foretrækker chokolade frem for vanilje.
_cons – Dette er det multinomiale logit-estimat for chokolade i forhold til vanilje, når de prædiktorvariable i modellen vurderes til nul. For mænd (variablen kvinder vurderes til nul) med nul video- og puslespilsscore er logitværdien for at foretrække chokolade frem for vanilje 1,912. Det skal bemærkes, at en evaluering af video og puslespil til nul er uden for intervallet af plausible resultater. Hvis scoringerne var middelcentrerede, ville interceptet have en naturlig fortolkning: log odds for at foretrække chokolade frem for vanilje for en mand med gennemsnitlige video- og puslespilsscorer.
jordbær i forhold til vanilje
video – Dette er det multinomiale logit-estimat for en stigning på én enhed i videoscoren for jordbær i forhold til vanilje, idet de andre variabler i modellen holdes konstante. Hvis en forsøgsperson øger sin videoscore med et point, forventes det multinomiale logodds for at foretrække jordbær frem for vanilje at stige med 0,023 enhed, mens alle andre variabler i modellen holdes konstante.
puslespil – Dette er det multinomiale logit-estimat for en stigning på en enhed i puslespilsscore for jordbær i forhold til vanilje, idet de andre variabler i modellen holdes konstante. Hvis en forsøgsperson øger sin puslespilsscore med et point, forventes det multinomiale logodds for at foretrække jordbær frem for vanilje at stige med 0,043 enhed, mens alle andre variabler i modellen holdes konstante.
kvinde – Dette er det multinomiale logit-estimat, der sammenligner kvinder og mænd for jordbær i forhold til vanilje, idet de andre variabler i modellen holdes konstante. Den multinomiale logit for kvinder i forhold til mænd er 0,033 enhed lavere for at foretrække jordbær frem for vanilje, idet alle andre forudsigelsesvariabler i modellen holdes konstante. Med andre ord er det mere sandsynligt, at mænd end kvinder foretrækker jordbæris frem for vaniljeis.
_cons – Dette er det multinomiale logit-estimat for jordbær i forhold til vanilje, når de prædiktorvariable i modellen vurderes til nul. For mænd (variablen kvinder vurderes til nul) med nul video- og puslespilsscore er logitværdien for at foretrække jordbær frem for vanilje -4,057.
j. Std. Err. – Dette er standardfejlene for de enkelte regressionskoefficienter for de to respektive modeller, der er estimeret. De anvendes både ved beregningen af z-teststatistikken, med overstregning k, og konfidensintervallet for regressionskoefficienten, med overstregning l.
k. z og P>|z| – Teststatistikken z er forholdet mellem koef. og Std. Err. for den respektive prædiktor, og p-værdien P>|z| er sandsynligheden for, at z-teststatistikken (eller en mere ekstrem teststatistik) ville blive observeret under nulhypotesen. For et givet alfa-niveau bestemmer z og P>|z|, om nulhypotesen om, at en bestemt prædiktorers regressionskoefficient er nul, givet at resten af prædiktorerne indgår i modellen, kan afvises eller ej. Hvis P>|z|er mindre end alpha, kan nulhypotesen forkastes, og parameterestimatet anses for at være signifikant på det pågældende alpha-niveau. z-værdien følger en standard normalfordeling, som bruges til at teste mod en tosidet alternativ hypotese om, at Coef. ikke er lig med nul. I multinomial logistisk regression er fortolkningen af et parameterestimats signifikans begrænset til den model, i hvilken parameterestimatet blev beregnet. F.eks. kan signifikansen af et parameterestimat i chokolademodellen i forhold til vaniljemodellen ikke antages at være gældende i jordbærmodellen i forhold til vaniljemodellen.
chokolade i forhold til vanilje
For chokolade i forhold til vanilje er z-teststatistikken for den prædiktive video (-0,024/0,021) -1,12 med en tilhørende p-værdi på 0,261. Hvis vi sætter vores alfa-niveau til 0,05, vil vi ikke kunne forkaste nulhypotesen og konkludere, at for chokolade i forhold til vanilje har regressionskoefficienten for video ikke vist sig at være statistisk forskellig fra nul, da puslespil og kvinde er med i modellen.
For chokolade i forhold til vanilje er z-teststatistikken for prædiktoren puslespil (-0,039/0,020) -1,99 med en tilhørende p-værdi på 0,046. Hvis vi igen sætter vores alfa-niveau til 0,05, vil vi forkaste nulhypotesen og konkludere, at regressionskoefficienten for puslespil har vist sig at være statistisk forskellig fra nul for chokolade i forhold til vanilje, da video og kvinde er med i modellen.
For chokolade i forhold til vanilje er z-teststatistikken for prædiktoren female (0,817/0,391) 2,09 med en tilhørende p-værdi på 0,037. Hvis vi igen sætter vores alfa-niveau til 0,05, vil vi forkaste nulhypotesen og konkludere, at forskellen mellem mænd og kvinder har vist sig at være statistisk forskellig for chokolade i forhold til vanilje, davideo og female er med i modellen.
For chokolade i forhold til vanilje er z-teststatistikken for interceptet, _cons (1,912/1,127) 1,70 med en tilhørende p-værdi på 0,090. Med et alfa-niveau på 0,05 ville vi ikke kunne forkaste nulhypotesen og konkludere, at a) den multinomiale logit for mænd (variablen kvinde vurderet til nul) og med nul video- og puslespilsscore i chokolade i forhold til vanilje findes ikke at være statistisk forskellig fra nul; eller b) for mænd med nul video- og puslespilsscore er man statistisk usikker på, om de er mere tilbøjelige til at blive klassificeret som foretrækkende chokolade eller vanilje. Vi kan foretage den anden fortolkning, når vi betragter _cons som en specifik covariatprofil (mænd med nul video- og puslespilsscore). Baseret på koefficientens retning og signifikans angiver _cons, om profilen ville have en større tilbøjelighed til at blive klassificeret på det ene niveau af udfaldsvariablen end på det andet niveau.
jordbær i forhold til vanilje
For jordbær i forhold til vanilje er z-teststatistikken for prædiktorvideoen (0,023/0,021) 1,10 med en tilhørende p-værdi på 0,272. Hvis vi sætter vores alfa-niveau til 0,05, vil vi ikke kunne forkaste nulhypotesen og konkludere, at for jordbær i forhold til vanilje har regressionskoefficienten for video ikke vist sig at være statistisk forskellig fra nul, da puslespil og kvinde er med i modellen.
For jordbær i forhold til vanilje er z-teststatistikken for prædiktoren puslespil (0,043/0,020) 2,16 med en tilhørende p-værdi på 0,031. Hvis vi igen sætter vores alfa-niveau til 0,05, vil vi forkaste nulhypotesen og konkludere, at regressionskoefficienten for puslespil har vist sig at være statistisk forskellig fra nul for jordbær i forhold til vanilje, da video og kvinde indgår i modellen.
For jordbær i forhold til vanilje er z-teststatistikken for prædiktoren kvinde (-0,033/0,350) -0,09 med en tilknyttet p-værdi på 0,925. Hvis vi igen sætter vores alfa-niveau til 0,05, vil vi ikke kunne forkaste nulhypotesen og konkludere, at for jordbær i forhold til vanilje har regressionskoefficienten for kvinde ikke vist sig at være statistisk forskellig fra nul, da puslespil og video indgår i modellen.
For jordbær i forhold til vanilje er z-teststatistikken for interceptet, _cons (-4,057/1,223) -3,32 med en tilhørende p-værdi på 0,001. Med et alfa-niveau på 0,05 ville vi forkaste nulhypotesen og konkludere, at a) den multinomiale logit for mænd (variablen kvinde vurderet til nul) og med nul video- og puslespilsscore i jordbær i forhold til vanilje er statistisk forskellig fra nul; eller b) for mænd med nul video- og puslespilsscore er der en statistisk signifikant forskel mellem sandsynligheden for at blive klassificeret som foretrækkende jordbær eller foretrækkende vanilje. En sådan mand vil være mere tilbøjelig til at blive klassificeret som foretrækker vanilje frem for jordbær. Vi kan foretage den anden fortolkning, når vi betragter _cons som en specifik covariatprofil (mænd med nul video- og puslespilsscore). Baseret på koefficientens retning og signifikans angiver _cons, om profilen ville have en større tilbøjelighed til at blive klassificeret på det ene niveau af udfaldsvariablen end på det andet niveau.
l. – Dette er konfidensintervallet (CI) for en individuel multinomial logit-regressionskoefficient, givet at de andre prædiktorer er i modellen for udfald m i forhold til referencegruppen. For en given prædiktor med et konfidensniveau på 95 % vil vi sige, at vi er 95 % sikre på, at den “sande” multinomiale logitregressionskoefficient for populationen ligger mellem den nedre og den øvre grænse af intervallet for udfald m i forhold til referencegruppen. Den beregnes som Coef. (zα/2)*(Std.Err.), hvor zα/2 er en kritisk værdi på den normale standardfordeling. CI svarer til z-teststatistikken: hvis CI’et omfatter nul, vil vi ikke kunne forkaste nulhypotesen om, at en bestemt regressionskoefficient er nul, når de andre prædiktorer er med i modellen. En fordel ved et CI er, at det er illustrativt; det giver et interval, hvor den “sande” parameter kan ligge.
Tolkning af det relative risikorelaterede forhold
Det følgende er fortolkningen af den multinomiale logistiske regression i form af relative risikorelaterede forhold og kan fås ved hjælp af mlogit, rrr efter at have kørt den multinomiale logitmodel eller ved at angive rrr-indstillingen, når den fulde model er specificeret. Denne del af fortolkningen gælder for nedenstående output.
mlogit ice_cream video puzzle female, rrr
Iteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485Multinomial logistic regression Number of obs = 200 LR chi2(6) = 33.10 Prob > chi2 = 0.0000Log likelihood = -194.03485 Pseudo R2 = 0.0786------------------------------------------------------------------------------ ice_cream | RRRa Std. Err. z P>|z| b-------------+----------------------------------------------------------------chocolate | video | .9767108 .0204862 -1.12 0.261 .9373726 1.0177 puzzle | .9618236 .0187714 -1.99 0.046 .925727 .9993276 female | 2.262839 .8847276 2.09 0.037 1.051598 4.869199-------------+----------------------------------------------------------------strawberry | video | 1.023187 .0213558 1.10 0.272 .9821747 1.065911 puzzle | 1.043942 .0207633 2.16 0.031 1.004029 1.085441 female | .9676721 .3387 -0.09 0.925 .4872981 1.921595------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)
a. Relativ risikokvotient – Dette er de relative risikokvotienter for den tidligere viste multinomial logit-model. De kan fås ved at eksponere de multinomiale logit-koefficienter, ecoef, eller ved at angive rrr-indstillingen, når mlogit-kommandoen udstedes. Husk på, at den multinomiale logitmodel estimerer k-1 modeller, hvor den k-te ligning er relativ til referencegruppen. RRR for en koefficient angiver, hvordan risikoen for, at resultatet falder i sammenligningsgruppen sammenlignet med risikoen for, at resultatet falder i referencegruppen, ændrer sig med den pågældende variabel. En RRR > 1 angiver, at risikoen for, at resultatet falder i sammenligningsgruppen i forhold til risikoen for, at resultatet falder i referencegruppen, stiger i takt med, at variablen stiger. Med andre ord er det mere sandsynligt, at resultatet i sammenligningsgruppen er mere sandsynligt. En RRR < 1 angiver, at risikoen for, at resultatet falder i sammenligningsgruppen i forhold til risikoen for, at resultatet falder i referencegruppen, falder, efterhånden som variablen stiger. Se nedenstående fortolkninger af de relative risikokvotienter for eksempler. Generelt gælder det, at hvis RRR < 1, er der større sandsynlighed for, at resultatet falder i referencegruppen.
chokolade i forhold til vanilje
video – Dette er det relative risikoforhold for en stigning på én enhed i video score for at foretrække chokolade frem for vanilje, givet at de øvrige variabler i modellen holdes konstante. Hvis en forsøgsperson øger sin videoscore med en enhed, forventes den relative risiko for at foretrække chokolade frem for vanilje at falde med en faktor på 0,977, idet de andre variabler i modellen holdes konstante. Så ved en stigning på én enhed i videoen ville den relative risiko for at være i chokoladegruppen være 0,977 gange mere sandsynlig, når de andre variabler i modellen holdes konstante. Mere generelt kan vi sige, at hvis en forsøgsperson øger sin videoscore, kan vi forvente, at hun vil være mere tilbøjelig til at foretrække vaniljeis frem for chokoladeis.
puslespil – Dette er det relative risikoforhold for en stigning på én enhed i puslespilsresultatet for at foretrække chokolade frem for vanilje, givet at de andre variabler i modellen holdes konstante. Hvis en forsøgsperson øger sin puzzle-score med en enhed, forventes den relative risiko for at foretrække chokolade frem for vanilje at falde med en faktor på 0,962, idet de andre variabler i modellen holdes konstante. Mere generelt kan vi sige, at hvis to forsøgspersoner har identiske videoscores og begge er kvinder (eller begge er mænd), er der større sandsynlighed for, at forsøgspersonen med den højere puzzle-score foretrækker vaniljeis frem for chokoladeis end forsøgspersonen med den lavere puzzle-score.
kvinde – Dette er det relative risikoforhold, der sammenligner kvinder med mænd med hensyn til at foretrække chokolade frem for vaniljeis, givet at de andre variabler i modellen holdes konstante. For kvinder i forhold til mænd forventes den relative risiko for at foretrække chokolade i forhold til vanilje at stige med en faktor 2,263, idet de andre variabler i modellen holdes konstante. Med andre ord er der større sandsynlighed for, at kvinder end mænd foretrækker chokoladeis frem for vaniljeis.
jordbær i forhold til vanilje
video – Dette er det relative risikoforhold for en stigning på én enhed i videoscore for at foretrække jordbær frem for vanilje, givet at de andre variabler i modellen holdes konstante. Hvis en forsøgsperson øger sin videoscore med en enhed, forventes den relative risiko for jordbær i forhold til vanilje at stige med en faktor på 1,023, idet de andre variabler i modellen holdes konstante. Mere generelt kan vi sige, at hvis en forsøgsperson øger sin videoscore, kan vi forvente, at hun vil være mere tilbøjelig til at foretrække jordbæris frem for vaniljeis.
puslespil – Dette er det relative risikoforhold for en stigning på en enhed i puslespilsscoren for at foretrække jordbær frem for vanilje, givet at de andre variabler i modellen holdes konstante. Hvis en forsøgsperson øger sin puzzle-score med en enhed, forventes den relative risiko for jordbær i forhold til vanilje at stige med en faktor 1,043, idet de andre variabler i modellen holdes konstante. Mere generelt kan vi sige, at hvis to forsøgspersoner har identiske videoscores og begge er kvinder (eller begge er mænd), er det mere sandsynligt, at forsøgspersonen med den højere puzzle-score vil foretrække jordbæris frem for vaniljeis end forsøgspersonen med den lavere puzzle-score.
kvinde – Dette er det relative risikoforhold, der sammenligner kvinder med mænd for jordbær i forhold til vanilje, givet at de andre variabler i modellen holdes konstante. For kvinder i forhold til mænd forventes den relative risiko for at foretrække jordbær frem for vanilje at falde med en faktor 0,968, idet de andre variabler i modellen holdes konstante. Med andre ord er der mindre sandsynlighed for, at kvinder end mænd foretrækker jordbæris frem for vaniljeis.
b. – Dette er CI for det relative risikoforhold, givet at de andre prædiktorer er i modellen. For en given prædiktor med et konfidensniveau på 95 % vil vi sige, at vi er 95 % sikre på, at det “sande” relative risikoforhold i befolkningen, der sammenligner udfald m med referencegruppen, ligger mellem den nedre og øvre grænse i intervallet. En fordel ved et CI er, at det er illustrativt; det giver et interval, hvor det “sande” relative risikoforhold kan ligge.
Skriv et svar