Multinomial Logistic Regression | Stata Annotated Output
On januari 28, 2022 by adminOp deze pagina staat een voorbeeld van een multinomial logistic regression-analyse met voetnoten waarin de uitvoer wordt uitgelegd. De gegevens zijn verzameld over 200 middelbare scholieren en bestaan uit scores op verschillende tests, waaronder een videospel en een puzzel. De uitkomstmaat in deze analyse is de voorkeurssmaak van ijs – vanille, chocolade of aardbei – waarvan we gaan kijken welke relaties er bestaan met scores op een videospel (video), scores op een puzzel (puzzel) en geslacht (vrouw). Onze responsvariabele, roomijs, wordt als categorisch behandeld in de veronderstelling dat de niveaus van roomijs geen natuurlijke volgorde hebben, en we laten Stata de referentiegroep kiezen. In ons voorbeeld zal dit vanille zijn. Stata kiest standaard de groep die het vaakst voorkomt als referentiegroep. De eerste helft van deze pagina interpreteert de coëfficiënten in termen van multinomiale log-odds (logits). Deze zullen dicht bij maar niet gelijk zijn aan de log-odds die worden verkregen in een logistische regressie met twee niveaus van de uitkomstvariabele. De tweede helft interpreteert de coëfficiënten in termen van relatieve risicoverhoudingen.
use https://stats.idre.ucla.edu/stat/stata/output/mlogit, clear
Voordat de regressie wordt uitgevoerd, kan het verkrijgen van een frequentie van de ijssmaken in de gegevens informatie opleveren voor de selectie van een referentiegroep.
tab ice_cream favorite flavor of ice cream | Freq. Percent Cum. ------------+----------------------------------- chocolate | 47 23.50 23.50 vanilla | 95 47.50 71.00 strawberry | 58 29.00 100.00 ------------+----------------------------------- Total | 200 100.00
Vanille is de meest voorkomende ijssmaak en zal in dit voorbeeld de referentiegroep zijn.
mlogit ice_cream video puzzle femaleIteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485Multinomial logistic regression Number of obs = 200 LR chi2(6) = 33.10 Prob > chi2 = 0.0000Log likelihood = -194.03485 Pseudo R2 = 0.0786------------------------------------------------------------------------------ ice_cream | Coef. Std. Err. z P>|z| -------------+----------------------------------------------------------------chocolate | video | -.0235647 .0209747 -1.12 0.261 -.0646744 .017545 puzzle | -.0389243 .0195165 -1.99 0.046 -.0771759 -.0006726 female | .8166202 .3909813 2.09 0.037 .050311 1.582929 _cons | 1.912256 1.127256 1.70 0.090 -.2971258 4.121638-------------+----------------------------------------------------------------strawberry | video | .022922 .0208718 1.10 0.272 -.0179861 .0638301 puzzle | .0430036 .0198894 2.16 0.031 .0040211 .081986 female | -.032862 .3500153 -0.09 0.925 -.7188793 .6531553 _cons | -4.057323 1.222939 -3.32 0.001 -6.45424 -1.660407------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)
Iteration Loga
Iteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485
a. Iteratielog – Dit is een lijst van de log-likelihoods bij elke iteratie. Bedenk dat multinomiale logistische regressie, net als binaire en geordende logistische regressie, gebruik maakt van maximum likelihood schatting, wat een iteratieve procedure is. De eerste iteratie (iteratie 0 genoemd) is de loglikentie van het “nul”- of “lege” model; dat wil zeggen, een model zonder voorspellers. Bij de volgende iteratie wordt (worden) de voorspeller(s) in het model opgenomen. Bij elke iteratie neemt de loglikentie toe, omdat het doel is de loglikentie te maximaliseren. Wanneer het verschil tussen de opeenvolgende iteraties zeer klein is, wordt gezegd dat het model “geconvergeerd” is, stopt het itereren en worden de resultaten weergegeven. Voor meer informatie over dit proces voor binaire uitkomsten, zieRegressiemodellen voor Categoriale en Beperkte Afhankelijke Variabelen van J. Scott Long (blz. 52-61).
Modelsamenvatting
Multinomial logistic regression Number of obsc = 200 LR chi2(6)d = 33.10 Prob > chi2e = 0.0000Log likelihood = -194.03485b Pseudo R2f = 0.0786
b. Logwaarschijnlijkheid – Dit is de logwaarschijnlijkheid van het gepaste model. Deze wordt gebruikt in de Likelihood Ratio Chi-Square test om na te gaan of alle regressiecoëfficiënten van alle voorspellers in het model gelijktijdig nul zijn en in tests van geneste modellen.
c. Aantal obs – Dit is het aantal waarnemingen dat in de multinomiale logistische regressie wordt gebruikt. Het kan minder zijn dan het aantal gevallen in de dataset als er ontbrekende waarden zijn voor sommige variabelen in de vergelijking. Standaard verwijdert Stata onvolledige gevallen van de lijst.
d. LR chi2(6) – Dit is de Likelihood Ratio (LR) Chi-Square test die voor beide vergelijkingen (chocolade ten opzichte van vanille en aardbei ten opzichte van vanille) aantoont dat de regressiecoëfficiënt van ten minste één van de voorspellers niet gelijk is aan nul. Het getal tussen haakjes geeft de vrijheidsgraden aan van de Chi-Square-verdeling die wordt gebruikt om de LR Chi-Square statistiek te testen en wordt gedefinieerd door het aantal geschatte modellen (2) maal het aantal voorspellers in het model (3). De LR Chi-Square statistiek kan worden berekend door -2*( L(nulmodel) – L(gepast model)) = -2*((-210,583) – (-194,035)) = 33,096, waarbij L(nulmodel) de logische waarschijnlijkheid is met alleen de responsvariabele in het model (iteratie 0) en L(gepast model) de logische waarschijnlijkheid is van de laatste iteratie (in de veronderstelling dat het model convergeerde) met alle parameters.
e. Prob > chi2 – Dit is de kans op een LR-teststatistiek die even extreem is als, of extremer dan, de waargenomen statistiek onder de nulhypothese; de nulhypothese is dat alle regressiecoëfficiënten in beide modellen gelijktijdig gelijk zijn aan nul. Met andere woorden, dit is de kans dat deze chi-kwadraat statistiek (33,10) wordt verkregen of nog een extremer als er in feite geen effect van de voorspellende variabelen is. Deze p-waarde wordt vergeleken met een gespecificeerd alfa-niveau, onze bereidheid om een type I-fout te aanvaarden, die gewoonlijk wordt vastgesteld op 0,05 of 0,01. De kleine p-waarde van de LR-test, <0,00001, zou ons doen concluderen dat ten minste één van de regressiecoëfficiënten in het model niet gelijk is aan nul. De parameter van de chi-kwadraatverdeling die wordt gebruikt om de nulhypothese te testen, wordt bepaald door de vrijheidsgraden in de voorafgaande regel, chi2(6).
f. Pseudo R2 – Dit is de pseudo R-kwadraat van McFadden. Logistische regressie heeft geen equivalent voor de R-kwadraat die in OLS regressie wordt gevonden; veel mensen hebben echter geprobeerd er een te bedenken. Er bestaat een grote verscheidenheid van pseudo-R-kwadraatstatistieken. Omdat deze statistiek niet betekent wat R-square in OLS-regressie betekent (het deel van de variantie van de responsvariabele dat door de voorspellers wordt verklaard), raden wij aan deze statistiek met grote voorzichtigheid te interpreteren.
Parameterschattingen
------------------------------------------------------------------------------ ice_creamg | Coef.h Std. Err.j zk P>|z|k l-------------+----------------------------------------------------------------chocolate | video | -.0235647 .0209747 -1.12 0.261 -.0646744 .017545 puzzle | -.0389243 .0195165 -1.99 0.046 -.0771759 -.0006726 female | .8166202 .3909813 2.09 0.037 .050311 1.582929 _cons | 1.912256 1.127256 1.70 0.090 -.2971258 4.121638-------------+----------------------------------------------------------------strawberry | video | .022922 .0208718 1.10 0.272 -.0179861 .0638301 puzzle | .0430036 .0198894 2.16 0.031 .0040211 .081986 female | -.032862 .3500153 -0.09 0.925 -.7188793 .6531553 _cons | -4.057323 1.222939 -3.32 0.001 -6.45424 -1.660407------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)i
g. ice_cream – Dit is de responsvariabele in de multinomiale logistische regressie. Onder ice_cream staan twee replicaten van de voorspellende variabelen, die de twee geschatte modellen vertegenwoordigen: chocolade ten opzichte van vanille en aardbei ten opzichte van vanille.
h en i. Coef. en referentgroep – Dit zijn de geschatte multinomiale logistische regressiecoëfficiënten, respectievelijk het referentieniveau, voor het model. Een belangrijk kenmerk van het multinomiale logit-model is dat het k-1 modellen schat, waarbij k het aantal niveaus van de uitkomstvariabele is. In dit geval stelde Stata standaard vanille in als de referentiegroep, en schatte daarom een model voor chocolade ten opzichte van vanille en een model voor aardbei ten opzichte van vanille. Aangezien de parameterschattingen betrekking hebben op de referentiegroep, is de standaardinterpretatie van de multinomiale logit dat voor een verandering van een eenheid in de voorspellende variabele, de logit van uitkomst m ten opzichte van de referentiegroep naar verwachting zal veranderen met de respectieve parameterschatting (die in log-afdeeleenheden is), gegeven dat de variabelen in het model constant worden gehouden.
chocolade ten opzichte van vanille
video – Dit is de multinomiale logitschatting voor een stijging met één eenheid van de videoscore voor chocolade ten opzichte van van vanille, gegeven dat de andere variabelen in het model constant worden gehouden. Als een proefpersoon zijn videoscore met een punt zou verhogen, zouden de multinomiale log-odds voor de voorkeur voor chocolade boven vanille naar verwachting met 0,024 eenheid dalen, terwijl alle andere variabelen in het model constant worden gehouden.
puzzle – Dit is de multinomiale logit-schatting voor een stijging van de puzzelscore voor chocolade ten opzichte van van vanille met een eenheid, terwijl de andere variabelen in het model constant worden gehouden. Als een proefpersoon zijn puzzelscore met één punt zou verhogen, zouden de multinomiale logo-kansen voor de voorkeur voor chocolade boven vanille naar verwachting met 0,039 eenheid dalen, terwijl alle andere variabelen in het model constant worden gehouden.
female – Dit is de multinomiale logit-schatting voor de vergelijking van vrouwen en mannen voor chocolade ten opzichte van van vanille, waarbij de andere variabelen in het model constant worden gehouden. De multinomiale logit voor vrouwen ten opzichte van mannen is 0,817 eenheid hoger voor de voorkeur voor chocolade boven vanille, als alle andere voorspellende variabelen in het model constant worden gehouden. Met andere woorden, vrouwen geven vaker dan mannen de voorkeur aan chocolade boven vanille.
_cons – Dit is de multinomiale logitschatting voor chocolade ten opzichte van van vanille wanneer de voorspellende variabelen in het model op nul worden gewaardeerd. Voor mannen (de variabele vrouwen op nul gewaardeerd) met video- en puzzelscores van nul is de logit voor de voorkeur voor chocolade boven vanille 1,912. Merk op dat de evaluatie van video en puzzel op nul buiten het bereik van plausibele scores ligt. Als de scores gemiddeld gecentreerd waren, zou het intercept een natuurlijke interpretatie hebben: log odds of prefering chocolate to vanilla for a male with average video and puzzle scores.
strawberry relative to vanilla
video – Dit is de multinomiale logitschatting voor een toename van een eenheid in videoscore voor aardbei ten opzichte van van vanille, gegeven dat de andere variabelen in het model constant worden gehouden. Als een proefpersoon zijn videoscore met één punt zou verhogen, zouden de multinomiale log-odds voor de voorkeur voor aardbei boven vanille naar verwachting met 0,023 eenheid stijgen, terwijl alle andere variabelen in het model constant worden gehouden.
puzzel – Dit is de multinomiale logit-schatting voor een stijging met één eenheid van de puzzelscore voor aardbei ten opzichte van van vanille, terwijl de andere variabelen in het model constant worden gehouden. Als een proefpersoon zijn puzzelscore met één punt zou verhogen, zouden de multinomiale logokansen voor de voorkeur voor aardbei boven vanille naar verwachting met 0,043 eenheid toenemen, terwijl alle andere variabelen in het model constant worden gehouden.
female – Dit is de multinomiale logitschatting voor de vergelijking van vrouwen met mannen voor aardbei ten opzichte van van vanille, waarbij de andere variabelen in het model constant worden gehouden. De multinomiale logit voor vrouwen ten opzichte van mannen is 0,033 eenheid lager voor de voorkeur voor aardbei boven vanille, als alle andere voorspellende variabelen in het model constant worden gehouden. Met andere woorden, mannen hebben een grotere kans dan vrouwen om de voorkeur te geven aan aardbeienijs boven vanille-ijs.
_cons – Dit is de multinomiale logitschatting voor aardbei ten opzichte van van vanille wanneer de voorspellende variabelen in het model op nul worden gewaardeerd. Voor mannen (de variabele vrouw op nul gesteld) met nul video- en puzzelscores is de logit voor de voorkeur voor aardbei boven vanille -4,057.
j. Std. Err. – Dit zijn de standaardfouten van de individuele regressiecoëfficiënten voor de twee respectieve geschatte modellen. Zij worden gebruikt in zowel de berekening van de z-teststatistiek, superscript k, als het betrouwbaarheidsinterval van de regressiecoëfficiënt, superscript l.
k. z en P>|z| – De teststatistiek z is de verhouding van de Coef. tot de Std. Err. van de respectieve voorspeller, en de p-waarde P>|z| is de waarschijnlijkheid dat de z-teststatistiek (of een meer extreme teststatistiek) zou worden waargenomen onder de nulhypothese. Voor een gegeven alpha-niveau bepalen z en P>|z| of de nulhypothese dat de regressiecoëfficiënt van een bepaalde voorspeller nul is, al dan niet kan worden verworpen, gegeven dat de rest van de voorspellers in het model zitten. Indien P>|z|minder is dan alpha, dan kan de nulhypothese verworpen worden en wordt de parameterschatting als significant beschouwd op dat alpha-niveau. De z-waarde volgt een standaardnormale verdeling die wordt gebruikt om te toetsen aan een tweezijdige alternatieve hypothese dat de Coef. niet gelijk is aan nul. Bij multinomiale logistische regressie is de interpretatie van de significantie van een parameterschatting beperkt tot het model waarin de parameterschatting werd berekend. Zo kan bijvoorbeeld niet worden aangenomen dat de significantie van een parameterschatting in het chocolade- ten opzichte van het vanillemodel ook geldt in het aardbei- ten opzichte van het vanillemodel.
chocolade ten opzichte van vanille
Voor chocolade ten opzichte van vanille is de z-test statistiek voor de voorspellende video (-0,024/0,021) -1,12 met een bijbehorende p-waarde van 0,261. Als we ons alfaniveau op 0,05 stellen, kunnen we de nulhypothese niet verwerpen en concluderen we dat voor chocolade ten opzichte van van vanille de regressiecoëfficiënt voor video niet statistisch verschillend van nul blijkt te zijn, aangezien puzzel en vrouw in het model zitten.
Voor chocolade ten opzichte van vanille is de z-test statistiek voor de voorspellende factor puzzel (-0,039/0,020) -1,99 met een bijbehorende p-waarde van 0,046. Als we ons alfaniveau opnieuw op 0,05 stellen, verwerpen we de nulhypothese en concluderen we dat de regressiecoëfficiënt voor puzzel statistisch verschillend is van nul voor chocolade ten opzichte van van vanille, aangezien video en vrouw in het model zitten.
Voor chocolade ten opzichte van vanille is de z-test statistiek voor de voorspeller vrouwtje (0,817/0,391) 2,09 met een bijbehorende p-waarde van 0,037. Als we ons alfaniveau opnieuw op 0,05 stellen, zouden we de nulhypothese verwerpen en concluderen dat het verschil tussen mannen en vrouwen statistisch verschillend is gebleken voor chocolade ten opzichte van vanille, gegeven het feit datvideo en vrouw in het model zitten.
Voor chocolade ten opzichte van vanille is de z-teststatistiek voor het intercept, _cons (1,912/1,127) 1,70 met een bijbehorende p-waarde van 0,090. Met een alfaniveau van 0,05 zouden we de nulhypothese niet verwerpen en concluderen dat a) de multinomiale logit voor mannen (de variabele vrouw op nul gesteld) en met nul video- en puzzelscores bij chocolade ten opzichte van van vanille statistisch niet verschillend van nul blijkt te zijn; of b) voor mannen met nul video- en puzzelscores statistisch niet zeker is of zij eerder bij chocolade dan bij vanille worden ingedeeld. We kunnen de tweede interpretatie maken als we de _cons zien als een specifiek covariaat profiel (mannetjes met nul video- en puzzelscores). Op basis van de richting en significantie van de coëfficiënt geeft de _cons aan of het profiel een grotere neiging zou hebben om in het ene niveau van de uitkomstvariabele te worden ingedeeld dan in het andere niveau.
aardbei ten opzichte van vanille
Voor aardbei ten opzichte van vanille is de z-test statistiek voor de voorspellende video (0,023/0,021) 1,10 met een bijbehorende p-waarde van 0,272. Als we ons alfaniveau op 0,05 stellen, kunnen we de nulhypothese niet verwerpen en concluderen we dat voor aardbei ten opzichte van vanille de regressiecoëfficiënt voor video niet statistisch verschillend van nul blijkt te zijn, aangezien puzzel en vrouw in het model zitten.
Voor aardbei ten opzichte van vanille is de z-test statistiek voor de voorspellende factor puzzel (0,043/0,020) 2,16 met een bijbehorende p-waarde van 0,031. Als we ons alfaniveau opnieuw op 0,05 instellen, verwerpen we de nulhypothese en concluderen we dat de regressiecoëfficiënt voor puzzel statistisch verschillend is van nul voor aardbei ten opzichte van van vanille, aangezien video en vrouw in het model zitten.
Voor aardbei ten opzichte van van vanille is de z-test statistiek voor de voorspeller vrouw (-0,033/0,350) -0,09 met een bijbehorende p-waarde van 0,925. Als we ons alfaniveau weer op 0,05 stellen, kunnen we de nulhypothese niet verwerpen en concluderen we dat voor aardbei ten opzichte van vanille de regressiecoëfficiënt voor vrouwtje niet statistisch verschillend van nul blijkt te zijn, aangezien puzzel en video in het model zitten.
Voor aardbei ten opzichte van vanille is de z-test statistiek voor het intercept, _cons (-4,057/1,223) -3,32 met een bijbehorende p-waarde van 0,001. Met een alfaniveau van 0,05 zouden we de nulhypothese verwerpen en concluderen dat a) de multinomiale logit voor mannen (de variabele vrouw op nul geëvalueerd) en met nul video- en puzzelscores in aardbei ten opzichte van van vanille statistisch verschillend zijn van nul; of b) er voor mannen met nul video- en puzzelscores een statistisch significant verschil is tussen de waarschijnlijkheid om als voorkeur voor aardbei of als voorkeur voor vanille te worden ingedeeld. Zo’n mannetje zou meer kans hebben om als voorkeur voor vanille dan voor aardbei te worden geclassificeerd. We kunnen de tweede interpretatie maken als we de _cons als een specifiek covariaat profiel zien (mannetjes met nul video- en puzzelscores). Op basis van de richting en significantie van de coëfficiënt geeft de _cons aan of het profiel een grotere neiging zou hebben om in het ene niveau van de uitkomstvariabele te worden ingedeeld dan in het andere niveau.
l. – Dit is het betrouwbaarheidsinterval (CI) voor een individuele multinomiale logit regressiecoëfficiënt, gegeven dat de andere voorspellers in het model voor uitkomst m ten opzichte van de referentiegroep zijn. Voor een gegeven voorspeller met een betrouwbaarheidsniveau van 95% zeggen wij dat wij er 95% zeker van zijn dat de “ware” multinomiale logit regressiecoëfficiënt voor de populatie tussen de onder- en bovengrens van het interval ligt voor uitkomst m ten opzichte van de referentiegroep. Hij wordt berekend als de Coef. (zα/2)*(Std.Err.), waarbij zα/2 een kritische waarde op de standaardnormale verdeling is. De CI is equivalent met de z-test statistiek: indien de CI nul omvat, zouden wij de nulhypothese dat een bepaalde regressiecoëfficiënt nul is niet verwerpen, gegeven het feit dat de andere voorspellers in het model zitten. Een voordeel van een CI is dat het illustratief is; het geeft een bereik waar de “ware” parameter kan liggen.
Relative Risk Ratio Interpretation
Het volgende is de interpretatie van de multinomiale logistische regressie in termen van relatieve risicoverhoudingen en kan worden verkregen door mlogit, rrr na het uitvoeren van het multinomiale logit model of door het specificeren van de rrr optie wanneer het volledige model is gespecificeerd. Dit deel van de interpretatie is van toepassing op de onderstaande uitvoer.
mlogit ice_cream video puzzle female, rrr
Iteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485Multinomial logistic regression Number of obs = 200 LR chi2(6) = 33.10 Prob > chi2 = 0.0000Log likelihood = -194.03485 Pseudo R2 = 0.0786------------------------------------------------------------------------------ ice_cream | RRRa Std. Err. z P>|z| b-------------+----------------------------------------------------------------chocolate | video | .9767108 .0204862 -1.12 0.261 .9373726 1.0177 puzzle | .9618236 .0187714 -1.99 0.046 .925727 .9993276 female | 2.262839 .8847276 2.09 0.037 1.051598 4.869199-------------+----------------------------------------------------------------strawberry | video | 1.023187 .0213558 1.10 0.272 .9821747 1.065911 puzzle | 1.043942 .0207633 2.16 0.031 1.004029 1.085441 female | .9676721 .3387 -0.09 0.925 .4872981 1.921595------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)
a. Relatieve risicoratio – Dit zijn de relatieve risicoratio’s voor het multinomiale logit-model dat eerder werd getoond. Zij kunnen worden verkregen door de multinomiale logit coëfficiënten, ecoef, te exponentiëren of door de optie rrr op te geven wanneer het mlogit commando wordt gegeven. Bedenk dat het multinomiale logit-model k-1 modellen schat, waarbij de k-de vergelijking relatief is ten opzichte van de referentiegroep. Het RRR van een coëfficiënt geeft aan hoe het risico dat de uitkomst in de vergelijkingsgroep valt, verandert ten opzichte van het risico dat de uitkomst in de referentiegroep valt, naarmate de variabele in kwestie verandert. Een RRR > 1 geeft aan dat het risico dat de uitkomst in de vergelijkingsgroep valt ten opzichte van het risico dat de uitkomst in de referentiegroep valt, toeneemt naarmate de variabele toeneemt. Met andere woorden, de vergelijkingsuitkomst is waarschijnlijker. Een RRR < 1 geeft aan dat het risico dat de uitkomst in de vergelijkingsgroep valt ten opzichte van het risico dat de uitkomst in de referentiegroep valt, afneemt naarmate de variabele toeneemt. Zie de interpretaties van de relatieve risicoverhoudingen hieronder voor voorbeelden. In het algemeen, als de RRR < 1 is, is de kans groter dat de uitkomst in de referentiegroep valt.
chocolade ten opzichte van vanille
video – Dit is de relatieve risicoratio voor een toename van de videoscore met één eenheid voor het verkiezen van chocolade boven vanille, gegeven dat de andere variabelen in het model constant worden gehouden. Als een proefpersoon haar videoscore met één eenheid zou verhogen, zou het relatieve risico voor de voorkeur voor chocolade boven vanille naar verwachting afnemen met een factor 0,977, gegeven dat de andere variabelen in het model constant worden gehouden. Bij een toename van de videoscore met één eenheid zou het relatieve risico om in de chocoladegroep te zitten dus 0,977 keer groter zijn wanneer de andere variabelen in het model constant worden gehouden. Meer in het algemeen kunnen we zeggen dat als een proefpersoon haar videoscore zou verhogen, we zouden verwachten dat ze meer kans heeft om vanille-ijs te verkiezen boven chocolade-ijs.
puzzel – Dit is de relatieve risicoverhouding voor een toename van de puzzelscore met één eenheid voor een voorkeur voor chocolade boven vanille, gegeven dat de andere variabelen in het model constant worden gehouden. Als een proefpersoon haar puzzelscore met een eenheid verhoogt, zal het relatieve risico voor de voorkeur voor chocolade boven vanille naar verwachting met een factor 0,962 afnemen, als de andere variabelen in het model constant worden gehouden. Meer in het algemeen kunnen we zeggen dat als twee proefpersonen identieke videoscores hebben en allebei vrouw zijn (of allebei man), de proefpersoon met de hogere puzzelscore een grotere kans heeft om de voorkeur te geven aan vanille-ijs boven chocolade-ijs dan de proefpersoon met de lagere puzzelscore.
vrouwelijk – Dit is de relatieve risicoverhouding tussen vrouwen en mannen voor het verkiezen van chocolade boven vanille, gegeven dat de andere variabelen in het model constant worden gehouden. Voor vrouwen ten opzichte van mannen zou het relatieve risico voor de voorkeur voor chocolade ten opzichte van vanille naar verwachting toenemen met een factor 2,263 als de andere variabelen in het model constant worden gehouden. Met andere woorden, vrouwen hebben een grotere kans dan mannen om de voorkeur te geven aan chocolade-ijs boven vanille-ijs.
aardbei t.o.v. vanille
video – Dit is de relatieve risicoverhouding voor een toename van de videoscore met één eenheid voor een voorkeur voor aardbei t.o.v. vanille, gegeven dat de andere variabelen in het model constant worden gehouden. Als een proefpersoon haar videoscore met één eenheid zou verhogen, zou het relatieve risico voor aardbei ten opzichte van vanille naar verwachting met een factor 1,023 toenemen, gegeven dat de andere variabelen in het model constant worden gehouden. Meer in het algemeen kunnen we zeggen dat als een proefpersoon haar videoscore zou verhogen, we zouden verwachten dat ze meer geneigd zou zijn aardbeienijs te verkiezen boven vanille-ijs.
puzzel – Dit is de relatieve risicoverhouding voor een toename van de puzzelscore met één eenheid voor een voorkeur voor aardbei boven vanille, gegeven dat de andere variabelen in het model constant worden gehouden. Als een proefpersoon haar puzzelscore met een eenheid verhoogt, zal het relatieve risico voor aardbei ten opzichte van vanille naar verwachting met een factor 1,043 toenemen, als de andere variabelen in het model constant worden gehouden. Meer in het algemeen kunnen we zeggen dat als twee proefpersonen identieke videoscores hebben en allebei vrouw zijn (of allebei man), de proefpersoon met de hogere puzzelscore een grotere kans heeft om aardbeienijs te verkiezen boven vanille-ijs dan de proefpersoon met de lagere puzzelscore.
vrouwelijk – Dit is de relatieve risicoverhouding tussen vrouwen en mannen voor aardbeienijs ten opzichte van vanille-ijs, gegeven dat de andere variabelen in het model constant worden gehouden. Voor vrouwen ten opzichte van mannen zou het relatieve risico voor het verkiezen van aardbei boven vanille naar verwachting afnemen met een factor 0,968 als de andere variabelen in het model constant worden gehouden. Met andere woorden, vrouwen hebben minder kans dan mannen om de voorkeur te geven aan aardbeienijs boven vanille-ijs.
b. – Dit is de CI voor de relatieve risicoverhouding, gegeven dat de andere voorspellers in het model zitten. Voor een gegeven voorspeller met een betrouwbaarheidsniveau van 95% zouden we zeggen dat we er 95% zeker van zijn dat de “ware” relatieve risicoverhouding van de populatie bij vergelijking van uitkomst m met de referentiegroep tussen de onder- en bovengrens van het interval ligt. Een voordeel van een CI is dat het illustratief is; het geeft een bereik waar de “ware” relatieve risicoverhouding kan liggen.
Geef een antwoord