Multinomiális logisztikus regresszió | Stata Annotated Output
On január 28, 2022 by adminEz az oldal egy multinomiális logisztikus regressziós elemzés példáját mutatja be, a kimenetet magyarázó lábjegyzetekkel. Az adatokat 200 középiskolás diákról gyűjtötték, és különböző teszteken elért pontszámok, köztük egy videojáték és egy kirakós játék eredményei. A kimeneti mérőszám ebben az elemzésben a fagylalt kedvenc íze – vanília, csokoládé vagy eper -, amelyből megnézzük, hogy milyen összefüggések vannak a videojáték pontszámokkal (videó), a puzzle pontszámokkal (puzzle) és a nemmel (nő). Válaszváltozónkat, a fagylaltot, kategorikusnak fogjuk kezelni azzal a feltételezéssel, hogy a fagylalt szintjei nem rendelkeznek természetes sorrenddel, és megengedjük a Stata számára a referens csoport kiválasztását. Példánkban ez a vanília lesz. Alapértelmezés szerint a Stata a leggyakrabban előforduló csoportot választja referens csoportnak. Az oldal első fele az együtthatókat multinomiális log-odds (logits) formájában értelmezi. Ezek közel állnak a kimeneti változó két szintjével végzett logisztikus regresszióban elért log-odds-okhoz, de nem azonosak azokkal. A második fele az együtthatókat a relatív kockázati arányok szempontjából értelmezi.
use https://stats.idre.ucla.edu/stat/stata/output/mlogit, clear
A regresszió lefuttatása előtt a jégkrémízek gyakoriságának megszerzése az adatokban tájékoztathat a referenciacsoport kiválasztásáról.
tab ice_cream favorite flavor of ice cream | Freq. Percent Cum. ------------+----------------------------------- chocolate | 47 23.50 23.50 vanilla | 95 47.50 71.00 strawberry | 58 29.00 100.00 ------------+----------------------------------- Total | 200 100.00
A banília a leggyakrabban előforduló fagylaltíz, és ebben a példában ez lesz a referenciacsoport.
mlogit ice_cream video puzzle femaleIteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485Multinomial logistic regression Number of obs = 200 LR chi2(6) = 33.10 Prob > chi2 = 0.0000Log likelihood = -194.03485 Pseudo R2 = 0.0786------------------------------------------------------------------------------ ice_cream | Coef. Std. Err. z P>|z| -------------+----------------------------------------------------------------chocolate | video | -.0235647 .0209747 -1.12 0.261 -.0646744 .017545 puzzle | -.0389243 .0195165 -1.99 0.046 -.0771759 -.0006726 female | .8166202 .3909813 2.09 0.037 .050311 1.582929 _cons | 1.912256 1.127256 1.70 0.090 -.2971258 4.121638-------------+----------------------------------------------------------------strawberry | video | .022922 .0208718 1.10 0.272 -.0179861 .0638301 puzzle | .0430036 .0198894 2.16 0.031 .0040211 .081986 female | -.032862 .3500153 -0.09 0.925 -.7188793 .6531553 _cons | -4.057323 1.222939 -3.32 0.001 -6.45424 -1.660407------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)
Iteration Loga
Iteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485
a. Iterációs napló – Ez a log valószínűségek listája minden egyes iterációnál. Ne feledje, hogy a multinomiális logisztikus regresszió a bináris és a rendezett logisztikus regresszióhoz hasonlóan maximális valószínűség becslést használ, ami egy iteratív eljárás. Az első iteráció (az úgynevezett 0. iteráció) a “null” vagy “üres” modell logaritmikus valószínűsége, azaz a prediktorokat nem tartalmazó modell logaritmikus valószínűsége. A következő iterációnál a prediktor(ok) bekerülnek a modellbe. Minden egyes iterációnál a log-valószínűség nő, mivel a cél a log-valószínűség maximalizálása. Amikor az egymást követő iterációk közötti különbség nagyon kicsi, a modellről azt mondjuk, hogy “konvergált”, az iteráció leáll, és az eredmények megjelennek. További információt erről a folyamatról bináris eredmények esetén lásd: Regression Models for Categorical and Limited Dependent Variables by J. Scott Long (52-61. oldal).
Model Summary
Multinomial logistic regression Number of obsc = 200 LR chi2(6)d = 33.10 Prob > chi2e = 0.0000Log likelihood = -194.03485b Pseudo R2f = 0.0786
b. Log Likelihood – Ez az illesztett modell log valószínűsége. Ezt használják a Likelihood Ratio Chi-Square tesztben, amely azt vizsgálja, hogy a modellben az összes prediktor regressziós együtthatója egyszerre nulla-e, valamint az egymásba ágyazott modellek tesztjében.
c. Number of obs – Ez a multinomiális logisztikus regresszióban használt megfigyelések száma. Ez lehet kevesebb, mint az esetek száma az adatkészletben, ha az egyenletben egyes változókhoz hiányzó értékek vannak. Alapértelmezés szerint a Stata a hiányos esetek listánkénti törlését végzi.
d. LR chi2(6) – Ez a Likelihood Ratio (LR) Chi-Square teszt arra, hogy mindkét egyenlet (csokoládé a vaníliához képest és eper a vaníliához képest) esetében, hogy legalább az egyik prediktor regressziós együtthatója nem egyenlő nullával. A zárójelben lévő szám az LR Chi-négyzet statisztika teszteléséhez használt Chi-négyzet eloszlás szabadságfokát jelzi, és a becsült modellek számának (2) és a modellben szereplő prediktorok számának (3) szorzata. Az LR Chi-négyzet statisztika a következő módon számítható ki: -2*( L(null modell) – L(illesztett modell)) = -2*((-210,583) – (-194,035)) = 33,096, ahol L(null modell) a log likelihoodból származik, amikor csak a válaszváltozó van a modellben (0. iteráció), és L(illesztett modell) a log likelihood az utolsó iterációból (feltételezve, hogy a modell konvergált) az összes paraméterrel.
e. Prob > chi2 – Ez annak a valószínűsége, hogy a nullhipotézis mellett az LR tesztstatisztika ugyanolyan szélsőséges, vagy annál szélsőségesebb, mint a megfigyelt statisztika; a nullhipotézis az, hogy mindkét modellben az összes regressziós együttható egyszerre nulla. Más szóval, ez annak a valószínűsége, hogy ezt a khi-négyzet statisztikát (33,10) vagy egy szélsőségesebbet kapunk, ha a prediktorváltozóknak valójában nincs hatása. Ezt a p-értéket egy meghatározott alfa-szinthez hasonlítjuk, az I. típusú hiba elfogadására vonatkozó hajlandóságunkhoz, amelyet általában 0,05-ben vagy 0,01-ben határozunk meg. Az LR-teszt kis p-értéke, <0,00001, arra enged következtetni, hogy a modellben szereplő regressziós együtthatók közül legalább egy nem egyenlő nullával. A nullhipotézis teszteléséhez használt chi-négyzet eloszlás paraméterét az előzetes sorban szereplő szabadságfokok határozzák meg: chi2(6).
f. Pszeudo R2 – Ez a McFadden-féle pszeudo R-négyzet. A logisztikus regressziónak nincs az OLS-regresszióban található R-négyzetnek megfelelője; azonban sokan megpróbáltak már egyet kitalálni. Sokféle pszeudo-R-négyzet statisztika létezik. Mivel ez a statisztika nem azt jelenti, amit az R-négyzet az OLS-regresszióban (a válaszváltozó varianciájának a prediktorokkal magyarázott hányadát), azt javasoljuk, hogy ezt a statisztikát nagy óvatossággal értelmezzük.
Paraméterbecslések
------------------------------------------------------------------------------ ice_creamg | Coef.h Std. Err.j zk P>|z|k l-------------+----------------------------------------------------------------chocolate | video | -.0235647 .0209747 -1.12 0.261 -.0646744 .017545 puzzle | -.0389243 .0195165 -1.99 0.046 -.0771759 -.0006726 female | .8166202 .3909813 2.09 0.037 .050311 1.582929 _cons | 1.912256 1.127256 1.70 0.090 -.2971258 4.121638-------------+----------------------------------------------------------------strawberry | video | .022922 .0208718 1.10 0.272 -.0179861 .0638301 puzzle | .0430036 .0198894 2.16 0.031 .0040211 .081986 female | -.032862 .3500153 -0.09 0.925 -.7188793 .6531553 _cons | -4.057323 1.222939 -3.32 0.001 -6.45424 -1.660407------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)i
g. ice_cream – Ez a válaszváltozó a multinomiális logisztikus regresszióban. Az ice_cream alatt a prediktorváltozók két ismétlése található, amelyek a két becsült modellt képviselik: csokoládé a vaníliához képest és eper a vaníliához képest.
h és i. Coef. és referens csoport – Ezek a becsült multinomiális logisztikus regressziós együtthatók, illetve a modell referens szintje. A multinomiális logit modell fontos jellemzője, hogy k-1 modellt becsül, ahol k a kimeneti változó szintjeinek száma. Ebben az esetben a Stata alapértelmezés szerint a vaníliát állította be vonatkoztatási csoportnak, és ezért becsült egy modellt a csokoládéra a vaníliához képest, és egy modellt az eperre a vaníliához képest. Mivel a paraméterbecslések a vonatkoztatási csoporthoz viszonyítottak, a multinomiális logit standard értelmezése az, hogy a prediktor változó egységnyi változására az m kimenetel logitja a vonatkoztatási csoporthoz viszonyítva várhatóan a megfelelő paraméterbecsléssel változik (amely log-odds egységekben van megadva), feltéve, hogy a modellben szereplő változókat állandó értéken tartjuk.
csokoládé a vaníliához képest
videó – Ez a multinomiális logit becslés a csokoládé videó pontszámának egy egységnyi növekedésére a vaníliához képest, feltéve, hogy a modellben szereplő többi változót állandó értéken tartjuk. Ha egy alany egy ponttal növelné a videó pontszámát, a csokoládét a vaníliával szemben előnyben részesítő multinomiális log-odds várhatóan 0,024 egységgel csökkenne, miközben a modellben szereplő összes többi változót változatlanul tartják.
puzzle – Ez a multinomiális logit becslés a csokoládéra vonatkozó puzzle pontszám egy egységnyi növekedésére a vaníliához képest, feltéve, hogy a modellben szereplő többi változót változatlanul tartják. Ha egy alany egy ponttal növelné rejtvénypontszámát, a csokoládé vaníliával szembeni előnyben részesítésének multinomiális log-odds-értéke várhatóan 0,039 egységgel csökkenne, miközben a modellben szereplő összes többi változót változatlanul tartják.
female – Ez az a multinomiális logit-becslés, amely a csokoládéval szembeni előnyben részesítést a vaníliával szemben a nők és férfiak között hasonlítja össze, feltéve, hogy a modellben szereplő többi változót változatlanul tartják. A multinomiális logit a nők esetében a férfiakhoz képest 0,817 egységgel magasabb a csokoládé előnyben részesítésére a vaníliával szemben, ha a modellben szereplő összes többi előrejelző változót állandó értéken tartjuk. Más szóval a nők nagyobb valószínűséggel részesítik előnyben a csokoládét a vaníliával szemben, mint a férfiak.
_cons – Ez a multinomiális logit becslése a csokoládéra a vaníliához képest, ha a modellben lévő prediktor változókat nullára értékeljük. A férfiak esetében (a női változót nullára értékelték), nulla videó- és puzzle-pontszámmal, a csokoládé vaníliával szembeni preferálásának logit értéke 1,912. Megjegyzendő, hogy a videó és a rejtvény nullára történő értékelése kívül esik a plauzibilis pontszámok tartományán. Ha a pontszámok átlagközpontúak lennének, a metszéspontnak természetes értelmezése lenne: a csokoládé vaníliával szembeni preferálásának log esélye egy átlagos videó és puzzle pontszámmal rendelkező férfi esetében.
eper a vaníliához képest
videó – Ez a multinomiális logit becslés az eper videó pontszámának egy egységnyi növekedésére a vaníliához képest, feltéve, hogy a modellben a többi változót állandó értéken tartjuk. Ha egy alany egy ponttal növelné a videó pontszámát, akkor az epret a vaníliával szemben előnyben részesítő multinomiális log-odds várhatóan 0,023 egységgel nőne, miközben a modellben szereplő összes többi változót változatlanul tartják.
puzzle – Ez a multinomiális logit becslés az eperre vonatkozó puzzle pontszám egy egységnyi növekedésére a vaníliához képest, mivel a modellben szereplő többi változót változatlanul tartják. Ha egy alany egy ponttal növelné a puzzle pontszámát, akkor a multinomiális log-odds arra, hogy az epret a vaníliával szemben előnyben részesíti, várhatóan 0,043 egységgel nőne, miközben a modellben lévő összes többi változót állandónak tartják.
female – Ez a multinomiális logit becslés, amely a nőket és a férfiakat hasonlítja össze az eperrel szemben a vaníliával, feltéve, hogy a modellben lévő többi változót állandónak tartják. A multinomiális logit a nők számára a férfiakhoz képest 0,033 egységgel alacsonyabb az eper előnyben részesítésére a vaníliával szemben, feltéve, hogy a modellben szereplő összes többi prediktor változót állandó értéken tartják. Más szóval a férfiak nagyobb valószínűséggel kedvelik az eperfagylaltot a vaníliafagylalt helyett, mint a nők.
_cons – Ez a multinomiális logit becslése az eperre a vaníliához képest, ha a modellben szereplő összes prediktor változót nullára értékeljük. A nulla videó- és puzzle-pontszámmal rendelkező férfiak (a női változót nullára értékelték) esetében az eper vaníliával szembeni preferálásának logit értéke -4,057.
j. Std. Err. – Ezek az egyes regressziós együtthatók standard hibái a két vonatkozó modell becslésénél. Ezeket használják mind a z tesztstatisztika (k felirat), mind a regressziós együttható konfidenciaintervallumának (l felirat) kiszámításánál.
k. z és P>|z| – A z tesztstatisztika a Coef. és az adott prediktor Std. Err. hányadosa, a p-érték P>|z| pedig az a valószínűség, hogy a z tesztstatisztika (vagy egy szélsőségesebb tesztstatisztika) a nullhipotézis esetén megfigyelhető lenne. Egy adott alfa-szint esetén a z és a P>|z| meghatározza, hogy elvethető-e az a nullhipotézis, hogy egy adott prediktor regressziós együtthatója nulla, feltéve, hogy a többi prediktor is szerepel a modellben. Ha P>|z|kisebb, mint az alfa, akkor a nullhipotézis elvethető, és a paraméterbecslés szignifikánsnak tekinthető az adott alfa-szinten. A z érték standard normális eloszlást követ, amelyet annak a kétoldali alternatív hipotézisnek a tesztelésére használunk, hogy a Coef. nem egyenlő nullával. A multinomiális logisztikus regresszióban a paraméterbecslés szignifikanciájának értelmezése arra a modellre korlátozódik, amelyben a paraméterbecslést kiszámították. Például egy paraméterbecslés szignifikanciája a csokoládéhoz viszonyított vanília modellben nem feltételezhető az eperhez viszonyított vanília modellben.
csokoládé a vaníliához viszonyítva
A csokoládé a vaníliához viszonyítva esetében a z tesztstatisztika a prediktor videóra (-0,024/0,021) -1,12, a hozzá tartozó p-érték 0,261-es. Ha az alfa-szintet 0,05-re állítjuk, akkor nem tudjuk elutasítani a nullhipotézist, és arra a következtetésre jutunk, hogy a csokoládé esetében a vaníliához képest a videó regressziós együtthatója statisztikailag nem különbözik nullától, mivel a rejtvény és a nő szerepel a modellben.
A csokoládé esetében a vaníliához képest a puzzle prediktorra vonatkozó z tesztstatisztika (-0,039/0,020) -1,99, a hozzá tartozó p-érték 0,046-os értékkel. Ha ismét 0,05-re állítjuk az alfa-szintet, akkor elutasítjuk a nullhipotézist, és arra következtetünk, hogy a puzzle regressziós együtthatója statisztikailag különbözik a nullától a csokoládé esetében a vaníliához képest, feltéve, hogy a videó és a nő szerepel a modellben.
A csokoládé esetében a vaníliához viszonyítva a női prediktorra vonatkozó z tesztstatisztika (0,817/0,391) 2,09, a hozzá tartozó p-érték 0,037. Ha ismét 0,05-re állítjuk az alfa-szintet, akkor elutasítjuk a nullhipotézist, és arra a következtetésre jutunk, hogy a férfiak és nők közötti különbség statisztikailag eltérőnek bizonyult a csokoládé esetében a vaníliához képest, mivelvideo és female szerepel a modellben.
A csokoládéra a vaníliához képest a z tesztstatisztika az interceptre, _cons (1,912/1,127) 1,70, a hozzá tartozó p-érték 0,090. A 0,05-ös alfa-szint mellett nem tudnánk elutasítani a nullhipotézist, és arra a következtetésre jutnánk, hogy a) a multinomiális logit a férfiak (a változó női értékelt nulla) és nulla videó- és puzzle-pontszámmal rendelkező férfiak esetében a csokoládé a vaníliához képest statisztikailag nem különbözik a nullától; vagy b) a nulla videó- és puzzle-pontszámmal rendelkező férfiak esetében statisztikailag bizonytalan, hogy nagyobb valószínűséggel sorolhatók-e a csokoládét vagy a vaníliát kedvelők közé. A második értelmezést akkor tudjuk elvégezni, ha a _cons-t egy adott kovariánsprofilnak tekintjük (a nulla videó- és puzzle-pontszámmal rendelkező hímek). Az együttható iránya és szignifikanciája alapján a _cons jelzi, hogy a profil nagyobb valószínűséggel sorolható-e a kimeneti változó egyik szintjére, mint a másikra.
eper a vaníliához viszonyítva
Az eper a vaníliához viszonyítva a prediktor videó (0,023/0,021) z tesztstatisztikája 1,10, a hozzá tartozó p-érték 0,272-es értékkel. Ha az alfa-szintet 0,05-re állítjuk, akkor nem tudjuk elutasítani a nullhipotézist, és arra a következtetésre jutunk, hogy az eper esetében a vaníliához képest a videó regressziós együtthatója statisztikailag nem különbözik nullától, mivel a rejtvény és a nő szerepel a modellben.
A vaníliához viszonyított eper esetében a puzzle prediktorra vonatkozó z tesztstatisztika (0,043/0,020) 2,16, a hozzá tartozó p-érték 0,031. Ha az alfa-szintet ismét 0,05-re állítjuk, akkor elutasítjuk a nullhipotézist, és arra következtetünk, hogy a puzzle regressziós együtthatója statisztikailag különbözik a nullától az eper esetében a vaníliához képest, mivel a videó és a nő szerepel a modellben.
Az eper esetében a vaníliához képest a nő prediktorra vonatkozó z tesztstatisztika (-0,033/0,350) -0,09, a hozzá tartozó p-érték 0,925. Ha ismét 0,05-re állítjuk az alfa-szintet, akkor nem tudjuk elutasítani a nullhipotézist, és arra a következtetésre jutunk, hogy az eper esetében a vaníliához képest a nőstény regressziós együtthatója statisztikailag nem különbözik nullától, mivel a puzzle és a videó szerepel a modellben.
A vaníliához viszonyított eper esetében az intercept, _cons (-4,057/1,223) z tesztstatisztikája -3,32, amihez 0,001-es p-érték társul. 0,05-ös alfa-szint mellett elutasítanánk a nullhipotézist, és arra a következtetésre jutnánk, hogy a) a multinomiális logit a férfiak (a változó női értékelt nulla) és a nulla videó- és puzzle-pontszámmal rendelkező férfiak esetében az eper a vaníliához képest statisztikailag különbözik a nullától; vagy b) a nulla videó- és puzzle-pontszámmal rendelkező férfiak esetében statisztikailag szignifikáns különbség van az epret vagy vaníliát preferálónak való besorolás valószínűsége között. Egy ilyen hím nagyobb valószínűséggel lenne besorolható a vaníliát az eperrel szemben előnyben részesítőnek. A második értelmezést akkor tudjuk elvégezni, ha a _cons-t egy adott kovariánsprofilnak tekintjük (nulla videó- és puzzle-pontszámmal rendelkező hímek). Az együttható iránya és szignifikanciája alapján a _cons jelzi, hogy a profil nagyobb valószínűséggel sorolható-e a kimeneti változó egyik szintjére, mint a másikra.
l. – Ez az egyéni multinomiális logit regressziós együttható konfidencia intervalluma (CI), tekintve, hogy a többi prediktor szerepel a modellben az m kimenetelhez képest a referenciacsoporthoz képest. Egy adott prediktor esetében 95%-os megbízhatósági szinttel azt mondjuk, hogy 95%-ban biztosak vagyunk abban, hogy a “valódi” populációs multinomiális logit regressziós együttható az intervallum alsó és felső határa között van az m kimenetelre vonatkozóan a referens csoporthoz viszonyítva. Ezt úgy számítjuk ki, mint a Coef. (zα/2)*(Std.Err.), ahol zα/2 a standard normális eloszlás kritikus értéke. A CI egyenértékű a z tesztstatisztikával: ha a CI nullát tartalmaz, akkor nem tudjuk elutasítani azt a nullhipotézist, hogy egy adott regressziós együttható nulla, mivel a többi prediktor szerepel a modellben. A CI előnye, hogy szemléltető jellegű; egy olyan tartományt ad meg, ahol a “valódi” paraméter feküdhet.
Relatív kockázati arányok értelmezése
A következőkben a multinomiális logisztikus regresszió relatív kockázati arányok szerinti értelmezése következik, amelyet a multinomiális logit modell futtatása után az mlogit, rrr segítségével kaphatunk meg, vagy a teljes modell megadásakor az rrr opció megadásával. Az értelmezés ezen része az alábbi kimenetre vonatkozik.
mlogit ice_cream video puzzle female, rrr
Iteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485Multinomial logistic regression Number of obs = 200 LR chi2(6) = 33.10 Prob > chi2 = 0.0000Log likelihood = -194.03485 Pseudo R2 = 0.0786------------------------------------------------------------------------------ ice_cream | RRRa Std. Err. z P>|z| b-------------+----------------------------------------------------------------chocolate | video | .9767108 .0204862 -1.12 0.261 .9373726 1.0177 puzzle | .9618236 .0187714 -1.99 0.046 .925727 .9993276 female | 2.262839 .8847276 2.09 0.037 1.051598 4.869199-------------+----------------------------------------------------------------strawberry | video | 1.023187 .0213558 1.10 0.272 .9821747 1.065911 puzzle | 1.043942 .0207633 2.16 0.031 1.004029 1.085441 female | .9676721 .3387 -0.09 0.925 .4872981 1.921595------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)
a. Relatív kockázati arány – Ezek a korábban bemutatott multinomiális logit modell relatív kockázati arányai. Ezeket a multinomiális logit együtthatók exponenciálásával, ecoef, vagy az rrr opció megadásával kaphatjuk meg az mlogit parancs kiadásakor. Emlékezzünk arra, hogy a multinomiális logit modell k-1 modellt becsül, ahol a k-adik egyenlet a vonatkoztatási csoporthoz viszonyítva van. Egy együttható RRR értéke azt mutatja meg, hogy az összehasonlító csoportba eső kimenetel kockázata hogyan változik az összehasonlító csoportba eső kimenetel kockázatához képest a referenciacsoportba eső kimenetel kockázatához képest a kérdéses változó függvényében. Az RRR > 1 azt jelzi, hogy a változó növekedésével nő annak kockázata, hogy a kimenetel az összehasonlító csoportba esik, a referenciacsoportba eső kimenetel kockázatához képest. Más szóval, az összehasonlítási kimenetel valószínűbb. Az RRR < 1 azt jelzi, hogy a változó növekedésével csökken annak kockázata, hogy a kimenetel az összehasonlító csoportba esik, annak kockázatához képest, hogy a kimenetel a referenciacsoportba esik. Példákért lásd a relatív kockázati arányok alábbi értelmezéseit. Általában, ha az RRR < 1, akkor a kimenetel nagyobb valószínűséggel kerül a referenciacsoportba.
csokoládé a vaníliához képest
videó – Ez a relatív kockázati arány a videó pontszámának egy egységnyi növekedése esetén a csokoládé előnyben részesítésére a vaníliával szemben, feltéve, hogy a modellben a többi változót állandó értéken tartjuk. Ha egy alany egy egységgel növelné a videó pontszámát, a csokoládé vaníliával szembeni preferenciájának relatív kockázata várhatóan 0,977-szeresére csökkenne, feltéve, hogy a modellben szereplő többi változót állandó értéken tartják. Tehát a videó értékének egy egységnyi növekedése esetén a csokoládé csoportba kerülés relatív kockázata 0,977-szer valószínűbb lenne, ha a modellben szereplő többi változót változatlanul tartjuk. Általánosabban fogalmazva azt mondhatjuk, hogy ha egy alany növeli a videós pontszámát, akkor várhatóan nagyobb valószínűséggel fogja előnyben részesíteni a vaníliafagylaltot a csokoládéfagylalttal szemben.
puzzle – Ez a relatív kockázati arány a puzzle pontszámának egy egységnyi növekedése esetén a csokoládé előnyben részesítésére a vaníliával szemben, feltéve, hogy a modellben szereplő többi változót állandó értéken tartjuk. Ha egy alany egy egységgel növelné a puzzle pontszámát, a csokoládé vaníliával szembeni preferenciájának relatív kockázata várhatóan 0,962-szeresére csökkenne, feltéve, hogy a modellben szereplő többi változót állandó értéken tartják. Általánosabban azt mondhatjuk, hogy ha két alany azonos videó pontszámmal rendelkezik, és mindketten nők (vagy mindketten férfiak), akkor a magasabb rejtvénypontszámmal rendelkező alany nagyobb valószínűséggel fogja a vaníliafagyit előnyben részesíteni a csokoládéfagyival szemben, mint az alacsonyabb rejtvénypontszámmal rendelkező alany.
nő – Ez az a relatív kockázati arány, amely összehasonlítja a nők és a férfiak csokoládét a vaníliával szembeni preferenciáját, feltéve, hogy a modellben a többi változót állandó értéken tartjuk. A nők esetében a férfiakhoz képest a csokoládé vaníliával szembeni előnyben részesítésének relatív kockázata várhatóan 2,263-szorosára nő, ha a modellben szereplő többi változót állandó értéken tartjuk. Más szóval, a nők nagyobb valószínűséggel részesítik előnyben a csokoládéfagylaltot a vaníliafagylalttal szemben, mint a férfiak.
eper a vaníliához képest
videó – Ez a relatív kockázati arány a videó pontszámának egy egységnyi növekedése esetén az eper a vaníliával szemben, feltéve, hogy a modellben szereplő többi változót állandó értéken tartják. Ha egy alany egy egységgel növelné a videó pontszámát, akkor az eperrel szembeni relatív kockázat a vaníliával szemben várhatóan 1,023-szorosára nőne, feltéve, hogy a modellben szereplő többi változót állandó értéken tartják. Általánosabban fogalmazva azt mondhatjuk, hogy ha egy alany növeli a videós pontszámát, akkor várhatóan nagyobb valószínűséggel fogja az eperfagylaltot preferálni a vaníliafagylalttal szemben.
puzzle – Ez a relatív kockázati arány a puzzle pontszámának egy egységnyi növekedése esetén az eperfagyi előnyben részesítése a vaníliával szemben, feltéve, hogy a modellben szereplő többi változót állandó értéken tartjuk. Ha egy alany egy egységgel növelné puzzle pontszámát, akkor az eperrel szembeni relatív kockázat a vaníliával szemben várhatóan 1,043-szorosára nőne, feltéve, hogy a modellben szereplő többi változót állandó értéken tartják. Általánosabban azt mondhatjuk, hogy ha két alany azonos videó pontszámmal rendelkezik és mindketten nők (vagy mindketten férfiak), akkor a magasabb puzzle pontszámmal rendelkező alany nagyobb valószínűséggel részesíti előnyben az eperfagyit a vaníliafagyival szemben, mint az alacsonyabb puzzle pontszámmal rendelkező alany.
female – Ez az a relatív kockázati arány, amely a nők és a férfiak összehasonlításával az eperfagylaltot a vaníliához képest, feltéve, hogy a modellben szereplő egyéb változókat állandó értéken tartjuk. A nők esetében a férfiakhoz képest az epret a vaníliával szemben előnyben részesítő nők relatív kockázata várhatóan 0,968-szorosára csökken, feltéve, hogy a modellben szereplő többi változót állandó értéken tartják. Más szóval, a nők kisebb valószínűséggel részesítik előnyben az eperfagylaltot a vaníliafagylalttal szemben, mint a férfiak.
b. – Ez a relatív kockázati arány CI-je, tekintve, hogy a modellben a többi prediktor szerepel. Egy adott prediktor esetében 95%-os megbízhatósági szinttel azt mondjuk, hogy 95%-ban biztosak vagyunk abban, hogy az m kimenetelt a referenciacsoporttal összehasonlító “valódi” populációs relatív kockázati arány az intervallum alsó és felső határa között van. A CI egyik előnye, hogy szemléltető jellegű; egy olyan tartományt ad meg, ahol a “valódi” relatív kockázati arány feküdhet.
Vélemény, hozzászólás?