Multinomial Logistic Regression | Stata Annotated Output
Il Gennaio 28, 2022 da adminQuesta pagina mostra un esempio di analisi di regressione logistica multinomiale con note che spiegano l’output. I dati sono stati raccolti su 200 studenti delle scuole superiori e sono punteggi su vari test, tra cui un videogioco e un puzzle. La misura del risultato in questa analisi è il gusto preferito di gelato – vaniglia, cioccolato o fragola – da cui vedremo quali relazioni esistono con i punteggi dei videogiochi (video), i punteggi dei puzzle (puzzle) e il genere (femminile). La nostra variabile di risposta, ice_cream, sarà trattata come categorica assumendo che i livelli di ice_cream non abbiano un ordine naturale, e permetteremo a Stata di scegliere il gruppo di riferimento. Nel nostro esempio, questo sarà vaniglia. Per impostazione predefinita, Stata sceglie il gruppo più frequente come gruppo di riferimento. La prima metà di questa pagina interpreta i coefficienti in termini di probabilità logiche multinomiali (logit). Questi saranno vicini ma non uguali alle probabilità logiche ottenute in una regressione logistica con due livelli della variabile di risultato. La seconda metà interpreta i coefficienti in termini di rapporti di rischio relativo.
use https://stats.idre.ucla.edu/stat/stata/output/mlogit, clear
Prima di eseguire la regressione, ottenere una frequenza dei gusti di gelato nei dati può informare la selezione di un gruppo di riferimento.
tab ice_cream favorite flavor of ice cream | Freq. Percent Cum. ------------+----------------------------------- chocolate | 47 23.50 23.50 vanilla | 95 47.50 71.00 strawberry | 58 29.00 100.00 ------------+----------------------------------- Total | 200 100.00
Vaniglia è il gusto di gelato più frequente e sarà il gruppo di riferimento in questo esempio.
mlogit ice_cream video puzzle femaleIteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485Multinomial logistic regression Number of obs = 200 LR chi2(6) = 33.10 Prob > chi2 = 0.0000Log likelihood = -194.03485 Pseudo R2 = 0.0786------------------------------------------------------------------------------ ice_cream | Coef. Std. Err. z P>|z| -------------+----------------------------------------------------------------chocolate | video | -.0235647 .0209747 -1.12 0.261 -.0646744 .017545 puzzle | -.0389243 .0195165 -1.99 0.046 -.0771759 -.0006726 female | .8166202 .3909813 2.09 0.037 .050311 1.582929 _cons | 1.912256 1.127256 1.70 0.090 -.2971258 4.121638-------------+----------------------------------------------------------------strawberry | video | .022922 .0208718 1.10 0.272 -.0179861 .0638301 puzzle | .0430036 .0198894 2.16 0.031 .0040211 .081986 female | -.032862 .3500153 -0.09 0.925 -.7188793 .6531553 _cons | -4.057323 1.222939 -3.32 0.001 -6.45424 -1.660407------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)
Iteration Loga
Iteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485
a. Log dell’iterazione – Questo è un elenco delle probabilità log ad ogni iterazione. Ricordate che la regressione logistica multinomiale, come la regressione logistica binaria e ordinata, utilizza la stima della massima verosimiglianza, che è una procedura iterativa. La prima iterazione (chiamata iterazione 0) è la probabilità logica del modello “nullo” o “vuoto”, cioè un modello senza predittori. All’iterazione successiva, i predittori sono inclusi nel modello. Ad ogni iterazione, la probabilità logica aumenta perché l’obiettivo è quello di massimizzare la probabilità logica. Quando la differenza tra le iterazioni successive è molto piccola, si dice che il modello è “convergente”, l’iterazione si ferma e i risultati vengono visualizzati. Per maggiori informazioni su questo processo per i risultati binari, vedere Modelli di regressione per variabili dipendenti categoriche e limitate di J. Scott Long (pagina 52-61).
Sommario del modello
Multinomial logistic regression Number of obsc = 200 LR chi2(6)d = 33.10 Prob > chi2e = 0.0000Log likelihood = -194.03485b Pseudo R2f = 0.0786
b. Log Likelihood – Questo è il log likelihood del modello montato. E’ usato nel test Likelihood Ratio Chi-Square per verificare se tutti i coefficienti di regressione dei predittori nel modello sono contemporaneamente zero e nei test dei modelli annidati.
c. Number of obs – Questo è il numero di osservazioni utilizzate nella regressione logistica multinomiale. Può essere inferiore al numero di casi nel set di dati se ci sono valori mancanti per alcune variabili nell’equazione. Per impostazione predefinita, Stata fa una cancellazione in senso orario dei casi incompleti.
d. LR chi2(6) – Questo è il test di Likelihood Ratio (LR) Chi-Square che per entrambe le equazioni (cioccolato rispetto a vaniglia e fragola rispetto a vaniglia) che almeno uno dei coefficienti di regressione dei predittori non sia uguale a zero. Il numero tra parentesi indica i gradi di libertà della distribuzione Chi-quadro usata per testare la statistica LR Chi-quadro ed è definita dal numero di modelli stimati (2) per il numero di predittori nel modello (3). La statistica LR Chi-quadro può essere calcolata da -2*( L(modello nullo) – L(modello adattato)) = -2*((-210.583) – (-194.035)) = 33.096, dove L(modello nullo) è dalla probabilità logica con solo la variabile di risposta nel modello (Iterazione 0) e L(modello adattato) è la probabilità logica dall’iterazione finale (assumendo che il modello converga) con tutti i parametri.
e. Prob > chi2 – Questa è la probabilità di ottenere una statistica di test LR estrema quanto, o più, della statistica osservata sotto l’ipotesi nulla; l’ipotesi nulla è che tutti i coefficienti di regressione di entrambi i modelli siano contemporaneamente uguali a zero. In altre parole, questa è la probabilità di ottenere questa statistica chi-quadro (33,10) o una più estrema se di fatto non c’è alcun effetto delle variabili predittrici. Questo p-value viene confrontato con un livello alfa specificato, la nostra disponibilità ad accettare un errore di tipo I, che è tipicamente fissato a 0,05 o 0,01. Il piccolo p-value del test LR, <0,00001, ci porterebbe a concludere che almeno uno dei coefficienti di regressione nel modello non è uguale a zero. Il parametro della distribuzione chi-quadro usato per testare l’ipotesi nulla è definito dai gradi di libertà nella linea di priorità, chi2(6).
f. Pseudo R2 – Questo è lo pseudo R-squadro di McFadden. La regressione logistica non ha un equivalente dell’R-squared che si trova nella regressione OLS; tuttavia, molte persone hanno cercato di trovarne uno. Esiste un’ampia varietà di statistiche pseudo R-quadro. Poiché questa statistica non significa ciò che R-square significa nella regressione OLS (la proporzione di varianza della variabile di risposta spiegata dai predittori), suggeriamo di interpretare questa statistica con grande cautela.
Stime dei parametri
------------------------------------------------------------------------------ ice_creamg | Coef.h Std. Err.j zk P>|z|k l-------------+----------------------------------------------------------------chocolate | video | -.0235647 .0209747 -1.12 0.261 -.0646744 .017545 puzzle | -.0389243 .0195165 -1.99 0.046 -.0771759 -.0006726 female | .8166202 .3909813 2.09 0.037 .050311 1.582929 _cons | 1.912256 1.127256 1.70 0.090 -.2971258 4.121638-------------+----------------------------------------------------------------strawberry | video | .022922 .0208718 1.10 0.272 -.0179861 .0638301 puzzle | .0430036 .0198894 2.16 0.031 .0040211 .081986 female | -.032862 .3500153 -0.09 0.925 -.7188793 .6531553 _cons | -4.057323 1.222939 -3.32 0.001 -6.45424 -1.660407------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)i
g. ice_cream – Questa è la variabile di risposta nella regressione logistica multinomiale. Sotto ice_cream ci sono due repliche delle variabili predittrici, che rappresentano i due modelli stimati: cioccolato rispetto a vaniglia e fragola rispetto a vaniglia.
h e i. Coef. e gruppo di riferimento – Questi sono i coefficienti stimati della regressione logistica multinomiale e il livello di riferimento, rispettivamente, per il modello. Una caratteristica importante del modello logit multinomiale è che stima k-1 modelli, dove k è il numero di livelli della variabile di risultato. In questo caso, Stata, per default, ha impostato la vaniglia come gruppo di riferimento, e quindi ha stimato un modello per il cioccolato rispetto alla vaniglia e un modello per la fragola rispetto alla vaniglia. Poiché le stime dei parametri sono relative al gruppo di riferimento, l’interpretazione standard del logit multinomiale è che per un cambiamento di unità nella variabile predittiva, il logit del risultato m relativo al gruppo di riferimento dovrebbe cambiare della sua rispettiva stima del parametro (che è in unità log-odds) dato che le variabili nel modello sono mantenute costanti.
cioccolato rispetto a vaniglia
video – Questa è la stima logit multinomiale per un aumento di una unità nel punteggio video per il cioccolato rispetto alla vaniglia, dato che le altre variabili del modello sono tenute costanti. Se un soggetto dovesse aumentare il suo punteggio video di un punto, le probabilità logiche multinomiali di preferire il cioccolato alla vaniglia dovrebbero diminuire di 0,024 unità, mantenendo costanti tutte le altre variabili del modello.
puzzle – Questa è la stima logit multinomiale per un aumento di un’unità nel punteggio puzzle per il cioccolato rispetto alla vaniglia, dato che le altre variabili del modello sono tenute costanti. Se un soggetto aumentasse il suo punteggio di un punto, le probabilità logiche multinomiali di preferire il cioccolato alla vaniglia dovrebbero diminuire di 0,039 unità, mantenendo costanti tutte le altre variabili del modello.
femmina – Questa è la stima logit multinomiale che confronta le femmine con i maschi per il cioccolato rispetto alla vaniglia, dato che le altre variabili del modello sono costanti. Il logit multinomiale per le femmine rispetto ai maschi è di 0,817 unità più alto per preferire il cioccolato alla vaniglia, dato che tutte le altre variabili predittive nel modello sono tenute costanti. In altre parole, le femmine hanno più probabilità dei maschi di preferire il cioccolato alla vaniglia.
_cons – Questa è la stima del logit multinomiale per il cioccolato rispetto alla vaniglia quando le variabili predittrici nel modello sono valutate a zero. Per i maschi (la variabile femminile valutata a zero) con zero punteggi video e puzzle, il logit per preferire il cioccolato alla vaniglia è 1,912. Si noti che valutare il video e il puzzle a zero è fuori dalla gamma di punteggi plausibili. Se i punteggi fossero centrati sulla media, l’intercetta avrebbe un’interpretazione naturale: probabilità logiche di preferire il cioccolato alla vaniglia per un maschio con punteggi medi di video e puzzle.
fragola rispetto alla vaniglia
video – Questa è la stima logit multinomiale per un aumento di una unità nel punteggio video per la fragola rispetto alla vaniglia, date le altre variabili nel modello sono tenute costanti. Se un soggetto dovesse aumentare il suo punteggio video di un punto, le probabilità logiche multinomiali di preferire la fragola alla vaniglia dovrebbero aumentare di 0,023 unità mantenendo costanti tutte le altre variabili del modello.
puzzle – Questa è la stima logit multinomiale per un aumento di una unità nel punteggio puzzle per la fragola rispetto alla vaniglia, dato che le altre variabili del modello sono tenute costanti. Se un soggetto dovesse aumentare il suo punteggio di un punto nel puzzle, le probabilità logiche multinomiali per preferire la fragola alla vaniglia dovrebbero aumentare di 0,043 unità mantenendo costanti tutte le altre variabili nel modello.
femmina – Questa è la stima logit multinomiale che confronta le femmine ai maschi per la fragola rispetto alla vaniglia, dato che le altre variabili nel modello sono tenute costanti. Il logit multinomiale per le femmine rispetto ai maschi è 0,033 unità più basso per preferire la fragola alla vaniglia, dato che tutte le altre variabili predittive nel modello sono tenute costanti. In altre parole, i maschi hanno più probabilità delle femmine di preferire il gelato alla fragola a quello alla vaniglia.
_cons – Questa è la stima del logit multinomiale per la fragola rispetto alla vaniglia quando le variabili predittrici nel modello sono valutate a zero. Per i maschi (la variabile femminile valutata a zero) con zero punteggi video e puzzle, il logit per preferire la fragola alla vaniglia è -4,057.
j. Std. Err. – Questi sono gli errori standard dei singoli coefficienti di regressione per i due rispettivi modelli stimati. Sono usati sia nel calcolo della statistica di prova z, apice k, che nell’intervallo di confidenza del coefficiente di regressione, apice l.
k. z e P>|z| – La statistica di prova z è il rapporto tra il Coef. e l’Errore Standard del rispettivo predittore, e il p-value P>|z| è la probabilità che la statistica di prova z (o una statistica di prova più estrema) sarebbe osservata sotto l’ipotesi nulla. Per un dato livello alfa, z e P>|z| determinano se l’ipotesi nulla che il coefficiente di regressione di un particolare predittore sia zero, dato che il resto dei predittori sono nel modello, può essere rifiutata o meno. Se P>|z|è minore di alfa, allora l’ipotesi nulla può essere rifiutata e la stima del parametro è considerata significativa a quel livello alfa. Il valore z segue una distribuzione normale standard che è usata per testare contro un’ipotesi alternativa bilaterale che la Coef. non sia uguale a zero. Nella regressione logistica multinomiale, l’interpretazione della significatività della stima di un parametro è limitata al modello in cui la stima del parametro è stata calcolata. Per esempio, la significatività della stima di un parametro nel modello cioccolato rispetto a quello vaniglia non può essere assunta nel modello fragola rispetto a quello vaniglia.
cioccolato rispetto alla vaniglia
Per il cioccolato rispetto alla vaniglia, la statistica del test z per il video predittore (-0,024/0,021) è -1,12 con un valore p associato di 0,261. Se impostiamo il nostro livello alfa a 0,05, non riusciremmo a rifiutare l’ipotesi nulla e concluderemmo che per il cioccolato rispetto alla vaniglia, il coefficiente di regressione per il video non è stato trovato statisticamente diverso da zero dato che puzzle e femminile sono nel modello.
Per il cioccolato rispetto alla vaniglia, la statistica del test z per il predittore puzzle (-0,039/0,020) è -1,99 con un valore p associato di 0,046. Se impostiamo nuovamente il nostro livello alfa a 0,05, rifiutiamo l’ipotesi nulla e concludiamo che il coefficiente di regressione per il puzzle è stato trovato statisticamente diverso da zero per il cioccolato rispetto alla vaniglia, dato che il video e la femmina sono nel modello.
Per il cioccolato rispetto alla vaniglia, la statistica del test z per il predittore femminile (0,817/0,391) è 2,09 con un p-value associato di 0,037. Se impostiamo nuovamente il nostro livello alfa a 0,05, rifiuteremo l’ipotesi nulla e concluderemo che la differenza tra maschi e femmine è stata trovata statisticamente diversa per il cioccolato rispetto alla vaniglia, dato chevideo e femmina sono nel modello.
Per il cioccolato rispetto alla vaniglia, la statistica del test z per l’intercetta, _cons (1,912/1,127) è 1,70 con un p-value associato di 0,090. Con un livello alfa di 0,05, non riusciremmo a rifiutare l’ipotesi nulla e concluderemmo che a) il logit multinomiale per i maschi (la variabile femminile valutata a zero) e con zero punteggi video e puzzle in cioccolato rispetto a vaniglia si trova a non essere statisticamente diverso da zero; oppure b) per i maschi con zero punteggi video e puzzle, si è statisticamente incerti se sono più propensi a essere classificati come preferenti cioccolato o vaniglia. Possiamo fare la seconda interpretazione quando consideriamo le _cons come uno specifico profilo di covariate (maschi con zero punteggi video e puzzle). In base alla direzione e alla significatività del coefficiente, il _cons indica se il profilo avrebbe una maggiore propensione ad essere classificato in un livello della variabile di risultato rispetto all’altro livello.
fragola rispetto a vaniglia
Per la fragola rispetto alla vaniglia, la statistica del test z per il video predittore (0,023/0,021) è 1,10 con un valore p associato di 0,272. Se impostiamo il nostro livello alfa a 0,05, non riusciremmo a rifiutare l’ipotesi nulla e concluderemmo che per la fragola rispetto alla vaniglia, il coefficiente di regressione per il video non è stato trovato statisticamente diverso da zero dato che puzzle e femminile sono nel modello.
Per la fragola rispetto alla vaniglia, la statistica del test z per il predittore puzzle (0,043/0,020) è 2,16 con un valore p associato di 0,031. Se impostiamo di nuovo il nostro livello alfa a 0,05, rifiutiamo l’ipotesi nulla e concludiamo che il coefficiente di regressione per il puzzle è stato trovato statisticamente diverso da zero per la fragola rispetto alla vaniglia dato che il video e la femmina sono nel modello.
Per la fragola rispetto alla vaniglia, la statistica del test z per il predittore femmina (-0,033/0,350) è -0,09 con un valore p associato di 0,925. Se impostiamo di nuovo il nostro livello alfa a 0,05, non riusciremmo a rifiutare l’ipotesi nulla e concluderemmo che per la fragola rispetto alla vaniglia, il coefficiente di regressione per la femmina non è stato trovato statisticamente diverso da zero dato che puzzle e video sono nel modello.
Per la fragola rispetto alla vaniglia, la statistica del test z per l’intercetta, _cons (-4,057/1,223) è -3,32 con un p-value associato di 0,001. Con un livello alfa di 0,05, rifiuteremmo l’ipotesi nulla e concluderemmo che a) il logit multinomiale per i maschi (la variabile femminile valutata a zero) e con zero punteggi video e puzzle in fragola rispetto a vaniglia sono statisticamente diversi da zero; o b) per i maschi con zero punteggi video e puzzle, c’è una differenza statisticamente significativa tra la probabilità di essere classificati come preferenti la fragola o preferenti la vaniglia. Un tale maschio avrebbe più probabilità di essere classificato come preferente la vaniglia alla fragola. Possiamo fare la seconda interpretazione quando vediamo le _cons come un profilo specifico di covariate (maschi con zero punteggi video e puzzle). In base alla direzione e alla significatività del coefficiente, il _cons indica se il profilo avrebbe una maggiore propensione ad essere classificato in un livello della variabile di risultato rispetto all’altro livello.
l. – Questo è l’intervallo di confidenza (CI) per un coefficiente di regressione logit multinomiale individuale dato che gli altri predittori sono nel modello per il risultato m rispetto al gruppo di riferimento. Per un dato predittore con un livello di confidenza del 95%, diremo che siamo sicuri al 95% che il “vero” coefficiente di regressione logit multinomiale della popolazione si trova tra il limite inferiore e superiore dell’intervallo per l’esito m rispetto al gruppo di riferimento. Si calcola come Coef. (zα/2)*(Std.Err.), dove zα/2 è un valore critico sulla distribuzione normale standard. L’IC è equivalente alla statistica del test z: se l’IC include zero, non riusciremmo a rifiutare l’ipotesi nulla che un particolare coefficiente di regressione sia zero dato che gli altri predittori sono nel modello. Un vantaggio di un CI è che è illustrativo; fornisce un intervallo in cui il “vero” parametro può trovarsi.
Interpretazione del rapporto di rischio relativo
Quella che segue è l’interpretazione della regressione logistica multinomiale in termini di rapporto di rischio relativo e può essere ottenuta da mlogit, rrr dopo aver eseguito il modello logit multinomiale o specificando l’opzione rrr quando viene specificato il modello completo. Questa parte dell’interpretazione si applica all’output sottostante.
mlogit ice_cream video puzzle female, rrr
Iteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485Multinomial logistic regression Number of obs = 200 LR chi2(6) = 33.10 Prob > chi2 = 0.0000Log likelihood = -194.03485 Pseudo R2 = 0.0786------------------------------------------------------------------------------ ice_cream | RRRa Std. Err. z P>|z| b-------------+----------------------------------------------------------------chocolate | video | .9767108 .0204862 -1.12 0.261 .9373726 1.0177 puzzle | .9618236 .0187714 -1.99 0.046 .925727 .9993276 female | 2.262839 .8847276 2.09 0.037 1.051598 4.869199-------------+----------------------------------------------------------------strawberry | video | 1.023187 .0213558 1.10 0.272 .9821747 1.065911 puzzle | 1.043942 .0207633 2.16 0.031 1.004029 1.085441 female | .9676721 .3387 -0.09 0.925 .4872981 1.921595------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)
a. Rapporto di rischio relativo – Questi sono i rapporti di rischio relativo per il modello logit multinomiale mostrato prima. Possono essere ottenuti esponenziando i coefficienti logit multinomiali, ecoef, o specificando l’opzione rrr quando viene emesso il comando mlogit. Ricordiamo che il modello logit multinomiale stima k-1 modelli, dove la kesima equazione è relativa al gruppo di riferimento. L’RRR di un coefficiente indica come il rischio che il risultato cada nel gruppo di confronto rispetto al rischio che il risultato cada nel gruppo di riferimento cambia con la variabile in questione. Un RRR > 1 indica che il rischio che il risultato cada nel gruppo di confronto rispetto al rischio che il risultato cada nel gruppo di riferimento aumenta all’aumentare della variabile. In altre parole, l’esito del confronto è più probabile. Un RRR < 1 indica che il rischio che l’esito cada nel gruppo di confronto rispetto al rischio che l’esito cada nel gruppo di riferimento diminuisce all’aumentare della variabile. Vedere le interpretazioni dei rapporti di rischio relativo qui sotto per degli esempi. In generale, se il RRR < 1, il risultato è più probabile che sia nel gruppo di riferimento.
cioccolato rispetto alla vaniglia
video – Questo è il rapporto di rischio relativo per un aumento di una unità del punteggio video per preferire il cioccolato alla vaniglia, dato che le altre variabili nel modello sono tenute costanti. Se un soggetto aumentasse il suo punteggio video di una unità, il rischio relativo di preferire il cioccolato alla vaniglia dovrebbe diminuire di un fattore pari a 0,977, dato che le altre variabili del modello sono mantenute costanti. Quindi, dato un aumento di una unità nel video, il rischio relativo di essere nel gruppo del cioccolato sarebbe 0,977 volte più probabile quando le altre variabili del modello sono tenute costanti. Più in generale, possiamo dire che se un soggetto aumentasse il suo punteggio video, ci aspetteremmo che abbia più probabilità di preferire il gelato alla vaniglia a quello al cioccolato.
puzzle – Questo è il rapporto di rischio relativo per un aumento di una unità nel punteggio del puzzle per preferire il cioccolato alla vaniglia, dato che le altre variabili del modello sono tenute costanti. Se un soggetto aumentasse di un’unità il suo punteggio nel puzzle, il rischio relativo di preferire il cioccolato alla vaniglia dovrebbe diminuire di un fattore pari a 0,962, dato che le altre variabili del modello sono mantenute costanti. Più in generale, possiamo dire che se due soggetti hanno punteggi video identici e sono entrambi di sesso femminile (o entrambi di sesso maschile), il soggetto con il punteggio più alto ha maggiori probabilità di preferire il gelato alla vaniglia a quello al cioccolato rispetto al soggetto con il punteggio più basso.
femmina – Questo è il rapporto di rischio relativo che confronta le femmine con i maschi nel preferire il cioccolato alla vaniglia, dato che le altre variabili del modello sono tenute costanti. Per le femmine rispetto ai maschi, il rischio relativo di preferire il cioccolato rispetto alla vaniglia dovrebbe aumentare di un fattore di 2,263, dato che le altre variabili del modello sono mantenute costanti. In altre parole, le donne hanno più probabilità degli uomini di preferire il gelato al cioccolato rispetto a quello alla vaniglia.
fragola rispetto alla vaniglia
video – Questo è il rapporto di rischio relativo per un aumento di una unità del punteggio video per preferire la fragola alla vaniglia, dato che le altre variabili del modello sono tenute costanti. Se un soggetto dovesse aumentare il suo punteggio video di una unità, il rischio relativo per la fragola rispetto alla vaniglia dovrebbe aumentare di un fattore di 1,023, dato che le altre variabili del modello sono tenute costanti. Più in generale, possiamo dire che se un soggetto aumentasse il suo punteggio video, ci aspetteremmo che abbia più probabilità di preferire il gelato alla fragola rispetto a quello alla vaniglia.
puzzle – Questo è il rapporto di rischio relativo per un aumento di una unità nel punteggio del puzzle per preferire la fragola alla vaniglia, dato che le altre variabili del modello sono tenute costanti. Se un soggetto dovesse aumentare il suo punteggio di un puzzle di una unità, il rischio relativo per la fragola rispetto alla vaniglia dovrebbe aumentare di un fattore di 1,043, dato che le altre variabili del modello sono tenute costanti. Più in generale, possiamo dire che se due soggetti hanno punteggi video identici e sono entrambi di sesso femminile (o entrambi di sesso maschile), il soggetto con il punteggio puzzle più alto ha più probabilità di preferire il gelato alla fragola a quello alla vaniglia rispetto al soggetto con il punteggio puzzle più basso.
femmina – Questo è il rapporto di rischio relativo che confronta le femmine con i maschi per la fragola rispetto alla vaniglia, dato che le altre variabili del modello sono tenute costanti. Per le femmine rispetto ai maschi, il rischio relativo di preferire la fragola alla vaniglia dovrebbe diminuire di un fattore pari a 0,968, dato che le altre variabili del modello sono costanti. In altre parole, le femmine hanno meno probabilità dei maschi di preferire il gelato alla fragola a quello alla vaniglia.
b. – Questo è il CI per il rapporto di rischio relativo dato che gli altri predittori sono nel modello. Per un dato predittore con un livello di confidenza del 95%, diremo che siamo sicuri al 95% che il “vero” rapporto di rischio relativo della popolazione che confronta il risultato m con il gruppo di riferimento si trova tra il limite inferiore e superiore dell’intervallo. Un vantaggio di un CI è che è illustrativo; fornisce un intervallo in cui il “vero” rapporto di rischio relativo può trovarsi.
Lascia un commento