Regresión Logística Multinomial | Salida Anotada de Stata
On enero 28, 2022 by adminEsta página muestra un ejemplo de un análisis de regresión logística multinomial con notas a pie de página que explican la salida. Los datos se recogieron en 200 estudiantes de secundaria y son las puntuaciones en varias pruebas, incluyendo un videojuego y un rompecabezas. La medida de resultado en este análisis es el sabor de helado preferido -vainilla, chocolate o fresa- del que vamos a ver qué relación existe con las puntuaciones en el videojuego (vídeo), el puzzle (rompecabezas) y el género (femenino). Nuestra variable de respuesta, helado, va a ser tratada como categórica bajo el supuesto de que los niveles de helado no tienen un orden natural, y vamos a permitir que Stata elija el grupo de referencia. En nuestro ejemplo, será la vainilla. Por defecto, Stata elige el grupo más frecuente como grupo de referencia. La primera mitad de esta página interpreta los coeficientes en términos de logaritmos multinomiales (logits). Éstos serán cercanos, pero no iguales, a los log-odds obtenidos en una regresión logística con dos niveles de la variable de resultado. La segunda mitad interpreta los coeficientes en términos de ratios de riesgo relativo.
use https://stats.idre.ucla.edu/stat/stata/output/mlogit, clear
Antes de ejecutar la regresión, la obtención de una frecuencia de los sabores de helado en los datos puede informar la selección de un grupo de referencia.
tab ice_cream favorite flavor of ice cream | Freq. Percent Cum. ------------+----------------------------------- chocolate | 47 23.50 23.50 vanilla | 95 47.50 71.00 strawberry | 58 29.00 100.00 ------------+----------------------------------- Total | 200 100.00
La vainilla es el sabor de helado más frecuente y será el grupo de referencia en este ejemplo.
mlogit ice_cream video puzzle femaleIteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485Multinomial logistic regression Number of obs = 200 LR chi2(6) = 33.10 Prob > chi2 = 0.0000Log likelihood = -194.03485 Pseudo R2 = 0.0786------------------------------------------------------------------------------ ice_cream | Coef. Std. Err. z P>|z| -------------+----------------------------------------------------------------chocolate | video | -.0235647 .0209747 -1.12 0.261 -.0646744 .017545 puzzle | -.0389243 .0195165 -1.99 0.046 -.0771759 -.0006726 female | .8166202 .3909813 2.09 0.037 .050311 1.582929 _cons | 1.912256 1.127256 1.70 0.090 -.2971258 4.121638-------------+----------------------------------------------------------------strawberry | video | .022922 .0208718 1.10 0.272 -.0179861 .0638301 puzzle | .0430036 .0198894 2.16 0.031 .0040211 .081986 female | -.032862 .3500153 -0.09 0.925 -.7188793 .6531553 _cons | -4.057323 1.222939 -3.32 0.001 -6.45424 -1.660407------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)
Iteration Loga
Iteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485
a. Registro de la iteración – Este es un listado de las probabilidades logarítmicas en cada iteración. Recuerde que la regresión logística multinomial, al igual que la binaria y la ordenada, utiliza la estimación de máxima verosimilitud, que es un procedimiento iterativo. La primera iteración (llamada iteración 0) es la probabilidad logarítmica del modelo «nulo» o «vacío»; es decir, un modelo sin predictores. En la siguiente iteración, se incluyen los predictores en el modelo. En cada iteración, la probabilidad logarítmica aumenta porque el objetivo es maximizar la probabilidad logarítmica. Cuando la diferencia entre las sucesivas iteraciones es muy pequeña, se dice que el modelo ha «convergido», se detiene la iteración y se muestran los resultados. Para más información sobre este proceso para resultados binarios, véase Modelos de regresión para variables dependientes categóricas y limitadas de J. Scott Long (página 52-61).
Resumen del modelo
Multinomial logistic regression Number of obsc = 200 LR chi2(6)d = 33.10 Prob > chi2e = 0.0000Log likelihood = -194.03485b Pseudo R2f = 0.0786
b. Log Likelihood – Es la probabilidad logarítmica del modelo ajustado. Se utiliza en la prueba de Chi-cuadrado de la relación de verosimilitud para determinar si todos los coeficientes de regresión de los predictores en el modelo son simultáneamente cero y en las pruebas de modelos anidados.
c. Número de obs – Es el número de observaciones utilizadas en la regresión logística multinomial. Puede ser menor que el número de casos en el conjunto de datos si hay valores perdidos para algunas variables en la ecuación. Por defecto, Stata realiza un borrado en lista de los casos incompletos.
d. LR chi2(6) – Esta es la prueba de la razón de verosimilitud (LR) chi-cuadrado de que para ambas ecuaciones (chocolate en relación con la vainilla y fresa en relación con la vainilla) que al menos uno de los coeficientes de regresión de los predictores no es igual a cero. El número entre paréntesis indica los grados de libertad de la distribución Chi-Cuadrado utilizada para probar el estadístico LR Chi-Cuadrado y se define por el número de modelos estimados (2) por el número de predictores en el modelo (3). El estadístico LR Chi-Cuadrado puede calcularse mediante -2*( L(modelo nulo) – L(modelo ajustado)) = -2*((-210.583) – (-194.035)) = 33.096, donde L(modelo nulo) es el logaritmo de probabilidad con sólo la variable de respuesta en el modelo (Iteración 0) y L(modelo ajustado) es el logaritmo de probabilidad de la iteración final (suponiendo que el modelo convergió) con todos los parámetros.
e. Prob > chi2 – Esta es la probabilidad de obtener una estadística de prueba LR tan extrema como, o más, que la estadística observada bajo la hipótesis nula; la hipótesis nula es que todos los coeficientes de regresión a través de ambos modelos son simultáneamente iguales a cero. En otras palabras, es la probabilidad de obtener este estadístico chi-cuadrado (33,10) o uno más extremo si de hecho no hay efecto de las variables predictoras. Este valor p se compara con un nivel alfa específico, nuestra disposición a aceptar un error de tipo I, que suele fijarse en 0,05 o 0,01. El pequeño valor p de la prueba LR, <0,00001, nos llevaría a concluir que al menos uno de los coeficientes de regresión del modelo no es igual a cero. El parámetro de la distribución chi-cuadrado utilizado para probar la hipótesis nula se define por los grados de libertad en la línea anterior, chi2(6).
f. Pseudo R2 – Se trata del pseudo R-cuadrado de McFadden. La regresión logística no tiene un equivalente al R-cuadrado que se encuentra en la regresión OLS; sin embargo, muchas personas han tratado de idear uno. Hay una gran variedad de estadísticas de pseudo R-cuadrado. Debido a que esta estadística no significa lo que R-cuadrado significa en la regresión OLS (la proporción de la varianza de la variable de respuesta explicada por los predictores), sugerimos interpretar esta estadística con gran precaución.
Estimaciones de parámetros
------------------------------------------------------------------------------ ice_creamg | Coef.h Std. Err.j zk P>|z|k l-------------+----------------------------------------------------------------chocolate | video | -.0235647 .0209747 -1.12 0.261 -.0646744 .017545 puzzle | -.0389243 .0195165 -1.99 0.046 -.0771759 -.0006726 female | .8166202 .3909813 2.09 0.037 .050311 1.582929 _cons | 1.912256 1.127256 1.70 0.090 -.2971258 4.121638-------------+----------------------------------------------------------------strawberry | video | .022922 .0208718 1.10 0.272 -.0179861 .0638301 puzzle | .0430036 .0198894 2.16 0.031 .0040211 .081986 female | -.032862 .3500153 -0.09 0.925 -.7188793 .6531553 _cons | -4.057323 1.222939 -3.32 0.001 -6.45424 -1.660407------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)i
g. helado – Esta es la variable de respuesta en la regresión logística multinomial. Debajo de helado hay dos réplicas de las variables predictoras, que representan los dos modelos que se estiman: chocolate en relación con la vainilla y fresa en relación con la vainilla.
h e i. Coef. y grupo de referencia – Son los coeficientes estimados de la regresión logística multinomial y el nivel de referencia, respectivamente, para el modelo. Una característica importante del modelo logit multinomial es que estima k-1 modelos, donde k es el número de niveles de la variable de resultado. En este caso, Stata, por defecto, estableció la vainilla como el grupo de referencia, y por lo tanto estimó un modelo para el chocolate en relación con la vainilla y un modelo para la fresa en relación con la vainilla. Dado que las estimaciones de los parámetros son relativas al grupo de referencia, la interpretación estándar del logit multinomial es que para un cambio de unidad en la variable de predicción, se espera que el logit del resultado m relativo al grupo de referencia cambie por su respectiva estimación del parámetro (que está en unidades log-odds) dado que las variables en el modelo se mantienen constantes.
chocolate en relación con la vainilla
vídeo – Esta es la estimación logit multinomial para un aumento de una unidad en la puntuación de vídeo para el chocolate en relación con la vainilla, dado que las otras variables en el modelo se mantienen constantes. Si un sujeto aumentara su puntuación de vídeo en un punto, se esperaría que las probabilidades logarítmicas multinomiales de preferir el chocolate a la vainilla disminuyeran en 0,024 unidades, manteniendo constantes todas las demás variables del modelo.
rompecabezas – Esta es la estimación logarítmica multinomial para un aumento de una unidad en la puntuación de rompecabezas para el chocolate en relación con la vainilla, dado que las demás variables del modelo se mantienen constantes. Si un sujeto aumentara su puntuación de rompecabezas en un punto, se esperaría que las probabilidades logarítmicas multinomiales de preferir el chocolate a la vainilla disminuyeran en 0,039 unidades, manteniendo constantes todas las demás variables del modelo.
mujer – Esta es la estimación logarítmica multinomial que compara a las mujeres con los hombres para el chocolate en relación con la vainilla, dado que las demás variables del modelo se mantienen constantes. El logit multinomial para las mujeres en relación con los hombres es 0,817 unidades más alto para preferir el chocolate a la vainilla, dado que todas las demás variables predictoras del modelo se mantienen constantes. En otras palabras, las mujeres son más propensas que los hombres a preferir el chocolate a la vainilla.
_cons – Esta es la estimación logit multinomial para el chocolate en relación con la vainilla cuando las variables predictoras en el modelo se evalúan en cero. Para los hombres (la variable femenina evaluada a cero) con puntuaciones de vídeo y rompecabezas nulas, el logit para preferir el chocolate a la vainilla es 1,912. Obsérvese que evaluar el vídeo y el puzzle a cero está fuera del rango de puntuaciones plausibles. Si las puntuaciones estuvieran centradas en la media, el intercepto tendría una interpretación natural: log de probabilidades de preferir el chocolate a la vainilla para un varón con puntuaciones medias de vídeo y rompecabezas.
fresa en relación con la vainilla
vídeo – Esta es la estimación logit multinomial para un aumento de una unidad en la puntuación de vídeo para la fresa en relación con la vainilla, dado que las otras variables en el modelo se mantienen constantes. Si un sujeto aumentara su puntuación de vídeo en un punto, se esperaría que las probabilidades logarítmicas multinomiales de preferir la fresa a la vainilla aumentaran en 0,023 unidades, manteniendo constantes todas las demás variables del modelo.
rompecabezas – Esta es la estimación logarítmica multinomial para un aumento de una unidad en la puntuación de rompecabezas para la fresa en relación con la vainilla, dado que las demás variables del modelo se mantienen constantes. Si un sujeto aumentara su puntuación de rompecabezas en un punto, se esperaría que las probabilidades logarítmicas multinomiales de preferir la fresa a la vainilla aumentaran en 0,043 unidades, manteniendo constantes todas las demás variables del modelo.
mujer – Esta es la estimación logarítmica multinomial que compara a las mujeres con los hombres para la fresa en relación con la vainilla, dado que las demás variables del modelo se mantienen constantes. El logit multinomial para las mujeres en relación con los hombres es 0,033 unidades inferior para preferir la fresa a la vainilla, dado que todas las demás variables predictoras del modelo se mantienen constantes. En otras palabras, los hombres tienen más probabilidades que las mujeres de preferir el helado de fresa al de vainilla.
_cons – Esta es la estimación logit multinomial para la fresa en relación con la vainilla cuando las variables predictoras del modelo se evalúan en cero. Para los hombres (la variable femenina evaluada a cero) con puntuaciones de vídeo y rompecabezas nulas, el logit para preferir la fresa a la vainilla es -4,057.
j. Err. estándar – Son los errores estándar de los coeficientes de regresión individuales para los dos modelos respectivos estimados. Se utilizan tanto en el cálculo del estadístico de prueba z, superíndice k, como en el intervalo de confianza del coeficiente de regresión, superíndice l.
k. z y P>|z| – El estadístico de prueba z es la relación entre el Coef. y el Err. Std. del respectivo predictor, y el valor p P>|z| es la probabilidad de que el estadístico de prueba z (o un estadístico de prueba más extremo) se observe bajo la hipótesis nula. Para un nivel alfa dado, z y P>|z| determinan si se puede rechazar la hipótesis nula de que el coeficiente de regresión de un predictor particular es cero, dado que el resto de los predictores están en el modelo. Si P>|z|es menor que alfa, entonces se puede rechazar la hipótesis nula y la estimación del parámetro se considera significativa a ese nivel de alfa. El valor z sigue una distribución normal estándar que se utiliza para contrastar una hipótesis alternativa de dos caras de que el Coef. no es igual a cero. En la regresión logística multinomial, la interpretación de la significación de la estimación de un parámetro se limita al modelo en el que se calculó la estimación del parámetro. Por ejemplo, la significación de la estimación de un parámetro en el modelo de chocolate en relación con el de vainilla no puede asumirse como válida en el modelo de fresa en relación con el de vainilla.
chocolate en relación con la vainilla
Para el chocolate en relación con la vainilla, la estadística de la prueba z para el vídeo predictor (-0,024/0,021) es -1,12 con un valor p asociado de 0,261. Si fijamos nuestro nivel alfa en 0,05, no podremos rechazar la hipótesis nula y concluiremos que, para el chocolate en relación con la vainilla, el coeficiente de regresión del vídeo no es estadísticamente diferente de cero, dado que el rompecabezas y la mujer están en el modelo.
Para el chocolate en relación con la vainilla, la estadística de la prueba z para el predictor rompecabezas (-0,039/0,020) es -1,99 con un valor p asociado de 0,046. Si volvemos a fijar nuestro nivel alfa en 0,05, rechazaríamos la hipótesis nula y concluiríamos que el coeficiente de regresión para el rompecabezas es estadísticamente diferente de cero para el chocolate en relación con la vainilla, dado que el vídeo y la mujer están en el modelo.
Para el chocolate en relación con la vainilla, la estadística de la prueba z para el predictor mujer (0,817/0,391) es 2,09 con un valor p asociado de 0,037. Si volvemos a fijar nuestro nivel alfa en 0,05, rechazaríamos la hipótesis nula y concluiríamos que la diferencia entre hombres y mujeres ha resultado ser estadísticamente diferente para el chocolate en relación con la vainilla, dado que el vídeo y la mujer están en el modelo.
Para el chocolate en relación con la vainilla, la estadística de la prueba z para el intercepto, _cons (1,912/1,127) es 1,70 con un valor p asociado de 0,090. Con un nivel alfa de 0,05, no podríamos rechazar la hipótesis nula y concluiríamos que a) el logit multinomial para los hombres (la variable mujer evaluada en cero) y con puntuaciones nulas en el vídeo y el puzzle en el chocolate con respecto a la vainilla no es estadísticamente diferente de cero; o b) para los hombres con puntuaciones nulas en el vídeo y el puzzle, no se sabe estadísticamente si es más probable que se clasifiquen como que prefieren el chocolate o la vainilla. Podemos hacer la segunda interpretación cuando vemos los _cons como un perfil de covariable específico (varones con puntuaciones cero en vídeo y puzzle). Según la dirección y la significación del coeficiente, el _cons indica si el perfil tendría una mayor propensión a ser clasificado en un nivel de la variable de resultado que en el otro.
fresa en relación con la vainilla
Para la fresa en relación con la vainilla, la estadística de la prueba z para el vídeo predictor (0,023/0,021) es 1,10 con un valor p asociado de 0,272. Si fijamos nuestro nivel alfa en 0,05, no podremos rechazar la hipótesis nula y concluiremos que, para la fresa en relación con la vainilla, el coeficiente de regresión del vídeo no es estadísticamente diferente de cero, dado que el rompecabezas y la mujer están en el modelo.
Para la fresa en relación con la vainilla, la estadística de la prueba z para el predictor puzzle (0,043/0,020) es 2,16 con un valor p asociado de 0,031. Si volvemos a fijar nuestro nivel alfa en 0,05, rechazaríamos la hipótesis nula y concluiríamos que el coeficiente de regresión para el rompecabezas es estadísticamente diferente de cero para la fresa en relación con la vainilla, dado que el vídeo y la mujer están en el modelo.
Para la fresa en relación con la vainilla, el estadístico de prueba z para el predictor mujer (-0,033/0,350) es -0,09 con un valor p asociado de 0,925. Si volvemos a fijar nuestro nivel alfa en 0,05, no podremos rechazar la hipótesis nula y concluiremos que, para la fresa en relación con la vainilla, el coeficiente de regresión para la mujer no es estadísticamente diferente de cero, dado que el rompecabezas y el vídeo están en el modelo.
Para la fresa en relación con la vainilla, la estadística de la prueba z para el intercepto, _cons (-4,057/1,223) es -3,32 con un valor p asociado de 0,001. Con un nivel alfa de 0,05, rechazaríamos la hipótesis nula y concluiríamos que a) el logit multinomial para los varones (la variable mujer evaluada en cero) y con puntuaciones nulas en vídeo y puzzle en fresa respecto a vainilla son estadísticamente diferentes de cero; o b) para los varones con puntuaciones nulas en vídeo y puzzle, existe una diferencia estadísticamente significativa entre la probabilidad de ser clasificado como que prefiere la fresa o que prefiere la vainilla. Un hombre así tendría más probabilidades de ser clasificado como que prefiere la vainilla que la fresa. Podemos hacer la segunda interpretación cuando vemos los _cons como un perfil de covariable específico (varones con puntuaciones nulas en el vídeo y en el puzzle). Según la dirección y la significación del coeficiente, el _cons indica si el perfil tendría una mayor propensión a ser clasificado en un nivel de la variable de resultado que en el otro.
l. – Se trata del intervalo de confianza (IC) para un coeficiente de regresión logit multinomial individual dado que los otros predictores están en el modelo para el resultado m en relación con el grupo de referencia. Para un predictor dado con un nivel de confianza del 95%, diríamos que tenemos un 95% de confianza en que el «verdadero» coeficiente de regresión logit multinomial de la población se encuentra entre el límite inferior y superior del intervalo para el resultado m en relación con el grupo de referencia. Se calcula como el Coef. (zα/2)*(Std.Err.), donde zα/2 es un valor crítico en la distribución normal estándar. El IC es equivalente al estadístico de la prueba z: si el IC incluye cero, no podríamos rechazar la hipótesis nula de que un coeficiente de regresión concreto es cero dado que los demás predictores están en el modelo. Una ventaja de un IC es que es ilustrativo; proporciona un rango en el que puede estar el parámetro «verdadero».
Interpretación de la razón de riesgo relativa
La siguiente es la interpretación de la regresión logística multinomial en términos de razones de riesgo relativas y puede obtenerse mediante mlogit, rrr después de ejecutar el modelo logit multinomial o especificando la opción rrr cuando se especifica el modelo completo. Esta parte de la interpretación se aplica a la salida siguiente.
mlogit ice_cream video puzzle female, rrr
Iteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485Multinomial logistic regression Number of obs = 200 LR chi2(6) = 33.10 Prob > chi2 = 0.0000Log likelihood = -194.03485 Pseudo R2 = 0.0786------------------------------------------------------------------------------ ice_cream | RRRa Std. Err. z P>|z| b-------------+----------------------------------------------------------------chocolate | video | .9767108 .0204862 -1.12 0.261 .9373726 1.0177 puzzle | .9618236 .0187714 -1.99 0.046 .925727 .9993276 female | 2.262839 .8847276 2.09 0.037 1.051598 4.869199-------------+----------------------------------------------------------------strawberry | video | 1.023187 .0213558 1.10 0.272 .9821747 1.065911 puzzle | 1.043942 .0207633 2.16 0.031 1.004029 1.085441 female | .9676721 .3387 -0.09 0.925 .4872981 1.921595------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)
a. Razón de riesgo relativo – Estas son las razones de riesgo relativo para el modelo logit multinomial mostrado anteriormente. Pueden obtenerse exponenciando los coeficientes logit multinomiales, ecoef, o especificando la opción rrr cuando se emite el comando mlogit. Recordemos que el modelo logit multinomial estima k-1 modelos, donde la kª ecuación es relativa al grupo de referencia. La RRR de un coeficiente indica cómo el riesgo del resultado que cae en el grupo de comparación comparado con el riesgo del resultado que cae en el grupo de referencia cambia con la variable en cuestión. Un RRR > 1 indica que el riesgo del resultado que cae en el grupo de comparación en relación con el riesgo del resultado que cae en el grupo de referencia aumenta a medida que la variable aumenta. En otras palabras, el resultado de la comparación es más probable. Un RRR < 1 indica que el riesgo de que el resultado caiga en el grupo de comparación en relación con el riesgo de que el resultado caiga en el grupo de referencia disminuye a medida que la variable aumenta. Consulte las interpretaciones de los cocientes de riesgos relativos más adelante para ver ejemplos. En general, si el RRR < 1, es más probable que el resultado se encuentre en el grupo de referencia.
chocolate en relación con la vainilla
vídeo – Este es el ratio de riesgo relativo para un aumento de una unidad en la puntuación de vídeo para preferir el chocolate a la vainilla, dado que las otras variables en el modelo se mantienen constantes. Si un sujeto aumenta su puntuación de vídeo en una unidad, se espera que el riesgo relativo de preferir el chocolate a la vainilla disminuya en un factor de 0,977, dado que las demás variables del modelo se mantienen constantes. Así, dado un aumento de una unidad en el vídeo, el riesgo relativo de estar en el grupo del chocolate sería 0,977 veces más probable cuando las otras variables del modelo se mantienen constantes. De forma más general, podemos decir que si un sujeto aumentara su puntuación de vídeo, esperaríamos que fuera más probable que prefiriera el helado de vainilla sobre el de chocolate.
rompecabezas – Este es el ratio de riesgo relativo para un aumento de una unidad en la puntuación de rompecabezas para preferir el chocolate a la vainilla, dado que las otras variables en el modelo se mantienen constantes. Si un sujeto aumenta su puntuación en el puzzle en una unidad, se espera que el riesgo relativo de preferir el chocolate a la vainilla disminuya en un factor de 0,962, dado que las otras variables del modelo se mantienen constantes. En términos más generales, podemos decir que si dos sujetos tienen idénticas puntuaciones de vídeo y ambos son mujeres (o ambos son hombres), es más probable que el sujeto con la mayor puntuación de rompecabezas prefiera el helado de vainilla al de chocolate que el sujeto con la menor puntuación de rompecabezas.
mujer – Esta es la razón de riesgo relativa que compara a las mujeres con los hombres para preferir el chocolate a la vainilla, dado que las otras variables en el modelo se mantienen constantes. En el caso de las mujeres con respecto a los hombres, se espera que el riesgo relativo de preferir el chocolate con respecto a la vainilla aumente en un factor de 2,263, dado que las demás variables del modelo se mantienen constantes. En otras palabras, las mujeres son más propensas que los hombres a preferir el helado de chocolate sobre el de vainilla.
fresa en relación con la vainilla
vídeo – Este es el ratio de riesgo relativo para un aumento de una unidad en la puntuación de vídeo para preferir la fresa a la vainilla, dado que las otras variables en el modelo se mantienen constantes. Si un sujeto aumenta su puntuación de vídeo en una unidad, se espera que el riesgo relativo para la fresa en relación con la vainilla aumente en un factor de 1,023, dado que las otras variables del modelo se mantienen constantes. De forma más general, podemos decir que si un sujeto aumentara su puntuación en el vídeo, esperaríamos que fuera más probable que prefiriera el helado de fresa frente al de vainilla.
rompecabezas – Este es el ratio de riesgo relativo para un aumento de una unidad en la puntuación del rompecabezas para preferir la fresa a la vainilla, dado que las otras variables en el modelo se mantienen constantes. Si un sujeto aumenta su puntuación en el puzzle en una unidad, se espera que el riesgo relativo para la fresa en relación con la vainilla aumente en un factor de 1,043, dado que las otras variables del modelo se mantienen constantes. En términos más generales, podemos decir que si dos sujetos tienen puntuaciones de vídeo idénticas y ambos son mujeres (o ambos son hombres), es más probable que el sujeto con la puntuación de rompecabezas más alta prefiera el helado de fresa al de vainilla que el sujeto con la puntuación de rompecabezas más baja.
mujer – Esta es la razón de riesgo relativa que compara a las mujeres con los hombres para el helado de fresa en relación con el de vainilla, dado que las otras variables en el modelo se mantienen constantes. En el caso de las mujeres en relación con los hombres, se espera que el riesgo relativo de preferir la fresa a la vainilla disminuya en un factor de 0,968, dado que las demás variables del modelo se mantienen constantes. En otras palabras, las mujeres son menos propensas que los hombres a preferir el helado de fresa al de vainilla.
b. – Este es el IC para la razón de riesgo relativo dado que los otros predictores están en el modelo. Para un predictor dado con un nivel de confianza del 95%, diríamos que tenemos un 95% de confianza en que la «verdadera» razón de riesgo relativo de la población que compara el resultado m con el grupo de referencia se encuentra entre el límite inferior y superior del intervalo. Una ventaja de un IC es que es ilustrativo; proporciona un rango en el que puede estar la «verdadera» razón de riesgo relativo.
Deja una respuesta