Régression logistique multinomiale | Stata Sortie annotée
On janvier 28, 2022 by adminCette page montre un exemple d’analyse de régression logistique multinomiale avec des notes de bas de page expliquant la sortie. Les données ont été recueillies sur 200 lycéens et sont des scores à divers tests, y compris un jeu vidéo et un puzzle. Le critère de jugement dans cette analyse est le parfum de glace préféré – vanille, chocolat ou fraise – à partir duquel nous allons voir quelles relations existent avec les scores obtenus aux jeux vidéo (vidéo), aux puzzles (puzzle) et le sexe (féminin). Notre variable de réponse, crème glacée, va être traitée comme une variable catégorielle en supposant que les niveaux de crème glacée n’ont pas d’ordre naturel, et nous allons permettre à Stata de choisir le groupe référent. Dans notre exemple, ce sera vanille. Par défaut, Stata choisit le groupe le plus fréquent comme groupe référent. La première moitié de cette page interprète les coefficients en termes de log-odds multinomiaux (logits). Ceux-ci seront proches mais non égaux aux log-odds obtenus dans une régression logistique avec deux niveaux de la variable de résultat. La seconde moitié interprète les coefficients en termes de rapports de risque relatif.
use https://stats.idre.ucla.edu/stat/stata/output/mlogit, clear
Avant d’exécuter la régression, l’obtention d’une fréquence des parfums de crème glacée dans les données peut informer la sélection d’un groupe de référence.
tab ice_cream favorite flavor of ice cream | Freq. Percent Cum. ------------+----------------------------------- chocolate | 47 23.50 23.50 vanilla | 95 47.50 71.00 strawberry | 58 29.00 100.00 ------------+----------------------------------- Total | 200 100.00
La vanille est le parfum de crème glacée le plus fréquemment rencontré et sera le groupe de référence dans cet exemple.
mlogit ice_cream video puzzle femaleIteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485Multinomial logistic regression Number of obs = 200 LR chi2(6) = 33.10 Prob > chi2 = 0.0000Log likelihood = -194.03485 Pseudo R2 = 0.0786------------------------------------------------------------------------------ ice_cream | Coef. Std. Err. z P>|z| -------------+----------------------------------------------------------------chocolate | video | -.0235647 .0209747 -1.12 0.261 -.0646744 .017545 puzzle | -.0389243 .0195165 -1.99 0.046 -.0771759 -.0006726 female | .8166202 .3909813 2.09 0.037 .050311 1.582929 _cons | 1.912256 1.127256 1.70 0.090 -.2971258 4.121638-------------+----------------------------------------------------------------strawberry | video | .022922 .0208718 1.10 0.272 -.0179861 .0638301 puzzle | .0430036 .0198894 2.16 0.031 .0040211 .081986 female | -.032862 .3500153 -0.09 0.925 -.7188793 .6531553 _cons | -4.057323 1.222939 -3.32 0.001 -6.45424 -1.660407------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)
Iteration Loga
Iteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485
a. Journal des itérations – Il s’agit d’une liste des vraisemblances logarithmiques à chaque itération. Rappelez-vous que la régression logistique multinomiale, comme la régression logistique binaire et ordonnée, utilise l’estimation du maximum de vraisemblance, qui est une procédure itérative. La première itération (appelée itération 0) est la vraisemblance logarithmique du modèle » nul » ou » vide « , c’est-à-dire un modèle sans prédicteurs. À l’itération suivante, le ou les prédicteurs sont inclus dans le modèle. À chaque itération, la vraisemblance logarithmique augmente car l’objectif est de maximiser la vraisemblance logarithmique. Lorsque la différence entre les itérations successives est très faible, on dit que le modèle a « convergé », l’itération s’arrête et les résultats sont affichés. Pour plus d’informations sur ce processus pour les résultats binaires, voirRegression Models for Categorical and Limited Dependent Variables de J. Scott Long (page 52-61).
Sommaire du modèle
Multinomial logistic regression Number of obsc = 200 LR chi2(6)d = 33.10 Prob > chi2e = 0.0000Log likelihood = -194.03485b Pseudo R2f = 0.0786
b. Log Likelihood – Il s’agit de la logarithme de la vraisemblance du modèle ajusté. Elle est utilisée dans le test du chi carré du rapport de vraisemblance pour savoir si tous les coefficients de régression des prédicteurs dans le modèle sont simultanément nuls et dans les tests des modèles imbriqués.
c. Nombre d’obs – Il s’agit du nombre d’observations utilisées dans la régression logistique multinomiale. Il peut être inférieur au nombre de cas dans l’ensemble de données s’il y a des valeurs manquantes pour certaines variables de l’équation. Par défaut, Stata effectue une suppression par liste des cas incomplets.
d. LR chi2(6) – Il s’agit du test du chi carré du rapport de vraisemblance (LR) indiquant que pour les deux équations (chocolat par rapport à vanille et fraise par rapport à vanille) qu’au moins un coefficient de régression des prédicteurs n’est pas égal à zéro. Le nombre entre parenthèses indique les degrés de liberté de la distribution du chi-deux utilisée pour tester la statistique du chi-deux LR et est défini par le nombre de modèles estimés (2) multiplié par le nombre de prédicteurs dans le modèle (3). La statistique du chi carré LR peut être calculée par -2*( L(modèle nul) – L(modèle ajusté)) = -2*((-210,583) – (-194,035)) = 33,096, où L(modèle nul) provient de la vraisemblance logarithmique avec seulement la variable de réponse dans le modèle (itération 0) et L(modèle ajusté) est la vraisemblance logarithmique de l’itération finale (en supposant que le modèle a convergé) avec tous les paramètres.
e. Prob > chi2 – C’est la probabilité d’obtenir une statistique de test LR aussi extrême, ou plus, que la statistique observée sous l’hypothèse nulle ; l’hypothèse nulle est que tous les coefficients de régression à travers les deux modèles sont simultanément égaux à zéro. En d’autres termes, il s’agit de la probabilité d’obtenir cette statistique chi-deux (33,10) ou une statistique plus extrême s’il n’y a en fait aucun effet des variables prédicteurs. Cette valeur p est comparée à un niveau alpha spécifique, notre volonté d’accepter une erreur de type I, qui est généralement fixée à 0,05 ou 0,01. La faible valeur p du test LR, <0,00001, nous amènerait à conclure qu’au moins un des coefficients de régression du modèle n’est pas égal à zéro. Le paramètre de la distribution du chi-deux utilisé pour tester l’hypothèse nulle est défini par les degrés de liberté dans la ligne antérieure, chi2(6).
f. Pseudo R2 – Il s’agit du pseudo R-carré de McFadden. La régression logistique n’a pas d’équivalent au R-carré que l’on trouve dans la régression MCO ; cependant, de nombreuses personnes ont essayé d’en trouver un. Il existe une grande variété de statistiques de pseudo-R-carré. Parce que cette statistique ne signifie pas ce que le R-carré signifie dans la régression MCO (la proportion de la variance de la variable réponse expliquée par les prédicteurs), nous suggérons d’interpréter cette statistique avec beaucoup de prudence.
Estimations des paramètres
------------------------------------------------------------------------------ ice_creamg | Coef.h Std. Err.j zk P>|z|k l-------------+----------------------------------------------------------------chocolate | video | -.0235647 .0209747 -1.12 0.261 -.0646744 .017545 puzzle | -.0389243 .0195165 -1.99 0.046 -.0771759 -.0006726 female | .8166202 .3909813 2.09 0.037 .050311 1.582929 _cons | 1.912256 1.127256 1.70 0.090 -.2971258 4.121638-------------+----------------------------------------------------------------strawberry | video | .022922 .0208718 1.10 0.272 -.0179861 .0638301 puzzle | .0430036 .0198894 2.16 0.031 .0040211 .081986 female | -.032862 .3500153 -0.09 0.925 -.7188793 .6531553 _cons | -4.057323 1.222939 -3.32 0.001 -6.45424 -1.660407------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)i
g. ice_cream – Il s’agit de la variable réponse dans la régression logistique multinomiale. Sous ice_cream se trouvent deux répliques des variables prédicteurs, représentant les deux modèles estimés : chocolat par rapport à vanille et fraise par rapport à vanille.
h et i. Coef. et groupe référent – Ce sont les coefficients de régression logistique multinomiale estimés et le niveau référent, respectivement, pour le modèle. Une caractéristique importante du modèle logit multinomial est qu’il estime k-1 modèles, où k est le nombre de niveaux de la variable de résultat. Dans ce cas, Stata a défini par défaut la vanille comme groupe référent et a donc estimé un modèle pour le chocolat par rapport à la vanille et un modèle pour la fraise par rapport à la vanille. Étant donné que les estimations des paramètres sont relatives au groupe référent, l’interprétation standard du logit multinomial est que pour un changement d’unité dans la variable prédicteur, on s’attend à ce que le logit du résultat m par rapport au groupe référent change de son estimation de paramètre respective (qui est en unités log-odds) étant donné que les variables du modèle sont maintenues constantes.
chocolat par rapport à vanille
vidéo – Il s’agit de l’estimation logit multinomiale pour une augmentation d’une unité du score vidéo pour le chocolat par rapport à la vanille, étant donné que les autres variables du modèle sont maintenues constantes. Si un sujet augmentait son score vidéo d’un point, on s’attendrait à ce que les probabilités logit multinomiales de préférer le chocolat à la vanille diminuent de 0,024 unité en maintenant constantes toutes les autres variables du modèle.
puzzle – Il s’agit de l’estimation logit multinomiale pour une augmentation d’une unité du score puzzle pour le chocolat par rapport à la vanille, étant donné que les autres variables du modèle sont maintenues constantes. Si un sujet augmentait son score de puzzle d’un point, on s’attendrait à ce que les log-odds multinomiaux pour préférer le chocolat à la vanille diminuent de 0,039 unité en maintenant constantes toutes les autres variables du modèle.
féminin – Il s’agit de l’estimation logit multinomiale comparant les femmes aux hommes pour le chocolat par rapport à la vanille, étant donné que les autres variables du modèle sont maintenues constantes. Le logit multinomial des femmes par rapport aux hommes est supérieur de 0,817 unité pour la préférence du chocolat par rapport à la vanille, étant donné que toutes les autres variables prédictives du modèle sont constantes. En d’autres termes, les femmes sont plus susceptibles que les hommes de préférer le chocolat à la vanille.
_cons – Il s’agit de l’estimation du logit multinomial pour le chocolat par rapport à la vanille lorsque les variables prédicteurs du modèle sont évaluées à zéro. Pour les hommes (la variable femme évaluée à zéro) avec des scores de vidéo et de puzzle nuls, le logit pour préférer le chocolat à la vanille est de 1,912. Notez que l’évaluation de la vidéo et du puzzle à zéro est en dehors de la plage des scores plausibles. Si les scores étaient centrés sur la moyenne, l’ordonnée à l’origine aurait une interprétation naturelle : probabilité logarithmique de préférer le chocolat à la vanille pour un homme ayant des scores moyens pour les vidéos et les énigmes.
fraise par rapport à vanille
vidéo – Il s’agit de l’estimation logit multinomiale pour une augmentation d’une unité du score vidéo pour la fraise par rapport à la vanille, étant donné que les autres variables du modèle sont maintenues constantes. Si un sujet augmentait son score vidéo d’un point, on s’attendrait à ce que les probabilités logit multinomiales de préférer la fraise à la vanille augmentent de 0,023 unité en maintenant constantes toutes les autres variables du modèle.
puzzle – Il s’agit de l’estimation logit multinomiale pour une augmentation d’une unité du score puzzle pour la fraise par rapport à la vanille, étant donné que les autres variables du modèle sont maintenues constantes. Si un sujet augmentait son score de puzzle d’un point, on s’attendrait à ce que les log-odds multinomiaux pour préférer la fraise à la vanille augmentent de 0,043 unité en maintenant constantes toutes les autres variables du modèle.
femelle – Il s’agit de l’estimation logit multinomiale comparant les femmes aux hommes pour la fraise par rapport à la vanille, étant donné que les autres variables du modèle sont maintenues constantes. Le logit multinomial pour les femmes par rapport aux hommes est inférieur de 0,033 unité pour préférer la fraise à la vanille, étant donné que toutes les autres variables prédictives du modèle sont constantes. En d’autres termes, les hommes sont plus susceptibles que les femmes de préférer la glace à la fraise à la glace à la vanille.
_cons – Il s’agit de l’estimation logit multinomiale pour la fraise par rapport à la vanille lorsque les variables prédictives du modèle sont évaluées à zéro. Pour les hommes (la variable femelle évaluée à zéro) avec des scores de vidéo et de puzzle nuls, le logit pour préférer la fraise à la vanille est de -4,057.
j. Err. std – Il s’agit des erreurs standard des coefficients de régression individuels pour les deux modèles respectifs estimés. Elles sont utilisées à la fois dans le calcul de la statistique de test z, exposant k, et dans l’intervalle de confiance du coefficient de régression, exposant l.
k. z et P>|z| – La statistique de test z est le rapport entre le Coef. et l’Err. std. du prédicteur respectif, et la valeur p P>|z| est la probabilité que la statistique de test z (ou une statistique de test plus extrême) soit observée sous l’hypothèse nulle. Pour un niveau alpha donné, z et P>|z| déterminent si l’on peut ou non rejeter l’hypothèse nulle selon laquelle le coefficient de régression d’un prédicteur particulier est nul, étant donné que les autres prédicteurs sont dans le modèle. Si P>|z| est inférieur à alpha, alors l’hypothèse nulle peut être rejetée et l’estimation du paramètre est considérée comme significative à ce niveau alpha. La valeur z suit une distribution normale standard qui est utilisée pour tester une hypothèse alternative bilatérale selon laquelle le Coef. n’est pas égal à zéro. Dans la régression logistique multinomiale, l’interprétation de la signification de l’estimation d’un paramètre est limitée au modèle dans lequel l’estimation du paramètre a été calculée. Par exemple, on ne peut pas supposer que la signification de l’estimation d’un paramètre dans le modèle chocolat par rapport à vanille soit valable dans le modèle fraise par rapport à vanille.
chocolat par rapport à vanille
Pour le chocolat par rapport à la vanille, la statistique du test z pour la vidéo prédicteur (-0,024/0,021) est de -1,12 avec une valeur p associée de 0,261. Si nous fixons notre niveau alpha à 0,05, nous ne parviendrons pas à rejeter l’hypothèse nulle et nous conclurons que pour le chocolat par rapport à la vanille, le coefficient de régression de la vidéo ne s’est pas avéré statistiquement différent de zéro étant donné que le puzzle et la femme sont dans le modèle.
Pour le chocolat par rapport à la vanille, la statistique du test z pour le prédicteur puzzle (-0,039/0,020) est de -1,99 avec une valeur p associée de 0,046. Si nous fixons à nouveau notre niveau alpha à 0,05, nous rejetterions l’hypothèse nulle et conclurions que le coefficient de régression pour puzzle s’est avéré statistiquement différent de zéro pour le chocolat par rapport à la vanille étant donné que la vidéo et la femme sont dans le modèle.
Pour le chocolat par rapport à la vanille, la statistique du test z pour le prédicteur female (0,817/0,391) est de 2,09 avec une valeur p associée de 0,037. Si nous fixons à nouveau notre niveau alpha à 0,05, nous rejetterions l’hypothèse nulle et conclurions que la différence entre les hommes et les femmes s’est avérée statistiquement différente pour le chocolat par rapport à la vanille étant donné quevideo et female sont dans le modèle.
Pour le chocolat par rapport à la vanille, la statistique du test z pour l’intercept, _cons (1,912/1,127) est de 1,70 avec une valeur p associée de 0,090. Avec un niveau alpha de 0,05, nous ne parviendrions pas à rejeter l’hypothèse nulle et conclurions que a) le logit multinomial pour les hommes (la variable femelle étant évaluée à zéro) et avec des scores de vidéo et d’énigme de zéro dans le chocolat par rapport à la vanille ne sont pas statistiquement différents de zéro ; ou b) pour les hommes avec des scores de vidéo et d’énigme de zéro, vous n’êtes pas statistiquement sûrs qu’ils sont plus susceptibles d’être classés comme préférant le chocolat ou la vanille. Nous pouvons faire la deuxième interprétation lorsque nous considérons les _cons comme un profil de covariable spécifique (hommes avec des scores de vidéo et de puzzle nuls). Sur la base de la direction et de la signification du coefficient, le _cons indique si le profil aurait une plus grande propension à être classé dans un niveau de la variable de résultat que dans l’autre niveau.
fraise par rapport à vanille
Pour la fraise par rapport à la vanille, la statistique du test z pour la vidéo prédicteur (0,023/0,021) est de 1,10 avec une valeur p associée de 0,272. Si nous fixons notre niveau alpha à 0,05, nous ne parviendrons pas à rejeter l’hypothèse nulle et nous conclurons que pour la fraise par rapport à la vanille, le coefficient de régression de la vidéo ne s’est pas avéré statistiquement différent de zéro étant donné que le puzzle et la femme sont dans le modèle.
Pour la fraise par rapport à la vanille, la statistique du test z pour le prédicteur puzzle (0,043/0,020) est de 2,16 avec une valeur p associée de 0,031. Si nous fixons à nouveau notre niveau alpha à 0,05, nous rejetterions l’hypothèse nulle et conclurions que le coefficient de régression pour puzzle s’est avéré statistiquement différent de zéro pour la fraise par rapport à la vanille étant donné que la vidéo et la femme sont dans le modèle.
Pour la fraise par rapport à la vanille, la statistique du test z pour le prédicteur femme (-0,033/0,350) est de -0,09 avec une valeur p associée de 0,925. Si nous fixons à nouveau notre niveau alpha à 0,05, nous ne parviendrons pas à rejeter l’hypothèse nulle et à conclure que pour la fraise par rapport à la vanille, le coefficient de régression pour female ne s’est pas avéré statistiquement différent de zéro étant donné que puzzle et video sont dans le modèle.
Pour la fraise par rapport à la vanille, la statistique du test z pour l’intercept, _cons (-4,057/1,223) est de -3,32 avec une valeur p associée de 0,001. Avec un niveau alpha de 0,05, nous rejetterions l’hypothèse nulle et conclurions que a) le logit multinomial pour les hommes (la variable femelle étant évaluée à zéro) et avec des scores de vidéo et d’énigmes de zéro dans la catégorie fraise par rapport à la vanille sont statistiquement différents de zéro ; ou b) pour les hommes avec des scores de vidéo et d’énigmes de zéro, il existe une différence statistiquement significative entre la probabilité d’être classé comme préférant la fraise ou la vanille. Un tel mâle serait plus susceptible d’être classé comme préférant la vanille à la fraise. Nous pouvons faire la deuxième interprétation lorsque nous considérons les _cons comme un profil de covariable spécifique (les hommes avec des scores de vidéo et de puzzle nuls). Sur la base de la direction et de la signification du coefficient, le _cons indique si le profil aurait une plus grande propension à être classé dans un niveau de la variable de résultat que dans l’autre niveau.
l. – Il s’agit de l’intervalle de confiance (IC) pour un coefficient de régression logit multinomial individuel étant donné que les autres prédicteurs sont dans le modèle pour le résultat m par rapport au groupe référent. Pour un prédicteur donné avec un niveau de confiance de 95 %, nous dirions que nous sommes sûrs à 95 % que le « vrai » coefficient de régression logit multinomial de la population se situe entre les limites inférieure et supérieure de l’intervalle pour le résultat m par rapport au groupe de référence. Il est calculé comme le Coef. (zα/2)*(Std.Err.), où zα/2 est une valeur critique sur la distribution normale standard. L’IC est équivalent à la statistique du test z : si l’IC inclut zéro, nous ne parviendrons pas à rejeter l’hypothèse nulle selon laquelle un coefficient de régression particulier est nul, étant donné que les autres prédicteurs sont dans le modèle. Un avantage d’un IC est qu’il est illustratif ; il fournit une plage où le « vrai » paramètre peut se trouver.
Interprétation du rapport de risque relatif
Ce qui suit est l’interprétation de la régression logistique multinomiale en termes de rapports de risque relatif et peut être obtenu par mlogit, rrr après avoir exécuté le modèle logit multinomial ou en spécifiant l’option rrr lorsque le modèle complet est spécifié. Cette partie de l’interprétation s’applique à la sortie ci-dessous.
mlogit ice_cream video puzzle female, rrr
Iteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485Multinomial logistic regression Number of obs = 200 LR chi2(6) = 33.10 Prob > chi2 = 0.0000Log likelihood = -194.03485 Pseudo R2 = 0.0786------------------------------------------------------------------------------ ice_cream | RRRa Std. Err. z P>|z| b-------------+----------------------------------------------------------------chocolate | video | .9767108 .0204862 -1.12 0.261 .9373726 1.0177 puzzle | .9618236 .0187714 -1.99 0.046 .925727 .9993276 female | 2.262839 .8847276 2.09 0.037 1.051598 4.869199-------------+----------------------------------------------------------------strawberry | video | 1.023187 .0213558 1.10 0.272 .9821747 1.065911 puzzle | 1.043942 .0207633 2.16 0.031 1.004029 1.085441 female | .9676721 .3387 -0.09 0.925 .4872981 1.921595------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)
a. Rapport de risque relatif – Il s’agit des rapports de risque relatif pour le modèle logit multinomial présenté précédemment. Ils peuvent être obtenus en exponentialisant les coefficients logit multinomiaux, ecoef, ou en spécifiant l’option rrr lorsque la commande mlogit est émise. Rappelons que le modèle logit multinomial estime k-1 modèles, où la kième équation est relative au groupe référent. Le RRR d’un coefficient indique comment le risque que le résultat tombe dans le groupe de comparaison par rapport au risque que le résultat tombe dans le groupe référent change avec la variable en question. Un RRR > 1 indique que le risque que le résultat tombe dans le groupe de comparaison par rapport au risque que le résultat tombe dans le groupe référent augmente lorsque la variable augmente. En d’autres termes, le résultat de la comparaison est plus probable. Un RRR < 1 indique que le risque que l’issue tombe dans le groupe de comparaison par rapport au risque que l’issue tombe dans le groupe de référence diminue à mesure que la variable augmente. Voir les interprétations des rapports de risque relatif ci-dessous pour des exemples. En général, si le RRR < 1, le résultat est plus susceptible de se trouver dans le groupe de référence.
chocolat par rapport à vanille
vidéo – Il s’agit du rapport de risque relatif pour une augmentation d’une unité du score vidéo pour préférer le chocolat à la vanille, étant donné que les autres variables du modèle sont maintenues constantes. Si un sujet augmente son score vidéo d’une unité, le risque relatif de préférer le chocolat à la vanille devrait diminuer d’un facteur de 0,977, les autres variables du modèle étant maintenues constantes. Ainsi, pour une augmentation d’une unité de la vidéo, le risque relatif de faire partie du groupe chocolat serait 0,977 fois plus élevé lorsque les autres variables du modèle sont constantes. Plus généralement, on peut dire que si un sujet augmente son score de vidéo, on s’attendrait à ce qu’il soit plus susceptible de préférer la glace à la vanille à la glace au chocolat.
puzzle – Il s’agit du rapport de risque relatif pour une augmentation d’une unité du score de puzzle de préférer le chocolat à la vanille, étant donné que les autres variables du modèle sont maintenues constantes. Si un sujet augmente d’une unité son score au puzzle, le risque relatif de préférer le chocolat à la vanille devrait diminuer d’un facteur de 0,962, les autres variables du modèle étant maintenues constantes. Plus généralement, on peut dire que si deux sujets ont des scores vidéo identiques et sont tous deux de sexe féminin (ou tous deux de sexe masculin), le sujet ayant le score de puzzle le plus élevé est plus susceptible de préférer la glace à la vanille à la glace au chocolat que le sujet ayant le score de puzzle le plus faible.
femme – Il s’agit du rapport de risque relatif comparant les femmes aux hommes pour préférer le chocolat à la vanille, étant donné que les autres variables du modèle sont maintenues constantes. Pour les femmes par rapport aux hommes, le risque relatif de préférer le chocolat à la vanille devrait être multiplié par 2,263, les autres variables du modèle étant constantes. En d’autres termes, les femmes sont plus susceptibles que les hommes de préférer la glace au chocolat à la glace à la vanille.
fraise par rapport à vanille
vidéo – Il s’agit du rapport de risque relatif pour une augmentation d’une unité du score vidéo pour préférer la fraise à la vanille, étant donné que les autres variables du modèle sont maintenues constantes. Si un sujet augmente son score vidéo d’une unité, le risque relatif de préférer la fraise à la vanille devrait augmenter d’un facteur de 1,023, les autres variables du modèle étant maintenues constantes. Plus généralement, on peut dire que si un sujet augmente son score vidéo, on s’attendrait à ce qu’il soit plus susceptible de préférer la glace à la fraise à la glace à la vanille.
puzzle – Il s’agit du rapport de risque relatif pour une augmentation d’une unité du score puzzle pour préférer la fraise à la vanille, étant donné que les autres variables du modèle sont maintenues constantes. Si un sujet augmente son score au puzzle d’une unité, le risque relatif de préférer la fraise à la vanille devrait augmenter d’un facteur de 1,043, les autres variables du modèle étant maintenues constantes. Plus généralement, on peut dire que si deux sujets ont des scores vidéo identiques et sont tous deux de sexe féminin (ou tous deux de sexe masculin), le sujet ayant le score de puzzle le plus élevé est plus susceptible de préférer la glace à la fraise à la glace à la vanille que le sujet ayant le score de puzzle le plus faible.
femme – Il s’agit du rapport de risque relatif comparant les femmes aux hommes pour la fraise par rapport à la vanille, étant donné que les autres variables du modèle sont maintenues constantes. Pour les femmes par rapport aux hommes, le risque relatif de préférer la fraise à la vanille devrait diminuer d’un facteur de 0,968, les autres variables du modèle étant constantes. En d’autres termes, les femmes sont moins susceptibles que les hommes de préférer la glace à la fraise à la glace à la vanille.
b. – Il s’agit de l’IC pour le rapport de risque relatif étant donné que les autres prédicteurs sont dans le modèle. Pour un prédicteur donné avec un niveau de confiance de 95%, nous dirons que nous sommes sûrs à 95% que le « vrai » rapport de risque relatif de la population comparant le résultat m au groupe référent se situe entre la limite inférieure et supérieure de l’intervalle. L’avantage d’un IC est qu’il est illustratif ; il fournit une fourchette dans laquelle le « vrai » rapport de risque relatif peut se trouver.
Laisser un commentaire