Multinomiale logistische Regression | Stata Kommentierte Ausgabe
On Januar 28, 2022 by adminDiese Seite zeigt ein Beispiel für eine multinomiale logistische Regressionsanalyse mit Fußnoten zur Erläuterung der Ausgabe. Die Daten wurden von 200 Oberstufenschülern erhoben und umfassen die Ergebnisse verschiedener Tests, einschließlich eines Videospiels und eines Puzzles. Die Ergebnisgröße in dieser Analyse ist die bevorzugte Eissorte – Vanille, Schokolade oder Erdbeere -, von der wir sehen werden, welche Beziehungen zu den Ergebnissen des Videospiels (Video), des Puzzles (Puzzle) und des Geschlechts (weiblich) bestehen. Unsere Antwortvariable, ice_cream, wird als kategorisch behandelt, unter der Annahme, dass die Ebenen von ice_cream keine natürliche Ordnung haben, und wir werden Stata erlauben, die Bezugsgruppe zu wählen. In unserem Beispiel wird dies Vanille sein. Standardmäßig wählt Stata die am häufigsten vorkommende Gruppe als Bezugsgruppe aus. Die erste Hälfte dieser Seite interpretiert die Koeffizienten in Form von multinomialen log-odds (logits). Diese entsprechen in etwa den log-odds, die bei einer logistischen Regression mit zwei Stufen der Ergebnisvariablen erzielt werden, sind aber nicht gleich. In der zweiten Hälfte werden die Koeffizienten als relative Risikoverhältnisse interpretiert.
use https://stats.idre.ucla.edu/stat/stata/output/mlogit, clear
Bevor die Regression durchgeführt wird, kann die Ermittlung der Häufigkeit der Eissorten in den Daten die Auswahl einer Referenzgruppe erleichtern.
tab ice_cream favorite flavor of ice cream | Freq. Percent Cum. ------------+----------------------------------- chocolate | 47 23.50 23.50 vanilla | 95 47.50 71.00 strawberry | 58 29.00 100.00 ------------+----------------------------------- Total | 200 100.00
Vanille ist die am häufigsten vorkommende Eissorte und wird in diesem Beispiel die Referenzgruppe sein.
mlogit ice_cream video puzzle femaleIteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485Multinomial logistic regression Number of obs = 200 LR chi2(6) = 33.10 Prob > chi2 = 0.0000Log likelihood = -194.03485 Pseudo R2 = 0.0786------------------------------------------------------------------------------ ice_cream | Coef. Std. Err. z P>|z| -------------+----------------------------------------------------------------chocolate | video | -.0235647 .0209747 -1.12 0.261 -.0646744 .017545 puzzle | -.0389243 .0195165 -1.99 0.046 -.0771759 -.0006726 female | .8166202 .3909813 2.09 0.037 .050311 1.582929 _cons | 1.912256 1.127256 1.70 0.090 -.2971258 4.121638-------------+----------------------------------------------------------------strawberry | video | .022922 .0208718 1.10 0.272 -.0179861 .0638301 puzzle | .0430036 .0198894 2.16 0.031 .0040211 .081986 female | -.032862 .3500153 -0.09 0.925 -.7188793 .6531553 _cons | -4.057323 1.222939 -3.32 0.001 -6.45424 -1.660407------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)
Iteration Loga
Iteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485
a. Iterationsprotokoll – Dies ist eine Auflistung der logarithmischen Wahrscheinlichkeiten bei jeder Iteration. Denken Sie daran, dass die multinomiale logistische Regression, wie die binäre und geordnete logistische Regression, die Maximum-Likelihood-Schätzung verwendet, die ein iteratives Verfahren ist. Die erste Iteration (Iteration 0 genannt) ist die logische Wahrscheinlichkeit des „Null“- oder „leeren“ Modells, d. h. eines Modells ohne Prädiktoren. Bei der nächsten Iteration wird der/die Prädiktor(en) in das Modell aufgenommen. Bei jeder Iteration nimmt die log Likelihood zu, da das Ziel darin besteht, die log Likelihood zu maximieren. Wenn die Differenz zwischen den aufeinander folgenden Iterationen sehr klein ist, gilt das Modell als „konvergiert“, die Iteration wird beendet und die Ergebnisse werden angezeigt. Weitere Informationen zu diesem Prozess für binäre Ergebnisse finden Sie inRegression Models for Categorical and Limited Dependent Variables von J. Scott Long (Seite 52-61).
Modellzusammenfassung
Multinomial logistic regression Number of obsc = 200 LR chi2(6)d = 33.10 Prob > chi2e = 0.0000Log likelihood = -194.03485b Pseudo R2f = 0.0786
b. Log Likelihood – Dies ist die log Likelihood des angepassten Modells. Sie wird beim Likelihood-Ratio-Chi-Quadrat-Test verwendet, um festzustellen, ob die Regressionskoeffizienten aller Prädiktoren im Modell gleichzeitig Null sind, und bei Tests von verschachtelten Modellen.
c. Anzahl der Beobachtungen – Dies ist die Anzahl der Beobachtungen, die in der multinomialen logistischen Regression verwendet werden. Sie kann geringer sein als die Anzahl der Fälle im Datensatz, wenn es fehlende Werte für einige Variablen in der Gleichung gibt. Standardmäßig führt Stata eine listenweise Löschung von unvollständigen Fällen durch.
d. LR chi2(6) – Dies ist der Likelihood Ratio (LR) Chi-Quadrat-Test, dass für beide Gleichungen (Schokolade relativ zu Vanille und Erdbeere relativ zu Vanille) mindestens einer der Regressionskoeffizienten der Prädiktoren ungleich Null ist. Die Zahl in den Klammern gibt die Freiheitsgrade der Chi-Quadrat-Verteilung an, die zum Testen der LR-Chi-Quadrat-Statistik verwendet wird, und ist definiert durch die Anzahl der geschätzten Modelle (2) mal die Anzahl der Prädiktoren im Modell (3). Die LR Chi-Quadrat-Statistik kann wie folgt berechnet werden: -2*( L(Nullmodell) – L(angepasstes Modell)) = -2*((-210,583) – (-194,035)) = 33,096, wobei L(Nullmodell) aus der logischen Wahrscheinlichkeit mit nur der Antwortvariablen im Modell (Iteration 0) und L(angepasstes Modell) die logische Wahrscheinlichkeit aus der letzten Iteration (unter der Annahme, dass das Modell konvergiert) mit allen Parametern ist.
e. Prob > chi2 – Dies ist die Wahrscheinlichkeit, eine LR-Teststatistik zu erhalten, die genauso extrem oder noch extremer ist als die beobachtete Statistik unter der Nullhypothese; die Nullhypothese ist, dass alle Regressionskoeffizienten in beiden Modellen gleichzeitig gleich Null sind. Mit anderen Worten, es handelt sich um die Wahrscheinlichkeit, diese Chi-Quadrat-Statistik (33,10) oder eine noch extremere zu erhalten, wenn es tatsächlich keinen Effekt der Prädiktorvariablen gibt. Dieser p-Wert wird mit einem bestimmten Alpha-Niveau verglichen, unserer Bereitschaft, einen Fehler vom Typ I zu akzeptieren, der in der Regel auf 0,05 oder 0,01 festgelegt wird. Der kleine p-Wert des LR-Tests, <0,00001, lässt den Schluss zu, dass mindestens einer der Regressionskoeffizienten im Modell ungleich Null ist. Der Parameter der Chi-Quadrat-Verteilung, die zum Testen der Nullhypothese verwendet wird, wird durch die Freiheitsgrade in der vorherigen Zeile definiert, chi2(6).
f. Pseudo R2 – Dies ist das Pseudo-R-Quadrat von McFadden. Die logistische Regression hat kein Äquivalent zum R-Quadrat der OLS-Regression, aber viele haben versucht, ein solches zu finden. Es gibt eine Vielzahl von Pseudo-R-Quadrat-Statistiken. Da diese Statistik nicht das bedeutet, was R-Quadrat in der OLS-Regression bedeutet (der Anteil der Varianz der Antwortvariablen, der durch die Prädiktoren erklärt wird), empfehlen wir, diese Statistik mit großer Vorsicht zu interpretieren.
Parameterschätzungen
------------------------------------------------------------------------------ ice_creamg | Coef.h Std. Err.j zk P>|z|k l-------------+----------------------------------------------------------------chocolate | video | -.0235647 .0209747 -1.12 0.261 -.0646744 .017545 puzzle | -.0389243 .0195165 -1.99 0.046 -.0771759 -.0006726 female | .8166202 .3909813 2.09 0.037 .050311 1.582929 _cons | 1.912256 1.127256 1.70 0.090 -.2971258 4.121638-------------+----------------------------------------------------------------strawberry | video | .022922 .0208718 1.10 0.272 -.0179861 .0638301 puzzle | .0430036 .0198894 2.16 0.031 .0040211 .081986 female | -.032862 .3500153 -0.09 0.925 -.7188793 .6531553 _cons | -4.057323 1.222939 -3.32 0.001 -6.45424 -1.660407------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)i
g. ice_cream – Dies ist die Antwortvariable in der multinomialen logistischen Regression. Unter ice_cream befinden sich zwei Wiederholungen der Prädiktorvariablen, die die beiden geschätzten Modelle repräsentieren: Schokolade im Verhältnis zu Vanille und Erdbeere im Verhältnis zu Vanille.
h und i. Koeff. und Referenzgruppe – Dies sind die geschätzten multinomialen logistischen Regressionskoeffizienten bzw. die Referenzgruppe für das Modell. Ein wichtiges Merkmal des multinomialen Logit-Modells ist, dass es k-1 Modelle schätzt, wobei k die Anzahl der Stufen der Ergebnisvariablen ist. In diesem Fall hat Stata standardmäßig Vanille als Referenzgruppe festgelegt und daher ein Modell für Schokolade relativ zu Vanille und ein Modell für Erdbeere relativ zu Vanille geschätzt. Da die Parameterschätzungen relativ zur Referenzgruppe sind, ist die Standardinterpretation des multinomialen Logits, dass für eine Einheitsänderung der Prädiktorvariable das Logit des Ergebnisses m relativ zur Referenzgruppe sich um die jeweilige Parameterschätzung (die in log-odds-Einheiten angegeben ist) ändern soll, wenn die Variablen im Modell konstant gehalten werden.
Schokolade relativ zu Vanille
Video – Dies ist die multinomiale Logit-Schätzung für einen Anstieg der Videowertung um eine Einheit für Schokolade relativ zu Vanille, wenn die anderen Variablen im Modell konstant gehalten werden. Wenn eine Versuchsperson ihre Videopunktzahl um einen Punkt erhöhen würde, würde die multinomiale Logit-Schätzung für die Bevorzugung von Schokolade gegenüber Vanille um 0,024 Einheiten abnehmen, wenn alle anderen Variablen im Modell konstant gehalten werden.
Puzzle – Dies ist die multinomiale Logit-Schätzung für eine Erhöhung der Puzzlepunktzahl um eine Einheit für Schokolade gegenüber Vanille, wenn die anderen Variablen im Modell konstant gehalten werden. Wenn ein Proband seine Rätselpunktzahl um einen Punkt erhöhen würde, würde die multinomiale Logit-Schätzung für die Bevorzugung von Schokolade gegenüber Vanille um 0,039 Einheiten abnehmen, wenn alle anderen Variablen im Modell konstant gehalten werden.
weiblich – Dies ist die multinomiale Logit-Schätzung für den Vergleich von Frauen und Männern für Schokolade im Vergleich zu Vanille, wenn die anderen Variablen im Modell konstant gehalten werden. Die multinomiale Logit-Schätzung für Frauen im Vergleich zu Männern ist um 0,817 Einheiten höher für die Bevorzugung von Schokolade gegenüber Vanille, wenn alle anderen Prädiktorvariablen im Modell konstant gehalten werden. Mit anderen Worten: Frauen bevorzugen mit größerer Wahrscheinlichkeit Schokolade gegenüber Vanille als Männer.
_cons – Dies ist die multinomiale Logit-Schätzung für Schokolade gegenüber Vanille, wenn die Prädiktorvariablen im Modell mit Null bewertet werden. Für Männer (die weibliche Variable wird mit Null bewertet) mit Null Video- und Rätselbewertungen ist der Logit für die Bevorzugung von Schokolade gegenüber Vanille 1,912. Beachten Sie, dass die Bewertung von Video und Rätsel mit Null außerhalb des Bereichs plausibler Werte liegt. Wären die Werte mittelwertzentriert, hätte der Achsenabschnitt eine natürliche Interpretation: log odds für die Bevorzugung von Schokolade gegenüber Vanille für eine männliche Person mit durchschnittlichen Video- und Rätselwerten.
Erdbeere gegenüber Vanille
Video – Dies ist die multinomiale Logit-Schätzung für einen Anstieg der Videowerte um eine Einheit für Erdbeere gegenüber Vanille, wenn die anderen Variablen im Modell konstant gehalten werden. Wenn eine Versuchsperson ihre Videopunktzahl um einen Punkt erhöhen würde, würde die multinomiale Logit-Schätzung für die Bevorzugung von Erdbeere gegenüber Vanille um 0,023 Einheiten steigen, wenn alle anderen Variablen im Modell konstant gehalten werden.
Puzzle – Dies ist die multinomiale Logit-Schätzung für eine Erhöhung der Puzzlepunktzahl um eine Einheit für Erdbeere gegenüber Vanille, wenn die anderen Variablen im Modell konstant gehalten werden. Wenn ein Proband seine Rätselpunktzahl um einen Punkt erhöhen würde, würde die multinomiale Logit-Schätzung für die Bevorzugung von Erdbeere gegenüber Vanille um 0,043 Einheiten steigen, wenn alle anderen Variablen im Modell konstant gehalten werden.
weiblich – Dies ist die multinomiale Logit-Schätzung für den Vergleich von Frauen und Männern für Erdbeere im Vergleich zu Vanille, wenn die anderen Variablen im Modell konstant gehalten werden. Die multinomiale Logit-Schätzung für Frauen im Vergleich zu Männern ist um 0,033 Einheiten niedriger für die Bevorzugung von Erdbeere gegenüber Vanille, wenn alle anderen Prädiktorvariablen im Modell konstant gehalten werden. Mit anderen Worten: Männer bevorzugen mit größerer Wahrscheinlichkeit Erdbeereis gegenüber Vanilleeis als Frauen.
_cons – Dies ist die multinomiale Logit-Schätzung für Erdbeere gegenüber Vanille, wenn die Prädiktorvariablen im Modell mit Null bewertet werden. Für Männer (die weibliche Variable wird mit Null bewertet) mit Null Video- und Rätselbewertungen ist der Logit für die Bevorzugung von Erdbeere gegenüber Vanille -4,057.
j. Std. Err. – Dies sind die Standardfehler der einzelnen Regressionskoeffizienten für die beiden jeweils geschätzten Modelle. Sie werden sowohl bei der Berechnung der z-Teststatistik, hochgestellt k, als auch des Konfidenzintervalls des Regressionskoeffizienten, hochgestellt l.
k, verwendet. z und P>|z| – Die Teststatistik z ist das Verhältnis von Koeff. zu Std. Err. des jeweiligen Prädiktors, und der p-Wert P>|z| ist die Wahrscheinlichkeit, dass die z-Teststatistik (oder eine extremere Teststatistik) unter der Nullhypothese beobachtet werden würde. Für ein gegebenes Alphaniveau bestimmen z und P>|z|, ob die Nullhypothese, dass der Regressionskoeffizient eines bestimmten Prädiktors Null ist, abgelehnt werden kann, wenn die übrigen Prädiktoren im Modell enthalten sind oder nicht. Wenn P>|z| kleiner als Alpha ist, kann die Nullhypothese zurückgewiesen werden, und der Parameterschätzer wird bei diesem Alpha-Niveau als signifikant angesehen. Der z-Wert folgt einer Standardnormalverteilung, die zum Testen auf eine zweiseitige Alternativhypothese, dass der Coef. ungleich Null ist, verwendet wird. Bei der multinomialen logistischen Regression ist die Interpretation der Signifikanz einer Parameterschätzung auf das Modell beschränkt, in dem die Parameterschätzung berechnet wurde. So kann beispielsweise nicht davon ausgegangen werden, dass die Signifikanz einer Parameterschätzung im Modell Schokolade relativ zu Vanille auch im Modell Erdbeere relativ zu Vanille gilt.
Schokolade relativ zu Vanille
Für Schokolade relativ zu Vanille beträgt die z-Teststatistik für den Prädiktor Video (-0,024/0,021) -1,12 mit einem zugehörigen p-Wert von 0,261. Wenn wir unser Alpha-Niveau auf 0,05 setzen, können wir die Nullhypothese nicht zurückweisen und schlussfolgern, dass für Schokolade im Vergleich zu Vanille der Regressionskoeffizient für Video sich nicht statistisch von Null unterscheidet, da Puzzle und Frau im Modell enthalten sind.
Für Schokolade im Vergleich zu Vanille beträgt die z-Teststatistik für den Prädiktor Puzzle (-0,039/0,020) -1,99 mit einem zugehörigen p-Wert von 0,046. Wenn wir unser Alpha-Niveau wieder auf 0,05 setzen, würden wir die Nullhypothese ablehnen und zu dem Schluss kommen, dass der Regressionskoeffizient für Puzzle für Schokolade im Vergleich zu Vanille statistisch von Null verschieden ist, da Video und Frau im Modell enthalten sind.
Für Schokolade im Vergleich zu Vanille beträgt die z-Teststatistik für den Prädiktor weiblich (0,817/0,391) 2,09 mit einem zugehörigen p-Wert von 0,037. Wenn wir unser Alpha-Niveau wieder auf 0,05 setzen, würden wir die Nullhypothese ablehnen und zu dem Schluss kommen, dass der Unterschied zwischen Männern und Frauen für Schokolade im Vergleich zu Vanille statistisch unterschiedlich ist, da Video und Frau im Modell enthalten sind.
Für Schokolade im Vergleich zu Vanille beträgt die z-Teststatistik für den Achsenabschnitt _cons (1,912/1,127) 1,70 mit einem zugehörigen p-Wert von 0,090. Bei einem Alpha-Niveau von 0,05 können wir die Nullhypothese nicht zurückweisen und schlussfolgern, dass a) der multinomiale Logit für Männer (die weibliche Variable wird mit Null bewertet) und mit Null Video- und Rätselbewertungen bei Schokolade im Vergleich zu Vanille statistisch nicht von Null verschieden ist; oder b) für Männer mit Null Video- und Rätselbewertungen statistisch unsicher ist, ob sie eher als Schokoladen- oder Vanillevorlieben eingestuft werden. Wir können die zweite Interpretation vornehmen, wenn wir die _cons als ein spezifisches Kovariatenprofil betrachten (Männer mit null Video- und Rätselbewertungen). Ausgehend von der Richtung und der Signifikanz des Koeffizienten zeigt _cons an, ob das Profil eine größere Neigung hat, in eine Stufe der Ergebnisvariablen eingestuft zu werden als in die andere Stufe.
Erdbeere im Vergleich zu Vanille
Für Erdbeere im Vergleich zu Vanille beträgt die z-Teststatistik für den Prädiktor Video (0,023/0,021) 1,10 mit einem zugehörigen p-Wert von 0,272. Wenn wir unser Alpha-Niveau auf 0,05 setzen, können wir die Nullhypothese nicht zurückweisen und schlussfolgern, dass für Erdbeere im Vergleich zu Vanille der Regressionskoeffizient für Video sich nicht statistisch von Null unterscheidet, da Puzzle und Frau im Modell enthalten sind.
Für Erdbeere im Vergleich zu Vanille beträgt die z-Teststatistik für den Prädiktor Puzzle (0,043/0,020) 2,16 mit einem zugehörigen p-Wert von 0,031. Wenn wir wieder unser Alpha-Niveau auf 0,05 setzen, würden wir die Nullhypothese ablehnen und schlussfolgern, dass der Regressionskoeffizient für Puzzle statistisch von Null für Erdbeere im Vergleich zu Vanille verschieden ist, da Video und weiblich im Modell sind.
Für Erdbeere im Vergleich zu Vanille beträgt die z-Teststatistik für den Prädiktor weiblich (-0,033/0,350) -0,09 mit einem zugehörigen p-Wert von 0,925. Wenn wir unser Alpha-Niveau wieder auf 0,05 setzen, können wir die Nullhypothese nicht zurückweisen und schlussfolgern, dass für Erdbeere im Vergleich zu Vanille der Regressionskoeffizient für weiblich sich nicht statistisch von Null unterscheidet, da Puzzle und Video im Modell enthalten sind.
Für Erdbeere im Vergleich zu Vanille beträgt die z-Teststatistik für den Achsenabschnitt _cons (-4,057/1,223) -3,32 mit einem zugehörigen p-Wert von 0,001. Bei einem Alpha-Niveau von 0,05 würden wir die Nullhypothese ablehnen und zu dem Schluss kommen, dass a) der multinomiale Logit für Männer (die weibliche Variable wird mit Null bewertet) und mit Null Video- und Rätselbewertungen in Erdbeere im Vergleich zu Vanille statistisch von Null verschieden sind; oder b) für Männer mit Null Video- und Rätselbewertungen ein statistisch signifikanter Unterschied zwischen der Wahrscheinlichkeit besteht, als Erdbeer- oder Vanillepräferenz eingestuft zu werden. Ein solches Männchen würde eher als Vanille- als als Erdbeervorbereiter eingestuft werden. Wir können die zweite Interpretation vornehmen, wenn wir die _cons als ein spezifisches Kovariatenprofil betrachten (Männer mit Null Video- und Rätselbewertungen). Ausgehend von der Richtung und der Signifikanz des Koeffizienten zeigt _cons an, ob das Profil eine größere Neigung hätte, in eine Stufe der Ergebnisvariablen eingestuft zu werden als in die andere Stufe.
l. – Dies ist das Konfidenzintervall (CI) für einen einzelnen multinomialen Logit-Regressionskoeffizienten, wenn die anderen Prädiktoren im Modell für das Ergebnis m relativ zur Referenzgruppe vorhanden sind. Für einen gegebenen Prädiktor mit einem Konfidenzniveau von 95 % würden wir sagen, dass wir zu 95 % sicher sind, dass der „wahre“ multinomiale Logit-Regressionskoeffizient der Population zwischen der unteren und der oberen Grenze des Intervalls für das Ergebnis m im Vergleich zur Referenzgruppe liegt. Er wird berechnet als Coef. (zα/2)*(Std.Err.), wobei zα/2 ein kritischer Wert der Standardnormalverteilung ist. Der CI ist äquivalent zur z-Teststatistik: Wenn der CI Null einschließt, kann die Nullhypothese, dass ein bestimmter Regressionskoeffizient Null ist, nicht zurückgewiesen werden, da die anderen Prädiktoren im Modell vorhanden sind. Ein Vorteil eines CI ist, dass es illustrativ ist; es liefert einen Bereich, in dem der „wahre“ Parameter liegen könnte.
Interpretation des relativen Risikoverhältnisses
Das Folgende ist die Interpretation der multinomialen logistischen Regression in Form von relativen Risikoverhältnissen und kann durch mlogit, rrr nach der Ausführung des multinomialen Logit-Modells oder durch Angabe der Option rrr, wenn das vollständige Modell spezifiziert wird, erhalten werden. Dieser Teil der Interpretation gilt für die folgende Ausgabe.
mlogit ice_cream video puzzle female, rrr
Iteration 0: log likelihood = -210.58254Iteration 1: log likelihood = -194.75041Iteration 2: log likelihood = -194.03782Iteration 3: log likelihood = -194.03485Iteration 4: log likelihood = -194.03485Multinomial logistic regression Number of obs = 200 LR chi2(6) = 33.10 Prob > chi2 = 0.0000Log likelihood = -194.03485 Pseudo R2 = 0.0786------------------------------------------------------------------------------ ice_cream | RRRa Std. Err. z P>|z| b-------------+----------------------------------------------------------------chocolate | video | .9767108 .0204862 -1.12 0.261 .9373726 1.0177 puzzle | .9618236 .0187714 -1.99 0.046 .925727 .9993276 female | 2.262839 .8847276 2.09 0.037 1.051598 4.869199-------------+----------------------------------------------------------------strawberry | video | 1.023187 .0213558 1.10 0.272 .9821747 1.065911 puzzle | 1.043942 .0207633 2.16 0.031 1.004029 1.085441 female | .9676721 .3387 -0.09 0.925 .4872981 1.921595------------------------------------------------------------------------------(ice_cream==vanilla is the base outcome)
a. Relatives Risikoverhältnis – Dies sind die relativen Risikoverhältnisse für das oben gezeigte multinomiale Logit-Modell. Sie können durch Potenzieren der multinomialen Logit-Koeffizienten, ecoef, oder durch Angabe der Option rrr bei der Ausgabe des Befehls mlogit ermittelt werden. Es sei daran erinnert, dass das multinomiale Logit-Modell k-1 Modelle schätzt, wobei die k-te Gleichung relativ zur Referenzgruppe ist. Die RRR eines Koeffizienten gibt an, wie sich das Risiko, dass das Ergebnis in der Vergleichsgruppe eintritt, im Vergleich zum Risiko, dass das Ergebnis in der Referenzgruppe eintritt, mit der betreffenden Variable verändert. Eine RRR > 1 zeigt an, dass das Risiko, dass das Ergebnis in der Vergleichsgruppe eintritt, im Verhältnis zu dem Risiko, dass das Ergebnis in der Referenzgruppe eintritt, mit dem Anstieg der Variablen zunimmt. Mit anderen Worten: Das Ergebnis der Vergleichsgruppe ist wahrscheinlicher. Ein RRR < 1 zeigt an, dass das Risiko, dass das Ergebnis in der Vergleichsgruppe eintritt, im Verhältnis zum Risiko, dass das Ergebnis in der Referenzgruppe eintritt, mit zunehmender Variable abnimmt. Beispiele für die Interpretation der relativen Risikoverhältnisse finden Sie weiter unten. Im Allgemeinen gilt: Wenn das RRR < 1 ist, ist es wahrscheinlicher, dass das Ergebnis in die Vergleichsgruppe fällt.
Schokolade im Vergleich zu Vanille
Video – Dies ist das relative Risikoverhältnis für eine Erhöhung des Videowertes um eine Einheit für die Bevorzugung von Schokolade gegenüber Vanille, wenn die anderen Variablen im Modell konstant gehalten werden. Wenn eine Versuchsperson ihre Videowertung um eine Einheit erhöht, würde das relative Risiko, Schokolade gegenüber Vanille zu bevorzugen, voraussichtlich um den Faktor 0,977 abnehmen, wenn die anderen Variablen im Modell konstant gehalten werden. Bei einem Anstieg der Videowertung um eine Einheit wäre also das relative Risiko, zur Schokoladengruppe zu gehören, 0,977-mal höher, wenn die anderen Variablen im Modell konstant gehalten werden. Ganz allgemein kann man sagen, dass eine Versuchsperson, die ihre Videowertung erhöht, mit größerer Wahrscheinlichkeit Vanilleeis gegenüber Schokoladeneis bevorzugt.
Puzzle – Dies ist das relative Risikoverhältnis für eine Erhöhung der Puzzle-Punktzahl um eine Einheit für die Bevorzugung von Schokolade gegenüber Vanille, wenn die anderen Variablen im Modell konstant gehalten werden. Wenn eine Versuchsperson ihre Rätselpunktzahl um eine Einheit erhöht, würde das relative Risiko, Schokolade gegenüber Vanille zu bevorzugen, voraussichtlich um den Faktor 0,962 sinken, wenn die anderen Variablen im Modell konstant gehalten werden. Ganz allgemein kann man sagen, dass, wenn zwei Probanden identische Videowerte haben und beide weiblich (oder beide männlich) sind, die Person mit dem höheren Rätselwert mit größerer Wahrscheinlichkeit Vanilleeis gegenüber Schokoladeneis bevorzugt als die Person mit dem niedrigeren Rätselwert.
weiblich – Dies ist das relative Risikoverhältnis zwischen Frauen und Männern für die Bevorzugung von Schokolade gegenüber Vanille, wenn die anderen Variablen im Modell konstant gehalten werden. Für Frauen im Vergleich zu Männern würde das relative Risiko, Schokolade im Vergleich zu Vanille zu bevorzugen, um den Faktor 2,263 steigen, wenn die anderen Variablen im Modell konstant gehalten werden. Mit anderen Worten: Frauen bevorzugen mit größerer Wahrscheinlichkeit Schokoladeneis gegenüber Vanilleeis als Männer.
Erdbeere im Vergleich zu Vanille
Video – Dies ist das relative Risikoverhältnis für eine Erhöhung des Videowertes um eine Einheit für die Bevorzugung von Erdbeere gegenüber Vanille, wenn die anderen Variablen des Modells konstant gehalten werden. Wenn eine Versuchsperson ihre Videowertung um eine Einheit erhöht, würde das relative Risiko für Erdbeere im Vergleich zu Vanille um den Faktor 1,023 steigen, wenn die anderen Variablen im Modell konstant gehalten werden. Ganz allgemein kann man sagen, dass eine Versuchsperson, die ihre Videobewertung erhöht, mit größerer Wahrscheinlichkeit Erdbeereis gegenüber Vanilleeis bevorzugt.
Puzzle – Dies ist das relative Risikoverhältnis für eine Erhöhung der Puzzle-Punktzahl um eine Einheit für die Bevorzugung von Erdbeere gegenüber Vanille, wenn die anderen Variablen im Modell konstant gehalten werden. Wenn eine Versuchsperson ihre Rätselpunktzahl um eine Einheit erhöht, würde das relative Risiko für Erdbeere im Vergleich zu Vanille um den Faktor 1,043 steigen, wenn die anderen Variablen im Modell konstant gehalten werden. Ganz allgemein kann man sagen, dass, wenn zwei Probanden identische Videowerte haben und beide weiblich (oder beide männlich) sind, die Person mit dem höheren Rätselwert mit größerer Wahrscheinlichkeit Erdbeereis gegenüber Vanilleeis bevorzugt als die Person mit dem niedrigeren Rätselwert.
weiblich – Dies ist das relative Risikoverhältnis zwischen Frauen und Männern für Erdbeere im Vergleich zu Vanille, wenn die anderen Variablen im Modell konstant gehalten werden. Für Frauen im Vergleich zu Männern würde das relative Risiko, Erdbeere gegenüber Vanille zu bevorzugen, voraussichtlich um den Faktor 0,968 abnehmen, wenn die anderen Variablen im Modell konstant gehalten werden. Mit anderen Worten: Frauen bevorzugen mit geringerer Wahrscheinlichkeit als Männer Erdbeereis gegenüber Vanilleeis.
b. – Dies ist der KI für das relative Risikoverhältnis, wenn die anderen Prädiktoren im Modell konstant sind. Für einen gegebenen Prädiktor mit einem Konfidenzniveau von 95 % würden wir sagen, dass wir zu 95 % sicher sind, dass das „wahre“ relative Risikoverhältnis der Bevölkerung beim Vergleich von Ergebnis m mit der Referenzgruppe zwischen der unteren und oberen Grenze des Intervalls liegt. Ein Vorteil eines KI ist, dass es illustrativ ist; es liefert einen Bereich, in dem das „wahre“ relative Risikoverhältnis liegen könnte.
Schreibe einen Kommentar