Thursday, 26 October 2017

Bestellt Probit Modell In Stata Forex


Also Im Versuch, für eine Prüfung zu studieren und Im nicht sicher, wie diese Probes-Regression Ich lief auf Stata interpretieren. Die Daten sind auf Kreditgenehmigung und Weiß ist eine Dummy-Variable, die 1, wenn eine Person weiß war, und 0, wenn die Person nicht war. Jede mögliche Hilfe auf, wie man dieses liest, würde sehr geschätzt. Was Im meistens suchen ist, wie die geschätzte Wahrscheinlichkeit der Darlehensgenehmigung für Weißweine und Nonwhites zu finden. Kann mir da jemand auch weiterhelfen mit dem Text hier und wie man es normal macht. Im tut mir leid, ich weiß nicht, wie dies zu tun. Für die Variable weiß: für die Konstante: Im allgemeinen können Sie die Koeffizienten nicht aus der Ausgabe einer Probit-Regression interpretieren (nicht auf irgendeine Standardmethode). Sie müssen die Randeffekte der Regressoren interpretieren, dh, wie stark sich die (bedingte) Wahrscheinlichkeit der Ergebnisvariablen ändert, wenn Sie den Wert eines Regressors ändern und alle anderen Regressoren bei einigen Werten konstant halten. Dies unterscheidet sich von dem linearen Regressionsfall, in dem Sie die geschätzten Koeffizienten direkt interpretieren. Dies ist so, weil in dem linearen Regressionsfall die Regressionskoeffizienten die Randeffekte sind. In der Probit-Regression gibt es einen zusätzlichen Rechenschritt, der erforderlich ist, um die Randeffekte zu erhalten, sobald Sie die Probit-Regression passen. Lineare und Probit-Regressionsmodelle Probit-Regression. Man beachte, dass Sie im Probit-Modell die (bedingte) Wahrscheinlichkeit eines erfolgreichen Ergebnisses modellieren, dh Yi1, mathbb leftYi1mid X, ldots, X beta0, ldots, betaKright Phi (beta0 Summe K betakX), wobei Phi (cdot) ist Die kumulative Verteilungsfunktion der Standard-Normalverteilung. Dies bedeutet im Grunde, dass die Wahrscheinlichkeit, dass die Ergebnisvariable Yi 1 ist, abhängig von den Regressoren eine bestimmte Funktion einer linearen Kombination der Regressoren ist. Lineare Regression . Vergleichen Sie dies mit dem linearen Regressionsmodell, wobei mathbb links (Yimid X, ldots, X beta0, ldots, betaKright) beta0 sum K betakX das (bedingte) Mittel des Ergebnisses eine lineare Kombination der Regressoren ist. Randeffekte Außer im linearen Regressionsmodell haben Koeffizienten selten direkte Interpretationen. Wir interessieren uns typischerweise für die ceteris paribus-Effekte von Veränderungen in den Regressoren, die die Merkmale der Ergebnisvariablen beeinflussen. Dies ist die Vorstellung, dass marginale Effekte messen. Lineare Regression . Ich möchte nun wissen, wie sehr sich der Mittelwert der Ergebnisvariablen bewegt, wenn ich einen der Regressoren verschiebe. Aber das ist nur der Regressionskoeffizient, was bedeutet, dass der Randeffekt einer Änderung im k-ten Regressor nur der Regressionskoeffizient ist . Probit-Regression. Es ist jedoch leicht zu sehen, dass dies nicht der Fall ist für die Probit-Regression frac leftYi1mid X, ldots, X beta0, ldots, betaKright betakphi (beta0 sum K betakX), die nicht gleich dem Regressionskoeffizienten ist. Dies sind die Randwirkungen für das Probit-Modell und die Quantität, die wir nachher haben. Dies hängt insbesondere von den Werten aller anderen Regressoren und den Regressionskoeffizienten ab. Hier ist phi (cdot) die Standard-Normalwahrscheinlichkeitsdichtefunktion. Wie sind Sie, diese Menge zu berechnen, und was sind die Entscheidungen der anderen Regressoren, die diese Formel eingeben sollte? Zum Glück gibt Stata diese Berechnung nach einer Probit-Regression und bietet einige Standardwerte der Entscheidungen der anderen Regressoren (es gibt keine universelle Vereinbarung Auf diesen Vorgaben). Diskrete Regressoren Beachten Sie, dass ein Großteil der oben genannten gilt für den Fall der kontinuierlichen Regressoren, da wir Kalkül verwendet haben. Im Falle von diskreten Regressoren, müssen Sie diskrete Änderungen zu verwenden. SO zum Beispiel ist die diskrete Änderung in einem Regressor X, der die Werte annimmt, kleiner Anfang Delta mathbb leftYi1mid X, ldots, X beta0, ldots, betaKrightampbetakphi (beta0 sum betalX Betak Summe Kbetal X) ampquadbetakphi (beta0 sum betalX sum Kbetal X) end Berechnung der Randeffekte in der Stata Probit Regression. Hier ist ein Beispiel für die Berechnung der Randwirkungen nach einer Probit-Regression in Stata. Hier ist die Ausgabe, die Sie erhalten, aus dem Rand-Befehl Dies kann interpretiert werden, zum Beispiel, dass die eine Ein-Einheiten-Änderung in der Altersvariable, erhöht die Wahrscheinlichkeit der Union Status um 0.003442. Ähnlich, aus dem Süden, verringert die Wahrscheinlichkeit der Union Status durch 0.1054928 Lineare Regression. Als abschließende Überprüfung können wir bestätigen, dass die Randwirkungen im linearen Regressionsmodell die gleichen sind wie die Regressionskoeffizienten (mit einem kleinen Twist). Wenn Sie die folgende Regression ausführen und die Randeffekte berechnen, erhalten Sie nur die Regressionskoeffizienten. Beachten Sie die interessante Tatsache, dass Stata die Netto-Marginal-Effekt eines Regressors einschließlich der Wirkung durch die quadratischen Begriffe berechnet, wenn im Modell enthalten. NOTICE: Die IDRE Statistical Consulting-Gruppe wird die Migration der Website auf die WordPress CMS im Februar zu erleichtern Wartung und Erstellung Von neuen Inhalten. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, die Weiterleitungen so zu halten, dass die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group durch ein Geschenk Stata Datenanalyse Beispiele Probit Regression Version info: Der Code für diese Seite wurde in Stata 12 getestet. Probit Regression, auch als probit Modell, wird verwendet, um zu modellieren Dichotome oder binäre Ergebnisvariablen. Im Probit-Modell wird die inverse Standard-Normalverteilung der Wahrscheinlichkeit als Linearkombination der Prädiktoren modelliert. Bitte beachten Sie: Der Zweck dieser Seite ist, zu zeigen, wie man verschiedene Datenanalyse-Befehle verwendet. Es deckt nicht alle Aspekte des Forschungsprozesses, die Forscher erwartet werden, zu tun. Dabei werden insbesondere die Datenreinigung und - prüfung, die Überprüfung der Annahmen, die Modelldiagnose und die möglichen Folgeanalysen nicht berücksichtigt. Beispiele für Probit-Regression Beispiel 1: Angenommen, wir interessieren uns für die Faktoren, die beeinflussen, ob ein politischer Kandidat eine Wahl gewinnt. Das Ergebnis (Antwort) Variable ist binär (01) gewinnen oder verlieren. Die Prädiktor-Variablen von Interesse sind die Menge an Geld für die Kampagne verbracht, die Menge der Zeit verbracht Kampagne negativ und ob der Kandidat ist ein etablierter. Beispiel 2: Ein Forscher ist daran interessiert, wie Variablen, wie GRE (Graduate Record Exam Scores), GPA (Grade Punkt Durchschnitt) und Prestige der Undergraduate-Institution, Wirkung Eintritt in die Graduate School. Die Antwortgröße, admitdont zugeben, ist eine binäre Variable. Beschreibung der Daten Für unsere Datenanalyse im Folgenden werden wir auf Beispiel 2 erweitern, um in die Graduiertenschule zu gelangen. Wir haben hypothetische Daten erstellt, die auf unserer Website abgerufen werden können. Dieser Datensatz hat eine binäre Antwort (Ergebnis, abhängige) Variable namens admit. Es gibt drei Vorhersagevariablen: gre. Gpa und Rang. Wir behandeln die Variablen gre und gpa als stetig. Der variable Rang ist ordinal, er nimmt die Werte 1 bis 4 an. Institutionen mit einem Rang 1 haben das höchste Prestige, die mit dem Rang 4 haben den niedrigsten Wert. Wir werden Rang als kategorisch behandeln. Analysemethoden, die Sie berücksichtigen könnten Im Folgenden finden Sie einige Analysemethoden, die Ihnen begegnet sind. Einige der aufgeführten Methoden sind recht vernünftig, während andere entweder aus der Bevorzugung gefallen oder haben Einschränkungen. Probit Regression, der Schwerpunkt dieser Seite. Logistische Regression. Ein Logitmodell führt zu Ergebnissen mit ähnlicher Probit-Regression. Die Wahl des Probits gegenüber dem Logit hängt weitgehend von individuellen Vorlieben ab. OLS-Regression. Bei Verwendung mit einer binären Antwortvariable wird dieses Modell als lineares Wahrscheinlichkeitsmodell bezeichnet und kann als eine Möglichkeit zur Beschreibung bedingter Wahrscheinlichkeiten verwendet werden. Jedoch verletzen die Fehler (d. h. Residuen) aus dem linearen Wahrscheinlichkeitsmodell die Homoskedastizität und die Normalität von Fehlerannahmen der OLS-Regression, was zu ungültigen Standardfehlern und Hypothesentests führt. Für eine genauere Erörterung dieser und anderer Probleme mit dem linearen Wahrscheinlichkeitsmodell siehe Long (1997, S. 38-40). Zweigruppendiskriminante Funktionsanalyse. Eine multivariate Methode für dichotome Ergebnisgrößen. Hotellings T 2. Das Ergebnis 01 wird in die Gruppierungsvariable umgewandelt, und die früheren Prädiktoren werden zu Ergebnisvariablen. Dies führt zu einem Gesamttest der Signifikanz, gibt aber keine individuellen Koeffizienten für jede Variable, und es ist unklar, inwieweit jedes quadratische Quotient für die Auswirkungen der anderen Quotienten angepasst wird. Probit-Regression Nachfolgend verwenden wir den probit-Befehl, um a zu schätzen Probit-Regressionsmodell. Das i. Bevor der Rang angibt, dass Rang eine Faktorvariable ist (d. h. kategorische Variable), und dass sie als eine Reihe von Indikatorvariablen in das Modell aufgenommen werden sollte. Beachten Sie, dass diese Syntax in Stata 11 eingeführt wurde. In der obigen Ausgabe sehen wir zuerst das Iterationsprotokoll, das angibt, wie schnell das Modell konvergiert. Die Log-Likelihood (-229.20658) kann in Vergleichen von verschachtelten Modellen verwendet werden, aber wir zeigen hier kein Beispiel. Auch an der Spitze der Ausgabe sehen wir, dass alle 400 Beobachtungen in unserem Datensatz verwendet wurden (weniger Beobachtungen wären verwendet worden, wenn irgendeine unserer Variablen fehlende Werte hätte). Das Wahrscheinlichkeitsverhältnis chi-Quadrat von 41,56 mit einem p-Wert von 0,0001 sagt uns, dass unser Modell als Ganzes statistisch signifikant ist, das heißt, es passt deutlich besser als ein Modell ohne Prädiktoren. In der Tabelle sehen wir die Koeffizienten, ihre Standardfehler, die z-Statistik, die zugehörigen p-Werte und das Konfidenzintervall der Koeffizienten. Beide gre. Gpa. Und die drei Indikatorvariablen für Rang sind statistisch signifikant. Die Probit-Regressionskoeffizienten geben die Veränderung im z-Score - oder Probit-Index für eine Ein-Einheiten-Änderung im Prädiktor an. Für eine Erhöhung der Einheit um 1 Einheit. Die z-Kerbe steigt um 0,001 an. Für jede Einheit Erhöhung in gpa. Die z-Kerbe steigt um 0,478. Die Indikatorvariablen für Rang haben eine etwas andere Interpretation. Zum Beispiel, nachdem er eine Grundschule im Rang von 2 besucht hat, im Vergleich zu einer Institution mit einem Rang von 1 (die Referenzgruppe), verringert sich die z-Punktzahl um 0,415. Mit dem Testbefehl können wir auf eine Gesamt-Wirkung des Ranges testen. Unten sehen wir, dass der Gesamteffekt des Ranges statistisch signifikant ist. Wir können auch zusätzliche Hypothesen über die Unterschiede in den Koeffizienten für verschiedene Rangniveaus testen. Im Folgenden testen wir, dass der Koeffizient für Rang 2 gleich dem Koeffizienten für Rang 3 ist. Sie können auch vorhergesagte Wahrscheinlichkeiten verwenden, um das Modell zu verstehen. Sie können vorhergesagte Wahrscheinlichkeiten mit dem Ränderbefehl berechnen, der in Stata 11 eingeführt wurde. Im Folgenden verwenden wir den Ränderbefehl, um die vorhergesagte Eintrittswahrscheinlichkeit auf jeder Rangstufe zu berechnen. Wobei alle anderen Variablen in dem Modell an ihren Mitteln gehalten werden. Weitere Informationen zur Verwendung des Ränderbefehls zur Berechnung der vorhergesagten Wahrscheinlichkeiten finden Sie auf unserer Seite Verwenden von Rändern für vorhergesagte Wahrscheinlichkeiten. In der obigen Ausgabe sehen wir, dass die vorausgesagte Wahrscheinlichkeit, in ein Graduiertenprogramm aufgenommen zu werden, 0,52 für die höchsten Prestigeuniversitäten (Rang 1) und 0,19 für die untergeordneten Institutionen (Rang 4) ist, wobei gre und gpa an ihren Mitteln gehalten werden. Im folgenden werden die prognostizierten Wahrscheinlichkeiten für Werte von gre von 200 bis 800 in Schritten von 100 erzeugt. Da wir weder atmeans angegeben haben oder in (.) Angegeben wurden, um Werte anzugeben, bei denen die anderen Prädiktorvariablen gehalten werden, sind die Werte in der Tabelle Die unter Verwendung der Abtastwerte der anderen Prädiktorvariablen berechnet werden. Um beispielsweise die durchschnittliche prognostizierte Wahrscheinlichkeit zu berechnen, wenn gre 200, wurde die prognostizierte Wahrscheinlichkeit für jeden Fall unter Verwendung dieser Fälle als Wert von Rang und gpa berechnet. Und die Einstellung gre bis 200. In der obigen Tabelle können wir sehen, dass die mittlere prognostizierte Wahrscheinlichkeit, akzeptiert zu werden, nur 0,16 beträgt, wenn die GRE-Punktzahl 200 ist und auf 0,42 steigt, wenn die GRE-Punktzahl 800 ist (Mittelung über die Stichprobenwerte von gpa und Rang ). Es kann auch hilfreich sein, Graphen von vorhergesagten Wahrscheinlichkeiten zu verwenden und das Modell darzustellen. Wir mögen auch sehen, wie gut unser Modell passt. Dies kann insbesondere beim Vergleich konkurrierender Modelle nützlich sein. Der benutzerdefinierte Befehl "fitstat" erzeugt eine Vielzahl von Anpassungsstatistiken. Weitere Informationen zu fitstat erhalten Sie, indem Sie findit fitstat eingeben (siehe Wie kann ich den Befehl findit verwenden, um nach Programmen zu suchen und zusätzliche Hilfe für weitere Informationen über die Verwendung von findit zu erhalten). Was Sie beachten sollten Leere Zellen oder kleine Zellen: Sie sollten auf leere oder kleine Zellen überprüfen, indem Sie eine Kreuztabelle zwischen kategorischen Prädiktoren und der Ergebnisvariablen durchführen. Wenn eine Zelle sehr wenige Fälle (eine kleine Zelle) hat, kann das Modell instabil werden oder es läuft überhaupt nicht. Trennung oder Quasi-Trennung (auch perfekte Vorhersage genannt), eine Bedingung, bei der das Ergebnis nicht auf einigen Ebenen der unabhängigen Variablen variiert. Siehe unsere Seite FAQ: Was ist eine vollständige oder quasi vollständige Trennung in der Logistikprofit-Regression und wie gehen wir mit ihnen für Informationen über Modelle mit perfekter Vorhersage um. Beispiel-Größe: Sowohl probit - als auch logit-Modelle erfordern mehr Fälle als OLS-Regression, da sie Maximal-Likelihood-Schätzverfahren verwenden. Es ist manchmal möglich, Modelle für binäre Ergebnisse in Datensätzen mit nur einer kleinen Anzahl von Fällen mit exakter logistischer Regression (mit dem exlogistischen Befehl) abzuschätzen. Weitere Informationen finden Sie in unserem Datenanalysebeispiel für eine exakte logistische Regression. Es ist auch wichtig zu beachten, dass, wenn das Ergebnis selten ist, auch wenn die gesamte Datenmenge groß ist, kann es schwierig sein, ein Probit-Modell zu schätzen. Pseudo-R-Quadrat: Es gibt viele verschiedene Psuedo-R-Quadrate. Sie alle versuchen, Informationen ähnlich wie die von R-squared in OLS-Regression zur Verfügung gestellt, aber keiner von ihnen kann genau so interpretiert werden, wie R-Quadrat in OLS-Regression interpretiert wird. Für eine Diskussion über verschiedene Pseudo-R-Quadrate siehe Long und Freese (2006) oder unsere FAQ-Seite Was sind Pseudo-R-Quadrate In Stata werden Werte von 0 als eine Ebene der Ergebnisvariablen und alle anderen nicht fehlenden Werte behandelt Werden als die zweite Ebene des Ergebnisses behandelt. Diagnostik: Die Diagnose für die Probit-Regression unterscheidet sich von der für die OLS-Regression. Die Diagnostik für Probit-Modelle ähnelt denen von Logitmodellen. Zur Diskussion der Modelldiagnostik für logistische Regression siehe Hosmer und Lemeshow (2000, Kapitel 5). Referers Hosmer, D. Lemeshow, S. (2000). Applied Logistic Regression (Zweite Auflage). New York: John Wiley Sons, Inc. Long, J. Scott (1997). Regressionsmodelle für kategorische und begrenzte abhängige Variablen. Thousand Oaks, CA: Sage Veröffentlichungen. Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, ein Buch oder ein Softwareprodukt der Universität von Kalifornien verstanden werden.

No comments:

Post a Comment