Log Transformation Von Variablen In Stata Forex

Um den Standardfehler der Schätzung zu finden, nehmen wir die Summe aller quadrierten Restterme und dividieren durch (n - 2) und nehmen dann die Quadratwurzel des Ergebnisses. In diesem Fall beträgt die Summe der quadrierten Reste 0.090.160.642.250.04 3.18. Mit fünf Beobachtungen, n - 2 3 und SEE (3.18 / 3) 1/2 1.03. Die Berechnung für Standardfehler ist relativ ähnlich der Standardabweichung für eine Probe (n - 2 wird anstelle von n - 1 verwendet). Es gibt einige Hinweise auf die prädiktive Qualität eines Regressionsmodells mit niedrigeren SEE-Zahlen, die zeigen, dass genauere Vorhersagen möglich sind. Die Standard-Fehler-Messung zeigt jedoch nicht, inwieweit die unabhängige Variable Variationen im abhängigen Modell erklärt. Bestimmungskoeffizient Wie der Standardfehler gibt diese Statistik einen Hinweis darauf, wie gut ein lineares Regressionsmodell als Schätzer von Werten für die abhängige Variable dient. Sie arbeitet, indem man den Bruchteil der Gesamtvariation in der abhängigen Variablen misst, die durch Variation in der unabhängigen Variable erklärt werden kann. In diesem Zusammenhang besteht die Gesamtvariation aus zwei Fraktionen: Gesamtvariation erklärt Variation unerklärliche Variation Gesamtvariation Gesamtvariation Der Bestimmungskoeffizient. Oder erklärter Variation als Prozentsatz der Gesamtvariation, ist der erste dieser beiden Ausdrücke. Es wird manchmal als 1 - (ungeklärte Variation / totale Variation) ausgedrückt. Für eine einfache lineare Regression mit einer unabhängigen Variablen quadriert die einfache Methode zur Berechnung des Bestimmungskoeffizienten den Korrelationskoeffizienten zwischen den abhängigen und unabhängigen Variablen. Da der Korrelationskoeffizient durch r gegeben ist, wird der Bestimmungskoeffizient im Volksmund als R² oder R-Quadrat bezeichnet. Wenn beispielsweise der Korrelationskoeffizient 0,76 beträgt, ist das R-Quadrat (0,76) 2 0,578. R-Quadrat-Ausdrücke werden gewöhnlich als Prozentsätze ausgedrückt, weshalb 0,578 57,8 wäre. Ein zweites Verfahren zur Berechnung dieser Zahl besteht darin, die Gesamtvariation in der abhängigen Variablen Y als die Summe der quadrierten Abweichungen von dem Probenmittel zu finden. Als nächstes wird der Standardfehler der Schätzung nach dem im vorigen Abschnitt beschriebenen Verfahren berechnet. Der Koeffizient der Bestimmung wird dann durch (Gesamtvariation in Y) / Gesamtvariation in Y berechnet. Diese zweite Methode ist für mehrere Regressionen notwendig, wobei es mehr als eine unabhängige Variable gibt, aber für unseren Kontext werden wir Vorausgesetzt der r (Korrelationskoeffizient), um ein R-Quadrat zu berechnen. Was R 2 uns sagt, sind die Änderungen der abhängigen Variablen Y, die durch Änderungen in der unabhängigen Variablen X erklärt werden. R 2 von 57.8 sagt uns, dass 57.8 der Änderungen in Y aus X resultieren, dass auch 1 - 57.8 oder 42.2 von Die Änderungen in Y sind unerklärt durch X und sind das Ergebnis anderer Faktoren. Je höher der R-Quadrat, desto besser die Vorhersagecharakteristik des linearen Regressionsmodells. Regressionskoeffizienten Für einen Regressionskoeffizienten (Intercept a oder Slope b) kann ein Konfidenzintervall mit folgenden Informationen ermittelt werden: 13 Ein geschätzter Parameterwert aus einer Probe 13 Standardfehler der Schätzung (SEE) 13 Signifikanzniveau für die t - Verteilung 13 Freiheitsgrade (die Stichprobengröße - 2) 13 Für einen Steigungskoeffizienten wird die Formel für das Konfidenzintervall durch btc SEE angegeben, wobei tc der kritische t-Wert auf unserem gewählten signifikanten Niveau ist. Um zu veranschaulichen, nehmen Sie eine lineare Regression mit einem Investmentfonds Renditen als abhängige Variable und den SampP 500 Index als unabhängige Variable. Für fünf Jahre der vierteljährlichen Renditen ergibt sich der Steigungskoeffizient b als 1,18 mit einem Standardfehler der Schätzung von 0,147. Die Studierenden-t-Verteilung für 18 Freiheitsgrade (20 Quartale - 2) bei einer 0,05 Signifikanzniveau ist 2,011. Diese Daten geben uns ein Konfidenzintervall von 1,18 (0,147) (2,011) oder einen Bereich von 0,87 bis 1,49. Unsere Interpretation ist, dass es nur eine Chance von 5, dass die Steigung der Bevölkerung ist entweder weniger als 0,87 oder größer als 1,49 - wir sind 95 zuversichtlich, dass dieser Fonds mindestens 87 so flüchtig wie die SampP 500, aber nicht mehr als 149 wie Volatil, basierend auf unserer Fünf-Jahres-Stichprobe. Hypothesentests und Regressionskoeffizienten Regressionskoeffizienten werden häufig mit dem Hypothesentestverfahren getestet. Abhängig davon, was der Analytiker zu beweisen beabsichtigt, können wir einen Steigungskoeffizienten testen, um zu ermitteln, ob er die Chancen in der abhängigen Variablen und das Ausmaß, in dem sie Veränderungen erklärt, erklärt. Betas (Steigungskoeffizienten) können entweder über oder unter 1 (flüchtiger oder weniger flüchtig als der Markt) bestimmt werden. Alphas (der Intercept-Koeffizient) können auf einer Regression zwischen einem Investmentfonds und dem relevanten Marktindex getestet werden, um festzustellen, ob Anhaltspunkte für ein hinreichend positives Alpha vorliegen (was auf eine Wertschöpfung des Fondsmanagers schließen lässt). Die Mechanismen der Hypothesentests entsprechen denen, die wir vorher verwendet haben. Eine Nullhypothese wird auf der Grundlage eines ungleichen, grßer als oder kleiner als der Fall gewählt, wobei die Alternative alle Werte erfüllt, die nicht in dem null Fall abgedeckt sind. Angenommen in unserem vorherigen Beispiel, in dem wir eine Rendite auf dem SampP 500 für 20 Quartale zurückgestellt haben, ist unsere Hypothese, dass dieser Investmentfonds volatiler ist als der Markt. Ein Fonds, der der Marktvolatilität entspricht, wird eine Steigung b von 1,0 aufweisen, so dass für diesen Hypothesentest die Nullhypothese (H 0) als Fall angegeben wird, bei dem die Steigung kleiner oder gleich 1,0 ist (dh H 0: b lt 1,0 ). Die alternative Hypothese H a hat b gt 1,0. Wir wissen, dass dies ein größerer Fall ist (dh ein Schwanz) - wenn wir ein 0,05 Signifikanzniveau annehmen, ist t gleich 1.734 bei Freiheitsgraden n - 2 18. Beispiel: Interpretieren eines Hypothesentests Aus unserer Stichprobe haben wir Hatte b von 1,18 und Standardfehler von 0,147 geschätzt. Unsere Teststatistik wird mit dieser Formel berechnet: t geschätzter Koeffizient - hypothetischer Koeffizient. / Standardfehler (1,18 - 1,0) / 0,177 0,18 / 0,147 oder t 1,224. Für dieses Beispiel liegt unsere berechnete Teststatistik unter dem Ablehnungsniveau von 1,734, so dass wir nicht in der Lage sind, die Nullhypothese zurückzuweisen, dass der Fonds volatiler ist als der Markt. Interpretation: Die Hypothese, dass b gt 1 für diesen Fonds wahrscheinlich mehr Beobachtungen (Freiheitsgrade) benötigt, die mit statistischer Signifikanz nachgewiesen werden können. Auch bei 1,18 nur leicht über 1,0 ist es durchaus möglich, dass dieser Fonds eigentlich nicht so volatil ist wie der Markt, und wir waren richtig, die Nullhypothese nicht abzulehnen. Beispiel: Interpretation eines Regressionskoeffizienten Die CFA-Prüfung ist wahrscheinlich, die Zusammenfassungsstatistik einer linearen Regression zu geben und um Interpretation zu bitten. Zur Veranschaulichung gehen die folgenden Statistiken für eine Regression zwischen einem Small-Cap-Wachstumsfonds und dem Russell 2000-Index in Betracht: 13 Korrelationskoeffizient 13 Die beiden Abkürzungen sind RSS und SSE: 13 RSS. Oder die Regressions-Summe der Quadrate, ist die Summe der Gesamtvariation in der abhängigen Variablen Y, die in der Regressionsgleichung erklärt wird. Die RSS wird berechnet, indem jede Abweichung zwischen einem vorhergesagten Y-Wert und dem mittleren Y-Wert berechnet wird, wobei die Abweichung quadriert und alle Terme addiert werden. Wenn eine unabhängige Variable keine der Variationen einer abhängigen Variablen erklärt, dann sind die vorhergesagten Werte von Y gleich dem Mittelwert und RSS 0. 13 SSE. Oder die Summe des quadratischen Fehlers von Residuen berechnet, indem die Abweichung zwischen einem vorhergesagten Y und einem tatsächlichen Y ermittelt wird, das Ergebnis quadriert und alle Terme addiert werden. 13 TSS oder Gesamtabweichung ist die Summe aus RSS und SSE. Mit anderen Worten, diese ANOVA-Prozess bricht Varianz in zwei Teile: eine, die durch das Modell und eine, die nicht erklärt wird. Für eine Regressionsgleichung mit hoher prädiktiven Qualität müssen wir eine hohe RSS und eine niedrige SSE sehen, die das Verhältnis (RSS / 1) / SSE / (n - 2) hoch macht und (basierend auf einem Vergleich mit Ein kritischer F-Wert) statistisch aussagekräftig. Der kritische Wert wird der F-Verteilung entnommen und basiert auf Freiheitsgraden. Zum Beispiel, mit 20 Beobachtungen, Freiheitsgrade wäre n-2 oder 18, was zu einem kritischen Wert (aus der Tabelle) von 2,19. Wenn RSS 2,5 und SSE 1,8 wäre, wäre die berechnete Teststatistik F (2,5 / (1,8 / 18) 25, die über dem kritischen Wert liegt, was anzeigt, dass die Regressionsgleichung eine prädiktive Qualität aufweist (b ist von 0 verschieden) Schätzung der Wirtschaftsstatistiken mit Regressionsmodellen Regressionsmodelle werden häufig verwendet, um ökonomische Statistiken wie Inflation und BIP-Wachstum abzuschätzen. Es wird angenommen, dass zwischen der geschätzten jährlichen Inflation (X oder unabhängiger Variable) und der tatsächlichen Zahl (Y oder abhängiger Variable) : Unter Verwendung dieses Modells würde die vorhergesagte Inflationszahl auf der Grundlage des Modells für die folgenden Inflationsszenarien berechnet werden: 13 Inflationsabschätzung 13 Inflation basierend auf Modell 13 Die auf diesem Modell basierenden Prognosen scheinen am besten für typische Inflationsschätzungen zu sein und deuten darauf hin, dass extreme Schätzungen tendieren dazu, die Inflation zu übertreiben - z. B. eine tatsächliche Inflation von nur 4,46, wenn die Schätzung 4.7 war. Das Modell scheint zu suggerieren, dass Schätzungen sehr voraussagend sind. Um dieses Modell besser zu bewerten, müssten wir jedoch den Standardfehler und die Anzahl der Beobachtungen sehen, auf denen er basiert. Wenn wir den wahren Wert der Regressionsparameter (Slope und Intercept) kennen, wäre die Varianz eines beliebigen vorhergesagten Y-Werts gleich dem Quadrat des Standardfehlers. In der Praxis müssen wir die Regressionsparameter schätzen, also ist unser vorhergesagter Wert für Y eine Schätzung, die auf einem geschätzten Modell basiert. Wie zuversichtlich können wir in einem solchen Prozess sein Um ein Vorhersageintervall zu bestimmen, verwenden Sie die folgenden Schritte: 1. Prognostizieren Sie den Wert der abhängigen Variablen Y basierend auf unabhängiger Beobachtung X. 2. Berechnen Sie die Varianz des Vorhersagefehlers Wobei n die Anzahl der Beobachtungen ist, X der Wert der unabhängigen Variablen ist, die verwendet wird, um die Vorhersage durchzuführen, wobei X der geschätzte Mittelwert der unabhängigen Variablen und sx ist 2 ist die Varianz von X. 3. Wählen Sie ein Signifikanzniveau für das Konfidenzintervall. 4. Konstruieren Sie ein Intervall bei (1 -) Prozent Zuverlässigkeit unter Verwendung der Struktur Y t c s f. Hier ist ein weiterer Fall, wo das Material viel technischer als notwendig wird und man kann sich in Vorbereitung, wenn in Wirklichkeit die Formel für die Varianz eines Vorhersagefehlers nicht wahrscheinlich abgedeckt werden. Prioritize - verschwenden Sie wertvolle Studienzeiten, die es merken. Wenn das Konzept überhaupt getestet wird, youll wahrscheinlich die Antwort auf Teil 2 gegeben werden. Einfach wissen, wie die Struktur in Teil 4 verwenden, um eine Frage zu beantworten. Wenn zum Beispiel die vorhergesagte X-Beobachtung 2 für die Regression Y 1,5 2,5X ist, würden wir ein vorhergesagtes Y von 1,5 2,5 (2) oder 6,5 haben. Unser Vertrauensintervall beträgt 6,5 t c s f. Der t-stat basiert auf einem gewählten Vertrauensintervall und Freiheitsgraden, während sf die Quadratwurzel der obigen Gleichung ist (für Varianz des Prädiktionsfehlers: Wenn diese Zahlen tc 2.10 für 95 Vertrauen und sf 0.443 das Intervall sind Ist 6.5 (2.1) (0.443) oder 5.57 bis 7.43 Einschränkungen der Regressionsanalyse Konzentrieren Sie sich auf drei Hauptbeschränkungen: 1. Parameter Instabilität - Dies ist die Tendenz, dass sich die Beziehungen zwischen Variablen im Laufe der Zeit ändern, und zwar aufgrund von Veränderungen in der Wirtschaft oder den Märkten , Unter anderen Unsicherheiten. Wenn ein Investmentfonds eine Rückkehr Geschichte in einem Markt, in dem Technologie war ein Leadership-Sektor, das Modell kann nicht funktionieren, wenn ausländische Märkte und Small-Cap-Märkte sind Führer.- 2. Public Dissemination der Beziehung - In einem effizienten Markt , Kann dies die Effektivität dieser Beziehung in künftigen Perioden beschränken. So zeigt beispielsweise die Entdeckung, dass niedrige Kurs-zu-Buch-Wertbestände einen hohen Preis-zu-Buch-Wert übertreffen, eine höhere Wertentwicklung dieser Wertpapiere und wertorientierte Anlageansätze Wird nicht beibehalten die gleiche Beziehung wie in der Vergangenheit. 3. Verletzung von Regressionsbeziehungen - Früher haben wir die sechs klassischen Annahmen einer linearen Regression zusammengefasst. In der realen Welt sind diese Annahmen oft unrealistisch - z. B. Unter der Annahme, dass die unabhängige Variable X nicht zufällig ist. Einführung in stationäre und nichtstationäre Prozesse Ein nicht stationärer Prozess mit einem deterministischen Trend wird nach dem Entfernen des Trends oder der Detrending stationär. Zum Beispiel wird Yt t t in einen stationären Prozess transformiert, indem der Trend t: Yt - t t subtrahiert wird, wie in Abbildung 4 unten gezeigt. Es wird keine Beobachtung verloren, wenn eine Deposition verwendet wird, um einen nichtstationären Prozess in einen stationären Prozess umzuwandeln. Der Zinssatz, zu dem ein Depot die an der Federal Reserve gehaltenen Gelder an eine andere Depotbank leiht. Ein Portfolio von festverzinslichen Wertpapieren, in denen jedes Wertpapier ein signifikant unterschiedliches Fälligkeitsdatum aufweist. Der Zweck von. Das Verfalldatum der verschiedenen Aktienindex-Futures, Aktienindexoptionen, Aktienoptionen und Single Stock Futures. Alles auf Lager. Eine Art von Versicherungspolice, in der der Versicherte eine bestimmte Menge an Auslagen für Gesundheitsleistungen wie zahlt. Regierungsmaßnahmen und - politiken, die den internationalen Handel einschränken oder beschränken, oft mit der Absicht des Schutzes der lokalen Bevölkerung. Ein Treuhänder ist eine Person, die im Namen einer anderen Person oder Personen zu verwalten Vermögenswerte handelt. Einfache lineare Regressionsanalyse Regressionsanalyse ist eine statistische Methode, die versucht, die Beziehung zwischen zwei oder mehr Variablen zu erforschen und zu modellieren. Zum Beispiel möchte ein Analytiker wissen, ob es eine Beziehung zwischen Verkehrsunfällen und dem Alter des Fahrers gibt. Die Regressionsanalyse ist ein wichtiger Bestandteil der statistischen Analyse der aus konstruktiven Experimenten gewonnenen Daten und wird in diesem Kapitel kurz diskutiert. Jedes Experiment analysiert in DOE enthält Regressionsergebnisse für jede der Antworten. Diese Ergebnisse liefern zusammen mit den Ergebnissen der Varianzanalyse (die in den Kapiteln One Factor Designs und General Full Factory Designs beschrieben werden) Informationen, die nützlich sind, um wesentliche Faktoren in einem Experiment zu identifizieren und die Art der Beziehung zwischen diesen Faktoren zu erforschen die Antwort. Die Regressionsanalyse bildet die Grundlage für alle DOE-Berechnungen, die sich auf die Summe der in der Varianzanalyse verwendeten Quadrate beziehen. Der Grund hierfür ist in Anhang B. Zusätzlich enthält DOE auch ein Regressionstool, um zu sehen, ob zwei oder mehr Variablen zusammenhängen, und die Art der Beziehung zwischen ihnen zu erforschen. Dieses Kapitel beschreibt eine einfache lineare Regressionsanalyse, während ein nachfolgendes Kapitel sich auf eine multiple lineare Regressionsanalyse konzentriert. Einfache lineare Regressionsanalyse Ein lineares Regressionsmodell versucht, die Beziehung zwischen zwei oder mehreren Variablen mittels einer Geraden zu erklären. Man betrachte die Daten, die aus einem chemischen Verfahren erhalten wurden, in dem die Ausbeute des Verfahrens mit der Reaktionstemperatur zusammenhängt (siehe nachstehende Tabelle). Diese Daten können in DOE wie in der folgenden Abbildung gezeigt eingegeben werden:


Comments