Hallo,
ich hätte Frage zur Ökonometrie bzw. Statistik
Nehmen wir an in einem multiplen Regressionsmodell wird folgende Schätzung durchgeführt.
Dabei liegt Homoskedastizität vor. D. h. Var(ui) = sigma² für alle ui
y = ß1 + ß2x2 + ß3x3 + ß4x4 + u
Ich weiß, dass der Vektor u der Teil ist, den das Modell nicht erklären kann.
Zusammengefasst in Matrix und Vektorenschreibweise sieht das Modell so aus:
y = Xß + u
X ist die Matrix die alle Regressoren und die Konstante enthält.
Der KQ-Schätzer ist damit:
ß^ = (X'X)^-1X'y
Wenn nun eine Regression des urprünglichen Modells
y = ß1 + ß2x2 + ß3x3 + ß4x4 + u
auf u^ statt y durchgeführt wird. D. h. u^ ist der Vektor der Störterme.
D. h. mein Modell ist jetzt
u^ = ß1^ + ß2^x2 + ß3^x3 + ß4^x4
Wie sieht in diesem Fall der KQ Schätzer aus?
ß^ = (X'X)^-1X'u^ oder einfach ß^ = 0,
da u^ ja genau der Teil ist, den das Modell nicht erklären kann?
Danke für eure Hilfe
Deine Ausgangsgleichung:
\(y=\beta_{1} + \beta_{2}x_{2} + \beta_{3}x_{3} + \beta_{4}x_{4} + u\)
finde ich in zweierlei Hinsicht merkwürdig. Erstens hat \(\beta_{1}\) kein \(x_{1}\). Ich denke, da hast Du Dich einfach verschrieben. Zweitens finde ich aber auch merkwürdig, dass Du \(\beta_{i}\) schreibst und nicht \(b_{i}\). In Bühl 2012:442 steht:
»Bei der multiplen Regressionsanalyse geht es darum, die Koeffizienten der Gleichung
\(y=b_{1}\cdot x_{1}+b_{2}\cdot x_{2}+\cdots+b_{n}\cdot x_{n}+a\)
zu schätzen, wobei \(n\) die Anzahl der unabhängigen Variablen ist, die mit \(x_{1}\) bis \(x_{n}\) bezeichnet sind; \(a\) ist eine Konstante.«
Die eigentliche multiple Regressionsgleichung beinhaltet also die Koeffizienten \(b_{1}\) bis \(b_{n}\), nicht \(\beta_{1}\) bis \(\beta_{n}\). Letzteres sind die sogenannten /standardisierten/ Koeffizienten. Wenn sämtliche gemessenen Ausprägungen aller Variablen, d.h. sowohl von \(y\) als auch von \(x_{1}\) bis \(x_{n}\), in z-Werte überführt werden, dann sind die zu den z-Werten gehörenden Koeffizienten eben \(\beta_{1}\) bis \(\beta_{n}\). Bühl 2012:445 schreibt dazu:
»Einer Erklärung bedürfen noch die Beta-Koeffizienten. Diese sind auf den jeweiligen Wertebereich standardisierte Regressionskoeffizienten und geben die Wichtigkeit der aufgenommenen unabhängigen Variablen an.«
Das heißt, \(\beta_{1}\) bis \(\beta_{n}\) spielen eine Rolle, wenn Du wissen willst, wie hoch der Erklärungswert einer bestimmten unabhängigen Variablen \(x_{i}\) für die abhängige Variable \(y\) ist. Aber für die Gleichung selbst spielen sie keine Rolle.
Insofern ist Deine Ausgangsgleichung erklärungsbedürftig. Meine ich.
Viele Grüße
jake2042
Literatur
Bühl, Achim, (13)2012: SPSS 20. Einführung in die moderne Datenanalyse. (=scientific tools 4150) München: Pearson ─ jake2042 05.08.2019 um 15:56