2
Ganz generell: Wir wollen mithilfe von \( n \) erhobenen Daten die Varianz schätzen. Dabei hätten wir gern einen erwartungstreuen Schätzer, also einen Schätzwert, bei dem wir im Erwartungswert auch tatsächlich die Varianz herausbekommen.
Wenn wir jetzt \( n \) unabhängig und identisch verteilte Zufallsvariablen \( X_1, \dots, X_n \) haben, dann bilden wir zunächst das empirische Mittel
\( \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i \).
Dies liefert einen erwartungstreuen Schätzer für den Erwartungswert der \( X_i \). Man rechnet nämlich nach:
\( \mathbb{E}[ \bar{X} ] \) \( = \mathbb{E}[ \frac{1}{n} \sum_{i=1}^n X_i] \) \( = \frac{1}{n} \sum_{i=1}^n \mathbb{E}[X_i] \) \( = \frac{1}{n} \sum_{i=1}^n \mathbb{E}[X_1] \) \( = \mathbb{E}[X_1] \).
Nun zur Varianz. Man kann durch (relativ aufwendiges) Rechnen nachweisen, dass
\( \mathbb{E}[ \sum_{i=1}^n (X_i - \bar{X})^2] \) \( = (n-1) \text{Var}[X_1] \)
ist. Und hier liegt der Knackpunkt. Wenn wir jetzt nämlich
\( \tilde{S^2} = \frac{1}{n} \sum_{i=1}^n (X_i - \bar{X})^2 \)
betrachten (so wie man es für die Varianz intuitiv vielleicht machen würde), dann bekommen wir damit leider keinen erwartungstreuen Schätzer für die Varianz der \( X_i \). Man rechnet mit der obigen Formel nämlich nach:
\( \mathbb{E}[\tilde{S^2}] \) \( = \frac{1}{n} \mathbb{E}[ \sum_{i=1}^n (X_i - \bar{X})^2 ] \) \( = \frac{n-1}{n} \text{Var}[X_1] \).
Wenn wir hingegen
\( S^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})^2 \)
setzen, dann bekommen wir damit einen erwartungstreuen Schätzer für die Varianz der \( X_i \). In diesem Falle ist nämlich:
\( \mathbb{E}[S^2] \) \( = \frac{1}{n-1} \mathbb{E}[ \sum_{i=1}^n (X_i - \bar{X})^2 ] \) \( = \text{Var}[X_1] \).
Ich hoffe, das ist als Erklärung soweit nachvollziehbar.
Zum Abschluss möchte ich noch festhalten: Das "Problem" entsteht dadurch, dass man gerne einen erwartungstreuen Schätzer hätte. Man kann durchaus darüber streiten wie sinnvoll oder auch unsinnig diese Forderung ist.
Wenn wir jetzt \( n \) unabhängig und identisch verteilte Zufallsvariablen \( X_1, \dots, X_n \) haben, dann bilden wir zunächst das empirische Mittel
\( \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i \).
Dies liefert einen erwartungstreuen Schätzer für den Erwartungswert der \( X_i \). Man rechnet nämlich nach:
\( \mathbb{E}[ \bar{X} ] \) \( = \mathbb{E}[ \frac{1}{n} \sum_{i=1}^n X_i] \) \( = \frac{1}{n} \sum_{i=1}^n \mathbb{E}[X_i] \) \( = \frac{1}{n} \sum_{i=1}^n \mathbb{E}[X_1] \) \( = \mathbb{E}[X_1] \).
Nun zur Varianz. Man kann durch (relativ aufwendiges) Rechnen nachweisen, dass
\( \mathbb{E}[ \sum_{i=1}^n (X_i - \bar{X})^2] \) \( = (n-1) \text{Var}[X_1] \)
ist. Und hier liegt der Knackpunkt. Wenn wir jetzt nämlich
\( \tilde{S^2} = \frac{1}{n} \sum_{i=1}^n (X_i - \bar{X})^2 \)
betrachten (so wie man es für die Varianz intuitiv vielleicht machen würde), dann bekommen wir damit leider keinen erwartungstreuen Schätzer für die Varianz der \( X_i \). Man rechnet mit der obigen Formel nämlich nach:
\( \mathbb{E}[\tilde{S^2}] \) \( = \frac{1}{n} \mathbb{E}[ \sum_{i=1}^n (X_i - \bar{X})^2 ] \) \( = \frac{n-1}{n} \text{Var}[X_1] \).
Wenn wir hingegen
\( S^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})^2 \)
setzen, dann bekommen wir damit einen erwartungstreuen Schätzer für die Varianz der \( X_i \). In diesem Falle ist nämlich:
\( \mathbb{E}[S^2] \) \( = \frac{1}{n-1} \mathbb{E}[ \sum_{i=1}^n (X_i - \bar{X})^2 ] \) \( = \text{Var}[X_1] \).
Ich hoffe, das ist als Erklärung soweit nachvollziehbar.
Zum Abschluss möchte ich noch festhalten: Das "Problem" entsteht dadurch, dass man gerne einen erwartungstreuen Schätzer hätte. Man kann durchaus darüber streiten wie sinnvoll oder auch unsinnig diese Forderung ist.
Diese Antwort melden
Link
geantwortet
42
Student, Punkte: 7.13K
Student, Punkte: 7.13K
Vielen Dank, entschuldige bitte hatte so viele Abgaben und war an manchen Tagen einfach nur down. Ich denke mir das nochmal durch und schreibe, wenn was nicht klar ist, genau diese komplexen Umformungen will ich ja beweisen, weil es ja sonst teilweise wieder nicht bewiesen ist. Muss alles bewiesen, damit ich es mir merke. Bin aber gerade an einem guten Wiki-Artikel dran, der das beweist. Mal schauen. Auf jeden Fall vielen herzlichen Dank :)
─
sven03
20.12.2024 um 20:34