Varianz: warum (n - 1)

Aufrufe: 157     Aktiv: 20.12.2024 um 20:34

0
Ich habe folgendes Problem: bei der Varianz wird durch n - 1 geteilt. Ich weiß ja, x ist der Mittelwert dass sum((xi-x)^2))  = sum(xi^2-2x*xi+x^2) = sum(xi^2)-2*x*x*n+n*x^2 = sum(xi^2)-n*x^2*; weiters weiß ich, dass sum(xi-x)=0 (weil sum(xi)-xn= xn -xn = 0)
Aber ich verstehe nicht, wo ich bei * den Freiheitsgrad verliere, was das dividieren von n - 1 (weil n - 1) Summanden rechtfertigt.

Ich entschuldige mich für die Schreibweise, ich weiß nicht, wie ich das schön formatiert, ev. mit Latexe, darstelle
Hoffe es ist trotzdem entzifferbar und ich bedanke mich schon mal herzlichst für eure Hilfe
Diese Frage melden
gefragt

Punkte: 82

 

1
Ich kann dir leider keine gute Antwort geben, da Statistik nicht mein Gebiet ist - aber das wenn du "sample variance n-1" googlest, kriegst du viele Erklärungen auf Englisch.   ─   crystalmath 11.12.2024 um 21:41
Kommentar schreiben
1 Antwort
2
Ganz generell: Wir wollen mithilfe von \( n \) erhobenen Daten die Varianz schätzen. Dabei hätten wir gern einen erwartungstreuen Schätzer, also einen Schätzwert, bei dem wir im Erwartungswert auch tatsächlich die Varianz herausbekommen.

Wenn wir jetzt \( n \) unabhängig und identisch verteilte Zufallsvariablen \( X_1, \dots, X_n \) haben, dann bilden wir zunächst das empirische Mittel

\( \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i \).

Dies liefert einen erwartungstreuen Schätzer für den Erwartungswert der \( X_i \). Man rechnet nämlich nach:

\( \mathbb{E}[ \bar{X} ] \) \( = \mathbb{E}[ \frac{1}{n} \sum_{i=1}^n X_i] \) \( = \frac{1}{n} \sum_{i=1}^n \mathbb{E}[X_i] \) \( = \frac{1}{n} \sum_{i=1}^n \mathbb{E}[X_1] \) \( = \mathbb{E}[X_1] \).

Nun zur Varianz. Man kann durch (relativ aufwendiges) Rechnen nachweisen, dass

\( \mathbb{E}[ \sum_{i=1}^n (X_i - \bar{X})^2] \) \( = (n-1) \text{Var}[X_1] \)

ist. Und hier liegt der Knackpunkt. Wenn wir jetzt nämlich

\( \tilde{S^2} = \frac{1}{n} \sum_{i=1}^n (X_i - \bar{X})^2 \)

betrachten (so wie man es für die Varianz intuitiv vielleicht machen würde), dann bekommen wir damit leider keinen erwartungstreuen Schätzer für die Varianz der \( X_i \). Man rechnet mit der obigen Formel nämlich nach:

\( \mathbb{E}[\tilde{S^2}] \) \( = \frac{1}{n} \mathbb{E}[ \sum_{i=1}^n (X_i - \bar{X})^2 ] \) \( = \frac{n-1}{n} \text{Var}[X_1] \).

Wenn wir hingegen

\( S^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})^2 \)

setzen, dann bekommen wir damit einen erwartungstreuen Schätzer für die Varianz der \( X_i \). In diesem Falle ist nämlich:

\( \mathbb{E}[S^2] \) \( = \frac{1}{n-1} \mathbb{E}[ \sum_{i=1}^n (X_i - \bar{X})^2 ] \) \( = \text{Var}[X_1] \).

Ich hoffe, das ist als Erklärung soweit nachvollziehbar.

Zum Abschluss möchte ich noch festhalten: Das "Problem" entsteht dadurch, dass man gerne einen erwartungstreuen Schätzer hätte. Man kann durchaus darüber streiten wie sinnvoll oder auch unsinnig diese Forderung ist.
Diese Antwort melden
geantwortet

Student, Punkte: 7.13K

 

Vielen Dank, entschuldige bitte hatte so viele Abgaben und war an manchen Tagen einfach nur down. Ich denke mir das nochmal durch und schreibe, wenn was nicht klar ist, genau diese komplexen Umformungen will ich ja beweisen, weil es ja sonst teilweise wieder nicht bewiesen ist. Muss alles bewiesen, damit ich es mir merke. Bin aber gerade an einem guten Wiki-Artikel dran, der das beweist. Mal schauen. Auf jeden Fall vielen herzlichen Dank :)   ─   sven03 20.12.2024 um 20:34

Kommentar schreiben