Hey Laura,
ich stimme Christian hier mit dem Aufstellen der Nullhypothese vollkommen zu, wobei ich die Aussage, dass du das von "deinem Standpunkt" aus machen musst, ein wenig unpräzise finde.
Ich gebe auch Nachhilfe und ich hatte genau dieses Thema - Hypothesentests - letztens im Rahmen einer Präsentation, die eine meiner Schülerinnen geben musste.
Wir haben da echt lange diskutiert und ich will dir hier mal einen kleinen Überblick über unsere erarbeitete Struktur zu den Themen
- Allgemeines Vorgehen bei Hypothesentests
- Begründung: Warum Benennung mit "\(H_{0}\)" bzw. "\(H_{1}\)"?
- Leitregeln zur Auswahl der Hypothesen
geben, die dir bei deinem Problem ggf. weiterhelfen könnte (auch, wenn dir vieles davon wahrscheinlich schon bekann ist).
Ich konzentriere mich aber eher auch eine Begründung, die sich aus der Alternativhypothese her begründet, so dass dir das ggf. neu sein könnte.
Wofür brauchen wir Hypothesentests?
Hypothesentests (oder bei dir "Signifikanztest") werden dann benötigt, wenn man eine (statistische) Aussage überprüfen möchte, was in der Regel mit Wahrscheinlichkeitsdichteverteilungen zu tun hat.
Beispiel: Binomialverteilung, mit den Voraussetzungen für das Experiment:
- Experiment "mit Zurücklegen" (gleichbleibende Ereigniswahrscheinlichkeit) und
- Experiment "ohne Zugreihenfolge" (Zugreihenfolge ist innerhalb der Fragestellung irrelevant).
Hypothesentests sind meist in der Wissenschaft, Qualitätssicherung einer Firma oder bei der Analyse größerer Sachverhalte (z.B. psychologische Phänomene o.ä.) vertreten.
Wie gehe ich bei einem Hypothesentest allgemein vor?
Grundsätzlich geht es bei dem Hypothesentest darum, zwei Hypothesen aufzustellen, die man anschließend durch die Angabe eines Gültigkeitsintervalls (oft auch als "Entscheidungsregel" bezeichnet) bzw. einer kritischen Trefferanzahl \(k_{r}\) auswertet:
- Die Nullhypothese \(H_{0}\) und
- die Alternativhypothese \(H_{1}\).
Beide Hypothesen sind (zumindest im Rahmen der Schule / Abitur) immer mit einer Wahrscheinlichkeitsaussage verknüpft, die in Form einer Ungleichung ausgedrückt werden, beispielsweise:
- \(H_{0}\): \(p\leq p_{0}\)
- \(H_{1}\): \(p>p_{0}\)
Wichtig zu erkennen ist hierbei, dass man immer eine Testwahrscheinlichkeit \(p_{0}\) auswertet, die in der konkreten Testaussage erwähnt wird bzw. die zur Fragestellung passt (z.B. \(p_{0}=0.6\) für die Aussage "60 % der Testpersonen" kommen pünktlich, sprechen positiv auf ein Medikament an o.ä.).
Die jeweilige Testart lässt sich in
- linksseitige Tests,
- rechtsseitige Hypothesentests oder
- beidseitige Hypothesentests
gliedern, wobei der beidseitige Hypothesentest eigentlich einen Mix aus links- und rechtsseitigen Hypothesentests darstellt.
Entscheidend für die Auswahl der Testart ist allerdings - anders, als es so manche ganz gerne behaupten - nicht die Nullhypothese \(H_{0}\), sondern immer die Alternativhypothese \(H_{1}\).
Dieser Umstand hängt dann entscheidend mit dem mathematischen Vorgehen zusammen, das man zum Lösen des Hypothesentests anwendet.
Ich habe dieses Vorgehen bzw. den Ablauf eines Hypothesentests damals, zusammen mit meiner Schülerin, in den folgenden, chronologisch geordneten Ablauf gegliedert (der dir die Idee mit der Alternativhypothese auch noch einmal näher bringt):
- Erstellen einer Zeichnung (der Wahrscheinlichkeitsdichtefunktion) und Aufstellen der Hypothesen, inklusive Einzeichnen der kritischen Trefferzahl \(k_{r}\) in die Zeichnung. Hier ergibt sich dann auch die Benennung der Testart, je nachdem, wie man den Bereich für \(H_{1}\) auswählt (d.h. \(P(X\leq k_{r})\) für linksseitige und \(P(X\geq k_{r})\) für rechtsseitige Hypothesentests). Die Zeichnung kann übrigens auch dabei helfen, die richtigen Hypothesen auszuwählen, wenn man sich unschlüssig ist.
- Essentiell: Formulieren der Ungleichung, mit der Form \(P(X\;?\;k_{r})\leq\alpha_{s}\), mit der kritischen Trefferanzahl \(k_{r}\) und dem zu testenden Signifikanzniveau \(\alpha_{s}\), welches die maximal tolerierbare Irrtumswahrscheinlichkeit des Tests beschreibt. Die Auswahl des "\(?\)" in der Ungleichung hängt hierbei von der Testart bzw. von der Wahl der Alternativhypothese ab und entspricht in der Regel "\(\leq\)" oder "\(\geq\)".
- Umformen der Ungleichung bzw. anschließende (mathematische) Auswertung bzw. Interpretation mit den üblichen Regeln für Wahrscheinlichkeitsdichtefunktionen, d.h. eine Formulierung mit "kleiner oder gleich" wie \(P(X\leq k)\), da nur so eine kumulierte Wahrscheinlichkeit (cdf) berechnet werden kann. Ziel ist es hier, die kritische Trefferwahrscheinlichkeit \(k_{r}\) zu berechnen, für welche die Ungleichung ungültig oder gültig wird (hängt davon ab, welche Testart man gerade betrachtet).
- Aufstellen der "Entscheidungsregeln" bzw. der Intervalle, für welches man \(H_{0}\) oder \(H_{1}\) (bzw. die zugehörigen Wahrscheinlichkeitsaussagen / -ungleichungen) annimmt.
- Optional: Berechnung der "realen" Irrtumswahrscheinlichkeit \(\alpha\) als Fläche unter der Wahrscheinlichkeitsdichtefunktion im Bereich / Intervall der Alternativhypothese \(H_{1}\), d.h. Berechnung der kumulierten Wahrscheinlichkeit (cdf) mit \(\alpha=P(X\leq k_{r})\) für linksseitige bzw. \(\alpha=P(X\geq k_{r})\) für rechtsseitige Hypothesentests. Hierbei gilt immer, dass unsere "reale" Irrtumswahrscheinlichkeit \(\alpha\) kleiner oder gleich der maximal tolerierbaren Irrtumswahrscheinlichkeit / Signifikanzniveau \(\alpha_{s}\) sein muss (\(\alpha\leq\alpha_{s}\)). Ist das nicht so, dann liegt irgendwo ein Fehler in der Berechnung vor.
- Achtung: Das Signifikanzniveau \(\alpha_{s}\) ist nicht das gleiche wie die "reale" Irrtumswahrscheinlichkeit \(\alpha\), die sich nach Aufstellen der Entscheidungsregeln bzw. der Trefferanzahl-Intervalle für \(H_{0}\) und \(H_{1}\) ergibt!
- Optional: Durchführung eines "Experiments" ("reale Stichprobe"), mit der das zuvor aufgestellte "Modell" (= Entscheidungsregeln) getestet werden kann.
Hier muss man verstehen, dass es hier im Grunde zentral um das Aufstellen der Ungleichung
\(P(X\;?\;k_{r})\leq\alpha_{s}\)
geht, da diese für die Berechnung der kritischen Trefferanzahl \(k_{r}\) essentiell und somit Voraussetzung zum Lösen der Aufgabenstellung ist!
Woher kommen die Bezeichnungen \(H_{0}\) bzw. \(H_{1}\) für die Null- bzw. Alternativhypothese eigentlich?
Informatiker würden das so formulieren:
- Die Ungleichung \(P(X\;?\;k)\leq\alpha_{s}\) der Alternativhypothese ist erfüllt \(\rightarrow\) (mathematisch) wahre Aussage ("\(=\,1\)" in der Sprache der Informatik), dann befinden wir uns im Trefferanzahl-Intervall der Alternativhypothese. Beispiel: \(0,01 \leq 0,05\) (wahr)
- Die Ungleichung \(P(X\;?\;k)\leq\alpha_{s}\) der Alternativhypothese ist nicht erfüllt \(\rightarrow\) (mathematisch) falsche Aussage ("\(=\,0\)" in der Sprache der Informatik), dann befinden wir uns im Trefferanzahl-Intervall der Nullhypothese. Beispiel: \(0,06 \leq 0,05\) (falsch)
Dies ist übrigens auch der Grund dafür, warum man die Alternativhypothese als "\(H_{1}\)" bezeichnet, weil die Ungleichung wahr ("\(=\,1\)") ist, wenn die Ungleichung erfüllt ist.
Die Nullhypothese bezeichnet man als "\(H_{0}\)", wenn die Ungleichung der Alternativhypothese nicht erfüllt ist. "Null" entspricht in der Informatik der Aussage "falsch", also einem Zahlenwert von "\(0\)".
Für einen Hypothesentest ist also nicht die Nullhypothese, sondern immer die Auswahl der Alternativhypothese entscheidend, da die aufzustellende / verwendete Ungleichung genau dann gültig ist, wenn man sich im (Trefferwahrscheinlichkeits-)Intervall der Alternativhypothese \(H_{1}\) befindet!
Die Alternativhypothese ist also oft - z.B. in der Wissenschaft, Studienforschung, Psychologie o.ä. - immer das, was man zu beweisen versucht.
Und wie beeinflusst das die Auswahl der Nullhypothese?
Ich würde dies eher als "Wie wähle ich meine Alternativhypothese aus?" bezeichnen.
Da wir ja gesehen haben, dass die Alternativhypothese bei der Durchführung eines Hypothesentests essentiell zu sein scheint, haben wir in unserer Teamarbeit folgende "Regeln" / Leitregeln für die Alternativhypothese formuliert, mit der sich die Alternativhypothese (und daraus selbstverständlich auch die Nullhypothese) in der Regel eindeutig identifizieren lässt:
- Die Alternativhypothese \(H_{1}\) hat immer die Form \(H_{1}:\;p<p_{0}\) oder \(H_{1}:\;p>p_{0}\), aber kein "\(\leq\)" oder "\(\geq\)".
- Als Alternativhypothese \(H_{1}\) kann man immer die Aussage annehmen, die es zu beweisen (bzw. nachzuweisen) gilt - das entspricht oft dem, was zu Beginn einer Aufgabe zunächst sporadisch behauptet wird (z.B. aber nicht den Fragestellung am Ende deiner Aufgaben!).
- Optional: Ist ein Festlegen von "Was möchte ich beweisen?" so spontan nicht unbedingt möglich, dann sollte die Alternativhypothese \(H_{1}\) so gewählt werden, dass sie bei Irrtum / Fehler 1. Art (\(\alpha\)-Fehler, d.h. irrtümliche Ablehnung von \(H_{0}\), also Annehmen von \(H_{1}\), obwohl eigentlich \(H_{0}\) richtig ist) dramatischer bzw. schwerwiegender ausfällt. Sprich: Wähle die Alternativhypothese \(H_{1}\) im Zweifel so aus, dass sie dem größeren Übel entspricht.
Beachte hierbei aber, dass die Auswahl der Hypothese natürlich immer subjektiv ist und dass die Auswahl der Hypothesen davon abhängt, was man selbst vorzieht oder was man z.B. in der "realen" (nicht mathematischen Welt) genau testen kann.
So ist es z.B. (moralisch) nicht praktikabel, Todesraten bei Medikamenten zu testen, sondern in der Regel Überlebens- bzw. Heilungsraten, so dass die Auswahl der Hypothesen hierdurch etwa beeinflusst wird.
Die erste Leitregel kann hierbei also abweichen, so dass man anstelle von "\(<\)" oder "\(>\)" auch ein "\(\leq\)" bzw. "\(\geq\)" nehmen könnte.
Für dich als Schülerin ist das aber zunächst weniger relevant, so dass du dich hierbei an Punkt 1 orientieren kannst, um dir die Sachverhalte einfacher bzw. eindeutig merken zu können.
_________________________________________________________________________
Wenden wir diese Leitregeln einfach mal auf deine Beispiele an:
Aufgabe 3:
Aussage / Behauptung = "Mindestens 60 % der Flüge haben Verspätung"
Diese Aussage entspricht der Alternativhypothese, also dem, was man beweisen möchte (das ist nicht das Gleiche wie die Frage am Ende der Aufgabenstellung!). "Mindestens" deutet außerdem darauf hin, dass wir hier (ausnahmsweise) unsere 1. Leitregel vernachlässigen können, da "mindestens" einem "\(\geq\)" entspricht.
Es ergibt sich also nach der 2. Leitregel folgende Alternativhypothese:
\(H_{1}:\;p\geq p_{0}\;\Rightarrow p\geq 0.6\)
und es folgt die Nullhypothese:
\(H_{0}:\;p<p_{0}\;\Rightarrow p<0.6\)
Aufgabe 4:
Aussage / Behauptung = "Mindestens 20 % der Spieler sind gedopt"
Diese Aussage entspricht ebenfalls der Alternativhypothese, also dem, was man beweisen möchte (wieder nicht das Gleiche wie die Frage am Ende der Aufgabenstellung!).
"Mindestens" deutet außerdem darauf hin, dass wir hier wieder unsere 1. Leitregel vernachlässigen können ("mindestens" = "\(\geq\)").
Es ergibt sich also erneut nach der 2. Leitregel folgende Alternativhypothese:
\(H_{1}:\;p\geq p_{0}\;\Rightarrow p\geq 0.2\)
und es folgt die Nullhypothese:
\(H_{0}:\;p<p_{0}\;\Rightarrow p<0.2\)
_________________________________________________________________________
Hoffe, das hilft ein wenig dabei, deine Verwirrung ein wenig abzumildern. ;)
Liebe Grüße! :)
P.S.: Hier noch ein paar zusätzliche Links zu meiner Argumentation:
https://www.matheboard.de/archive/540919/thread.html
https://de.wikipedia.org/wiki/Wahrheitswert
http://eswf.uni-koeln.de/glossar/node150.html
https://lexikon.stangl.eu/10229/alternativhypothese/
https://www.spektrum.de/lexikon/psychologie/alternativhypothese/692