Bedingte Wahrscheinlichkeit

Aufrufe: 1642     Aktiv: 16.07.2019 um 12:12

1

Eine Statistik hat folgende Ergebnisse zutage gebracht: 52 % der Bevölkerung sind weiblich. 36 % der Frauen und 32 % der Männer geben Rot als Lieblingsfarbe an; 16 % der Frauen und 53 % der Männer bevorzugen Blau und der jeweilige Rest entschied sich für Grün.

 

b) Zeichne einen Ereignisbaum mit Stufe 1 = Farbwahl und Stufe 2 = Geschlechtswahl

Bei der Aufgabe bin ich mir unsicher.

 

g) Untersuche die Farbwahl und das Geschlecht einer Person auf Abhängigkeit 

vorallem g bereitet mir massive Probleme.

 

Vielen Dank

Diese Frage melden
gefragt

Schüler, Punkte: 15

 
Kommentar schreiben
2 Antworten
0

Hallo nervennahrung,

mein Vorschlag wäre, die ganze Aufgabe zuerst mit Kreuztabellen durchzurechnen und dann das Ganze noch einmal mit Wahrscheinlichkeitsbäumen [1] zu wiederholen. Selbstredend muss in beiden Fällen dasselbe herauskommen. Es ist aber ganz gut, wenn Du das zweimal durchrechnest, weil Du dann ein Gefühl für den Umgang mit den Tabellen und mit den Bäumen bekommst. Zuerst gehe ich auf die Tabellen und danach auf die Bäume ein. Ein Video, dass die Beziehung zwischen den Tabellen und den Wahrscheinlichkeitsbämen erklärt, findest Du hier:

https://youtu.be/LonDC-l4IVs

Das Video ist wirklich gut. Am besten, Du schaust es Dir mehrmals an und versuchst auch das Beispiel im Video mit Papier und Bleistift nachzuvollziehen.

Zunächst ein Wort zu den in der Aufgabe angegeben Prozentsätzen. Wenn da zum Beispiel etwas von 52 Prozent steht, dann solltest Du das so schreiben: 0,52. 100 Prozent ist 1, nämlich ein Ganzes. Nur, wenn Du alle angegebenen und selbst errechneten Wahrscheinlichkeiten so schreibst, kannst Du damit auch vernünfig rechnen. Jedenfalls ist das erheblich einfacher, als mit Prozentsätzen umzugehen.

Zunächst bastelst Du Dir eine Kreuztabelle für die unbedingten Wahrscheinlichkeiten. [2] Die brauchst Du um dann die einen oder anderen bedingten Wahrscheinlichkeiten bestimmen zu können. Ohne rechnen zu müssen kennen wir schon die Randverteilung der Variablen »Geschlecht«. Unser Ausgangspunkt sieht also so aus:

\(
\begin{array}{|c|c|c|c|c|}\hline
\mathrm{Geschlecht\times{}Farbe}&\mathrm{Rot}&\mathrm{Blau}&\mathrm{Grün}&\mathrm{Gesamt}
\\\hline
\mathrm{männlich}&?&?&?&0,48
\\\hline
\mathrm{weiblich}&?&?&?&0,52
\\\hline
\mathrm{Gesamt}&?&?&?&1,00
\\\hline
\end{array}
\)

Die Werte in den Zellen mit den Fragezeichen errechnest Du jetzt selber. Zum Beispiel weißt Du, dass 32 Prozent der Frauen Rot als Lieblingsfarbe angeben. Gleichzeitig weißt Du dass es 52 Prozent Frauen gibt. Diese beiden Werte multipliziertst Du jetzt wie in Gleichung (1) und setzt das Ergebnis in die entsprechende Zelle der Tabelle.

$$0,32\cdot 0,52 = \mathrm{rechne\:selbst!} \tag{1}$$

Daselbe machst Du mit weiblich/Blau, weiblich/Grün, männlich/Rot, männlich/Blau und männlich/Grün. Sollten Dir die Zahlen zu viele Stellen nach dem Komma haben, dann kannst Du runden. Natürlich können dann Rundungsfehler auftauchen. Das musst Du an der Stelle einfach selbst entscheiden.

Die Zahlen, die jetzt in den Spalten Rot, Blau und Grün jeweils untereinander stehen, addierst Du und schreibst das Ergebnis jweils in die Zellen Gesamt/Rot, Gesamt/Blau und Gesamt/Grün. Diese drei Zahlen müssen zusammen 1 ergeben.

Jetzt erstellst Du eine zweite Tabelle, die zunächst so aussieht:

\(
\begin{array}{|c|c|c|c|c|}\hline
\mathrm{Geschlecht\times{}Farbe}&\mathrm{Rot}&\mathrm{Blau}&\mathrm{Grün}&\mathrm{Gesamt}
\\\hline
\mathrm{männlich}&?&?&?&0,48
\\\hline
\mathrm{weiblich}&?&?&?&0,52
\\\hline
\mathrm{Gesamt}&1,00&1,00&1,00&1,00
\\\hline
\end{array}
\)

Das ist eine Tabelle, die zum Beispiel angibt: von allen, die als Lieblingsfarbe Rot angegeben haben, sind soundsoviel Prozent männlich und soundsoviel Prozent weiblich. Du hast hier also die Geschlechtsverteilung unter der Bedingung der Lieblingsfarbe. Die bedingten Wahrscheinlichkeiten, die in die Zellen mit den Fragezeichen gehören, rechnest Du aus, wie in Gleichung (2):

$$\mathrm{p(weiblich|Rot)}\mathrm{=\frac{p(weiblich\cap Rot)}{p(Rot)}} \tag{2}$$

Diese Gleichung findest Du auch im Video. Es ist die Gleichung für die bedingte Wahrscheinlichkeit. Die Zahl, die Du für \(\mathrm{p(weiblich\cap Rot)}\) brauchst, findest Du in der Tabelle mit den unbedingten Wahrscheinlichkeiten in der Zelle weiblich/Rot und die Zahl für \(\mathrm{p(Rot)}\) in der Zelle Gesamt/Rot. Auf diese Weise errechnest Du auch die Werte, die in die Zellen männlich/Rot, männlich/Blau, weiblich/Blau, männlich/Grün und weiblich/Grün kommen.

Du darft, und an dieser Stelle: Du solltest, die Ergebnisse, die Du mit dem Taschenrechner bekommst, runden. Je nachdem, ob Du, wenn Du die Ergebnisse wieder in Prozenwerte zurücktransformierst, keine, eine oder zwei Stellen nach dem Komma haben willst, rundest Du die Ergebnisse auf die zweite, die dritte oder die vierte Stelle nach dem Komma.

Um das, was Du jetzt hast, zu visualisieren, zeichnest Du ein segmentiertes und auf 100 Prozent skaliertes Säulendiagramm. Das Diagramm hat vier Säulen, nämlich je eine für die Spalten Rot, Blau, Grün und Gesamt. Jede Säule ist gleich groß, weil sie alle auf 100 Prozent skaliert sind. Die Säulen besitzen jeweils zwei Segmente, die die Prozentwerte für männlich und weiblich angeben.

Aus diesem Säulendiagramm kannst Du jetzt ablesen, ob Du eine schwache, mittlere oder starke Abhängigkeit der Variable Geschlecht von der Variable Lieblingsfarbe hast. Wie Du das obtisch beurteilen kannst zeigen die folgenden Bilder, die Benninghaus 1989:78–81 entnommen sind, zuerst am Beispiel von Vierfeldertafeln und dann am Beispiel von \(3\times 3\)-Tabellen:

Jetzt hast Du die Wahrscheinlichkeiten für das Geschlecht in Abhängigkeit von der Lieblingsfarbe. Was aber, wenn nicht das Geschlecht von der Lieblingsfarbe, sondern die Lieblingsfarbe vom Geschlecht abhängt? Nun, dafür erstellst Du wieder eine neue Tabelle und danach ein entsprechendes Säulendiagramm (das hast Du schon geahnt, oder?). Dazu hast Du zwei Möglichkeiten: entweder Du erstellst die Tabelle in derselben Orientierung wie bisher, das heißt, Du setzt die Farben in den Tabellenkopf und das Geschlecht an die Seite. In diesem Fall berechnest Du nicht die Spaltenprozent, sondern die Zeilenprozent. Der Ansatz für diese Tabelle sieht so aus:

\(
\begin{array}{|c|c|c|c|c|}\hline
\mathrm{Geschlecht\times{}Farbe}&\mathrm{Rot}&\mathrm{Blau}&\mathrm{Grün}&\mathrm{Gesamt}
\\\hline
\mathrm{männlich}&?&?&?&1,00
\\\hline
\mathrm{weiblich}&?&?&?&1,00
\\\hline
\mathrm{Gesamt}&?&?&?&1,00
\\\hline
\end{array}
\)

Oder Du kippst die Tabelle, das heißt, Du schreibst das Geschlecht in den Tabellenkopf und die Lieblingsfarbe an die Seite. Dann kannst Du wieder Spaltenprozent bilden. Der Ansatz für diese Tabelle sieht so aus:

\(
\begin{array}{|c|c|c|c|}\hline
\mathrm{Farbe\times{}Geschlecht}&\mathrm{männlich}&\mathrm{weiblich}&\mathrm{Gesamt}
\\\hline
\mathrm{Rot}&?&?&?
\\\hline
\mathrm{Blau}&?&?&?
\\\hline
\mathrm{Grün}&?&?&?
\\\hline
\mathrm{Gesamt}&1,00&1,00&1,00
\\\hline
\end{array}
\)

In beiden Fällen berechnest Du zum Beispiel den Anteil der Frauen, die Rot als Lieblingsfarbe angeben, auf die folgende Weise:

$$\mathrm{p(weiblich|Rot)}\mathrm{=\frac{p(weiblich\cap Rot)}{p(weiblich)}} \tag{3}$$

Die Zahlen zu Gleichung (3) holst Du dann wieder aus den entsprechenden Zellen der Tabelle mit den unbedingten Wahrscheinlichkeiten (das ist die erste, die Du gemacht hast). Auf entsprechende Weise füllst Du jetzt auch die weiteren Zellen mit Fragezeichen. Auch das Säulendiagramm zeichnest Du auf die Dir jetzt schon bekannte Weise, nur dass Du jetzt eben drei Säulen für männlich, weiblich und Gesamt hast, die jeweils in drei Segmente für Rot, Blau und Grün unterteilt sind. Natürlich machst Du auch hier alle drei Säulen gleich hoch (100 Prozent).

So. Jetzt hast Du die ganze Aufgabe mit Kreuztabellen durchgerechnet.

Und jetzt machst Du alles noch einmal. Nur jetzt verwendest Du keine Tabellen, sondern abeitest mit Wahrscheinlichkeitsbäumen. Aber bevor Du das machst, trinkst Du erst einmal eine Cola, schaust Dein Lieblingsmusikvideo und isst ein Butterbrot (oder so etwas in der Art).

Bist Du bereit, weiterzumachen? Gut. Der Text der Aufgabe ist insofern etwas knifflig, weil er die Zahlen so angibt, dass sie zu einem Wahrscheinlichkeitsbaum mit Geschlecht als erster und Lieblingsfarbe als zweiter Stufe passen. In Teilaufgabe b) sollst Du das aber umgekehrt machen. Hier machst Du gleich beides.

Du fängst mit einem Wahrscheinlichkeitsbaum an, der Geschlecht als erste und Lieblingsfarbe als zweite Stufe hat und trägst da zunächst die Zahlen ein, die im Text angegeben sind. Dein Baum sieht dann so aus:

Die fehlenden Werte bestimmst Du, indem Du zeilenweise (das heißt auf derselben Stufe) addierst und pfadweise, wenn Du also mit dem Finger einen Pfad von der Wurzel bis zu einer Ausprägung der letzten Stufe folgst) multiplizierst. Zum Beispiel ist in der ersten Stufe \(\mathrm{weiblich+?}=1\). Andererseits kommst Du zum Beispiel zu der unbedingten Wahrscheinlichkeit von weiblich und rot (\(\mathrm{p(weiblich\cap Rot)}\)), indem Du die beiden Wahrscheinlichkeiten entlang des Pfades multiplizierst. Du hast dann also \(0,52\cdot 0,36=\mathrm{?}\). So kannst Du alle Fragezeichenin dem Baum selbst errechnen.

Nun vergleiche mal die sechs Werte, die Du unter der untersten Zeile des Wahrscheinlichkeitsbaums stehen hast, mit den Wahrscheinlichkeiten in den Einzelzellen Deiner ersten Tabelle und die sechs Werte, die unter den Knoten männlich und weiblich, aber über den Knoten mit den Lieblingsfarben stehen, mit den Wahrscheinlichkeiten in den Einzelzellen Deiner dritten Tabelle. Du kannst also aus dem Wahrscheinlichkeitsbaum sowohl die unbedingten Einzelwahrscheinlichkeiten als auch die bedingten Wahrscheinlichkeiten der Lieblingsfarben nach Geschlecht ablesen. Die bedingten Wahrscheinlichkeiten des Geschlechts nach Lieblingsfarben kannst Du aus dem Wahrscheinlichkeitsbaum, so wie Du ihn jetzt gezeichnet hast, nicht direkt ablesen. Aber Du kannst sie errechnen. Um zum Beispiel zu berechnen, wie groß der Anteil der Frauen an allen ist, deren Lieblingsfarbe Rot ist (also nicht, wie hoch der Anteil derer, deren Lieblinlsfarbe Rot ist, an allen Frauen ist), addierst Du zuerst die unbedingten Wahrscheinlichkeiten derjenigen, die weiblich sind und rot lieben und der jenigen, die männlich sind und rot lieben. Das ergibt die unbedingte Wahrscheinlichkeit für alle, deren Lieblingsfarbe Rot ist, also \(\mathrm{p(Rot)}\). Da Du die unbedingte Wahrscheinlichkeit derjenigen, die weiblich sind und rot lieben, also \(\mathrm{p(weiblich)\cap p(Rot)}\), direkt aus dem Wahrscheinlichkeitsbaum ablesen kannst, kannst Du jetzt auch die von Dir gesuchte bedingte Wahrscheinlichkeit nach Gleichung (4) berechnen.

$$\mathrm{p(weiblich|Rot)=\frac{p(weiblich\cap Rot)}{p(m\ddot{a}nnlich\cap Rot)+p(weiblich\cap Rot)}=\frac{p(weiblich\cap Rot)}{p(Rot)}} \tag{4}$$

Auf diese Weise kannst Du jetzt die unbedingten Wahrscheinlichkeiten für Blau und Grün und den Rest der bedingten Wahrscheinlichkeiten des Geschlechts nach Lieblingsfarbe bestimmen. Wenn Du soweit bist, hast Du alles, was Du brauchst, um den Wahrscheinlichkeitsbaum mit umgedrehten Stufen zu konstruieren. Wenn

w = weiblich
m = männlich
R = Rot
B = Blau
G = Grün

ist, dann sieht Dein gedrehter Wahrscheinlichkeitsbaum (in den Du natürlich die jeweils errechneten Werte einträgst) so aus:

So. Jetzt hast Du alles getan, um die Fragen beantworten zu können, jedenfalls alles, was Du tun kannst. Und Du hast auch alles getan, um die Konzepte zu verstehen, die hinter den Tabellen, Bäumen und Formeln stehen. Das hoffe ich jedenfalls. Die Formulierung der Frage g) ist allerdings merkwürdig. Es ist nämlich nicht klar, ob da gefragt ist, inwiefern

  • das Geschlecht von der Wahl der Lieblingsfarbe
  • oder die Wahl der Lieblingsfarbe vom Geschlecht

abhängig ist. Im Zweifel würde ich an Deiner Stelle beides beantworten und dann sagen, dass die Fragestellung in dieser Beziehung nicht klar war. Kein Argument dabei ist die Entgegnung, dass das Geschlecht nach Alltagsverstand nicht von der Wahl der Lieblingsfarbe abhängig sein kann. Das Beispiel hätte nämlich auch anders lauten können und eine Schluderigkeit in der Formulierung sollte sich kein Autor und keine Autorin solcher Aufgaben leisten.

Viele Grüße
jake2042

 

[1]
Ein Wahrscheinlichkeitsbaum ist das, was in der Aufgabenstellung Ereignisbaum genannt wird.

[2]
Kreuztabellen sind Tabellen, in denen zwei Variablen zueinander in Beziehung gesetzt werden. Die Größe einer Kreuztabelle wird in Zeilen mal Spalten angegeben (\(\mathrm{r\times c}\)).

Die kleinste mögliche Kreuztabelle ist eine \(2\times 2\)-Tabelle. \(2\times 2\)-Tabellen werden auch Vierfeldertafeln genannt.

 

Literatur

Benninghaus, Hans, (6)1989: Statistik für Soziologen 1. Deskriptive Statistik. (= Teubner Studienskripten 22, Studienskripten zur Soziologie) Stuttgart: Teubner

Diese Antwort melden
geantwortet

Sonstiger Berufsstatus, Punkte: 1.22K

 

Mir fällt gerade ein, dass Frage g) auch so gemeint sein könnte, ob überhaupt ein Zusammenhang zwischen Geschlecht und Lieblingsfarbe besteht oder nicht. Wenn Du bei einer Verteilung des Geschlechts nach Lieblingsfarbe keinen Zusammenhang feststellen kannst, dann gibt es auch keinen bei einer Verteilung der Lieblingsfarbe nach Geschlecht. In den Säulendiagrammen siehst Du dann in beiden Fällen jeweils ganz exakt dieselbe Verteilung in den Segmenten der einzelnen Säulen. (Siehe dazu die Bilder aus dem Benninghaus-Buch.)

Wenn Du das nicht über eine Tabelle oder ein Säulendiagramm feststellen willst, sondern rechnerisch testen, dann kannst Du das so machen, wie Christian das vorgeschlagen hat. Das heißt, Du machst dann so etwas wie:

$$\mathrm{p(weiblich\cap Rot)=p(weiblich)\cdot p(Rot)} \tag{5}$$

und schaust dann, ob Gleichung (5) wahr oder falsch ist. Das machst Du mit allen sechs unbedingten Wahrscheinlichkeiten, in denen jeweils eine Geschlechtsausprägung mit einer Farbausprägung und-verknüpft (\(\cap\)) ist. Wenn alle sechs Gleichungen wahr sind, hast Du eine stochastische Unabhängigkeit, sonst nicht.

Es dürfte allerdings nicht vorkommen, dass nur einige dieser Gleichungen wahr sind, andere hingegen nicht(ungeprüft). Insofern dürfte auch eine dieser Testgleichungen reichen.

Viele Grüße
jake2042
  ─   jake2042 16.07.2019 um 05:45

Jetzt noch mal ein ganz wilder Gedanke. Du könntest die Werte, die in Deiner ersten Tabelle stehen, mit 100 multiplizieren und dann auf null Stellen nach dem Komma runden. Dann tust Du einfach so, als seinen das absolute Häufigkeiten. (Das ist natürlich eine ziemliche Schnapsidee!)

Und dann machst Du einen Chi-Quadrat-Test. Dabei wird aus den Randhäufigkeiten heraus bestimmt, wie die Zellenhäufigkeiten sein müssten, wenn beide Variablen (in Deinem Fall: Geschlecht und Lieblingsfarbe) voneinander unabhängig wären. diese theoretischen Zellenhäufigkeiten werden dann mit den tatsächlich beobachteten Zellenhäufigkeiten verglichen, um daraus zu eruieren, ob zwischen beide Variablen ein signifikanter Zusammenhang besteht oder nicht.

So. Mal ganz grob. Das ist aber natürlich nicht so ganz ernst gemeint. ;-)

Viele Grüße
jake2042
  ─   jake2042 16.07.2019 um 06:26

Da hättest du glatt ein Kapitel im Mathematik-Buch füllen können, mit dem genannten Inhalt. Vielen lieben Dank für die Antwort, auch wenn diese jetzt ein bisschen verspätet ankam, denn mein Abitur habe ich jetzt abgeschlossen, leider mit einer schlechten Abschlussklausur in Mathematik 4+. Naja wenigstens hab ich das Abitur jetzt.   ─   nervennahrung 16.07.2019 um 12:11

Kommentar schreiben

0

Hallo,

weißt du was ein Ereignisbaum ist? Was hast du denn bis jetzt versucht?

Zwei Ereignisse sind stochastisch unabhängig, wenn das Eintreffen des einen Ereignis nicht die Wahrscheinlichkeit beeinflusst, ob das andere Ereignis eintrifft.

Formal beudetet das \( P(A \cap B) = P(A) \cdot P(B) \) 

Grüße Christian

Diese Antwort melden
geantwortet

Sonstiger Berufsstatus, Punkte: 29.81K

 

Hey, erstmal vielen Dank für die Antwort.
was ein Ergebnisbaum bzw. Baumdiagramm ist, weiß ich. (1 Geschlecht / 2 Farbwahl, klappt ganz gut, aber andersherum fällt es mir schwer, ob das überhaupt stimmt.)
Bei der stochastischen Unabhängigkeit bin ich mir nur unsicher, wie man auf das Ergebnis 15,44% kommt, weil das so in den Lösungen ohne richtige Vorgehensweise steht.
  ─   nervennahrung 08.05.2019 um 13:02

Ich nehme also an dass das Problem ist die richtigen Wahrscheinlichkeiten zu bestimmen, oder?
Denn das Baumdiagramm zu zeichnen sollte ja dann passen.

Wir wollen die einzelnen Wahrscheinlichkeiten für die Farben berechnen.
Das bestimmst du, mit Hilfe der bedingten Wahrscheinlichkeit und dem Satz von Bayes.
\( P(A \cap B ) = P(A|B) \cdot P(B) \\ P(A|B) = \frac {P(B|A) \cdot P(A)} {P(B)} \)

Da wir die Wahrscheinlichkeiten für die Farbe haben wollen, suchen wir die Wahrscheinlichkeiten P(rot), P(blau) und P(grün).
Wir haben gegeben.
\( P(Mann) = 48 \% \\ P(Frau) = 52 \% \)

Welche bedingten Wahrscheinlichkeiten haben wir gegeben?
Wir haben zum Beispiel
\( P(Mann | rot) = 32 \% \\ P(Frau|rot) = 36 \% \)
Welche noch? Kannst du es damit berechnen?

Zur g)
Ich habe dir ja die Formel oben hingeschrieben. Nimm dir nun den in b) erstellen Ereignisbaum. Ich habe dir ja oben eine Formel hingeschrieben. Die Werte für diese Formel kannst du direkt aus diesem Baum ablesen. Ich denke \( P(A) \) und \( P(B) \) sind klar, wofür das steht oder?
\( P(A \cap B) \) ist die Wahrscheinlichkeit, die am Ende eines Zweiges steht. Nämlich am Ende des Zweiges mit zuerst passiert A und dann passiert B.
Wo soll 15,44% herauskommen? Habs noch nicht ganz durchgerechnet. Kannes nachher mal tun :)
  ─   christian_strack 08.05.2019 um 20:40


Also die Wahrscheinlichkeiten hatte ich alle und den Baum habe ich auch aufgemalt. Die Unsicherheit besteht nur bei der stochastischen Unabhängigkeit.
Bei der stochastischen Unabhängigkeit steht in der Lösung 15,44% ungleich 24,96%.
Das hatte mich irritiert, den Satz der Unabhängigkeit kenne ich ja bereits, aber... ich verstehe nicht wie die Lösung (die ist nicht ausführlich aufgeführt, auf 15,44 kommt.)
Vielen Dank.
  ─   nervennahrung 08.05.2019 um 22:51

Alles klar also nur noch die g).
Mich verwundert gerade, das ihr anscheinend nur eine Rechnung durchgeführt habt. Ich persöhnlich hätte nun entweder jede Farbe in Bezug auf die beiden Geschlechter überprüft oder einfach argumentiert.
Man kann eigentlich sofort sehen, das diese beiden Ereignisse stochastisch abhängig sein müssen. Das liegt schon alleine daran, das wir für die Geschlechter jeweils andere Wahrscheinlichkeiten für die einzelnen Farben erhalten. Also muss die Wahrscheinlichkeit abhängig sein, sonst wäre es die selbe.
  ─   christian_strack 09.05.2019 um 15:30

Vielleicht kannst du einmal deinen Ereignisbaum hochladen. Dann kann ich direkt an den Wahrscheinlichkeiten gucken woher die Rechnung kommt :)   ─   christian_strack 09.05.2019 um 15:36


Sorry das ich immer so lange beim antworten brauche. Habe mittlerweile die Klausur hinter mir. P(weiblich und grün) wurde untersucht. Vielen Dank dass du geholfen hast! Und geantwortet hast.
  ─   nervennahrung 10.05.2019 um 06:50

Kein Problem. Immer wieder gerne :)   ─   christian_strack 10.05.2019 um 12:09

Kommentar schreiben