Arbeitspfad zur Binomialverteilung bzw. Normalverteilung
3/5
3 Veranschaulichung - Menschen brauchen Bilder (Bilderbücher?, Bild-Zeitung?)
Die Tabelle der Wahrscheinlichkeitsverteilung erinnert an eine Funktionswertetabelle (jeder Wert
der ZV kommt ja nur einmal vor). Wir "basteln" uns also eine Funktion $f$, mit den Werten der ZV
als Argumente und den zugeordneten Wahrscheinlichkeiten als Werte - das
hört sich in Worten komplizierter an als es ist: nehmen wir das Urnenbeispiel der
letzten Lektion als Beispiel
$X$
1
2
3
4
$\Sigma P(X=a_i)$
$P(X=a_i)$
$\frac{6}{30}$
$\frac{10}{30}$
$\frac{12}{30}$
$\frac{2}{30}$
1
Hier der Graf dieser Funktion $f$
oder besser
Im obigen Beispiel geben die y-Werte die Wahrscheinlichkeiten an - also je weiter
oben ein Punkt desto wahrscheinlicher sein x-Wert. Das ist durchaus eine Möglichkeit
der Veranschaulichung bringt uns aber später bei kontinuierlichen ZV nicht mehr weiter.
Besser zu verallgemeinern ist ein Ansatz, indem man die Fläche unter der Funktion $f$
verwendet. Das führt uns zu folgender Definition:
Die Fläche unter der Funktion im Intervall [a,a+1[ ist gleich der Wahrscheinlichkeit, dass die ZV
den Wert a annimmt!
Um das zu formaliseren brauchen wir eine neue Nomenklatur:
Ist $f$ eine positiv definite reelle Funktion, (d.h.
$ \forall x \in \mathbb{R}: f(x)\ge 0 $) dann ist mit
$\int \limits_a^b f$ der Flächeninhalt des Graphen im Intervall [a,b] gemeint. Zur
Veranschaulichung
Beachte, dass der Flächeninhalt der Recheckflächen leicht auszurechnen ist,
da die Breite ja 1 ist, ergibt sie sich einfach als Summe der Wahrscheinlichkeiten:
\begin{align}
P(\Omega) = \int\limits_{-\infty}^{\infty} f = \sum_i P(X=i) = \sum_i p_i = 1
\end{align}
\begin{align}
P(a \leq X \leq b) = \int\limits_{a}^{b+1}\!\!\!\!f = \sum_{i=a}^b P(X=i)
\end{align}
Bei stetigen ZV wie z.B. Körpergewicht ist es noch leichter:
\begin{align}
P(a \leq X \leq b) = \int\limits_{a}^{b} f
\end{align}
Diese wichtige Funktion $f$ heißt Wahrscheinlichkeitsdichte(funktion)
Der gesamte Flächeninhalt unter einer Wahrscheinlichkeitsdichte ist
$ \int\limits_{-\infty}^{\infty} f =$
$ \forall x \in D_f: f(x) \geq $
$\int\limits_a^a f = $
Bei vielen Beispielen in der Stochastik geht es darum die Dichtefunktion zu bestimmen und
damit bestimmte Fragen zu beantworten. Bei diskreter Wertemenge der ZV ist das ja gleichbedeutend
mit dem Aufstellen der W-Tabelle aus der vorigen Lektion. Neu ist jetzt
die Visualisierung
die Möglichkeit zur Verallgemeinerung auf stetige Wertemengen der ZV
Beispiel:
Es wird zweimal gewürfelt. Ist die Ziffernsumme eine Primzahl erhält man den Betrag, ansonsten muss er eingezahlt werden.
Wähle eine angemessene ZV, gib deren Verteilung als Tabelle an und gib einen Graf der Dichtefunktion an!
Wir wählen als ZV X den auszuzahlenden Betrag - er ist negativ, wenn man verliert.
Wir schreiben uns die möglichen Werte geordnet in eine Tabelle und überlegen uns deren Wahrscheinlichkeit.
(Hier ganzen Bruch in der Schreibweise "x/36" eingeben)
$X$
-12
-10
-9
-8
-6
-4
2
3
5
7
11
$\Sigma P(X=a_i)$
$P(X=a_i)$
$\frac{1}{36}$
$\frac{3}{36}$
$\frac{4}{36}$
$\frac{5}{36}$
$\frac{2}{36}$
1
Die Wahrscheinlichkeitsverteilung (Histogramm) zeichnet man besten mit einem elektronischen Tool wie
z.B. LibreOffice Calc (Säulendiagramm, fehlende Werte müssen auf Null gesetzt werden und die
Abstände der Säulen muss auf 0% reduziert werden - außerdem scheint es nicht möglich die x-Achsenbeschriftung
um eine halbe Einheit zu verschieben, sodass ich als Beschriftung einfach die Intervallmitte gewählt habe)
Wer sich das Programm 'gnuplot' installieren möchte, kann sich leicht ein Skript anfertigen, um jedes beliebige
Histogramm zu zeichnen und bekommt dies in fast jedem beliebigen Format - ich hab mich hier für SVG(Scalable
Vector Graphics) entschieden, weil es von den Browsern unterstützt wird (und wie der Name sagt beliebig
skalierbar(vergrößern/verkleinern) ist). Die Bedienung von 'gnuplot' ist wieder eine eigene
Geschichte!
Skript
set terminal svg size 800,300 fname 'Verdana' fsize 8
set output 'boxes.svg'
set title "Veranschaulichung einer diskreten ZV mit einem Histogramm"
unset key
set boxwidth 1 absolute
set xtics -12,1,11
set grid linetype 5 linecolor rgb "#CCFFFF" linewidth 0.2
set style fill solid 0.1 border rgb '#0000ff'
set ylabel "Einheiten in 1/36"
plot [-12.5:12.5][0:7] 'die.dat' using ($1+0.5):($2*36) with boxes lc rgb '#C2D6FF'
replot 'die.dat' using ($1+0.5):($2*36+0.5):3 with labels
Beantworte an Hand der Tabelle(des Grafen der Dichte folgende Fragen):
Wie groß ist die W. weniger oder gleich 5 Euro zu gewinnen (formal $P(X \leq 5)=$) (Ergebnis in x/36 --
benutze dazu am besten das gnuplot Histogramm, weil das ist in x/36 beschriftet!)
Obige Aufgabe lässt sich als Flächenberechnung unter der Dichte $f$ auffassen:
$\displaystyle{ \int\limits_{-\infty}^x f}$.
Welchen Wert muss $x$ dafür besitzen? (passen Sie auf - "5" ist falsch; Stichwort:"diskrete Verteilung")
Es ist klar: $\displaystyle{ \int\limits_{-\infty}^{a} f + \int\limits_{a}^{\infty} f = 1}$
Damit lässt sich $\displaystyle{ \int\limits_{-\infty}^{6} f}$ berechnen als
$\displaystyle{1 - \int\limits_{x}^{\infty} f}$.
Wie groß ist $x$?
Bis zu welchem Wert der ZV liegen sie im unteren Quartil (Viertel?)
(formal $P(X \leq a) \leq 0,25 \quad $ Suche die größte Lösung für $a$ )
Wie groß ist der Erwartungswert $\mu$ auf 2 Dezimalstellen(wxMaxima verwenden)?
Berechne $\sigma = \sqrt{V(X)} $ auf 2 Dezimalstellen}
Wieviel Prozent (gerundet auf Einerstellen) der Ergebnisse liegen innerhalb einer
Standardabweichung um den Erwartungswert?
(formal $P(\mu - \sigma \leq X \leq \mu + \sigma) = P(|X-\mu|\leq \sigma) = ?$)
Bis zu welchem Wert der ZV liegen sie im oberen Quartil (Viertel?)
(formal $P(X \geq a) \leq 0,25 \quad $ Suche die kleinste Lösung für $a$ )
Wie (beinahe) immer zum Schluss ein kleiner multiple choice Test, um einige Dinge zu wiederholen:
Leider falsch!
Unter der Dichte liegen die W. von ganz $\Omega$
Leider falsch!
Ist die W. vom sicheren Ereignis (irgendwas mögliches muss passieren!)
Leider falsch!
vorige Frage nur anders formuliert
Leider falsch!
Unter der Dichte liegen die W. von ganz $\Omega$
Leider falsch!
Die Werte der Dichtefkt. sind Wahrscheinlichkeiten
Leider falsch!
für Wahrscheinlichkeiten $p$ gilt: $0\leq p \leq 1$
Leider falsch!
Fläche von $a$ bis $a$
Leider falsch!
Fläche von $a$ bis $a$ unter der Dichte verschwindet
Leider falsch!
6 ist erreichbar mit (5,1), (4,2) und (3,3)
Leider falsch!
6 ist erreichbar mit (5,1), (4,2) und (3,3) wobei
die ersten 2 vertauschbar sind - also 5 von 36!
Leider falsch!
4 ist darstellbar als ....
Leider falsch!
4 ist darstellbar als (2,2),(1,2) und (2,1)
Leider falsch!
2 ist darstellbar als ....
Leider falsch!
2 ist darstellbar als (1,1) - aus
Leider falsch!
3 ist darstellbar als (1,2) und (2,1)
Leider falsch!
3 ist darstellbar als (1,2) und (2,1) - das sind 2 von 36
Leider falsch!
Na - nun kann es nur mehr an der Konzentration liegen!
Leider falsch!
Na - nun kann es nur mehr an der Konzentration liegen!
Leider falsch!
Na - nun kann es nur mehr an der Konzentration liegen!
Leider falsch!
Na - nun kann es nur mehr an der Konzentration liegen!
Leider falsch!
Zähle in gnuplot-Histogramm von links alle Flächen bis 6
Leider falsch!
Oder mach es mit der Gegegwahrscheinlichkeit: lass die 2 rechten Säulen weg!
Leider falsch!
Zähle im gnuplot-Histogramm von links alle Flächen bis 6
Leider falsch!
Zähle im gnuplot-Histogramm von links alle Flächen bis 6 (!)
Leider falsch!
Setze in der obigen Gleichung $a=6$ - und du hast die Lösung!
Leider falsch!
Setze in der obigen Gleichung $a=6$ - und du hast die Lösung!
Leider falsch!
Im gnuplot-Histogramm von links solange addieren wie wir unter 9/36 bleiben!
Leider falsch!
Das sind die linken 3 Säulen, wobei bei jeder Säule links unten der Wert der ZV steht -
also "-9"
Leider falsch!
Erwartungswert in wxMaxima als Skalarprodukt - Erklärung siehe vorig Lektion!
Leider falsch!
in wxMaxima: a_i:[-12,-10,-9.......]
p_i:1/36*[1,3,4,......] und dann a_i . p_i
Leider falsch!
in wxMaxima nach Formel: $E(X^2)-\mu^2$ - siehe vorigen Abschnitt
Leider falsch!
in wxMaxima nach Formel: $E(X^2)-\mu^2$ - siehe vorigen Abschnitt
Leider falsch!
Wir suchen $P(a\leq X \leq b)$, wobei $a=\mu-\sigma\approx -9$
und $ b=\mu+\sigma\approx 6$ ist!
Leider falsch!
Die Säulen zwischen -9 und 6 addieren: 24/36=2/3 in Prozent gerundet?
Leider falsch!
Im gnuplot-Histogramm von rechts(!) solange addieren wie wir unter 9/36 bleiben!
Leider falsch!
Das sind die rechten 2 Säulen bis 7 (man könnte bis 6 gehen - aber 6 liegt
eigentlich nicht in der Wertemenge der ZV - außer man konstruiert eine neue
ZV Y mit Y=X,wo X existiert und 0 sonst, aber das ist eine andere Geschichte ...
Beachte:
Die Flächensäule für $X=a$ erstreckt sich von $a$ bis $a+1$ bei einer
diskreten ZV, die Fläche ist also um 1 zu klein!
Leider falsch!
Na - das hatten wir doch schon bei 1) abgehakt - oder?
Beachte:
Zählen Sie doch die Wahrscheinlichkeiten zusammen!