Übungsblatt 1

Aufgabe 1

In einem Fünf-Familienhaus wohnen die Familien Altmeyer, Becker, Carstens, Decker und Eckes. Von diesen Familien sind die monatlichen Haushalts-Bruttoeinkommen wie folgt erfasst worden:

Lfd. Nr. \(i\) Familie monatl. Bruttoeinkommen \(y_i\)
\(1\) A \(3000\)
\(2\) B \(2500\)
\(3\) C \(3500\)
\(4\) D \(3500\)
\(5\) E \(2500\)
  1. Geben Sie die Verteilung der monatlichen Bruttoeinkommen \(Y\) an.
    Lösung einblenden
    Hier sind zwei Auffassungen des Begriffs “Verteilung” möglich, einmal bezogen auf das deskriptive Merkmal und einmal bezogen auf die Einbettung des Merkmals als Zufallsvariable. Für die weiteren Aufgabenteile wird \(Y\) ohnehin als Zufallsvariable aufgefasst werden, daher ist die zweite Auffassung nützlicher.
    1. Verteilung des (deskriptiven) Merkmals (Häufigkeitsverteilung):
      \(a_j\) \(2500\) \(3000\) \(3500\) \(\Sigma\)
      \(h(a_j)\) \(2\) \(1\) \(2\) \(5\)
      \(r(a_j)\) \(\frac{2}{5}\) \(\frac{1}{5}\) \(\frac{2}{5}\) \(1\)
    2. Einbettung (vgl. Deskr.&WR, F. 190, SchlStat, F. 6) des Merkmals in die Wahrscheinlichkeitsrechnung: Zufallsvariable \(Y\) mit Werten
      \(\omega\) \(A\) \(B\) \(C\) \(D\) \(E\)
      \(Y(\omega)\) \(3000\) \(2500\) \(3500\) \(3500\) \(2500\)
      hat die folgende Verteilung:
      \(y_{i}\) \(2500\) \(3000\) \(3500\) \(\Sigma\)
      \(p_{Y}(y_{i})\) \(\frac{2}{5}\) \(\frac{1}{5}\) \(\frac{2}{5}\) \(1\)
      Bei der Einbettung des Merkmals in die Wahrscheinlichkeitsrechnung wird das Zufallsexperiment betrachtet, bei dem rein zufällig ein Merkmalsträger aus der statistischen Masse (die dann der Ergebnismenge \(\Omega\) entspricht) ausgewählt und dessen Merkmalswert festgestellt wird. Ist das Merkmal numerisch, kann man diese Zuordnung des Merkmalswert zum Merkmalsträger als Zufallsvariable (hier: \(Y\)) verstehen. Damit entsprechen (nicht nur in dieser Anwendung, sondern generell) die angenommenen Ausprägungen \(a_j\) des Merkmals den Trägerpunkten \(y_i\) der Zufallsvariablen und die relativen Häufigkeiten \(r(a_j)\) des Merkmals den Punktwahrscheinlichkeiten \(p(y_i)=P\left(\{\omega\in\Omega|Y(\omega)=y_i\}\right)\) der Zufallsvariablen, wobei \(P\) hier und in den folgenden Aufgabenteilen durch die Laplace-Wahrscheinlichkeit gegeben ist.
  2. Berechnen Sie den Erwartungswert und die Varianz von \(Y\).
    Lösung einblenden
    Es gilt (vgl. Deskr.&WR, F. 213) \[ \operatorname{E}(Y)= \sum_{i=1}^{3} p_Y(y_{i})\cdot y_{i} = \frac{2}{5} \cdot 2500 + \frac{1}{5} \cdot 3000 + \frac{2}{5} \cdot 3500 = 3000 \ . \] Mit (Deskr.&WR, F. 217) \[ \operatorname{E}(Y^2)= \sum_{i=1}^{3} p_Y(y_{i})\cdot y_{i}^2 = \frac{2}{5} \cdot 2500^2 + \frac{1}{5} \cdot 3000^2 + \frac{2}{5} \cdot 3500^2 = 9200000 \] erhält man außerdem mit Hilfe des Varianzzerlegungssatzes (Deskr.&WR, F. 220) \[\operatorname{Var}(Y)=\operatorname{E}(Y^2)-[\operatorname{E}(Y)]^2 = 9.2\times 10^{6} - 3000^2 = 2 \cdot 10^{5}\ .\]
  3. Wieviele Stichproben vom Umfang \(n=2\) ohne bzw. mit Zurücklegen (unter Berücksichtigung der Reihenfolge) gibt es?
    Lösung einblenden
    Es gibt (vgl. Deskr.&WR, F. 160) \((5)_{2}=\frac{5!}{(5-2)!}=20\) verschiedene Stichproben vom Umfang \(n=2\) ohne Zurücklegen und \(5^2 = 25\) verschiedene Stichproben mit Zurücklegen (jeweils unter Berücksichtigung der Reihenfolge).
  4. Geben Sie zu allen möglichen Ziehungen ohne Zurücklegen die zugehörigen Stichprobenrealisationen \((x_{1},x_{2})\) von \((X_{1},X_{2})\) an. Erstellen Sie daraus die gemeinsame Verteilung von \((X_{1},X_{2})\) sowie die zugehörige Verteilung von \(\overline{X}\).
    Lösung einblenden
    Realisationen \((x_1,x_2)\) der beiden Bruttoeinkommen zur jeweiligen Auswahl der 1. Familie (Zeilen) und 2. Familie (Spalten):
    A B C D E
    A unmöglich (3000,2500) (3000,3500) (3000,3500) (3000,2500)
    B (2500,3000) unmöglich (2500,3500) (2500,3500) (2500,2500)
    C (3500,3000) (3500,2500) unmöglich (3500,3500) (3500,2500)
    D (3500,3000) (3500,2500) (3500,3500) unmöglich (3500,2500)
    E (2500,3000) (2500,2500) (2500,3500) (2500,3500) unmöglich
    Hieraus resultiert die folgenden gemeinsame Verteilung von \((X_1,X_2)\) (vgl. Deskr.&WR, F. 258, SchlStat, F. 13):
    \(x_1 \backslash x_2\) \(2500\) \(3000\) \(3500\) \(\Sigma\)
    \(2500\) \(\frac{1}{10}\) \(\frac{1}{10}\) \(\frac{1}{5}\) \(\frac{2}{5}\)
    \(3000\) \(\frac{1}{10}\) \(0\) \(\frac{1}{10}\) \(\frac{1}{5}\)
    \(3500\) \(\frac{1}{5}\) \(\frac{1}{10}\) \(\frac{1}{10}\) \(\frac{2}{5}\)
    \(\Sigma\) \(\frac{2}{5}\) \(\frac{1}{5}\) \(\frac{2}{5}\) \(1\)
    Beispiel: \[p_{(X_1,X_2)}(2500,3000) = P\left(\{(\omega_1,\omega_2)|(X_1(\omega_1)=2500,X_2(\omega_2)=3000\}\right) = P\left(\{(B,A),(E,A)\}\right) = \frac{2}{20}\]
    Zugehörige Verteilung von \(\overline{X}\) mit \(p_{{\overline{X}}}({\overline{x}}_i) = P_{(X_1,X_2)}\left(\{(x_1,x_2)|\frac{1}{2}(x_1+x_2)={\overline{x}}_i \}\right)\) (vgl. SchlStat, F. 14):
    \(\overline{x}_{i}\) \(2500\) \(2750\) \(3000\) \(3250\) \(3500\) \(\Sigma\)
    \(p_{\overline{X}}(\overline{x}_{i})\) \(\frac{1}{10}\) \(\frac{1}{5}\) \(\frac{2}{5}\) \(\frac{1}{5}\) \(\frac{1}{10}\) \(1\)
    Beispiel: \[\begin{align*} p_{{\overline{X}}}(2750) &= P_{(X_1,X_2)}\left(\left\{(x_1,x_2)\big|\frac{1}{2}(x_1+x_2)=2750 \right\}\right) \\ &= p_{(X_1,X_2)}(2500,3000) + p_{(X_1,X_2)}(3000,2500) = \frac{1}{10} + \frac{1}{10} = \frac{1}{5} \end{align*}\]
  5. Führen Sie die Aufgabenstellungen aus Teil d. nun für die Ziehungen mit Zurücklegen durch.
    Lösung einblenden
    Realisationen \((x_1,x_2)\) der beiden Bruttoeinkommen zur jeweiligen Auswahl der 1. Familie (Zeilen) und 2. Familie (Spalten):
    A B C D E
    A (3000,3000) (3000,2500) (3000,3500) (3000,3500) (3000,2500)
    B (2500,3000) (2500,2500) (2500,3500) (2500,3500) (2500,2500)
    C (3500,3000) (3500,2500) (3500,3500) (3500,3500) (3500,2500)
    D (3500,3000) (3500,2500) (3500,3500) (3500,3500) (3500,2500)
    E (2500,3000) (2500,2500) (2500,3500) (2500,3500) (2500,2500)
    Hieraus resultiert die folgenden gemeinsame Verteilung von \((X_1,X_2)\) (vgl. SchlStat, F. 15):
    \(x_1 \backslash x_2\) \(2500\) \(3000\) \(3500\) \(\Sigma\)
    \(2500\) \(\frac{4}{25}\) \(\frac{2}{25}\) \(\frac{4}{25}\) \(\frac{2}{5}\)
    \(3000\) \(\frac{2}{25}\) \(\frac{1}{25}\) \(\frac{2}{25}\) \(\frac{1}{5}\)
    \(3500\) \(\frac{4}{25}\) \(\frac{2}{25}\) \(\frac{4}{25}\) \(\frac{2}{5}\)
    \(\Sigma\) \(\frac{2}{5}\) \(\frac{1}{5}\) \(\frac{2}{5}\) \(1\)
    Beispiel: \[p_{(X_1,X_2)}(2500,3000) = P\left(\{(\omega_1,\omega_2)|(X_1(\omega_1)=2500,X_2(\omega_2)=3000\}\right) = P\left(\{(B,A),(E,A)\}\right) = \frac{2}{25}\]
    Zugehörige Verteilung von \(\overline{X}\) mit \(p_{{\overline{X}}}({\overline{x}}_i) = P_{(X_1,X_2)}\left(\{(x_1,x_2)|\frac{1}{2}(x_1+x_2)={\overline{x}}_i \}\right)\) (vgl. SchlStat, F. 16):
    \(\overline{x}_{i}\) \(2500\) \(2750\) \(3000\) \(3250\) \(3500\) \(\Sigma\)
    \(p_{\overline{X}}(\overline{x}_{i})\) \(\frac{4}{25}\) \(\frac{4}{25}\) \(\frac{9}{25}\) \(\frac{4}{25}\) \(\frac{4}{25}\) \(1\)
    Beispiel: \[\begin{align*} P_{{\overline{X}}}(2750) &= P_{(X_1,X_2)}\left(\left\{(x_1,x_2)\big|\frac{1}{2}(x_1+x_2)=2750 \right\}\right) \\ &= p_{(X_1,X_2)}(2500,3000) + p_{(X_1,X_2)}(3000,2500) = \frac{2}{25} + \frac{2}{25} = \frac{4}{25} \end{align*}\]
  6. Vergleichen Sie die Wahrscheinlichkeitsverteilungen von \(\overline{X}\) aus den Aufgabenteilen d. und e. miteinander: Zeichnen Sie hierzu beide Wahrscheinlichkeitsfunktionen und berechnen Sie jeweils Erwartungswert, Varianz und Standardabweichung.
    Lösung einblenden
    Vergleich der Verteilungen von \(\overline{X}\) in beiden Varianten:
    • Bei Ziehung ohne Zurücklegen gilt: \[ \operatorname{E}(\overline{X})= \sum_{i=1}^{5} p_{\overline{X}}(\overline{x}_{i})\cdot \overline{x}_{i} = \frac{1}{10} \cdot 2500 + \frac{1}{5} \cdot 2750 + \frac{2}{5} \cdot 3000 + \frac{1}{5} \cdot 3250 + \frac{1}{10} \cdot 3500 = 3000 \ . \] Mit \[ \operatorname{E}(\overline{X}^2)= \sum_{i=1}^{5} p_{\overline{X}}(\overline{x}_{i})\cdot \overline{x}_{i}^2 = \frac{1}{10} \cdot 2500^2 + \frac{1}{5} \cdot 2750^2 + \frac{2}{5} \cdot 3000^2 + \frac{1}{5} \cdot 3250^2 + \frac{1}{10} \cdot 3500^2 = 9075000 \] erhält man außerdem \(\operatorname{Var}(\overline{X})=\operatorname{E}(\overline{X}^2)-[E(\overline{X})]^2 = 9.075\times 10^{6} - 3000^2 = 7.5 \cdot 10^{4}\). und die zugehörige Standardabweichung \(\sqrt{\operatorname{Var}(\overline{X})}=273.861\).
    • Bei Ziehung mit Zurücklegen gilt: \[ \operatorname{E}(\overline{X})= \sum_{i=1}^{5} p_{\overline{X}}(\overline{x}_{i})\cdot \overline{x}_{i} = \frac{4}{25} \cdot 2500 + \frac{4}{25} \cdot 2750 + \frac{9}{25} \cdot 3000 + \frac{4}{25} \cdot 3250 + \frac{4}{25} \cdot 3500 = 3000 \ . \] Mit \[ \operatorname{E}(\overline{X}^2)= \sum_{i=1}^{5} p_{\overline{X}}(\overline{x}_{i})\cdot \overline{x}_{i}^2 = \frac{4}{25} \cdot 2500^2 + \frac{4}{25} \cdot 2750^2 + \frac{9}{25} \cdot 3000^2 + \frac{4}{25} \cdot 3250^2 + \frac{4}{25} \cdot 3500^2 = 9100000 \] erhält man außerdem \(\operatorname{Var}(\overline{X})=\operatorname{E}(\overline{X}^2)-[E(\overline{X})]^2 = 9.1\times 10^{6} - 3000^2 = 1 \cdot 10^{5}\). und die zugehörige Standardabweichung \(\sqrt{\operatorname{Var}(\overline{X})}=316.228\).
      Wie im Vorlesungsbeispiel ist zu erkennen, dass in beiden Ziehungsvarianten der Erwartungswert von \({\overline{X}}\) mit dem Erwartungswert von \(Y\) übereinstimmt, eine Schätzung von \(\operatorname{E}(Y)\) mit Hilfe von \({\overline{X}}\) also für beide Ziehungsvarianten “im Mittel” korrekt funktioniert.
      Ebenfalls wie im Vorlesungsbeispiel schwankt \({\overline{X}}\) bei Ziehung ohne Zurücklegen weniger stark, in diesem Sinn ist die Schätzung also “präziser”, was auch der Intuition entspricht: hier ist ausgeschlossen, dass man in der 2. Ziehung keine zusätzliche Information über die Grundgesamtheit gewinnt.
  7. Welcher der Ziehungsvorgänge führt zu einer einfachen Stichprobe \((X_{1},X_{2})\)?
    Lösung einblenden
    Sieht man sich die gemeinsamen Verteilungen von \((X_1,X_2)\) in Teil d. und e. näher an, so stellt man fest, dass in beiden Fällen beide Randverteilungen, deren Punktwahrscheinlichkeiten als Zeilen- bzw. Spaltensummen abzulesen sind, mit der Verteilung von \(Y\) übereinstimmen. Es handelt sich bei \((X_1, X_2)\) also in beiden Ziehungsvarianten um eine Zufallsstichprobe gemäß Definition 2.1 (SchlStat, F. 17).
    Man stellt weiterhin fest, dass die beiden Zufallsvariablen beim Ziehen ohne Zurücklegen (Teil d.) nicht stochastisch unabhängig sind, da sich nicht alle gemeinsamen Wahrscheinlichkeiten als Produkt der Randwahrscheinlichkeiten ergeben (siehe DeskrWR, F. 267); besonders leicht ist das für \((x_1,x_2)=(3000,3000)\) zu erkennen, wo die gemeinsame Wahrscheinlichkeit \(0\) beträgt und schon auf den ersten Blick nicht das Produkt zweier positiver Randwahrscheinlichkeiten sein kann.
    Beim Ziehen mit Zurücklegen (Teil e.) lässt sich jedoch leicht verifizieren, dass sich alle 9 gemeinsamen Wahrscheinlichkeiten als Produkt der jeweiligen Randwahrscheinlichkeiten ergeben, \(X_1\) und \(X_2\) also stochastisch unabhängig sind.
    Also führt nur das Ziehen mit Zurücklegen zu einer einfachen (Zufalls-)Stichprobe gemäß Definition 2.1 (SchlStat, F. 17), da nur in diesem Fall die Stichprobenzufallsvariablen \(X_1\), \(X_2\) nicht nur identisch verteilt sind wie \(Y\), sondern auch stochastisch unabhängig.