Übungsblatt 8

Aufgabe 33

12 vierjährige Jungen und 12 vierjährige Mädchen wurden während zweier jeweils 15-minütiger Spielrunden beobachtet. Die Spielweise jedes Kindes während dieser zwei Perioden wurde bezüglich Aggressionshäufigkeit und -ausmaß mit folgenden Punkten bewertet:

Jungen \(x^A_{i}\) 86 69 72 65 103 70 108 45 111 104 41 50
Mädchen \(x^B_{i}\) 55 40 22 58 16 7 16 26 36 20 9 15

Aus den obigen Daten erhielt man folgende (gerundete) Maßzahlen: \[ \text{Jungen:}\quad \overline{x^A}=77,\quad s^2_{Y^A}=630.364;\qquad \text{Mädchen:}\quad \overline{x^B}=26.667,\quad s^2_{Y^B}=288.97 \] Es werde angenommen, dass sich die Punktzahlen bei den Jungen durch eine Zufallsvariable \(Y^A\) mit \(Y^A\sim N(\mu_A, \sigma_A^2)\) und bei den Mädchen durch eine Zufallsvariable \(Y^B\) mit \(Y^B\sim N(\mu_B, \sigma_B^2)\) beschreiben lassen, \(Y^A\) und \(Y^B\) stochastisch unabhängig, und die obigen Daten Realisationen von einfachen Stichproben zu \(Y^A\) bzw. \(Y^B\) sind. Testen Sie unter der Voraussetzung \(\sigma_A^{2}=\sigma_B^{2}\) zum Signifikanzniveau \(\alpha=0.05\) die Hypothese, dass sich im Aggressionsmaß keine geschlechtsspezifischen Unterschiede widerspiegeln, gegen die Alternative, dass sich im Aggressionsmaß geschlechtsspezifische Unterschiede widerspiegeln.

Lösung einblenden

Zweistichproben-\(t\)-Test für den Mittelwertvergleich bei unabhängigen Stichproben normalverteilter Zufallsvariablen mit unbekannter, aber übereinstimmender Varianz

  1. Hypothesen:
    \(H_0: \mu_A=\mu_B\qquad\text{gegen}\qquad H_1: \mu_A\ne \mu_B\)
  2. Teststatistik:
    \(\displaystyle t=\frac{\overline{X^A}-\overline{X^B}}{S}\sqrt{\frac{n_A\cdot n_B}{n_A+n_B}}\) ist unter \(H_0\) \(t(n_A+n_B-2)\)-verteilt (für \(\mu_A=\mu_B\)).
  3. Kritischer Bereich zum Niveau \(\alpha=0.05\):
    \(K=(-\infty,-t_{n_A+n_B-2;1-\frac{\alpha}{2}})\cup(t_{n_A+n_B-2;1-\frac{\alpha}{2}},+\infty)=(-\infty,-t_{22;0.975})\cup(t_{22;0.975},+\infty)=(-\infty,-2.074)\cup(2.074,+\infty)\)
  4. Berechnung der realisierten Teststatistik:
    Mit \[s^2=\frac{(n_A-1)\cdot s^2_{Y^A}+(n_B-1)\cdot s^2_{Y^B}}{n_A+n_B-2}=\frac{11\cdot 630.36 + 11 \cdot 288.97}{22}=459.665\] erhält man
    \(\displaystyle t=\frac{\overline{x^A}-\overline{x^B}}{s}\sqrt{\frac{n_A\cdot n_B}{n_A+n_B}}=\frac{77-26.667}{21.44}\sqrt{\frac{12\cdot 12}{12+12}}=5.75\)
  5. Entscheidung:
    \(t=5.75\in (-\infty,-2.074)\cup(2.074,+\infty)=K\quad\Rightarrow\quad H_0\) wird abgelehnt!
    Der Test stellt also signifikante geschlechtsspezifische Unterschiede im Aggressionmaß fest.

Erklär-Video zu Aufgabe 33

Aufgabe 34

Überprüfen Sie zum Signifikanzniveau \(\alpha=0.10\), ob die Stichprobenrealisation in Aufgabe 33 darauf hindeutet, dass die dort getroffene Annahme \(\sigma_A^2=\sigma_B^2\) verletzt ist.

Hinweis: Verwenden Sie den folgenden Tabellenausschnitt mit \(0.95\)-Quantilen von \(F(m,n)\)-Verteilungen sowie ggf. die Rechenregel \(F_{m,n;p} = \frac{1}{F_{n,m;1-p}}\).

n\m 5 6 7 8 9 10 11 12 13 14
5 5.050 4.950 4.876 4.818 4.772 4.735 4.704 4.678 4.655 4.636
6 4.387 4.284 4.207 4.147 4.099 4.060 4.027 4.000 3.976 3.956
7 3.972 3.866 3.787 3.726 3.677 3.637 3.603 3.575 3.550 3.529
8 3.687 3.581 3.500 3.438 3.388 3.347 3.313 3.284 3.259 3.237
9 3.482 3.374 3.293 3.230 3.179 3.137 3.102 3.073 3.048 3.025
10 3.326 3.217 3.135 3.072 3.020 2.978 2.943 2.913 2.887 2.865
11 3.204 3.095 3.012 2.948 2.896 2.854 2.818 2.788 2.761 2.739
12 3.106 2.996 2.913 2.849 2.796 2.753 2.717 2.687 2.660 2.637
13 3.025 2.915 2.832 2.767 2.714 2.671 2.635 2.604 2.577 2.554
14 2.958 2.848 2.764 2.699 2.646 2.602 2.565 2.534 2.507 2.484
Lösung einblenden

\(F\)-Test für die Varianzen zweier normalverteilter Zufallsvariablen

  1. Hypothesen:
    \(H_0: \sigma_A^2=\sigma_B^2\qquad\text{gegen}\qquad H_1: \sigma_A^2\ne \sigma_B^2\)
  2. Teststatistik:
    \(\displaystyle F=\frac{S^2_{Y^A}}{S^2_{Y^B}}\) ist unter \(H_0\) \(F(n_A-1,n_B-1)\)-verteilt (für \(\sigma_A^2=\sigma_B^2\)).
  3. Kritischer Bereich zum Niveau \(\alpha=0.10\):
    \(K=[0,F_{n_A-1,n_B-1;\frac{\alpha}{2}})\cup(F_{n_A-1,n_B-1;1-\frac{\alpha}{2}},+\infty)=[0,F_{11,11;0.05})\cup(F_{11,11;0.95},+\infty)=[0,0.355)\cup(2.818,+\infty)\)
  4. Berechnung der realisierten Teststatistik:
    \(\displaystyle F=\frac{S^2_{Y^A}}{S^2_{Y^B}}=\frac{630.364}{288.97}=2.1814\)
  5. Entscheidung:
    \(F=2.1814\notin [0,0.355)\cup(2.818,+\infty)=K\quad\Rightarrow\quad H_0\) wird nicht abgelehnt!
    Der Test findet also keine ausreichenden Anzeichen für eine Verletzung der in Aufgabe 33 angenommenen Varianzgleichheit.

Erklär-Video zu Aufgabe 34

Aufgabe 35

Die Messung des Cholesteringehaltes im Blut bei 8 Männern im Alter von 20 bis 30 Jahren bzw. 10 Männern im Alter von 40 bis 50 Jahren ergab folgende Werte:

20–30 Jahre 204 218 200 244 221 200 224 228
40–50 Jahre 257 231 284 251 222 176 273 239 240 267

Aus den obigen Daten erhielt man folgende (gerundete) Maßzahlen: \[ \text{20-30 Jahre:}\quad \overline{x^A}=217.375,\quad s^2_{Y^A}=237.411;\quad \text{40-50 Jahre:}\quad \overline{x^B}=244,\quad s^2_{Y^B}=945.111 \] Es werde angenommen, dass sich die Cholesteringehalte bei Männern im Alter von 20 bis 30 Jahren durch eine Zufallsvariable \(Y^A\) mit \(Y^A\sim N(\mu_A, \sigma_A^2)\) und bei Männern im Alter von 40 bis 50 Jahren durch eine Zufallsvariable \(Y^B\) mit \(Y^B\sim N(\mu_B, \sigma_B^2)\) beschreiben lassen, \(Y^A\) und \(Y^B\) stochastisch unabhängig, und die obigen Daten Realisationen von einfachen Stichproben zu \(Y^A\) bzw. \(Y^B\) sind. Überprüfen Sie unter der Voraussetzung \(\sigma_A^{2}=\sigma_B^{2}\) zum Signifikanzniveau \(\alpha=0.05\) die Vermutung, dass der Cholesteringehalt bei Männern im Alter von 40 bis 50 Jahren im Mittel höher ist als bei Männern im Alter von 20 bis 30 Jahren.

Lösung einblenden

Zweistichproben-\(t\)-Test für den Mittelwertvergleich bei unabhängigen Stichproben normalverteilter Zufallsvariablen mit unbekannter, aber übereinstimmender Varianz

  1. Hypothesen:
    \(H_0: \mu_A\ge \mu_B\qquad\text{gegen}\qquad H_1: \mu_A<\mu_B\)
  2. Teststatistik:
    \(\displaystyle t=\frac{\overline{X^A}-\overline{X^B}}{S}\sqrt{\frac{n_A\cdot n_B}{n_A+n_B}}\) ist unter \(H_0\) \(t(n_A+n_B-2)\)-verteilt (für \(\mu_A=\mu_B\)).
  3. Kritischer Bereich zum Niveau \(\alpha=0.05\):
    \(K=(-\infty,-t_{n_A+n_B-2;1-\alpha})=(-\infty,-t_{16;0.95})=(-\infty,-1.746)\)
  4. Berechnung der realisierten Teststatistik:
    Mit \[s^2=\frac{(n_A-1)\cdot s^2_{Y^A}+(n_B-1)\cdot s^2_{Y^B}}{n_A+n_B-2}=\frac{7\cdot 237.41 + 9 \cdot 945.11}{16}=635.491\] erhält man
    \(\displaystyle t=\frac{\overline{x^A}-\overline{x^B}}{s}\sqrt{\frac{n_A\cdot n_B}{n_A+n_B}}=\frac{217.375-244}{25.209}\sqrt{\frac{8\cdot 10}{8+10}}=-2.227\)
  5. Entscheidung:
    \(t=-2.227\in (-\infty,-1.746)=K\quad\Rightarrow\quad H_0\) wird abgelehnt!
    Der Test kann die Vermutung höherer Cholesterinwerte bei Männern im Alter von 40 bis 50 Jahren also bestätigen.

Erklär-Video zu Aufgabe 35

Aufgabe 36

Entgegen der in Aufgabe 35 getroffenen Annahme der Varianzgleichheit vermutet man nun, dass die Varianz des Cholesteringehalts bei den Männern im Alter von 40 bis 50 Jahren größer ist als die Varianz des Cholesteringehalts bei Männern im Alter von 20 bis 30 Jahren. Kann diese Vermutung bei einem Signifikanzniveau von \(\alpha=0.05\) mit einem geeigneten Test auf Grundlage der Daten aus Aufgabe 35 bestätigt werden?

Hinweis: Verwenden Sie den folgenden Tabellenausschnitt mit \(0.95\)-Quantilen von \(F(m,n)\)-Verteilungen sowie ggf. die Rechenregel \(F_{m,n;p} = \frac{1}{F_{n,m;1-p}}\).

n\m 5 6 7 8 9 10 11 12 13 14
5 5.050 4.950 4.876 4.818 4.772 4.735 4.704 4.678 4.655 4.636
6 4.387 4.284 4.207 4.147 4.099 4.060 4.027 4.000 3.976 3.956
7 3.972 3.866 3.787 3.726 3.677 3.637 3.603 3.575 3.550 3.529
8 3.687 3.581 3.500 3.438 3.388 3.347 3.313 3.284 3.259 3.237
9 3.482 3.374 3.293 3.230 3.179 3.137 3.102 3.073 3.048 3.025
10 3.326 3.217 3.135 3.072 3.020 2.978 2.943 2.913 2.887 2.865
11 3.204 3.095 3.012 2.948 2.896 2.854 2.818 2.788 2.761 2.739
12 3.106 2.996 2.913 2.849 2.796 2.753 2.717 2.687 2.660 2.637
13 3.025 2.915 2.832 2.767 2.714 2.671 2.635 2.604 2.577 2.554
14 2.958 2.848 2.764 2.699 2.646 2.602 2.565 2.534 2.507 2.484
Lösung einblenden

\(F\)-Test für die Varianzen zweier normalverteilter Zufallsvariablen

  1. Hypothesen:
    \(H_0: \sigma_A^2\ge \sigma_B^2\qquad\text{gegen}\qquad H_1: \sigma_A^2<\sigma_B^2\)
  2. Teststatistik:
    \(\displaystyle F=\frac{S^2_{Y^A}}{S^2_{Y^B}}\) ist unter \(H_0\) \(F(n_A-1,n_B-1)\)-verteilt (für \(\sigma_A^2=\sigma_B^2\)).
  3. Kritischer Bereich zum Niveau \(\alpha=0.05\):
    \(K=[0,F_{n_A-1,n_B-1;\alpha})=[0,F_{7,9;0.05})=[0,0.272)\)
  4. Berechnung der realisierten Teststatistik:
    \(\displaystyle F=\frac{S^2_{Y^A}}{S^2_{Y^B}}=\frac{237.411}{945.111}=0.2512\)
  5. Entscheidung:
    \(F=0.2512\in [0,0.272)=K\quad\Rightarrow\quad H_0\) wird abgelehnt!
    Der Test kann die Vermutung einer höheren Varianz des Cholesteringehalts bei Männern im Alter von 40 bis 50 Jahren also bestätigen.

Erklär-Video zu Aufgabe 36