ue einfuhrung in die inferenzstatistik - univie.ac.at · 2017-05-10 · ue einfuhrung in die...
TRANSCRIPT
UE Einfuhrung in die Inferenzstatistik
Beispielsammlung
0 Einfuhrung und Wiederholung
0.1 Betrachten Sie das Experiment: Wurfeln mit zwei sechsseitigen Wurfeln. Berechnen
Sie die Wahrscheinlichkeitsfunktion und die Verteilungsfunktion der Zufallsvariable
Y, die die absolute Differenz der beiden Augenzahlen beschreibt.
0.2 Geben Sie ein k an, so dass die Funktion
f(x) =
kx2, 0 < x < 1
0, sonst
eine Dichte ist. Berechnen Sie außerdem die Verteilungsfunktion und P(1/3 < X ≤1/2), wobei die Zufallsvariable X die Dichte f hat.
0.3 Berechnen Sie den Erwartungswert und die Varianz der Zufallsvariable Y in Bei-
spiel 0.1.
0.4 Berechnen Sie den Erwartungswert und die Varianz der Zufallsvariable X, wobei
X die folgende Verteilungsfunktion hat
F (x) =
0, x < 0
x3, 0 ≤ x < 1
1, x ≥ 1.
0.5 Sei X die Lebensdauer von Gluhbirnen (in Stunden). Die Dichte von X sei
f(x) =
2x, 0 ≤ x < 1/2
3/4, 2 < x < 3
0, sonst.
(a) Welcher Prozentsatz an Gluhbirnen uberlebt langer als 15 Minuten ?
(b) Berechnen Sie E(X) und Var(X).
0Version: 10. Mai 2017
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 2
(c) Berechnen Sie P(0.25 < X ≤ 2.2|X > 1).
(d) Berechnen Sie P(X = 2), P(X = 0), P(X = E(X)).
0.6 Betrachten Sie die Zufallsvariable X mit E(X) = 10 und Var(X)=25. Geben Sie
positive Zahlen a und b an, so dass die Zufallsvariable Y = aX−b Erwartungswert
0 und Varianz 1 hat.
0.7 Die momenterzeugende Funktion (engl.: moment generating function) einer Zu-
fallsvariable X ist definiert als
MX(t) := E(eXt), t ∈ R.
(a) Es sei X ∼ N(0, 1). Berechnen Sie MX(t).
Hinweis: Erganze in der Rechnung (x2−2xt) zu einem vollstandigen Quadrat
und entdecke im gesamten Ausdruck die Dichte einer Normalverteilung mit
Erwartungswert t und Varianz 1.
(b) Es sei X ∼ Geo(θ), d.h. X folgt einer geometrischen Verteilung mit Parame-
ter θ ∈ (0, 1). Die Wahrscheinlichkeitsfunktion einer geometrisch verteilten
Zufallsvariable ist gegeben durch
P (X = k) = pθ(k) = (1− θ)k−1θ, k ∈ {1, 2, · · · }.
Berechnen Sie die momenterzeugende Funktion.
Hinweis: Fur eine diskrete Zufallsvariable X ist MX(t) gegeben durch
MX(t) =∑k
ektP (X = k).
0.8 Es sei X ∼ Geo(θ) mit θ ∈ (0, 1). Leiten Sie einfache Formeln fur P (X ≤ k)
und fur P (X ≥ k) her. Verwenden Sie hierfur die Wahrscheinlichkeitsfunktion aus
Beispiel 0.7.
0.9 Betrachte folgendes Glucksspiel: Der Einsatz wird mit Wahrscheinlichkeit p ver-
doppelt, mit Wahrscheinlichkeit 1− p verliert man ihn.
(a) Wie viele Runden muss man im Schnitt spielen, um einmal zu gewinnen?
Berechne auch die Varianz der Anzahl der zu spielenden Runden.
(b) Wenn man seinen Einsatz bei jedem Verlust verdoppelt und spielt, bis man
einmal gewonnen hat, wie hoch ist dann der zu erwartende Gewinn, wie hoch
ist der zu erwartende Einsatz?
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 3
0.10 Birdie’s Bearing Works manufactures bearing shafts whose diameters are normally
distributed with parameters µ = 1 and σ = 0.002. The buyer’s specifications
require these diameters to be 1.000±0.003 cm. What fraction of the manufacturer’s
shafts are likely to be rejected? If the manufacturer improves her quality control,
she can reduce the value of σ. What value of σ will ensure that not more than 1
percent of her shafts are likely to be rejected?
0.11 (Aus: S. Ross, A First Course in Probability Theory, 2nd ed. (New York: MacMil-
lan, 1984)). An expert witness in a paternity suit testifies that the length (in days)
of a pregnancy, from conception to delivery, is approximately normally distributed,
with parameters µ = 270 and σ = 10. The defendant in the suit is able to prove
that he was out of the country during the period from 290 to 240 days before the
birth of the child. What is the probability that the defendant was in the country
when the child was conceived?
0.12 Es wird mit zwei vierseitigen Wurfeln gewurfelt. Berechnen Sie die gemeinsame
Wahrscheinlichkeitsfunktion der Zufallsvariable X, die die maximale Augenzahl
beschreibt, und der Zufallsvariablen Y, die die Summe der beiden Augenzahlen
beschreibt. Sind die beiden Variablen unabhangig? Optional: Konnen Sie Ihre Re-
sultate auf den Fall zweier m-seitiger Wurfel (m > 1) erweitern?
0.13 Gegeben sei eine Zufallsvariable X mit E[X] = µ und Var(X) = σ2. Berechnen
Sie den Erwartungswert und die Varianz der Zufallsvariable
Y =X − µσ
.
Welche Eigenschaften von Erwartungswert und Varianz verwenden Sie?
1 Einfache Zufallsstichproben
1.1 Eine einfache Zufallsstichprobe einer Population der Große 2000 liefert die folgen-
den 25 Werte:
104 109 111 108 87
86 80 119 88 122
91 103 99 106 96
102 98 95 83 107
79 89 94 92 97
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 4
(a) Berechnen Sie unverzerrte Schatzungen fur den Populationsmittelwert und fur
die Populationsvarianz. Berechnen Sie außerdem eine unverzerrte Schatzung
fur die Varianz des Schatzers des Populationsmittelwerts.
(b) Geben Sie ein 95% Konfidenzintervall fur den Populationsmittelwert an.
1.2 Aus einer Population der Große N wird eine einfache Zufallsstichprobe X1, . . . , Xn
mit Zurucklegen gezogen. Dies bedeutet in der Notation aus der Vorlesung, dass
P(Xj = wi) =1
N
P(Xj = wi, Xj′ = wi′) =1
N2falls j 6= j′.
Es sei µ = 1/n∑n
i=1Xi. Berechnen Sie E[µ] und Var(µ).
1.3 Um den Populationsmittelwert µ zu schatzen wurden unabhangig voneinander zwei
Umfragen durchgefahrt. Die entsprechenden Schatzer werden mit µ1 und µ2, deren
Standardabweichungen mit σ1 und σ2 bezeichnet. Nehmen Sie an, dass µ1 und µ2
unverzerrt sind. Fur reelle Zahlen α und β konnen diese beiden Schatzer zu einem
neuen Schatzer kombiniert werden, namlich
µ∗ = αµ1 + βµ2.
Welche Bedingungen mussen α und β erfullen, damit µ∗ unverzerrt ist. Wie mussen
α und β gewahlt werden, damit die Varianz unter den davor gefundenen Bedin-
gungen minimal wird. Ist die Varianz des neuen Schatzers kleiner als die Varianz
von µ1 und/oder µ2?
1.4 In Umfragen ist es schwierig ehrliche Antworten auf heikle und unangenehme Fra-
gen zu bekommen, wie”Haben Sie schon jemals Drogen genommen?“ oder
”Haben
Sie jemals bei einer Prufung geschummelt?“ Um mit solchen Situationen umzuge-
hen, hat Warner (1965) die Methode der randomisierten Antwort eingefuhrt. Der
Befragte dreht einen Pfeil auf einem Rad oder zieht eine Kugel aus einer Urne,
die mit Ballen zweier verschiedener Farben gefallt ist, um zu bestimmen auf wel-
che Aussage er antwortet: (1)”Ich habe Charakteristik A“, oder (2)
”Ich habe
Charakteristik A nicht“. (Charakteristik A ist zum Beispiel, ob man bereits Dro-
gen genommen hat.) Der Interviewer weiß nicht, auf welche der beiden Aussagen
geantwortet wird und tragt nur die Antwort, namlich”ja“ oder
”nein“ ein. Die
Hoffnung ist hierbei, dass der Interviewte ehrlich antwortet, wenn er/sie erkennt,
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 5
dass der Interviewer nicht weiß, auf welche Aussage geantwortet wird. Es sei R der
Anteil der”ja“-Antworten in der Stichprobe. Weiters sei p die Wahrscheinlichkeit,
dass auf Aussage (1) geantwortet wird (p ist aus der Struktur des Zufallsexperi-
ments bekannt). Weiters sei q der Anteil der Personen in der Population, die die
Charakteristik A aufweisen, und r die Wahrscheinlichkeit, dass ein Befragter mit
”ja“ antwortet.
(a) Zeigen Sie, dass r = (2p− 1)q + (1− p).(Hinweis: Bedingen Sie auf den Ausgang der Randomisierung.)
(b) Zeigen Sie, dass E[R] = r, und geben Sie einen Schatzer Q fur q an, der
E[Q] = q erfullt.
(c) Zeigen Sie, dass
Var(R) ≈ r(1− r)n
,
wobei ≈ bedeutet”ist gleich bis auf Terme der Form (constant)/N oder
(constant)/(N−1)“. In der Vorlesung wurde zum Beispiel gezeigt, dass Var(µ) ≈σ2/n
1.5 Diese Aufgabe stellt einen Algorithmus vor um eine einfache Zufallsstichprobe
mittels einer sequentiellen Methode zu erhalten. Die insgesamt N Individuen einer
Population werden in einer vorher festgelegten Reihenfolge (z.B. in der aufgelis-
teten Reihenfolge) betrachtet und es wird schrittweise entschieden, ob sie in die
Stichprobe aufgenommen werden oder nicht. Das i-te Individuum wird mit einer
Wahrscheinlichkeit von
n− niN − i+ 1
aufgenommen, wobei ni die Anzahl der sich bereits in der Stichprobe befindenden
Individuen bezeichnet. Zeigen Sie, dass es sich hierbei wirklich um eine einfache
Zufallsstichprobe handelt, d.h. zeigen Sie, dass jede Teilmenge der Große n mit
einer Wahrscheinlichkeit von 1/(Nn
)auftritt.
1.6 Anhand einer einfachen Zufallsstichprobe wurde ein 90% Konfidenzintervall fur die
durchschnittliche Anzahl an Kindern pro Haushalt berechnet und ergab (0.7, 2.1).
Heißt dies, dass 90% der Haushalte zwischen 0.7 und 2.1 Kinder haben?
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 6
1.7 In dieser Aufgabe wird das Konzept eines einseitigen Konfidenzintervalls erklart.
Wie sollte A unter Verwendung des Zentralen Grenzwertsatzes gewahlt werden,
sodass das Intervall (−∞, µ − A] ein approximatives 90% Konfidenzintervall fur
µ ist, d.h., sodass P (µ ≤ µ − A) ≈ 0.9 gilt? (Hier bezeichnet µ den Mittelwert
einer einfachen Zufallsstichprobe der Große n.) Diese Konstruktion wird einseitiges
Konfidenzintervall genannt. Wie sollte A gewahlt werden, sodass (−∞, µ−A] ein
approximatives 95% Konfidenzintervall ist?
1.8 Betrachten Sie eine Situation, in der der Populationsmittelwert linear in der Zeit
t wachst: µ(t) = α+ βt (die Populationsvarianz bleibt konstant). Angenommen es
werden zu den Zeitpunkten t = 1, 2, 3 unabhangige einfache Zufallsstichproben der
Große n gezogen. Finden Sie Konstanten w1, w2, w3, sodass
β = w1X1 + w2X2 + w3X3
ein unverzerrter Schatzer fur die Anderungsrate β ist. Hier bezeichnet Xt den
Mittelwert der Stichprobe, die zum Zeitpunkt t gezogen wurde. Wie mussen die
Konstanten wt gewahlt werden, sodass der resultierende Schatzer minimale Varianz
hat (und gleichzeitig unverzerrt ist)?
1.9 Eine Population vom Umfang N bestehe aus zwei disjunkten Teilpopulationen,
sogenannten Strata. Des Weiteren seien die beiden Strata gleich groß. Fur den
Populationsmittelwert gilt also µ = (µ1 + µ2)/2, wobei µ1 und µ2 die Mittelwerte
innerhalb der beiden Strata bezeichnen. Die Varianzen innerhalb der beiden Stra-
ta bezeichnen wir mit σ21 und σ22. Angenommen aus jedem Stratum wurde eine
einfache Zufallsstichprobe der Große n gezogen. Weiters seien die beiden Zufallss-
tichproben voneinander unabhangig.
(a) Geben Sie einen unverzerrten Schatzer µ fur den Populationsmittelwert µ an,
indem Sie Schatzer fur die Mittelwerte der beiden Teilpopulationen geeignet
kombinieren. Berechnen Sie auch die Standardabweichung σµ des Schatzers
und geben Sie einen unverzerrten Schatzer dafur an.
(b) Betrachten Sie nun den Datensatz income.txt aus der Vorlesung. Die zu-
grundeliegende Population lasst sich in zwei Strata unterteilen: diejenigen
Personen, die ein Einkommen uber dem Medianeinkommen haben, und die-
jenigen Personen, deren Einkommen darunter liegt. Berechnen Sie fur diesen
Datensatz zuerst den Stichproben-Median. Teilen Sie dann die Stichprobe
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 7
in zwei Gruppen: diejenigen Werte, die kleiner als der Stichproben-Median
sind, und jene Werte, die großer als der Stichproben-Median sind oder mit
ihm ubereinstimmen. Verwenden Sie nun den ersten Teil dieser Aufgabe, um
einen unverzerrte Schatzer fur den Populationsmittelwert und seine Standard-
abweichung zu erhalten. Welche Annahmen mussen Sie treffen?
1.10 Betrachten Sie den Datensatz expenditures.txt, der die wochtentlichen Gesamt-
ausgaben aller Haushalte enthalt, die im Living Costs and Food Survey, 2010 er-
fasst wurden. Verschaffen Sie sich zuerst einen Gesamteindruck, indem Sie passende
deskriptive Statistiken und Grafiken erstellen, und berechnen Sie mit Hilfe einer
Normalverteilungsapproximation und mit Hilfe des Bootstraps jeweils ein approxi-
matives 95% Konfidenzintervall fur die erwarteten wochentlichen Gesamtausgaben
eines Haushalts.
1.11 Seien Xii.i.d.∼ U ([µ− 1, µ+ 1]), fur i ∈ N und µ ∈ R. Als Stichprobe wurden X1 =
0.2 und X2 = 0.7 gezogen. Zeigen Sie, dass der Schatzer µ = X1+X22 unverzerrt ist
und berechnen Sie ein symmetrisches 95%-Konfidenzintervall fur den Parameter
µ, d.h. ein Intervall der Form [µ− k, µ+ k], fur k > 0. Hinweis: X1 +X2 folgt eine
Dreiecksverteilung mit Erwartungswert 2µ und Support [2µ− 2, 2µ+ 2].
1.12 Das folegende Spiel wird gespielt. Ein Euro wird gesetzt und dann werden drei
Wurfel geworfen. Falls die Summe der Augenzahlen kleiner als 5 ist, gewinnt man
20 Euro.
(a) Was ist der erwartete Gewinn nach einem Spiel?
(b) Was ist die Verteilung des totalen Gewinnes nach zwei Spielen?
(c) Was ist die approximative Verteilung der totalen Gewinnes nach 100 Spielen
und wie groß ist die Wahrscheinlichkeit, dass dieser Gewinn positiv ist?
1.13 (a) Gesucht ist ein Konfidenzintervall fur den unbekannten Anteil p der Merk-
malstrager mit Eigenschaft A in einer Population. Wir ziehen eine Stichpro-
be X1, . . . , Xn aus unserer Population zufallig mit Zurucklegen. Wir haben
Xi = 1, falls das i-te Element der Stichprobe die Eigenschaft A besitzt, und 0
sonst. Finden Sie ein approximatives (1-α) -Konfidenzintervall fur p. Nehmen
Sie an, dass n ≥ 30.
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 8
(b) Aus der Meldekartei einer Großstadt werden 100 Personen zufallig ausgewahlt.
Anhand der Geburtsorte dieser Personen stellt man fest, dass 20% an ei-
nem anderen Ort geboren sind. Aufgrund dieses Stichprobenanteils soll ab-
geschatzt werden, wie viel Prozent der Gesamtbevolkerung der Großstadt an
einem anderen Ort geboren sind. Finden Sie auch ein 0.95 - Konfidenzinterval
fur den wahren Anteil der Bewohner, die an einem anderen Ort geboren sind.
2 Parametrische Modelle
2.1 Es seien X1, . . . , Xn i.i.d. U([0, θ]), θ > 0, d.h., X1, . . . , Xn sind unabhangig und fol-
gen einer Gleichverteilung auf dem Intervall [0, θ]. Die Dichte der Gleichverteilung
ist
fθ(x) =
1θ 0 ≤ x ≤ θ
0 sonst.
Finden Sie einen Schatzer fur θ mit der Momentenmethode.
2.2 Es seien X1, . . . , Xn i.i.d. U([θ1, θ2]), d.h., X1, . . . , Xn sind unabhangig und folgen
einer Gleichverteilung auf dem Intervall [θ1, θ2] fur θ1, θ2 ∈ R und θ1 < θ2. Finden
Sie Schatzer fur θ1 und θ2 mit der Momentenmethode.
2.3 Es seienX1, . . . , Xn i.i.d. B(n, p), d.h.,X1, . . . , Xn sind unabhangig und folgen einer
Binomialverteilung mit Parametern n ∈ N und p ∈ (0, 1). Finden Sie Schatzer fur
n und p mit der Momentenmethode.
2.4 Es seien X1, . . . , Xn unabhangig und identisch verteilt wie X mit P(X = 1) = 2−2θ2−θ
und P(X = 2) = θ2−θ fur θ ∈ (0, 1). Finden Sie einen Schatzer fur θ mit der
Momentenmethode.
2.5 Es seien X1, . . . , Xn i.i.d. Exp(λ) mit λ > 0. Die Dichte der Exponentialverteilung
ist
fλ(x) =
λe−λx x ≥ 0
0 sonst.
Finden Sie einen Schatzer fur λ mit der Momentenmethode.
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 9
2.6 Die Dichtefunktion der Paretoverteilung mit Parametern k > 0 und θ > 1 ist
gegeben durch
fk,θ(x) =
θkθ
xθ+1 x ≥ k
0 sonst.
Nehmen Sie an, dass k bekannt ist und, dass man eine i.i.d. Stichprobe der Große n
gegeben hat. Berechnen Sie einen Schatzer fur θ mit Hilfe der Momentenmethode.
2.7 Betrachten Sie die Gleichverteilung mit folgender Dichte
fα1,α2(x) =
12α2
α1 − α2 ≤ x ≤ α1 + α2
0 sonst,
wobei α1 ∈ R und α2 > 0. Nehmen Sie an, dass Sie eine i.i.d. Stichprobe der
Große n gegeben haben. Schatzen Sie die beiden Parameter α1 und α2 mittels der
Momentenmethode.
2.8 Eine der ersten Anwendungen der Poissonverteilung geht auf William S. Gos-
set (a.k.a. Student) zuruck. Er studierte die auftretenden Fehler bei der Zahlung
von Hefezellen mittels eines Hamozytometers. In dieser Studie wurden Hefezellen
getotet, mit Wasser und Gelatine vermischt und anschließend auf einer Glasplatte
abgekuhlt. Es wurden fur vier verschiedene Konzentrationen je 400 Zahlungen ge-
macht. Diese sind im Textdokument yeast.txt zusammengefasst. Schatzen Sie den
Parameter λ fur jede der vier Konzentrationen und konstruieren Sie approximative
95% Konfidenzintervalle. Fertigen Sie fur jede Konzentration eine Abbildung an,
in der Sie die beobachteten Haufigkeiten mit den theoretischen Haufigkeiten aus
den geschatzten Poissonmodellen vergleichen.
2.9 Es seien X1, . . . , Xn i.i.d. Geo(p) mit p ∈ (0, 1). Finden Sie einen Schatzer fur p
mit der Momentenmethode.
2.10 In einer okologischen Studie uber das Fressverhalten von Vogeln wurde die Anzahl
der Sprunge zwischen je zwei Flugen bei mehreren Vogeln gezahlt. Folgende Daten
wurden beobachtet:
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 10
Anzahl der Sprunge Haufigkeit
1 48
2 31
3 20
4 9
5 6
6 5
7 4
8 2
9 1
10 1
11 2
12 1
Verwenden Sie den Schatzer aus Beispiel 2.9 um eine geometrische Verteilung an-
zupassen und geben Sie ein approximatives 95% Konfidenzintervall an.
2.11 Die folgenden 16 Zahlen stammen aus einem Zufallszahlengenerator der i.i.d Be-
obachtungen einer N(µ, σ2) verteilten Zufallsvariable erzeugt:
7.886846 11.016898 7.861484 9.918058 10.286014 4.919416
11.790559 8.608189 10.343040 9.490196 9.831089 10.433526
10.616618 9.104823 7.657797 7.516910
(a) Schatzen Sie den Erwartungswert µ und die Varianz σ2 der zugrunde liegenden
Normalverteilung.
(b) Berechnen Sie ein approximatives 95% Konfidenzintervall fur µ.
(c) Wieviel großer musste die Stichprobe sein, damit sich die Lange des Konfi-
denzintervalls halbiert?
2.12 Betrachten Sie eine i.i.d. Stichprobe der Große n von Zufallsvariablen mit Dichte
fσ(x) =1
2σe−
|x|σ
fur x ∈ R, wobei σ > 0. Finden Sie einen Momentenschatzer fur σ.
2.13 Der Winkel θ, in dem Elektronen beim Zerfall des Elementarteilchens Myon emit-
tiert werden, hat die Eigenschaft, dass X = cos θ eine Dichte der folgenden Gestalt
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 11
hat
fα(x) =
1+αx2 −1 ≤ x ≤ 1
0 sonst.
Damit obige Funktion eine Dichte ist, muss |α| ≤ 1 gelten. Physikalische Uberlegungen
legen nahe, dass |α| ≤ 1/3.
(a) Berechnen Sie den Erwartungswert von X.
(b) Nehmen Sie an, Sie haben eine i.i.d. Stichprobe der Große n gegeben. Finden
Sie einen Momentenschatzer α fur α.
(c) Zeigen Sie, dass α ein unverzerrter Schatzer fur α mit Varianz (3−α2)/n ist.
(d) Verwenden Sie den Zentralen Grenzwertsatz um eine Approximation fur die
Stichprobenverteilung von α zu erhalten. Berechnen Sie damit fur n = 25 und
α = 0 naherungsweise die Wahrscheinlichkeit, dass α großer als 0.5 ist.
2.14 Es seien X1, . . . , Xn i.i.d. N(µ, σ2) mit µ ∈ R und σ2 > 0. Finden Sie Momen-
tenschatzer fur µ und σ2.
2.15 In einer Urne befinden sich rote und weiße Kugeln, der Anteil der roten Kugeln
sei p (unbekannt). Man zieht jetzt funf Mal mit Zurucklegen und erhalt die Folge
rot, weiß, weiß, rot, weiß. Bestimmen und berechnen Sie einen Schatzer fur p mit
der Momentenmethode.
2.16 Um die Große einer Tierpopulation zu bestimmen, wurden 100 Tiere gefangen,
markiert und danach wieder freigelassen. Zu einem spateren Zeitpunkt wurden
50 weitere Tiere gefangen, und es stellte sich heraus, dass 20 davon markiert wa-
ren. Erstellen Sie ein parametrisches Modell, das das Experiment beschreibt, und
entwickeln Sie einen Schatzer fur die Große der Population.
2.17 Aus einer exponentialverteilten Grundgesamtheit wurde eine Stichprobe der Große
50 gezogen. Der Stichprobenmittelwert betragt 2.17. Bestimmen Sie einen Momen-
tenschatzer fur den Parameter der zugrundeliegenden Exponentialverteilung und
konstruieren Sie ein 95% Konfidenzintervall.
2.18 The Datei bodytemp.txt enthalt die Korpertemperatur (Fahrenheit) und die Herz-
frequenz (Schlage pro Minute) von 65 Mannern (kodiert als 1) und 65 Frauen
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 12
(kodiert als 2) aus einer Studie von Schoemaker (1996). Schatzen Sie die Er-
wartungswerte und Varianzen der Korpertemperatur und der Herzfrequenz, se-
parat fur Manner und Frauen, unter der Annahme, dass die Beobachtungen un-
abhangig und normalverteilt sind. Bestimmen Sie 95% Konfidenzintervalle fur die
Erwartungswerte. Unterstutzen die Daten die Daumenregel einer durchschnittli-
chen Korpertemperatur von 98.6 Grad Fahrenheit?
2.19 Gegeben sei eine Stichprobe X1, . . . , Xn von unabhangigen Beobachtungen. Die i-
te Beobachtung Xi sei exponentialverteilt mit Parameter 2iλ, λ > 0, i = 1, . . . , n.
Entwerfen Sie einen vernunftigen Schatzer fur λ.
2.20 Betrachten Sie eine Stichprobe X1, . . . , Xn von unabhangigen und identisch verteil-
ten Zufallsvariablen, deren gemeinsamer Erwartungswert µ ist. Hier ist µ ∈ R ein
unbekannter Parameter. Die hier tatsachlich interessierende Große ist nicht µ son-
dern eine Funktion von µ, also eine Große von der Form θ = g(µ). Bestimmen Sie
einen Schatzer fur θ mit der Momentenmethode. Untersuchen Sie den Schatzer auf
Unverzerrtheit und Konsistenz, wenn die Funktion g(µ) (a) linear, (b) nichtlinear
und stetig, (c) unstetig ist.
2.21 In einer Urne befinden sich rote und weiße Kugeln, wobei der Anteil p der roten Ku-
geln entweder 1/2 oder 1/3 ist. Man zieht jetzt funf Mal mit Zurucklegen und erhalt
die Folge rot, weiß, weiß, rot, weiß. Was ist der Maximum-Likelihood-Schatzer fur
p?
2.22 Eine Urne enthalt 10 Geldstucke. Sie kann zwei unterschiedliche Zusammensetzun-
gen aufweisen:
Zustand I: 3 1-EURO-Munzen und 7 2-EURO-Munzen
Zustand II: 6 1-EURO-Munzen und 4 2-EURO-Munzen
Von Interesse ist der Gesamtbetrag θ des Geldes in der Urne. Der Zustand der Urne
und damit auch der Wert von θ seien unbekannt. Um θ zu schatzen, entnehmen
wir der Urne zwei Munzen mit Zurucklegen.
(a) Stellen Sie die Wahrscheinlichkeiten der einzelnen Stichproben in Abhangigkeit
von den Werten von θ in einer Tabelle zusammen.
(b) Geben Sie die Maximum-Likelihood-Schatzfunktion fur θ an.
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 13
(c) Bei einer Ziehung werden zwei 1-EURO-Munzen gezogen. Berechnen Sie den
Maximum-Likelihood-Schatzer fur θ?
2.23 Berechnen Sie die log-Likelihood fur den Parameter λ, wenn die Zufallsvaria-
blen unabhangig Poisson-verteilt sind. Berechnen Sie den Maximum-Likelihood-
Schatzer fur λ.
2.24 (a) Sei X eine Zufallsvariable mit Dichte f(x), fur x ∈ R und sei s ∈ R, wobei
s 6= 0. Finden Sie die Dichte der Zufallsvariablen Y = s ·X.
(b) Sei Y = s · X, fur s > 0, und sei X ∼ χ21. Weiters seien Y1, . . . , Yn i.i.d. Y .
Finden Sie den Maximum-Likelihood-Schatzer fur s.
2.25 (a) Eine Munze wird 20 mal geworfen und es wird gezahlt, wie oft sie auf”Kopf“
fallt. Sei p die Wahrscheinlichkeit, dass sie auf”Kopf“ fallt. Was ist dann die
log-Likelihood von p? Berechnen Sie den Maximum-Likelihood-Schatzer fur
p.
(b) Ein leicht abgeandertes Experiment: Eine Munze wird nun so lange geworfen
bis sie 10 mal auf”Kopf“ gefallen ist. Berechnen Sie die log-Likelihood von
p. Berechnen Sie den Maximum-Likelihood-Schatzer fur p.
Hinweis: Verwenden Sie die negative Binomialverteilung (siehe http://en.
wikipedia.org/wiki/Negative_binomial)
2.26 In einer Schachtel befinden sich 6 Kugeln, die entweder weiß oder rot sind. Die
Anzahl θ der roten Kugeln ist unbekannt (θ=0, 1, 2, 3, 4, 5 oder 6). Ein Statistiker
zieht mit Zurucklegen 4 Kugeln aus der Urne und erhalt folgendes Ergebnis: rot,
rot, weiß, rot.
(a) Wie groß ist die Wahrscheinlichkeit dieses Ereignisses, wenn θ = 2 ist?
(b) Wie lautet die Likelihoodfunktion fur θ aufgrund dieses Ergebnisses?
(c) Berechnen Sie den Maximum-Likelihood-Schatzer fur θ.
2.27 Es sei X hypergeometrisch verteilt mit Parameter N , M und n. Hier bezeichnet
N die Anzahl der Elemente in der Grundgesamtheit, M die Anzahl der Elemente
in der Grundgesamtheit mit einer bestimmten Eigenschaft und n die Anzahl der
Elemente in der Stichprobe. Was ist der Maximum-Likelihood-Schatzer fur M?
Hinweis: Betrachten Sie den Quotienten der Likelihood an den Stellen M und
M + 1, i.e., L(M)/L(M + 1).
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 14
2.28 Angenommen X1, . . . , Xn seien i.i.d. mit Dichte
fθ0(x) =
exp(−|x− θ0|) falls x ≥ θ0
0 sonst,
wobei θ0 ∈ R. Leiten Sie den Maximum-Likelihood-Schatzer her.
2.29 Angenommen X1, . . . , Xn seien i.i.d. mit Dichte
fθ0(x) =1
2exp(−|x− θ0|)
wobei θ0 ∈ R. Leiten Sie den Maximum-Likelihood-Schatzer her. (Hinweis:∑n
i=1 |xi−θ| wird minimiert fur θ = m, wobei m ein Stichproben-Median ist.)
2.30 In dieser Aufgabe wird die Cramer-Rao-Schranke fur diskrete Verteilungen herge-
leitet. Betrachten Sie eine diskret verteilte Zufallsvariable X mit Wertebereich
{ω1, ω2, . . . , ωd}, wobei d ≥ 2, und Wahrscheinlichkeitsfunktion p(x|θ0), wobei
θ0 ∈ Θ ⊆ R. Die Fisher-Information des Modells ist hier gegeben durch
I(θ0) := Eθ0
[(d
dθlog(p(X|θ0))
)2]
=
d∑i=1
p(ωi|θ0)(d
dθlog(p(ωi|θ0))
)2
.
Seien nunX1, . . . , Xn i.i.d. Zufallsvariablen mit Wahrscheinlichkeitsfunktion p(x|θ0)und θ0 ∈ Θ ⊆ R. Wir wollen zeigen, dass fur jeden unverzerrten Schatzer θ fur θ0
die Cramer-Rao-Ungleichung
Varθ0(θ) ≥ (nI(θ0))−1 (1)
gilt. Beweisen Sie dazu, mit der Bezeichnung Z =∑n
i=1ddθ log p(xi|θ0), die Aussa-
gen:
(a) Covθ0(θ, Z)2 ≤ Varθ0(θ)Varθ0(Z),
(b) Varθ0(Z) = nI(θ0),
(c) Covθ0(θ, Z) = 1.
Angenommen der Wertebereich {ω1, ω2, . . .} sei (abzahlbar) unendlich. Kann man
unter zusatzlichen Glattheitsbedingungen an die Wahrscheinlichkeitsfunktion p(x|θ0)ein ahnliches Argument wie fur den endlichen Fall anwenden? Ist θ ein effizienter
Schatzer fur θ?
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 15
2.31 Sei X1, . . . , Xn eine i.i.d. Stichprobe aus einer Cauchy-Verteilung mit Lokations-
parameter l ∈ R und Skalenparameter s > 0. Die Dichte ist gegeben durch
fl,s(x) = 1/(πs(1 + ((x− l)/s)2)) fur x ∈ R.
(a) Welche Gleichungen erfullen die Maximum-Likelihood-Schatzer? Ist es moglich
diese Gleichungen explizit zu losen, d.h., konnen Sie explizite Formeln fur die
Maximum-Likelihood-Schatzer angeben?
(b) Kann man die Parameter auch mit der Momentenmethode schatzen?
2.32 (a) Der Datensatz cauchy.txt enthalt eine i.i.d. Stichprobe der Große 50, wobei
die zugrundeliegende Verteilung eine Cauchy Verteilung ist. Berechnen Sie
die Maximum-Likelihood-Schatzer fur den Datensatz cauchy.txt. (Hinweis:
Verwenden Sie dazu beispielsweise die Funktion fitdistr aus der library
MASS.)
(b) Untersuchen Sie weiters das Verhalten des Maximum-Likelihood-Schatzers fur
den Lokationsparameter einer Cauchy Verteilung fur Stichproben der Große
10: Simulieren Sie dazu die Verteilung des Maximum-Likelihood-Schatzers
unter der Annahme, dass der zugrundeliegende Lokationsparameter 1 und
der zugrundeliegende Skalenparameter 2 ist. (Hinweis: Falls Sie die Funk-
tion fitdistr aus der MASS-library verwenden, um den MLE zu berech-
nen, benutzen Sie den Befehl fitdistr(s, "cauchy")$estimate[1] um den
geschatztschatzeen Lokationsparameter zu erhalten - hier bezeichnet s die
Stichprobe.)
2.33 Angenommen X1, . . . , Xn sind i.i.d. gleichverteilt auf [0, θ] mit θ > 0.
(a) Leiten Sie den Maximum-Likelihood-Schatzer fur θ her. Bestimmen Sie zusatzlich
dessen Dichte und berechnen Sie den Erwartungswert und die Varianz des
Maximum-Likelihood-Schatzers. Vergleichen Sie diese Resultate mit dem Mo-
mentenschatzer fur θ (vgl. Beispiel 2.1).
(b) Finden Sie eine erwartungstreue Modifikation des Maximum-Likelihood-Schatzers.
2.34 Es seien X1, . . . , Xn i.i.d. Poisson-verteilt mit Parameter λ > 0. Leiten Sie den
Maximum Likelihood Schatzer fur λ her. Ist dieser effizient?
2.35 Es seien X1, . . . , Xn i.i.d. geometrisch verteilt mit Parameter p ∈ (0, 1). Leiten Sie
den Maximum Likelihood Schatzer fur p her. Berechnen Sie die Fisher-Information
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 16
in diesem Modell. Konnen Sie mit der Cramer-Rao Schranke feststellen, ob der
Schatzer effizient ist?
2.36 Es seien X1, . . . , Xn i.i.d. Pareto-verteilt mit Parameter θ > 1 und x0 > 0. Die
Dichte ist gegeben durch:
fθ,x0(x) =
θ xθ0 x−θ−1 fur x ≥ x0
0 sonst.
Die Pareto-Verteilung wird oft verwendet, um Einkommensdaten zu modellieren,
da die Dichte nicht so schnell abfallt. Nehmen Sie an, dass x0 > 0 bekannt ist.
(a) Finden Sie einen Schatzer fur θ mit der Momentenmethode.
(b) Leiten Sie den Maximum Likelihood Schatzer θML fur θ her.
(c) Bestimmen Sie die Varianz der asymptotischen Verteilung von√n(θML − θ).
2.37 Es seien X1, . . . , Xn i.i.d. Rayleigh-verteilt mit Parameter θ > 0. Die Dichte ist
gegeben durch
fθ(x) =
xθ2
e−x2/(2θ2) fur x ≥ 0
0 sonst.
(a) Finden Sie einen Schatzer fur θ mit der Momentenmethode.
(b) Leiten Sie den Maximum Likelihood Schatzer θML fur θ her.
(c) Bestimmen Sie die Varianz der asymptotischen Verteilung von√n(θML − θ).
2.38 Die folgende Tabelle (siehe Fisher, 1958) zeigt Daten von Keimlingen, die Nach-
kommen von autogamen Heterozygoten sind. Jeder Keimling kann klassifiziert wer-
den als starke- oder zuckerhaltig und als grun oder weiß.
Typ Anzahl
starkehaltig und grun 1997
starkehaltig und weiß 906
zuckerhaltig und grun 904
zuckerhaltig und weiß 32
Aus der Genetik weiß man, dass die Zellenwahrscheinlichkeiten durch (2 + θ)/4,
(1− θ)/4, (1− θ)/4 und θ/4 mit θ ∈ (0, 1) gegeben sind.
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 17
(a) Leiten Sie den Maximum Likelihood Schatzer θML fur θ her. Bestimmen Sie
weiters die Varianz der asymptotischen Verteilung von√n(θML − θ).
(b) Berechnen Sie basierend auf (a) ein approximatives 95% Konfidenzintervall
fur θ.
(c) Verwenden Sie den Bootstrap um die Standardabweichung des Maximum Li-
kelihood Schatzer zu approximieren und vergleichen Sie das Ergebnis mit dem
Ergebnis aus (a).
(d) Verwenden Sie den Bootstrap um ein approximatives Konfidenzintervall fur
θ zu finden und vergleichen Sie das Ergebnis mit dem Ergebnis aus (b).
2.39 Betrachten Sie im vorigen Beispiel zwei weitere Schatzer, namlich
θ1 =4X1
n− 2, θ2 =
4X4
n,
wobei X1 und X4 die Haufigkeiten in der ersten bzw. vierten Zeile sind. Berechnen
Sie diese beiden Schatzer. Verwenden Sie, dass X1 und X4 binomialverteilte Zu-
fallsvariable sind, um zu zeigen, dass beide Schatzer unverzerrt sind. Bestimmen
Sie deren Varianzen. Verwenden Sie Beispiel 2.38 (a) um die Varianz von θML ge-
eignet zu approximieren. Vergleichen Sie diese Approximation mit den Varianzen
von θ1 und θ2.
2.40 Seien X1, . . . , Xni.i.d∼ X, wobei X einer Verteilung mit folgender Dichte folgt
f(x|θ) =
θ if x ∈ [0, α]
0 otherwise,
wobei θ > 0 und α = α(θ) nur von θ abhangt.
(a) Bestimmen Sie die Beziehung zwischen α und θ. Verwenden Sie, dass f(·|θ)eine Dichtefunktion ist.
(b) Berechnen Sie EX und VarX und schatzen Sie θ und α mittels Momen-
tenschatzern.
(c) Bestimmen Sie die approximative Verteilung von X (fur große n).
(d) Bestimmen Sie die approximative Verteilung Ihrer Momentenschatzer fur θ
und α (fur große n).
(e) Geben Sie ein ein approximatives (1 − γ) Konfidenzintervall fur θ an, wobei
0 < γ < 1.
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 18
3 Testen von Hypothesen
3.1 Im Folgenden seien die Daten nach einer Normalverteilung mit Parametern µ und
σ2 generiert. Argumentieren Sie, ob man die Nullhypothese ablehnt oder nicht.
(a) H0 : µ = 120 versus H1 : µ < 120; y = 114.2, n = 25, σ = 18, α = 0.08
(b) H0 : µ = 42.9 versus H1 : µ 6= 42.9; y = 45.1, n = 16, σ = 3.2, α = 0.01
(c) H0 : µ = 14.2 versus H1 : µ > 14.2; y = 15.8, n = 9, σ = 4.1, α = 0.13
3.2 Der Gehalt an Calcium eines Mineralwassers (in mg/l) wird an 6 verschiedenen
Tagen ermittelt: 840 680 920 1000 750 850. Der Produzent behauptet, dass das
Mineralwasser einen mittleren Calciumgehalt von 1000 mg/l hat. Testen Sie diese
Hypothese gegen eine zweiseitige Alternative zum Niveau α = 0.05,
(a) wenn die Varianz nicht bekannt ist.
(b) wenn die Standardabweichung 200 mg/l betragt.
3.3 Es sei Y1, . . . , Y8 ein i.i.d. Sample einer Gleichverteilung auf dem Intervall [0, θ] mit
θ > 0. Mit Hilfe der Teststatistik
Ymax = max1≤i≤8
Yi
testet man die Hypothese H0 : θ = 2 gegen die Alternative H1 : θ < 2 zum
Signifikanzniveau α = 0.1.
(a) Bestimmen Sie die Dichtefunktion von Ymax.
(b) Bestimmen Sie den kritischen Wert κ, sodass unter der Nullhypothese P(Ymax <
κ) = α gilt.
(c) Was ist die Wahrscheinlichkeit, einen Fehler zweiter Art zu begehen, wenn
θ = 1.7?
3.4 Eine Munze wird 10 mal (unabhangig voneinander) geworfen. Angenommen Sie
wollen die Hypothese, dass die Wahrscheinlichkeit fur”Kopf“ 1/2 ist, gegen die
Alternative, dass diese ungleich 1/2 ist, testen. Der Test lehnt die Nullhypothese
ab, wenn entweder 0 oder 10 Kopfe vorkommen.
(a) Berechnen Sie das Signifikanzniveau dieses Tests.
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 19
(b) Nehmen Sie an, dass die Wahrscheinlichkeit fur”Kopf“ 0.1 ist. Berechnen Sie
die Power dieses Tests.
3.5 Ein Test mit Signifikanzniveau α lehnt die Nullhypothese ab, wenn die Teststatistik
T strikt großer als t ist. Fur eine streng monoton steigende Funktion g(·) setzen
Sie S = g(T ). Hat der Test, der die Nullhypothese ablehnt, wenn S > g(t) ist,
Signifikanzniveau α?
3.6 Angenommen die Verteilung der Teststatistik T unter der Nullhypothese habe
Verteilungsfunktion F (·), wobei F (·) invertierbar ist, und angenommen ein Test
lehnt die Nullhypothese fur große Werte von T ab. Es sei V der p-Wert, d.h.,
V = 1− F (T ).
(a) Zeigen Sie, dass die Verteilung von V unter der Nullhypothese die Gleichver-
teilung auf [0, 1] ist.
(b) Berechnen Sie unter der Nullhypothese die Wahrscheinlichkeit, dass der p-
Wert großer als 0.1 ist.
(c) Welches Signifikanzniveau hat der Test, der ablehnt, wenn V < α ist?
3.7 Es wird vermutet, dass Menschen, die im Sterben liegen, ihren Tod bis kurz nach
einem wichtigen Ereignis, wie zum Beispiel einer Hochzeit oder einem Feiertag,
hinauszogern konnen. Philips und King (1988) analysierten dazu in den Jahren
1966 – 1984 Sterbemuster rund um das Passahfest, einem wichtigen judischen Fei-
ertag, in Kalifornien. Sie verglichen die Anzahl der Sterbefalle in der Woche vor
dem Passahfest (922) mit der Anzahl der Sterbefallen in der Woche nach dem
Passahfest (997) von insgesamt 1919 Menschen mit judischem Nachnamen. Wir
interpretieren die Anzahl vor und nach dem Passahfest als eine Tabelle mit zwei
Zellen. Falls kein Feiertagseffekt vorliegt, dann fallt ein Sterbefall mit Wahrschein-
lichkeit je 1/2 in eine der beiden Zellen. Um also zu zeigen, dass ein Feiertagseffekt
vorliegt, ist es notwendig zu zeigen, dass dieses einfache Modell nicht zu den Daten
passt. Formulieren Sie das als Testproblem und konstruieren Sie einen passenden
Test. Verwirft Ihr Test die Nullhypothese, dass kein Feiertagseffekt vorliegt? Wen-
den Sie den Test auch auf die Daten einer Gruppe von mannlichen Verstorbenen
mit chinesischen und japanischen Vorfahren an, von welchen 418 in der Woche
vor dem Passahfest und 434 in der Woche nach dem Passahfest verstorben sind.
Welche Relevanz hat die letztere Analyse fur die vorangegangene?
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 20
3.8 Berechnen Sie die p-Werte in Beispiel 3.1.
3.9 In einer reprasentativen Umfrage fur ein Land wurde das monatliche Einkommen
von 240 Mannern und 160 Frauen erhoben. Das durchschnittliche Einkommen der
Manner lag in der Stichprobe bei 1650 EUR, jenes der Frauen bei 1280 EUR.
Die Stichprobenstandardabweichung der Einkommens betrug 270 EUR bei den
Mannern und 480 EUR bei den Frauen.
(a) Testen Sie, ob ein Einkommensunterschied zwischen Mannern und Frauen
besteht (α = 0.01).
(b) Fuhren Sie einen Test auf Varianzhomogenitat durch (α = 0.01).
(c) Diskutieren Sie inhaltlich, inwieweit fur diese Fragestellung ein Test auf einen
Mittelwertsunterschied sinnvoll ist.
3.10 Zur Untersuchung der Variabilitat der Starke (in t/cm2) von zwei Typen von Stahl-
seilen (Typ 1, Typ 2) ergaben sich folgende Werte n1 = 10, s21 = 19.2, n2 = 16,
s22 = 3.5. Weist der Unterschied in den Standardabweichungen auf eine hohere
Variabilitat des Typ 1 hin? (α = 0.01).
3.11 Angenommen X1, . . . , Xn sind i.i.d. Poisson-verteilte Zufallsvariablen mit Parame-
ter λ > 0, und Sie wollen fur zwei verschiedene vorgegebene Werte λ0 > 0 und
λ1 > 0 mit dem Likelihood-Ratio-Test die Hypothese
H0 : λ = λ0 gegen H1 : λ = λ1
testen. Zeigen Sie, dass im Fall λ1 < λ0 der Likelihood-Ratio-Test verwirft, falls
X klein ist, und dass im Fall λ1 > λ0 der Likelihood-Ratio-Test verwirft, falls X
groß ist.
3.12 Angenommen X1, . . . , Xn sind i.i.d. Poisson-verteilte Zufallsvariablen mit Parame-
ter λ > 0, und Sie wollen fur einen vorgegebenen Wert λ0 > 0 die Hypothese
H0 : λ = λ0 gegen H1 : λ < λ0
testen. Zeigen Sie, dass der Likelihood-Ratio-Test UMP (Uniformly-Most-Powerful)
ist.
3.13 Gegeben sei eine normalverteilte Grundgesamtheit mit σ = 4. Mittels z-Test soll
die Hypothese H0 : µ = 10 gegen H1 : µ 6= 10 auf einem Signifikanzniveau von
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 21
α = 0.05 getestet werden. Genugt eine Zufallsstichprobe der Große n = 45, um
den Fehler zweiter Art unter 0.2 zu halten, wenn µ = 12 ?
3.14 Betrachten Sie eine Stichprobe der Große 1 aus einer Verteilung mit Dichte
fθ(y) =
(θ + 1)yθ, 0 ≤ y ≤ 1
0, sonst.
Falls y ≥ 0.9, dann verwirft man H0 : θ = 1 zugunsten von H1 : θ > 1. Berechnen
Sie das Signifikanzniveau des Tests.
3.15 In einem Betrieb verteilen sich die Krankenstande der letzten sechs Monate fol-
gendermaßen auf die Wochentage:
Mo Di Mi Do Fr
Anzahl 125 111 98 104 112
Testen Sie zum Niveau α = 0.05, ob die Krankenstande uber die Wochentage
gleichverteilt sind.
3.16 Einhundert ungeordnete Stichproben der Große 2 werden ohne Zurucklegen aus
einer Urne mit 6 roten und 4 weißen Ballen gezogen. Die Ergebnisse sind wie folgt
weiße Kugeln 0 1 2
Stichproben 35 55 10
Fuhren Sie einen Verteilungsanpassungstest fur die Hypergeometrische Verteilung
durch (α = 0.1).
3.17 Sie haben zwei verschiedene Dichten gegeben:
f0(x) =
1 fur 0 < x < 1
0 sonst,
sowie
f1(x) =
2x fur 0 < x < 1
0 sonst.
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 22
Weiters haben Sie eine Beobachtung, die einer Verteilung mit Dichte f folgt. Sie
wollen die Hypothese
H0 : f = f0 gegen H1 : f = f1
testen. Wie hoch ist die hochste Power, die ein Test zum Signifikanzniveau α = 0.1
haben kann?
3.18 Seien X1, . . . , Xn i.i.d. mit Dichte fθ mit θ ∈ R. Zeigen Sie die folgenden Aussagen:
(a) Angenommen C(X1, . . . , Xn) = C ist eine Konfidenzmenge fur θ, sodass fur
ein α ∈ (0, 1) gilt
Pθ(θ ∈ C) = 1− α fur alle θ ∈ R.
Angenommen Sie wollen fur ein fixes θ0 ∈ R die Hypothese
H0 : θ = θ0 gegen H1 : θ 6= θ0
testen. Zeigen Sie, dass der Test, der die Nullhypothese verwirft, falls θ0 /∈ Cist, Signifikanzniveau α hat.
(b) Angenommen fur jedes θ0 ∈ R gibt es einen Test tθ0 mit Signifikanzniveau
α ∈ (0, 1) fur die Hypothese
H0 : θ = θ0 gegen H1 : θ 6= θ0.
Zeigen Sie, dass die Konfidenzmenge
C = C(X1, . . . , Xn) = {θ ∈ R : tθ verwirft nicht}
erfullt, dass
Pθ(θ ∈ C) = 1− α fur alle θ ∈ R.
3.19 Sind die folgenden Aussagen wahr oder falsch?
(a) Die LR-Statistik ist immer kleiner oder gleich 1.
(b) Wenn der p-Wert 0.03 ist, dann lehnt der entsprechende Test mit Signifikanz-
niveau 0.02 ab.
(c) Wenn ein Test auf dem Signifikanzniveau 0.06 die Nullhypothese verwirft,
dann ist der p-Wert kleiner oder gleich 0.06.
(d) Der p-Wert ist die Wahrscheinlichkeit, dass die Nullhypothese wahr ist.
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 23
(e) Testet man simple Hypothesen mittels LR-Test, dann ist der p-Wert gleich
der LR-Statistik.
(f) Wenn die Teststatistik des Chiquadrat-Tests mit 4 Freiheitsgraden den Wert
8.5 hat, dann ist der p-Wert kleiner als 0.05.
3.20 Es seien X1, . . . , Xn i.i.d. exponentialverteilt mit Parameter λ. Leiten Sie den LR-
Test fur die Nullhypothese H0 : λ = λ0 und die Alternative H1 : λ 6= λ0 her. Zeigen
Sie, dass der Verwerfungsbereich von der Form {X exp(−λ0X) ≤ c} ist.
3.21 In einer klassischen Studie zur Genetik von Geissler (1889) wurde das Geschlechter-
verhaltnis untersucht. Die folgende Tabelle zeigt die Anzahl der mannlichen Kinder
in 6115 Familien mit je 12 Kindern. Die Daten wurden aus Krankenhausakten in
Sachsen gewonnen. Nehmen Sie an, dass das Geschlecht eines Kindes nicht das
Geschlecht der zukunftigen Geschwister beeinflusst und, dass die Wahrscheinlich-
keit eines mannlichen Kindes konstant uber die Zeit ist. Unter diesen Annahmen
ist die Anzahl der mannlichen Nachkommen in einer Familie mit 12 Kindern bino-
mialverteilt mit Parameter 12 und unbekannter Erfolgswahrscheinlichkeit p. Wenn
die Wahrscheinlichkeit eines mannlichen Nachkommens fur alle Familien gleich ist,
dann enthalt die nachfolgende Tabelle die Realisierungen von 6115 binomialverteil-
ten Zufallsvariablen. Testen Sie, ob die Daten mit diesem Modell ubereinstimmen.
Anzahl Haufigkeit Anzahl Haufigkeit
0 7 7 1033
1 45 8 670
2 181 9 286
3 478 10 104
4 829 11 24
5 1112 12 3
6 1343
3.22 Gegeben sind 600 Beobachtungen, die man folgendermaßen zusammenfassen kann:
Intervall (−∞,−1) (-1,-0.5) (-0.5, 0) (0, 0.5) (0.5, 1) (1,∞)
Haufigkeit 93 96 115 107 88 101
Uberprufen Sie auf einem Signifikanzniveau von α = 0.01 die Hypothese, dass die
Beobachtungen aus einer Standardnormalverteilung stammen
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 24
(a) mittels LR-Test,
(b) mittels Chiquadrat-Anpassungstest.
3.23 Es seien X1, . . . , Xm unabhangig und binomialverteilt mit Parameter ni und pi.
Leiten Sie den LR-Test fur die Nullhypothese
H0 : p1 = p2 = . . . = pm
gegen die Alternative, dass nicht alle pi gleich sind, her. Welche Grenzverteilung
hat die Teststatistik?
3.24 Es seien X1, . . . , Xn i.i.d. mit Verteilungsfunktion F und Y1, . . . , Ym i.i.d. mit Ver-
teilungsfunktion G. Weiters seien die Xi’s von den Yi’s unabhangig. Sie wollen die
Nullhypothese H0 : F = G testen. Nehmen Sie an, dass m+n gerade ist, sodass in
der kombinierten Stichprobe genau (m + n)/2 Beobachtungen kleiner oder gleich
dem Median und (m + n)/2 Beobachtungen großer als der Median sind. Nehmen
Sie weiters an, dass sowohl F als auch G stetig sind, sodass mit Wahrscheinlichkeit
1 alle Beobachtungen verschieden sind.
(a) Betrachten Sie die Teststatistik T , die zahlt, wie viele Xi’s kleiner oder gleich
dem Median der kombinierten Stichprobe sind. Zeigen Sie, dass die Teststa-
tistik unter der Nullhypothese hypergeometrisch verteilt ist, d.h., zeigen Sie
dass
P (T = k) =
((m+n)/2k
)((m+n)/2n−k
)(m+nn
) .
Konstruieren Sie einen Test.
(b) Eine Studie von McCool (1979) vergleicht die Leistung von Kugellagern ver-
schiedenen Typs. Dazu wurden jeweils 10 Kugellager zweier Typen untersucht
und es wurde festgestellt, nach wie vielen Umdrehungen das Kugellager bricht
(in Millionen); siehe bearings.txt. Verwenden Sie obigen Test, um die Null-
hypothese, dass es keinen Unterschied zwischen den beiden Kugellagern gibt,
zu testen.
3.25 In einer Grundgesamtheit sei ein Merkmal normalverteilt mit unbekanntem Erwar-
tungswert µ und bekannter Varianz σ2 = 2500. Es soll die Hypothese H0 : µ = 100
gegen H1 : µ 6= 100 getestet werden, wobei der Umfang der Stichprobe bei n = 100
liegt.
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 25
(a) Bestimmen Sie den Annahmebereich fur H0 (α = 0.05).
(b) Berechnen Sie die Wahrscheinlichkeit eines Fehlers zweiter Art unter der An-
nahme, dass der unbekannte Erwartungswert µ gleich (i) 105, (ii) 110 und
(iii) 115 ist.
(c) Erstellen Sie eine Skizze der Power des Tests als Funktion von µ.
3.26 Der Soziologe Max Weber fuhrt in dem Aufsatz”Zur Psychophysik der industriellen
Arbeit“ folgende Verteilung der Arbeitsunfalle mannlicher Arbeiter in Kopenhagen
1898-1907 dar:
Wochentag Mo Di Mi Do Fr Sa
Anzahl 50 46 34 34 33 43
(a) Die hohen Frequenzen am Samstag und Montag halt Weber fur eine Folge
des Alkohols (Freitag ist Lohnungstag) bzw. fur eine Folge großerer gesund-
heitlicher Strapazen am Wochenende. Testen Sie auf eine Gleichverteilung
(α = 0.01).
(b) Vorausgesetzt, die Stichprobe ware zehnmal so groß wie oben und die Vertei-
lung sahe wie folgt aus:
Wochentag Mo Di Mi Do Fr Sa
Anzahl 500 460 340 340 330 430
Testen Sie wie unter (a).
(c) Vergleichen Sie die gefundenen Ergebnisse miteinander und kommentieren Sie
diese.
3.27 Testen Sie mittels eines Verteilungsanpassungstests auf dem Signifikanzniveau α =
0.05, ob folgende Daten aus einer Exponentialverteilung mit Parameter λ stammen.
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 26
x Beobachtungen
0 ≤ x ≤ 1 83
1 < x ≤ 2 57
2 < x ≤ 3 28
3 < x ≤ 4 17
4 < x ≤ 5 10
5 < x ≤ 6 4
6 < x ≤ 7 3
7 < x ≤ 8 4
8 < x <∞ 5
3.28 Das National Center for Health Statistics (1970) stellte die untenstehenden mo-
natlichen Daten zur Verteilung von Suiziden in den Vereinigten Staten im Jahr
1970 zur Verfugung. Gibt es Anzeichen dafur, dass die Suizidrate saisonal variiert,
oder sind die Daten mit der Hypothese einer konstanten Rate konsistent?
Hinweis: Unter der Hypothese einer konstanten Rate kuonnen Sie die Anzahl
an Suiziden pro Monat als multinomialverteilte Zufallsvariable mit den passen-
den Wahrscheinlichkeiten modellieren, und einen Anpassungstest durchfuhren. Be-
trachten Sie eventuell auch die Vorzeichen von Oi−Ei, und stellen Sie fest, ob ein
Muster vorhanden ist.
Monat Selbstmorde Tage/Monat
Jan 1867 31
Feb 1789 28
Mar 1944 31
Apr 2094 30
Mai 2097 31
Jun 1981 30
Jul 1887 31
Aug 2024 31
Sep 1928 30
Okt 2032 31
Nov 1978 30
Dez 1859 31
3.29 Eine Zufallsvariable X ist lognormalverteilt, falls Y = log(X) normalverteilt ist.
Beispielsammlung”UE Einfuhrung in die Inferenzstatistik“ 27
(a) Bestimmen Sie die Dichtefunktion einer lognormalverteilten Zufallsvariable.
(b) Finden Sie heraus, ob die Lognormalverteilung auf die Daten octopods.txt
(Ruckenwirbellangen von taxonomisch unterschiedlichen Achtfußlern gemes-
sen in Millimetern, Robson 1929) passt.
3.30 In der Vorlesung wurde der Uberdispersionstest fur poissonverteilte Zufallsvaria-
blen besprochen. Nehmen Sie nun an, dass X1, . . . , Xn unabhangig poissonverteilte
Zufallsvariablen sind mit Parameter λi > 0 fur i = 1, . . . , n. Seien weiters l1, . . . , ln
positive und bekannte reelle Zahlen.
(a) Bestimmen Sie den LR-Test fur die Hypothese
H0 :λ1l1
= . . . =λnln
gegen H1 :λili6= λj
ljfur zumindest ein Paar i 6= j.
(b) Im Datensatz gamma-ray.txt finden Sie Schatzer 100 aufeinander folgende
Zeitintervalle (in Sekunden) die Anzahl an Gammastrahlen, die in 100 ver-
schiedenen Bereichen des Himmels gemessen wurden. Nehmen Sie an, dass die
Anzahl an emittierten Gammastrahlen in den 100 Bereichen unabhangig von-
einander und poissonverteilt sind. Testen Sie mit dem von Ihnen hergeleiteten
Test die Hypothese, dass die Emissionsraten (erwartete Anzahl an Emissio-
nen pro Sekunde) in den unterschiedlichen Bereichen des Himmels gleich sind.
Beachten Sie hierbei, dass die Zeitintervalle unterschiedlich lange sind.