1 statisik lv nr.: 1852 ws 2005/06 15. dezember 2005
Post on 06-Apr-2015
111 Views
Preview:
TRANSCRIPT
1
STATISIK
LV Nr.: 1852
WS 2005/06
15. Dezember 2005
2
Theorie
• Verteilungen– Diskrete Verteilungen– Stetige Verteilungen
• Stichproben– Verteilung– Grenzwertsätze
• Schätzen
3
Theoretische Verteilungen• Diskrete Verteilungen
– Binomialverteilung– Hypergeometrische Verteilung– Poissonverteilung– ...
• Stetige Verteilungen– Gleichverteilung– Exponentialverteilung– Normalverteilung– Chi-Quadrat Verteilung– t-Verteilung (Studentverteilung)– F-Verteilung– ...
4
Binomialverteilung
• Wahrscheinlichkeiten für die Häufigkeit des Eintreffens bestimmter Ereignisse bei Bernoulli-Experimenten berechnen.
• Bernoulli-Experiment: Folge von Bernoulli-Versuchen. Urnenmodell mit Zurücklegen– Es gibt nur 2 mögliche Ausgänge: A und Ā– Wahrscheinlichkeiten für Eintreten von A (θ)
und Ā (1- θ) sind konstant– Versuche sind voneinander unabhängig.
5
Binomialverteilung
• Bsp. Bernoulli-Experiment: – fünfmaliges Werfen einer Münze,
Zufallsvariable X „Anzahl der Zahlen“, Realisation x = 0, 1, 2, 3, 4, 5
– Wahrscheinlichkeiten für Eintreten von A: W(X=x) = f(x) = ?
6
Binomialverteilung
• Wahrscheinlichkeit des Auftretens einer bestimmten Realisation x: W(X=x) = f(x)
• Wahrscheinlichkeitsfunktion der Binomialverteilung:
n0,1,...,xfür
sonst0
θ)(1θx
nθ)n,(x;f
xnx
B
7
Binomialverteilung
• Bsp. Münzwurf (n=5), Wahrscheinlichkeit dass genau 2-mal Zahl geworfen wird: W(X=2)
0,31250,5)(10,52
5(2;5,0.5)f 252
B
8
Binomialverteilung
• Wahrscheinlichkeit, dass die Zufallsvariable X höchstens den Wert x annimmt: Verteilungsfunktion FB(x;n,θ)
xi n-i
Bi 0
nF (x;n,θ) θ (1 θ)
i
9
Binomialverteilung
• Bsp. Münzwurf (n=5), Wahrscheinlichkeit dass höchstens 2-mal Zahl geworfen wird: W(X 2)
2i 5-i
Bi 0
5F (2;5,0.5) 0,5 (1 0,5) 0,5
i
10
Binomialverteilung
• Erwartungswert der Binomialverteilung:
E(X) = n·θ
• Varianz der Binomialverteilung:
Var(X) = n·θ·(1-θ)
• Bsp. Münzwurf: – E(X) = 5·0,5 = 2,5– Var(X) = 5·0,5·(1-0,5) = 1,25
11
Hypergeometrische Verteilung
• Urnenmodell Ziehen ohne Zurücklegen:– Urne mit N Kugeln (M schwarze, N-M weiße)– Zufallsstichprobe: ziehe n Kugeln ohne
Zurücklegen – Wahrscheinlichkeit, dass unter den n
gezogenen Kugeln genau x schwarze zu finden sind?
• Ziehen ohne Zurücklegen, keine Berücksichtigung der Reihenfolge.
12
Hypergeometrische Verteilung
• Urnenmodell: – Aus M schwarzen Kugeln genau x auswählen: Anzahl
der Kombinationen
– Aus N-M weißen Kugeln genau n-x auswählen: Anzahl der Kombinationen
– Jede mögl. Stpr. „x schwarze aus M“ kann mit jeder mögl. Stpr. „n-x weiße aus N-M“ kombiniert werden.
– Daher: Gesamtzahl der Möglichkeiten genau x schwarze zu ziehen:
– Gesamtzahl der Möglichkeiten aus N Kugeln n zu ziehen:
M
x
N-M
n-x
N
n
M N-M
x n-x
13
Hypergeometrische Verteilung
• Wahrscheinlichkeit genau x schwarz Kugeln zu ziehen:
• Wahrscheinlichkeitsfunktion der Hypergeometrischen Verteilung:
M N-M
x n-x
N
n
H
M N-M
x n-x
Nf (x;N,n,M)= für x=0,1,...,n
n
0 sonst
14
Hypergeometrische Verteilung
• Verteilungsfunktion: Summation der Einzelwahrscheinlichkeiten
• Liefert Wahrscheinlichkeit für „höchstens x schwarze Kugeln“
15
Hypergeometrische Verteilung
• Bsp. Sortiment von N=8 Dioden, es werden n=3 zufällig gezogen (ohne Zurücklegen), M=5 der Dioden sind defekt.
• Ges: Wahrscheinlichkeit, dass genau 2 (=x) der 3 gezogenen Dioden defekt sind.
M N-M 5 8-5
x n-x 2 3-2 10 3P(X=x)= = = =0,5357
N 8 56
n 3
16
Hypergeometrische Verteilung
• Erwartungswert:
E(X) = n · M/N
• Varianz
Var(X) = n · M/N · (N-M)/N · (N-n)/(n-1)
• Approximation durch Binomialverteilung: – Wenn N, M, N-M groß und n klein, Parameter
der Binomialverteilung: θ = M/N– Faustregel: Approximation, wenn n/N < 0,05
17
Poissonverteilung
• Verteilung seltener Ereignisse
• Große Zahl von Versuchen n, Wahrscheinlichkeit θ für Auftreten eines Ereignisses sehr klein
• Wahrscheinlichkeitsfunktion: x -μ
P
μ ef (x;μ)= für x=0,1,...x!
0sonst
18
Poissonverteilung
• Erwartungswert: E(X) = μ• Varianz: Var(X) = μ• Approximation der Binomialverteilung
durch die Poissonverteilung: – n groß und θ klein, Parameter μ = n·θ– Faustregel: n > 10 und θ < 0,05.
• Approximation der Hypergeometrischen Vt.– M/N = θ klein, N im Vergleich zu n groß,
Parameter μ = n · M/N – Faustregel: M/N < 0,05 und n/N < 0,05
19
Poissonverteilung
• Bsp. Wahrscheinlichkeit bei einer Prüfung von n=2000 Buchungen genau 3 (=x) Fehlbuchungen zu finden, Anteil der Fehlbuchungen: θ=0,001.
• Poissonverteilung: μ = n·θ = 2x -μ 3 -2μ e 2 e
W(X=x)= = =0,1804x! 3!
20
Gleichverteilung
• Diskrete Zufallsvariable:
• Jede der k möglichen Ausprägungen hat gleiche Wahrscheinlichkeit
P(X=xi) = 1/k (i=1,…,k)
• Bsp. Wahrscheinlichkeitsverteilung der Augenzahl eines idealen Würfels:
P(X=xi) = 1/6 (i=1,…,6)
21
Gleichverteilung
• Stetige Zufallsvariable:
• Realisationen der stetigen Zufallsvariablen X liegen im Intervall [a;b]
• Dichtefunktion:
• P(x X x+Δx) = 1/(b-a) · Δx
G
1für a x b
f (x;a,b)= b-a0 sonst
22
GleichverteilungStetige Gleichverteilung
0
0,2
0 14
x
f(x
;a,b
)
a b
1/(b-a)
x x+Δx
P(xXx+Δx) = 1/(b-a) · Δx
23
Gleichverteilung
• Verteilungsfunktion (Integration der Dichte)
G
0 für x<a
x-aF (x;a,b)= für a x b
b-a1 für x>b
24
GleichverteilungStetige Gleichverteilung
0
0,2
0,4
0,6
0,8
1
1,2
0 14
x
F(x
;a,b
)
a b
25
Gleichverteilung
• Erwartungswert: E(X) = (a+b)/2
• Varianz: Var(X) = (b-a)² / 12
• Bsp. Wegzeit ist gleichverteilt im Intervall [30;40]. Ges. Wahrscheinlichkeit zw. 32 und 35 Min. zu benötigen.
P(32 X 35) = 1/(b-a) · Δx
= 1/(40-30) · (35-32) = 0,3
Durchschnittlich benötigte Zeit: E(X) = 35
26
Normalverteilung
• Wichtigste theoretische Verteilung:
• Normalverteilung: – stetige Verteilung – symmetrische Dichtefunktion– S-förmige Verteilungsfunktion– Erwartungswert: E(X) = µ– Varianz: Var(X) = σ²– Maximum der Dichte bei x=µ– Wendepunkte bei x=µσ
27
Normalverteilungen
• Normalverteilung:
• Dichtefunktion (für -∞<x<+∞ und σ>0) :
• Verteilungsfunktion:
21 x μ
2 2 σn 2
1f (x;μ,σ ) e
2πσ
21 v μx
2 2 σn 2
1F (x;μ,σ ) e dv
2πσ
28
Normalverteilung
• Normalverteilungen mit unterschiedlichen Parametern
Normalverteilung
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-6 -4 -2 0 2 4 6 8 10 12
x
f(x
)
N(4,3) N(0,1) N(2,2)
29
Normalverteilung
• VerteilungsfunktionVerteilungsfunktion Normalverteilung
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
-4 -3 -2 -1 0 1 2 3 4
x
F(x
)
µµ-σ µ+σµ-2σ µ+2σµ-3σ µ+3σ
30
Normalverteilung
• Standardnormalverteilung:– Erwartungswert µ = 0– Varianz σ² = 1
• Dichtefunktion: 2z
2
1
n e2π
1(z;0,1)f
31
Normalverteilung
• StandardnormalverteilungStandardnormalverteilung
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
0,5
-4 -3 -2 -1 0 1 2 3 4
z
f(z)
68,27%95,45%
99,73%
WP WP
32
Normalverteilung
• Approximation durch Normalverteilung: Mit wachsendem n nähern sich viele theoretische Vt. der Normalverteilung
• Empirische Verteilungen lassen sich ebenfalls oft durch die N-Vt. annähern.
33
Normalverteilung
• Reproduktionseigenschaft (od. Additivitäts- eigenschaft) der Normal-Vt.
• Additionstheorem der Normalverteilung: – Die Summe (X) von n unabhängig normalverteilten
Zufallvariablen X1,…,Xn ist ebenfalls normalverteilt.
X = X1 + … + Xn – Der Erwartungswert von X ist die Summe der einzelnen
Erwartungswerte μ1,…,μn
E(X) = μ = μ1 + … + μn – Die Varianz von X ist die Summe der einzelnen
Varianzen σ1²,…σn
²
Var(X) = σ² = σ1² + … + σn
²
34
Stichproben
• Arithmetische Mittel der Stichprobe:
• Varianz der Stichprobe:
• Anteilswert P einer Stichprobe:
n
1iix
n
1x
n
1i
2i
2 )x(x1n
1s
n
xp
35
Stichprobenverteilung
• Verteilung des arithmetischen Mittels der Stichprobe (Zufallsstichprobe): – Zufallsvariable X1,…,Xn
– Konkrete Realisation: x1,…,xn
• Arithmetische Mittel:
– Arithm. Mittel von ZV ist wieder eine ZV (Funktion von n ZV)
n
1iiX
n
1X
36
Stichprobenverteilung
• Erwartungswert der Verteilung des arithmetischen Mittels:
• Varianz der Verteilung des arithm. Mittels
• Standardabweichung od. Standardfehler
μXn
1E)XE(
n
1ii
n
σX
n
1Var)XVar(
2n
1ii
n
σ)XVar(σX
37
Stichprobenverteilung
• Erwartungswert u. Varianz bekannt
• Verteilung des arithm. Mittels?
• Annahme: Grundgesamtheit ist N(μ,σ²)-vt. – Reproduktionseigenschaft der N-Vt: Summe
von n unabhängig normal-vt. ZV ist wieder n-vt– Daher ist auch das arithm. Mittel normalverteilt
38
Grenzwertsätze
Verhalten des Mittelwert von n unabhängig identisch verteilten (i.i.d.) ZV X1,…,Xn, wenn n laufend erhöht wird (n→∞)
• Gesetz der Großen Zahlen
• Satz von Glivenko-Cantelli
• Zentraler Grenzwertsatz
39
Grenzwertsätze
• Gesetz der Großen Zahlen:
• Beinhaltet die Aussage, dass sich der Mittelwert mit wachsendem n immer mehr um den gemeinsamen Erwartungswert µ der Xi konzentriert.
0εWerteallefür0εμXn
1W
n
n
1ii
0εμXWnn
40
Grenzwertsätze
• Gesetz der Großen Zahlen:
• Beinhaltet die Aussage, dass der Wert der empirischen Verteilungsfunktion an der Stelle t mit wachsendem n gegen den entsprechenden Wert der Verteilungsfunktion von X konvergiert.
n X nW S (t)-F (t) ε 0 für alle Werte ε>0
41
Grenzwertsätze
• Satz von Glivenko-Cantelli:
• Wert der empirischen Verteilungsfunktion konvergiert an der Stelle t mit wachsendem n gegen den entsprechenden Wert der Verteilungsfunktion von X.
10(t)F(t)SsupWnXn
t
42
Grenzwertsätze
• Zentraler Grenzwertsatz:
• Aussage über die Form der Verteilung des Mittelwertes (standardisierte ZV Zn). Die Verteilungsfunktion von Zn konvergiert gegen die Standardnormalverteilung
(Φ … Vt-Fkt. der N(0,1) Vt.)
1)Var(Z und 0)E(Zmit σ
μXnZ nn
nn
Φ(z)z)W(Znn
43
Grenzwertsätze
• Aus dem Zentralen Grenzwertsatz folgt: Die Verteilung des arithm. Mittels von n unabhängig identisch verteilten Zufallsvariablen Xi (X1,…,Xn) strebt mit wachsendem Stichprobenumfang n gegen eine Normalverteilung mit dem Erwartungswert µ und Varianz σ²/n.
• Gleichbedeutend: Das arithmetische Mittel ist „asymptotisch normalverteilt“.
• Faustregel: n > 30, N-Vt. ist gute Näherung für die Vt. des arithmetischen Mittels der Stichprobe.
44
Stichprobenverteilung
• Verteilung der Varianz S² der Stichprobe:
• Annahme: Grundgesamtheit ist N(µ,σ²)-vt. Xi sind n unabhängige normal-vt. ZV mit E(Xi)=µ und Var(Xi)= σ² (i=1,…,n)
• Stichprobenvarianz S² ist eine Funktion von n ZV Xi und somit wieder eine ZV.
n
1i
2i
2 )X(X1n
1S
45
Stichprobenverteilung
• Verteilung der Varianz S² der Stichprobe:
• Chi-Quadrat Verteilung mit v=n-1 Freiheitsgraden, χ²n-1
• Es gilt:
Ist Z² = Xi² + … + Xn² (Summe von n quadrierten unabhängigen N(0,1)-verteilten ZV Xi), dann folgt Z² einer Chi-Quadrat Verteilung mit v Freiheitsgraden.
46
Stichprobenverteilung
• χ²v Verteilung: – Erwartungswert: E(Z²)=v– Varianz: Var(Z²)=2v
– Mit wachsendem v nähert sich die χ²v Vt. einer N-Vt. mit Parametern µ=v und σ²=2v.
47
Stichprobenverteilung
• Anteilswert P einer Stichprobe (P=X/n)
• 2 Modelle: – Ziehen mit Zurücklegen– Ziehen ohne Zurücklegen
• Bsp. Urne, N Kugeln, M schwarz, (N-M) weiße, ziehe n Kugeln (mit bzw. ohne Zurücklegen der gezogenen Kugeln), θ ist die Wahrscheinlichkeit für das Ziehen einer schwarzen Kugel.
48
Stichprobenverteilung
• Ziehen mit Zurücklegen– Exakte Verteilung: Binomialverteilung
Wahrscheinlichkeitsfunktion der ZV X:
– Erwartungswert: E(X) = nθ– Varianz: Var(X) = nθ(1- θ)
xnxB θ)(1θ
x
nθ)n,(x;f
49
Stichprobenverteilung
• Ziehen mit Zurücklegen– Erwartungswert des Stichprobenanteilswertes
P: E(P) = 1/n E(x) = θ– Varianz des Stichprobenanteilswertes P:
Var(P) = 1/n² Var(X) = θ(1- θ) / n– Standardfehler des Anteilswertes:
n
θ)θ(1σP
50
Stichprobenverteilung
• Approximation durch Normalverteilung (Faustregel: nθ(1- θ) ≥ 9)
• Erwartungswert: E(P) = µ = nθ
• Varianz: Var(P) = σP² = nθ(1- θ)
51
Stichprobenverteilung
• Ziehen ohne Zurücklegen– Exakte Verteilung: Hypergeometrische Vt. – Wahrscheinlichkeitsfunktion der ZV X:
– Erwartungswert: E(X) = n M/N– Varianz: Var(X) = nθ(1- θ) · (N-n)/(N-1)
n
N
xn
MN
x
M
M)n,N,(x;fH
52
Stichprobenverteilung
• Ziehen ohne Zurücklegen:– Erwartungswert des Stichprobenanteilswertes:
E(P) = 1/n E(X) = θ – Varianz des Stichprobenanteilswertes:
Var(P) = 1/n² Var(X) = θ(1- θ)/n · (N-n)/(N-1)– Standardfehler des Anteilswertes:
– Endlichkeitskorrektur = 1 setzen, wenn n bzgl. N sehr klein ist (Faustregel: n/N < 0,05)
1N
nN
n
θ)θ(1σP
53
Stichprobenverteilung
• Approximation durch Normalverteilung
µ = E(P) = θ
σ² = Var(P) = θ(1- θ)/n · (N-n)/(N-1)
54
Stichprobenverteilung
• Die Stichprobenverteilungen des arithmetischen Mittels, der Varianz und des Anteilswertes können also durch die Normalverteilung approximiert werden.
55
Stichprobenverteilung
• Differenz zweier arithmetischer Mittel:
• Annahmen: – 2 unabhängige Stichproben– Beide Grundgesamtheiten sind annähernd N-vt
• Stichprobenverteilung der Differenz: N-Vt – Erwartungswert:
– Varianz:
212121 μμ)XE()XE()XXE(E(D)
2
22
1
21
2121 n
σ
n
σ)XVar()XVar()XXVar(Var(D)
56
Stichprobenverteilung• Differenz zweier Anteilswerte:
• Annahmen: – 2 unabhängige Stichproben
– P1, P2 annähernd n-vt. und N1, N2 so groß, dass Endlichkeitskorrektur vernachlässigbar ist.
• Stichprobenverteilung: N-Vt – Erwartungswert:
– Varianz: 212121 θθ)E(P)E(P)PE(PE(D)
2
22
1
1121 n
)θ(1θ
n
)θ(1θ)PVar(PVar(D)
57
Stichprobenverteilung
• Quotient zweier Varianzen:
• Annahmen: – 2 unabhängige Stichproben (n1, n2)
– σ1² und σ2² aus n-vt Grundgesamtheiten
– Quotient:
22
22
21
21
/σS
/σSF
58
Stichprobenverteilung
• Stichprobenverteilung: F-Verteilung mit v1 und v2 Freiheitsgraden, Fv1,v2. Für v2 > 2 gilt:– Erwartungswert: E(F) = v2 / (v2-2)
– Varianz:
4)(v2)(vv
2)v(v2vVar(F)
22
21
2122
59
Schätzverfahren
• Schluss von der Grundgesamtheit auf eine Stichprobe: Inklusionsschluss (direkter Schluss)
• Schluss von einer Stichprobe auf Parameter einer Grundgesamtheit: Repräsentationsschluss (indirekter Schluss)
• Unterscheidung: – Punktschätzer (einziger Schätzwert)– Intervallschätzer (Konfidenzintervall)
60
Schätzverfahren
• Punktschätzer: Für den zu schätzenden Parameter wird nur ein einziger Schätzwert angegeben. – Bsp. Schätze das unbekannte arithm. Mittel einer
Grundgesamtheit μ durch das arithm. Mittel der Stichprobe
• Vorsicht: Die in einer Stichprobe realisierten Merkmalsausprägungen sind zufallsabhängig, Punktschätzer stimmen daher nur in den seltensten Fällen mit dem wahren Parameter überein.
x
61
Schätzverfahren
• Intervallschätzer: Ausgehend von einer Stichprobe wird ein Intervall bestimmt, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit liegt (Konfidenzintervall).
• Irrtumswahrscheinlichkeit ≤ α
• Konfidenzintervall zum Niveau 1-α (Vertrauensbereich od. Vertrauensintervall)
62
Schätzverfahren
• Ges: Konfidenzintervall für das arithm. Mittel: ZV
• Symmetrische Wahrscheinlichkeitsintervall
• Symmetrie: z(α /2) = –z(1-α/2)
daher: z = –z(1-α/2) und –z = z(α /2) und
α α1
2 2
X-μW(z n z ) 1- α
σ
2X~N(μ,σ )
α1)zσμXzσW(μ XX
63
Schätzverfahren
• In diesem Wahrscheinlichkeitsintervall liegt das arithm. Mittel mit der Wahrscheinlichkeit 1- α.
• Gesucht ist ist aber nicht das Ws-Intervall der ZV, sondern das Konfidenzintervall für das unbekannte arithm. Mittel µ der Grundgesamtheit. – Varianz σ² der Grundgesamtheit bekannt– Varianz σ² der Grundgesamtheit unbekannt
64
Schätzverfahren
• Konfidenzintervall für µ bei bekannter Varianz σ² der Grundgesamtheit:
Konkreter Stichprobenmittelwert XX zσxμzσx
x
65
Schätzverfahren
• Konfidenzintervall für µ bei unbekannter Varianz σ² der Grundgesamtheit:
• Statt der unbekannte Varianz σ² wird die Stichprobenvarianz S² verwendet.
• Zufallsvariable:
T ist t- verteilt mit v=n-1 Freiheitsgradenn
SμX
T
66
Verteilungen
• Es gilt:– Ist T der Quotient einer Standardnormalverteilung und
der Quadratwurzel des Mittelwerts von n quadrierten unabhängigen N(0,1)-verteilten ZV Xi, dann folgt T einer t-Verteilung mit v=n Freiheitsgraden.
• Zufallsvariable:
T ist t- verteilt mit v=n Freiheitsgraden T~tn
• t-Verteilung ist symmetrisch
0
n2i
i=1
XT=
1X
n
67
Verteilungen
• t- Verteilung mit v Freiheitsgraden:– Erwartungswert (für n>1):
E(T) = 0– Varianz (für n>2):
Var(T) = n / (n-2)
• Für n→∞ geht die t-Verteilung in die N(0,1) über.
• Approximation durch N(0,1)-Vt für n ≥ 30
68
• Wahrscheinlichkeitsintervall für das arithm. Mittel bei unbekannter Varianz:
• Wobei t = t(1-α/2);n-1 = – t(α/2);n-1 die Punkte sind, bei denen die Verteilungsfunktion der t- Verteilung mit n-1 Freiheitsgraden die Werte 1-α/2 bzw. α/2 besitzt.
Schätzverfahren
α α;n-1 1- ;n-1
2 2
X-μW(t t ) 1- α
S
n
69
• Konfidenzintervall für das arithm. Mittel bei unbekannter Varianz:
Konkreter Stichprobenmittelwert
Konkrete Stichprobenvarianz
Schätzverfahren
x
XX σ̂txμσ̂tx
Xσ̂
70
Schätzverfahren
• Konfidenzintervall für den Anteilswert:
• Ann. genügend großer Stichprobenumfang, d.h. Approximation durch N-Vt möglich, E(P) = θ und Var(P) = σP
²
• Standardisierte ZV:
2P
P-θZ=
σ
71
Schätzverfahren
• Wahrscheinlichkeitsintervall:
• Konfidenzintervall:
• Ist σP unbekannt, verwendet man stattdessen die Stichprobenvarianz des Anteilswertes als Schätzer.
α α1
P2 2
P-θW(z z ) 1- α
P Pp-zσ θ p+zσ
72
Schätzverfahren
• Konfidenzintervall für die Varianz
• ZV (n-1)S² / σ² ist χ² verteilt mit v=n-1 Freiheitsgraden
• Wahrscheinlichkeitsintervall:
• Konfidenzintervall:
22 2α α
;n-1 1- ;n-1P2 2
(n-1)SW(χ χ ) 1- α
σ
2 2
2 2α α
1- ;n-1 ;n-12 2
(n-1)S (n-1)S;
χ χ
73
Stichprobenumfang
• Bisher: – Geg: Stichprobenumfang n, Sicherheitsgrad 1-α– Ges: Konfidenzintervall
• Jetzt: – Geg: Konfidenzintervall, Sicherheitsgrad 1-α– Ges: Stichprobenumfang
• Absoluter Fehler Δμ = zσX ist ein Maß für die Genauigkeit der Schätzung
• Breite des Konfidenzintervalls: 2Δμ
74
Stichprobenumfang
• Frage: Welchen Stichprobenumfang benötigt man, um einen Parameter (arithm. Mittel) bei vorgegebener Genauigkeit und vorgegebenem Sicherheitsgrad zu schätzen?
2
22
μ)(
σzn
75
Eigenschaften von Schätzern
Eigenschaften von Schätzfunktionen:
• Erwartungstreue
• Effizienz
• Konsistenz
• Suffizienz
76
Eigenschaften von Schätzern
• Erwartungstreue
• Eine Schätzfunktion heißt erwartungstreu (unverzerrt, unbiased), wenn ihr Erwartungswert mit dem wahren Parameter übereinstimmt.
• Bedingung:
• Es gilt:
Θ)Θ̂E(
μ)XE( 22 σ)E(S
77
Eigenschaften von Schätzern
• Effizienz:
• Von 2 erwartungstreuen Schätzfunktionen gilt jene als effizienter (wirksamer), die die kleinere Varianz aufweist.
• Eine Schätzfunktion heißt effizient, wenn folgende Bedingungen erfüllt sind:
Θ)Θ̂E( )Θ̂Var()Θ̂Var( *
tionSchätzfunk treueerwartungsbeliebigeΘ̂*
78
Eigenschaften von Schätzern
• Konsistenz:
• Eine Schätzfunktion heißt konsistent, wenn der Schätzwert bei laufender Vergrößerung des Stichprobenumfangs (n→∞ oder n→N) mit dem zu schätzenden Parameter zusammenfällt.
79
Eigenschaften von Schätzern
• Suffizienz:
• Eine Schätzfunktion heißt suffizient (erschöpfend), wenn sie sämtliche Informationen über den zu schätzenden Parameter, welche die Stichprobe enthält ausschöpft.
80
Schätzverfahren
• Methode der Kleinsten Quadrat
• Maximum Likelihood
• Momentenmethode
81
Konfidenzintervall
• Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit (1-α) liegt.
82
Konfidenzintervall
• Bsp. Arithmetisches Mittel (ist bei N-Vt. Grundgesamtheit bzw. bei genügend großem Stichprobenumfang N-Vt.). Der wahre Parameter µ liegt mit der Wahrscheinlichkeit (1-α) im Intervall
XX
zσX;zσX
83
KonfidenzintervallKonfidenzintervall für den Parameter µ (bei N-Vt. des Stichprobenmittelwertes)
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3
Stichprobenmittelwert
Dic
hte
der
N(0
,1)
1-α = 0,95
α/2 = 0,025
Konfidenzintervall
α/2 = 0,025
x-z(α/2)σ x+z(1-α/2)σ
84
Konfidenzintervall
• Bsp. Körpergröße: – Mittelwert =173,42– Standardabweichung = 9,54 – N = 73– 2-seitiges KI zum Niveau α=0,05
Wahrscheinlichkeit, dass der wahre Parameter im KI liegt ist 0,95. Quantile der t-Vt: t=±1,99 Quantil der N(0,1)-Vt: z=±1,96
KI [171,19 ≤ µ ≤ 175,65] t-VtKI [171,23 ≤ µ ≤ 175,61] N(0,1)-Vt
top related