formelsammlung zur statistik i - ruhr-universität · pdf file1 deskriptive statistik 1.1...
TRANSCRIPT
Formelsammlungzur
Statistik I
Prof. Dr. Rolf HupenProf. Dr. Manfred Losch
Fakultat fur Wirtschaftswissenschaft
Inhaltsverzeichnis
1 Deskriptive Statistik 31.1 Datenlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.2 Quantile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.3 Mittelwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.4 Streuungsmae . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.5 Konzentrationsmae . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.6 Korrelationskoeffizienten . . . . . . . . . . . . . . . . . . . . . . . . . 121.7 Lineare Einfachregression . . . . . . . . . . . . . . . . . . . . . . . . . 131.8 Grundbegriffe der Zeitreihenanalyse . . . . . . . . . . . . . . . . . . . 141.9 Zeitliche Veranderungszahlen . . . . . . . . . . . . . . . . . . . . . . . 161.10 Wachstumsmodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191.11 Elastizitaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221.12 Indexzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1
1 Deskriptive Statistik
1.1 Datenlagen
1.1.1 Datenlage A
n beobachtete Merkmalswerte liegen als Urliste x1, . . . , xn vor.
1.1.2 Datenlage B
Es liegen zu m von einander verschiedenen Merkmalsauspragungen x1, . . . , xm diezugehorigen absoluten Haufigkeiten h1, . . . , hm (hi 0) ihres Auftretens vor.
n := h1 + . . . + hm ist die Anzahl der Merkmalstrager, bei denen das Merkmalerhoben worden ist.
fi :=hin
heit relative Haufigkeit der i-ten Auspragung xi.
Hi := h1 + . . . + hi heit kumulierte absolute Haufigkeit und
Fi := f1 + . . . + fi =1n(h1 + . . . + hi) =
1nHi heit kumulierte relative Haufigkeit.
Haufigkeitstabelle:
Merkmals- Haufigkeit kumulierte Haufigkeiti auspragung absolut relativ absolut relativ1 x1 h1 f1 = h1/n H1 F12 x2 h2 f2 = h2/n H2 F2...
......
......
...m xm hm fm = hm/n Hm = n Fm = 1
n =m
i=1hi 1 =
mi=1
fi
3
1 Deskriptive Statistik
Empirische Verteilungsfunktion:
F (x) :=
0 , x < x1Fi , xi x < xi+1 , i = 1, . . . ,m 11 , xm x
1.1.3 Datenlage C
Es liegen vor k Klassen G1 = [a0, a1), . . . , Gk = [ak1, ak) mit der Breite i :=aiai1 > 0 fur alle i = 1, . . . , k, sowie die absoluten Haufigkeiten h1, . . . , hk in denk Klassen.
n := h1+. . .+hk ist die Anzahl der Merkmalstrager, bei denen das Merkmal erhobenworden ist.
fi :=hin
relative Haufigkeit zur Klasse Gi,
Hi := h1 + . . . + hi kumulierte absolute Haufigkeit zur Klasse Gi und
Fi := f1 + . . . + fi =1nHi kumulierte relative Haufigkeit
Haufigkeitstabelle:
Klasse Grenzen Mittel- Breite Haufigkeit kumuliertepunkt absolut relativ relative H.keit
G1 [a0, a1) x1 1 = a1 a0 h1 f1 = h1/n F1G2 [a1, a2) x2 2 = a2 a1 h2 f2 = h2/n F2...
......
......
......
Gk [ak1, ak) xk k = ak ak1 hk fk = hk/n Fk = 1
n =k
i=1
hi 1 =k
i=1
fi
Approximierende empirische Verteilungsfunktion:
F (x) :=
0 , x < a0
Fi1 +fii
(x ai1) , ai1 x < ai , i = 1, . . . , k1 , ak x
Histogramm:
Darstellung der Haufigkeiten unter Beachtung der Flachenproportionalitat der Bal-ken.
Die Hohe des Rechtecks uber der Klasse Gi = [ai1, ai) wird wie folgt bestimmt:
4
1.2 Quantile
Hohe gi :=hii
bei absoluten Haufigkeiten
Hohe di :=fii
bei relativen Haufigkeiten
gi heit absolute Haufigkeitsdichte
di heit relative Haufigkeitsdichte
1.2 Quantile
1.2.1 Definition des p-Quantils
Zu 0 < p < 1 heit xp p-Quantil, falls sich unterhalb von xp hochstens 100 p %und oberhalb von xp hochstens 100 (1 p) % der Beobachtungswerte befinden.
0.25-Quantil := Q1 := unteres Quartil
0.50-Quantil := Q2 := mittleres Quartil oder Median
0.75-Quantil := Q3 := oberes Quartil
1.2.2 Datenlage A:
xp =
{x([np+1]) , np nicht ganzzahlig12(x([np]) + x([np+1])) , np ganzzahlig
,
wobei
[] := grote ganze Zahl, die kleiner oder gleich ist
und
x(i) den i-ten Beobachtungswert in der geordneten Urliste x(1) x(2) . . . x(n)bezeichnet.
1.2.3 Datenlage B:
xp =
{xi , falls Fi1 < p < Fi12(xi + xi+1) , falls p = Fi
,
wobei F0 := 0 gesetzt wird.
5
1 Deskriptive Statistik
1.2.4 Datenlage C:
xp wird angenahert als Losung der Gleichung F (xp) = p mit der approximierenden
empirischen Verteilungsfunktion F berechnet.
Man bestimme zunachst die Klasse Gi = [ai1, ai) mit Fi1 < p Fi, (F0 := 0),und setze dann
xp ai1 +p Fi1Fi Fi1
(ai ai1) .
Liegen absolute Haufigkeiten vor, bestimme man die Klasse Gi = [ai1, ai) mitHi1 < n p Hi, (H0 := 0), und setze dann
xp ai1 +n pHi1Hi Hi1
(ai ai1) .
1.3 Mittelwerte
1.3.1 Datenlage A:
Modus := haufigster Beobachtungswert
Median := mittleres Quartil = 0.50-Quantil
arithmetisches Mittel (AM):
AM :=1
n
ni=1
xi
harmonisches Mittel (HM):
HM :=n
ni=1
1
xi
geometrisches Mittel (GM):
GM := n
ni=1
xi
6
1.3 Mittelwerte
1.3.2 Datenlage B:
Modus := Merkmalsauspragung mit der groten absoluten oder relativen Haufigkeit
Median :=
xi , falls Fi1 < 0.5 < Fi12(xi + xi+1) , falls 0.5 = Fi
Gewichtetes arithmetisches Mittel (GAM):
GAM :=1
mi=1
hi
mi=1
hi xi =m
i=1
fi xi
Gewichtetes harmonisches Mittel (GHM):
GHM :=
mi=1
hi
mi=1
(hixi
) = 1mi=1
(fixi
)
Gewichtetes geometrisches Mittel (GGM):
GGM :=
(m
i=1
xhii
)1/ mi=1
hi
= n
mi=1
xhii
1.3.3 Datenlage C:
Modus (Verfahren 1):
Quadratische Interpolation in der modalen (haufigsten) Gruppe.
Man bestimmt die modale Klasse Gi, d.h. die Klasse Gi = [ai1, ai) mit der grotenHaufigkeitsdichte gi := hi/(ai ai1) und legt ein quadratisches Polynom
f(x) = ax2 + bx + c
durch die Punkte mit den Koordinaten (xi1; gi1), (xi; gi), (xi+1; gi+1), wobei xi1,xi, xi+1 die Mittelpunkte der Klassen Gi1, Gi, Gi+1 bezeichnen.
Die Stelle x0, fur die f(x) das Maximum annimmt, wird als Modus gewahlt.
7
1 Deskriptive Statistik
Modus (Verfahren 2):
Naherungslosung fur Verfahren 1
Man bestimmt wie beim Verfahren 1 die modale Klasse Gi und berechnet
Modus =ai(hi hi1) + ai1(hi hi+1)
(hi hi1) + (hi hi+1)
Bei unterschiedlichen Klassenbreiten sind in der obigen Formel die absoluten Haufig-keitsdichten gi anstelle von hi zu verwenden.
Median:
Man bestimme die Klasse Gi = [ai1, ai) mit Fi1 < 0.5 Fi. In diese Klasse Gifallt der Median.
Eine Feinberechnung x des Medians lat sich unter der Annahme der Gleichvertei-lung in den Klassen wie folgt durchfuhren:
x = ai1 +0.5 Fi1Fi Fi1
(ai ai1) = ai1 + (0.5 Fi1) ifi
Liegen absolute Haufigkeiten vor, bestimmt man die Klasse Gi = [ai1, ai) mitHi1 0):
t =ln
ln qfur q 6= 1
Schnittpunkt S = (tS; xS) zweier Wachstumsfunktionen a1 qt1 und a2 qt2,q1 6= q2:
tS =ln(a2/a1)
ln(q1/q2)und xS = a1 qtS1 = a2 qtS2
20
1.10 Wachstumsmodelle
1.10.3 Exponentielles Wachstumsmodell in stetiger Zeit
xt = a ebt , t = 0, 1, . . . , n
Wachstumsrate:=ln(
xtxt1
)= b fur alle t 1
Wachstumsfaktor xtxt1 = eb fur alle t 1
Konstante a = x0
Prognosewert: xn = x0 ebn
Startwert: x0 = xn ebn
Durchschnittswachstum b = ln xn ln x0n
Zeitraum: n = ln xn ln x0b fur b 6= 0
Sind zwei Werte xt1 und xt2 , t1 6= t2, gegeben, dann konnen a und b wie folgtberechnet werden:
a = et2 ln xt1 t1 ln xt2
t2 t1 und b = ln xt2 ln xt1t2 t1
Vervielfachungszeit t (xt = x0, > 0):
t =ln
bfur b 6= 0
Schnittpunkt S = (tS; xS) zweier Wachstumsfunktionen a1 eb1t und a2 eb2t,b1 6= b2:
tS =ln a2 ln a1
b1 b2und xS = a1 eb1tS = a2 eb2tS
Falls xt = a ebt = aqt, dann
ln
(xt
xt1
)= b = ln q und q = eb
undxt xt1
xt1= p = q 1 = eb 1
21
1 Deskriptive Statistik
1.11 Elastizitaten
Elastizitat :=Wachstumsrate Teilgroe T
Wachstumsrate Gesamtgroe G
Vorjahresvergleich
unstetiges Wachstum stetiges Wachstum
(Tt Tt1)/Tt1(Gt Gt1)/Gt1
ln(Tt/Tt1)ln(Gt/Gt1)
Basisjahrvergleich
unstetiges Wachstum stetiges Wachstum
(Tt T0)/T0(Gt G0)/G0
ln(Tt/T0)ln(Gt/G0)
im Jahresdurchschnitt
unstetiges Wachstum stetiges Wachstum
(Tn/T0)1/n 1
(Gn/G0)1/n 1
ln(Tn/T0)ln(Gn/G0)
22
1.12 Indexzahlen
1.12 Indexzahlen
1.12.1 Notation
t : Berichtsjahr
0 : Basisjahr
n : Anzahl Guter
pi(t) : Preis des Gutes i zum Zeitpunkt t
qi(t) : umgesetzte Menge des Gutes i zum Zeitpunkt t
1.12.2 Preisindex von Laspeyres PL(0, t):
Drei Darstellungsmoglichkeiten:
1. Mit Hilfe der allgemeinen Gewichte wi := pi(0) qi(0):
PL(0, t) =1
ni=1
wi
n
i=1
wi pi(t)
pi(0)
2. Mit Hilfe der normierten Gewichte gi := wi/n
j=1wj:
PL(0, t) =n
i=1
gi pi(t)
pi(0)
3. Aggregatform (Summenform):
PL(0, t) =
ni=1
pi(t) qi(0)n
i=1
pi(0) qi(0)
Interpretation des Preisindexes von Laspeyres:
Preisanderungsrate vom Basisjah