formelsammlung zur statistik i - ruhr-universität · pdf file1 deskriptive statistik 1.1...

Download Formelsammlung zur Statistik I - Ruhr-Universität · PDF file1 Deskriptive Statistik 1.1 Datenlagen 1.1.1 Datenlage A n beobachtete Merkmalswerte liegen als Urliste x 1,...,x n vor

If you can't read please download the document

Upload: vuongnhan

Post on 06-Feb-2018

223 views

Category:

Documents


0 download

TRANSCRIPT

  • Formelsammlungzur

    Statistik I

    Prof. Dr. Rolf HupenProf. Dr. Manfred Losch

    Fakultat fur Wirtschaftswissenschaft

  • Inhaltsverzeichnis

    1 Deskriptive Statistik 31.1 Datenlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.2 Quantile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.3 Mittelwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.4 Streuungsmae . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.5 Konzentrationsmae . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.6 Korrelationskoeffizienten . . . . . . . . . . . . . . . . . . . . . . . . . 121.7 Lineare Einfachregression . . . . . . . . . . . . . . . . . . . . . . . . . 131.8 Grundbegriffe der Zeitreihenanalyse . . . . . . . . . . . . . . . . . . . 141.9 Zeitliche Veranderungszahlen . . . . . . . . . . . . . . . . . . . . . . . 161.10 Wachstumsmodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191.11 Elastizitaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221.12 Indexzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

    1

  • 1 Deskriptive Statistik

    1.1 Datenlagen

    1.1.1 Datenlage A

    n beobachtete Merkmalswerte liegen als Urliste x1, . . . , xn vor.

    1.1.2 Datenlage B

    Es liegen zu m von einander verschiedenen Merkmalsauspragungen x1, . . . , xm diezugehorigen absoluten Haufigkeiten h1, . . . , hm (hi 0) ihres Auftretens vor.

    n := h1 + . . . + hm ist die Anzahl der Merkmalstrager, bei denen das Merkmalerhoben worden ist.

    fi :=hin

    heit relative Haufigkeit der i-ten Auspragung xi.

    Hi := h1 + . . . + hi heit kumulierte absolute Haufigkeit und

    Fi := f1 + . . . + fi =1n(h1 + . . . + hi) =

    1nHi heit kumulierte relative Haufigkeit.

    Haufigkeitstabelle:

    Merkmals- Haufigkeit kumulierte Haufigkeiti auspragung absolut relativ absolut relativ1 x1 h1 f1 = h1/n H1 F12 x2 h2 f2 = h2/n H2 F2...

    ......

    ......

    ...m xm hm fm = hm/n Hm = n Fm = 1

    n =m

    i=1hi 1 =

    mi=1

    fi

    3

  • 1 Deskriptive Statistik

    Empirische Verteilungsfunktion:

    F (x) :=

    0 , x < x1Fi , xi x < xi+1 , i = 1, . . . ,m 11 , xm x

    1.1.3 Datenlage C

    Es liegen vor k Klassen G1 = [a0, a1), . . . , Gk = [ak1, ak) mit der Breite i :=aiai1 > 0 fur alle i = 1, . . . , k, sowie die absoluten Haufigkeiten h1, . . . , hk in denk Klassen.

    n := h1+. . .+hk ist die Anzahl der Merkmalstrager, bei denen das Merkmal erhobenworden ist.

    fi :=hin

    relative Haufigkeit zur Klasse Gi,

    Hi := h1 + . . . + hi kumulierte absolute Haufigkeit zur Klasse Gi und

    Fi := f1 + . . . + fi =1nHi kumulierte relative Haufigkeit

    Haufigkeitstabelle:

    Klasse Grenzen Mittel- Breite Haufigkeit kumuliertepunkt absolut relativ relative H.keit

    G1 [a0, a1) x1 1 = a1 a0 h1 f1 = h1/n F1G2 [a1, a2) x2 2 = a2 a1 h2 f2 = h2/n F2...

    ......

    ......

    ......

    Gk [ak1, ak) xk k = ak ak1 hk fk = hk/n Fk = 1

    n =k

    i=1

    hi 1 =k

    i=1

    fi

    Approximierende empirische Verteilungsfunktion:

    F (x) :=

    0 , x < a0

    Fi1 +fii

    (x ai1) , ai1 x < ai , i = 1, . . . , k1 , ak x

    Histogramm:

    Darstellung der Haufigkeiten unter Beachtung der Flachenproportionalitat der Bal-ken.

    Die Hohe des Rechtecks uber der Klasse Gi = [ai1, ai) wird wie folgt bestimmt:

    4

  • 1.2 Quantile

    Hohe gi :=hii

    bei absoluten Haufigkeiten

    Hohe di :=fii

    bei relativen Haufigkeiten

    gi heit absolute Haufigkeitsdichte

    di heit relative Haufigkeitsdichte

    1.2 Quantile

    1.2.1 Definition des p-Quantils

    Zu 0 < p < 1 heit xp p-Quantil, falls sich unterhalb von xp hochstens 100 p %und oberhalb von xp hochstens 100 (1 p) % der Beobachtungswerte befinden.

    0.25-Quantil := Q1 := unteres Quartil

    0.50-Quantil := Q2 := mittleres Quartil oder Median

    0.75-Quantil := Q3 := oberes Quartil

    1.2.2 Datenlage A:

    xp =

    {x([np+1]) , np nicht ganzzahlig12(x([np]) + x([np+1])) , np ganzzahlig

    ,

    wobei

    [] := grote ganze Zahl, die kleiner oder gleich ist

    und

    x(i) den i-ten Beobachtungswert in der geordneten Urliste x(1) x(2) . . . x(n)bezeichnet.

    1.2.3 Datenlage B:

    xp =

    {xi , falls Fi1 < p < Fi12(xi + xi+1) , falls p = Fi

    ,

    wobei F0 := 0 gesetzt wird.

    5

  • 1 Deskriptive Statistik

    1.2.4 Datenlage C:

    xp wird angenahert als Losung der Gleichung F (xp) = p mit der approximierenden

    empirischen Verteilungsfunktion F berechnet.

    Man bestimme zunachst die Klasse Gi = [ai1, ai) mit Fi1 < p Fi, (F0 := 0),und setze dann

    xp ai1 +p Fi1Fi Fi1

    (ai ai1) .

    Liegen absolute Haufigkeiten vor, bestimme man die Klasse Gi = [ai1, ai) mitHi1 < n p Hi, (H0 := 0), und setze dann

    xp ai1 +n pHi1Hi Hi1

    (ai ai1) .

    1.3 Mittelwerte

    1.3.1 Datenlage A:

    Modus := haufigster Beobachtungswert

    Median := mittleres Quartil = 0.50-Quantil

    arithmetisches Mittel (AM):

    AM :=1

    n

    ni=1

    xi

    harmonisches Mittel (HM):

    HM :=n

    ni=1

    1

    xi

    geometrisches Mittel (GM):

    GM := n

    ni=1

    xi

    6

  • 1.3 Mittelwerte

    1.3.2 Datenlage B:

    Modus := Merkmalsauspragung mit der groten absoluten oder relativen Haufigkeit

    Median :=

    xi , falls Fi1 < 0.5 < Fi12(xi + xi+1) , falls 0.5 = Fi

    Gewichtetes arithmetisches Mittel (GAM):

    GAM :=1

    mi=1

    hi

    mi=1

    hi xi =m

    i=1

    fi xi

    Gewichtetes harmonisches Mittel (GHM):

    GHM :=

    mi=1

    hi

    mi=1

    (hixi

    ) = 1mi=1

    (fixi

    )

    Gewichtetes geometrisches Mittel (GGM):

    GGM :=

    (m

    i=1

    xhii

    )1/ mi=1

    hi

    = n

    mi=1

    xhii

    1.3.3 Datenlage C:

    Modus (Verfahren 1):

    Quadratische Interpolation in der modalen (haufigsten) Gruppe.

    Man bestimmt die modale Klasse Gi, d.h. die Klasse Gi = [ai1, ai) mit der grotenHaufigkeitsdichte gi := hi/(ai ai1) und legt ein quadratisches Polynom

    f(x) = ax2 + bx + c

    durch die Punkte mit den Koordinaten (xi1; gi1), (xi; gi), (xi+1; gi+1), wobei xi1,xi, xi+1 die Mittelpunkte der Klassen Gi1, Gi, Gi+1 bezeichnen.

    Die Stelle x0, fur die f(x) das Maximum annimmt, wird als Modus gewahlt.

    7

  • 1 Deskriptive Statistik

    Modus (Verfahren 2):

    Naherungslosung fur Verfahren 1

    Man bestimmt wie beim Verfahren 1 die modale Klasse Gi und berechnet

    Modus =ai(hi hi1) + ai1(hi hi+1)

    (hi hi1) + (hi hi+1)

    Bei unterschiedlichen Klassenbreiten sind in der obigen Formel die absoluten Haufig-keitsdichten gi anstelle von hi zu verwenden.

    Median:

    Man bestimme die Klasse Gi = [ai1, ai) mit Fi1 < 0.5 Fi. In diese Klasse Gifallt der Median.

    Eine Feinberechnung x des Medians lat sich unter der Annahme der Gleichvertei-lung in den Klassen wie folgt durchfuhren:

    x = ai1 +0.5 Fi1Fi Fi1

    (ai ai1) = ai1 + (0.5 Fi1) ifi

    Liegen absolute Haufigkeiten vor, bestimmt man die Klasse Gi = [ai1, ai) mitHi1 0):

    t =ln

    ln qfur q 6= 1

    Schnittpunkt S = (tS; xS) zweier Wachstumsfunktionen a1 qt1 und a2 qt2,q1 6= q2:

    tS =ln(a2/a1)

    ln(q1/q2)und xS = a1 qtS1 = a2 qtS2

    20

  • 1.10 Wachstumsmodelle

    1.10.3 Exponentielles Wachstumsmodell in stetiger Zeit

    xt = a ebt , t = 0, 1, . . . , n

    Wachstumsrate:=ln(

    xtxt1

    )= b fur alle t 1

    Wachstumsfaktor xtxt1 = eb fur alle t 1

    Konstante a = x0

    Prognosewert: xn = x0 ebn

    Startwert: x0 = xn ebn

    Durchschnittswachstum b = ln xn ln x0n

    Zeitraum: n = ln xn ln x0b fur b 6= 0

    Sind zwei Werte xt1 und xt2 , t1 6= t2, gegeben, dann konnen a und b wie folgtberechnet werden:

    a = et2 ln xt1 t1 ln xt2

    t2 t1 und b = ln xt2 ln xt1t2 t1

    Vervielfachungszeit t (xt = x0, > 0):

    t =ln

    bfur b 6= 0

    Schnittpunkt S = (tS; xS) zweier Wachstumsfunktionen a1 eb1t und a2 eb2t,b1 6= b2:

    tS =ln a2 ln a1

    b1 b2und xS = a1 eb1tS = a2 eb2tS

    Falls xt = a ebt = aqt, dann

    ln

    (xt

    xt1

    )= b = ln q und q = eb

    undxt xt1

    xt1= p = q 1 = eb 1

    21

  • 1 Deskriptive Statistik

    1.11 Elastizitaten

    Elastizitat :=Wachstumsrate Teilgroe T

    Wachstumsrate Gesamtgroe G

    Vorjahresvergleich

    unstetiges Wachstum stetiges Wachstum

    (Tt Tt1)/Tt1(Gt Gt1)/Gt1

    ln(Tt/Tt1)ln(Gt/Gt1)

    Basisjahrvergleich

    unstetiges Wachstum stetiges Wachstum

    (Tt T0)/T0(Gt G0)/G0

    ln(Tt/T0)ln(Gt/G0)

    im Jahresdurchschnitt

    unstetiges Wachstum stetiges Wachstum

    (Tn/T0)1/n 1

    (Gn/G0)1/n 1

    ln(Tn/T0)ln(Gn/G0)

    22

  • 1.12 Indexzahlen

    1.12 Indexzahlen

    1.12.1 Notation

    t : Berichtsjahr

    0 : Basisjahr

    n : Anzahl Guter

    pi(t) : Preis des Gutes i zum Zeitpunkt t

    qi(t) : umgesetzte Menge des Gutes i zum Zeitpunkt t

    1.12.2 Preisindex von Laspeyres PL(0, t):

    Drei Darstellungsmoglichkeiten:

    1. Mit Hilfe der allgemeinen Gewichte wi := pi(0) qi(0):

    PL(0, t) =1

    ni=1

    wi

    n

    i=1

    wi pi(t)

    pi(0)

    2. Mit Hilfe der normierten Gewichte gi := wi/n

    j=1wj:

    PL(0, t) =n

    i=1

    gi pi(t)

    pi(0)

    3. Aggregatform (Summenform):

    PL(0, t) =

    ni=1

    pi(t) qi(0)n

    i=1

    pi(0) qi(0)

    Interpretation des Preisindexes von Laspeyres:

    Preisanderungsrate vom Basisjah