4 spezifizierende beschreibung empirischer verteilungen
TRANSCRIPT
4 Spezifizierende Beschreibung empirischer Verteilungen
4.1 Spezifika empirischer Verteilungen
4.2 Lagekennwerte
4.2.3 Modalwert
4.3.1 Arithmetisches Mittel bei gruppierten Daten
4.2.1 Arithmetisches Mittel
4.2.2 Median
4.2.4 Fechnerâsche Lageregeln
4.3 Spezielle Lagekennwerte
4.3.2 Quantile
4.3.3 Geometrisches Mittel
65
69
69
73
77
78
80
80
82
87
4.4 Streuungskennwerte
4.4.1 Spannweite
92
92
4.4.2 Mittlere absolute Abweichungen 93
4 Spezifizierende Beschreibung empirischer Verteilungen
4.4.3 Median absoluter Abweichungen
4.4.4 Varianz, Standardabweichung und Schwankungsintervalle
4.5.2 QuantilsabstÀnde
4.7 Messung von Schiefe
4.5 Spezielle Streuungskennwerte
4.5.1 Varianz bei gruppierten Daten
4.5.3 Variationskoeffizient
4.6 Standardisierung mittels Lage und Streuung
4.8 Darstellung und Messung von Konzentration
97
100
104
104
107
109
113
117
120
4.8.1 Lorenzkurve
4.8.2 Gini-Koeffizient
120
123
4 Spezifizierende Beschreibung empirischer Verteilungen
64
4.9 Spezifische Eigenschaften empirischer Kennwerte 128
4.9.1 Minimumeigenschaft des arithmetischen Mittels
4.9.2 Minimumeigenschaft des Medians
128
132
4.9.3 Transformationseigenschaften 136
4.9.4 Robustheit 144
65
4.1 Spezifika empirischer Verteilungen
â UnimodalitÀt und MultimodalitÀt â
â Symmetrie und Schiefe â
â Lage und Streuung â
4.2 Lagekennwerte
4.2.1 Arithmetisches Mittel
â Definition und Berechnung â
69
Ò§ð¥ =1
ð
ð=1
ð
ð¥ð
> Gegeben metrisch skalierte Beobachtungswerte ð¥1, ð¥2,... ð¥ð:
> Merkmalssumme
ð=1
ð
ð¥ð = ð à ҧð¥
â Interpretation â
ð=1
ð
ð¥ð â Ò§ð¥ = 0 Schwerpunkteigenschaft
4.2 Lagekennwerte
71â Kein robuster Kennwert â
> Feststellung: Bei gleichmÀÃiger Verteilung aller Werte innerhalb der Klassen
stimmen Klassenmittelwert und Klassenmitte ungefÀhr Ìberein
> Im Beispiel (Tab. 4.2.1) gilt deshalb mit k = 6 Klassen:
Ò§ð¥ â1
ð
ð=1
6
ðð ðð
=1
305 Ã 2 + 15 Ã 8 + 25 Ã 10 + 35 Ã 6 + 45 Ã 3 + 55 Ã 1
= 26
ðð ... Klassenmitte der j-ten Klasse
ð6
ð6
4.2 Lagekennwerte
73
4.2.2 Median
â Definition und Interpretation â
â Berechnung bei Urlisten â
â1, 0, 0, 1, 3, 5, 6 â1, 0, 1, 3, 5, 6
ð¥1 = 0, ð¥2 = 1, ð¥3 = 5, ð¥4 = 6, ð¥5 = 3, ð¥6 = 0, ð¥7 = â1
Geordnete Werte:ð¥ 1 = â1, ð¥ 2 = 0, ð¥ 3 = 0, ð¥ 4 = 1, ð¥ 5 = 3, ð¥ 6 = 5, ð¥ 7 = 6
ð¥0.5 = 1 ð¥0.5 = 2
ð¥0.5 = ð¥ ð+12
= ð¥ 7+12
= ð¥ 4 = 1
ð = 7 ungerade:
ð¥0.5 = 0.5 ð¥ ð/2 + ð¥ ð/2+1 falls n gerade wÀre
4.2 Lagekennwerte
74
â Berechnung bei klassierten Daten â
Einfallsklasse des Medians ist hier ð = 3
ððâ1 = ð2 = 20, à·šð¹ð ð2 = 0.333, áð3/ð3 = 0.0333
4.3 Spezielle Lagekennwerte
4.3.1 Arithmetisches Mittel bei gruppierten Daten
80
â Hintergrund â
â Berechnung â
Ò§ð¥ =1
ð
ð=1
ð
Ò§ð¥ð ðð =1
11171.5 Ã 282 + 2.4 Ã 585 + 1.6 Ã 250
â 1.99
ð = 3 Gruppen
Ò§ð¥3 = 1.6 ð3 = 250
ð = 282 + 585 + 250= 1117
4.3 Spezielle Lagekennwerte
81
â Klassierung als Spezialfall â
ðð â Ò§ð¥ð> Klassenmitten ersetzen approximativ die Klassenmittel
> Gruppen sind gegeben als GröÃenklassen
> Problem: Klassenmittelwerte hÀufig unbekannt
4.3 Spezielle Lagekennwerte
82
4.3.2 Quantile
â Definition und Interpretation â
â Berechnung bei Urlisten â
> Ein x%-Quantil wird (grob) gesagt von x% der Werte unterschritten
und von (100x)% ÃŒberschritten
> Speziell: 50%-Quantil oder 0.5-Quantil = Median
ð¥0.25 = ð¥ 7.5 +1 = ð¥ 8 = 18 320
z. B. 0.25- und 0.9-Quantil:
ð¥0.9 = 0.5 ð¥ 27 + ð¥ 28 = 0.5 41004 + 44981 = 42992.5
0.25 Ã 30 = 7.5 â â 0.9 Ã 30 = 27 â â
Werte geordnet!
4.3 Spezielle Lagekennwerte
83
â Berechnung bei klassierten Daten â
Einfallsklasse des 0.25-Quantils ist hier ð = 2
ððâ1 = ð1 = 10, à·šð¹ð ð1 = 0.067, áð2/ð2 = 0.0267
4.3 Spezielle Lagekennwerte
84
ð¥0.25 â 10 +0.25 â 0.067
0.0267â 16.85
ð¥0.9 â 40 +0.9 â 0.867
0.01â 43.3
4.3 Spezielle Lagekennwerte
Beispiel 4.3.1: Dezile und QuintilsverhÀltnis der Einkommensverteilung
86
4.3 Spezielle Lagekennwerte
87
4.3.3 Geometrisches Mittel
â Hintergrund â
UmsÀtze eines Unternehmens
+10% â 10% + 30% (Wachstumsraten)
Problem: 1
30.1 â 0.1 + 0.3 = 0.1 aber
1000 Ã 1.1 Ã 1.1 Ã 1.1 = 1331 â 1287
Angabe des durchschnittlichen Wachstums mit 10% nicht sinnvoll
4.3 Spezielle Lagekennwerte
88
â Wachstumsfaktoren und Wachstumsraten â
â Definition und Berechnung â
> Wachstumsfaktoren im Beispiel: 1.1, 0.9, 1.3
> Wachstumsraten im Beispiel: +10%, 10%, +30%
Wachstumrate =(Wachstumsfaktor 1) Ã 100%
z.B. 1.3 =1287
990(âspÀterer Zeitpunkt/frÃŒherer Zeitpunktâ)
Ò§ð¥ðððð = 1.1 à 0.9 à 1.3 1/3 â 1.0877
Damit gilt tatsÀchlich:
1000 à ҧð¥ðððð à ҧð¥ðððð à ҧð¥ðððð = 1000 à 1.08773 = 1287
Alternativ: Ò§ð¥ðððð = 1287/1000 1/3 â 1.0877
4.3 Spezielle Lagekennwerte
91
> Durchschnittliches Wachstum des realen BIP von 1994 bis 2007
Ò§ð¥ðððð = 1.017 à 1.008 à 1.017 Ãâ¯Ã 1.033 1/13 â 1.016
> Durchschnittliches Wachstum des realen BIP von 2008 bis 2012
Ò§ð¥ðððð = 1.011 à 0.949 à 1.040 à 1.033 à 1.007 1/5 â 0.007
> Durchschnittliches Wachstum des nominalen BIP von 1994 bis 2012
Ò§ð¥ðððð = 2666.4/1782.2 1/18 â 1.023
4.4 Streuungskennwerte
4.4.1 Spannweite
92
â1, 0, 0, 1, 3, 5, 6 (geordnet!)
R = ð¥ 7 â ð¥ 1 = 6 â â1 = 7
4.4 Streuungskennwerte
4.4.2 Mittlere absolute Abweichungen
â Definition und Berechnung â
â1, 0, 0, 1, 3, 5, 6
ðâ =1
7â1 â 2 + 0 â 2 + 0 â 2 + 1 â 2 + 3 â 2 + 5 â 2 + 6 â 2
â¹ Ò§ð¥ = 2:
=1
73 + 2 + 2 + 1 + 1 + 3 + 4 â 2.29
ð =1
7â1 â 1 + 0 â 1 + 0 â 1 + 1 â 1 + 3 â 1 + 5 â 1 + 6 â 1
=1
72 + 1 + 1 + 0 + 2 + 4 + 5 â 2.14
â¹ ð¥0.5= 1:
93
4.4 Streuungskennwerte
94
â Interpretation â
> ðâ ... Durchschnittsabstand aller Werte zum arithmetischen Mittel
(Mittlere absolute Abweichung vom arithmetischen Mittel)
> ð ... Durchschnittsabstand aller Werte zum Median
(Mittlere absolute Abweichung vom Median)
4.4 Streuungskennwerte
95
â Berechnung bei klassierten Daten â
ðâ â1
302 à 5 â 26 + 8 à 15 â 26 +â¯+ 1 à 55 â 26 â 9.33
ð â1
302 à 5 â 25.02 + 8 à 15 â 25.02 + â¯+ 1 à 55 â 25.02 â 9.00
â¹ Ò§ð¥ = 26
â¹ ð¥0.5= 25.02
(Folie 71)
(Folie 75)
4.4 Streuungskennwerte
â Median als prÀferierter Bezugswert â
96
> ... ð theoretisch fundiert ÃŒber Minimumeigenschaft des Medians
> ... ðâ eher unÃŒblich
Summen laufen jeweils
bis k, j statt i
4.4 Streuungskennwerte
97
4.4.3 Median absoluter Abweichungen
â Hintergrund â
> Problem: Mittelwerte sind nicht robust, so auch nicht mittlere absolute
Abweichungen (auch nicht wenn Bezugspunkt Median ist)
Beobachtungswerte: 1, 2, 3, 4, 5 â¹ Ò§ð¥ = 3 ð¥0.5= 3
Absolute Abweichungen: 2, 1, 0, 1, 2 â¹ ðâ = 1.2
> Situation ohne AusreiÃer
ð = 1.2
1, 2, 3, 4, 500 â¹ Ò§ð¥ = 102 ð¥0.5= 3
Absolute Abweichungen: 101, 100, 99,98,398 â¹ ðâ = 159.2
2, 1, 0, 1, 497 â¹ ð = 100.2
> Situation mit AusreiÃer:
... vom arithmetischen Mittel bzw. Median
... vom arithmetischen Mittel
... vom Median
4.4 Streuungskennwerte
â Definition und Berechnung â
Situation mit AusreiÃer: 1, 2, 3, 4, 500
Absolute Abweichungen vom Median: 2, 1, 0, 1, 497
â¹ ð¥0.5= 3
Davon der Median: MAD = 1
Geordnet: 0, 1, 1, 2, 497
98
4.4 Streuungskennwerte
Beispiel 4.4.1: Streuung des weltweiten Pro-Kopf-BIP (vgl. Abb. 4.1.2)
99
Ò§ð¥ = 14 936
ð¥0.5 = 5 476
ð = 12 744
ððŽð· = 4 722
(alle Einheiten in US-Dollar)
4.4 Streuungskennwerte
4.4.4 Varianz, Standardabweichung und Schwankungsintervalle
â Definition und Berechnung â
> Empirische Varianz in âoriginÀrer Formelâ
Çð 2 =1
ð
ð=1
ð
ð¥ð â Ò§ð¥ 2
> Empirische Standardabweichung
Çð = Çð 2
> Rechenbeispiel:
â1, 0, 0, 1, 3, 5, 6 â¹ Ò§ð¥ = 2
â¹ Çð 2 =1
7â1 â 2 2 + 0 â 2 2 + 0 â 2 2 +⯠6 â 2 2 â 6.2857
â¹ Çð = 6.28571 â 2.51
4.4 Streuungskennwerte
101
â Verschiebungsformel fÃŒr die empirische Varianz â
> Allgemeine Verschiebungsformel
1
ð
ð=1
ð
ð¥ð â Ò§ð¥ 2 =1
ð
ð=1
ð
ð¥ð â ð 2 â Ò§ð¥ â ð 2
> FÃŒr c = 0 folgt daraus die Verschiebungsformel fÃŒr die emirische Varianz
1
ð
ð=1
ð
ð¥ð â Ò§ð¥ 2 =1
ð
ð=1
ð
ð¥ð2 â Ò§ð¥2
> Rechenbeispiel
â1, 0, 0, 1, 3, 5, 6 â¹ Ò§ð¥ = 2
â¹ Çð 2 =1
7â1 2 + 02 + 02 + 12 + 32 + 52 + 62 â 22 â 6.2857
4.4 Streuungskennwerte
102
â Standardabweichung und Interpretation â
Es liegen in den empirischen Schwankungsintervallen
Ò§ð¥ â Çð , Ò§ð¥ + Çð , Ò§ð¥ â 2 Çð , Ò§ð¥ + 2 Çð und Ò§ð¥ â 3 Çð , Ò§ð¥ + 3 Çð
ca. 68% 95% bzw. 99%
aller Beobachtungswerte.
4.4 Streuungskennwerte
103
â HintergrÃŒnde â
Bedeutendstes Streuungsmaà in der Statistik aus verschiedenen GrÌnden...
4.5 Spezielle Streuungskennwerte
105
â Beispiel 4.5.1 â
Ò§ð¥1 = 1.0 Ò§ð¥2 = 2.0 Ò§ð¥3 = 1.46
Çð 12 = 0.06 Çð 2
2 = 0.05 Çð 32 = 0.0464
ð1 = 3 ð2 = 4 ð3 = 5
â¹ Ò§ð¥ =
ð=1
3
áðð Ò§ð¥ð =3
12Ã 1.0 +
4
12Ã 2.0 +
5
12Ã 1.46 = 1.525
4.5 Spezielle Streuungskennwerte
106â HintergrÃŒnde â
â Interpretation â
â¹
ð=1
3
áðð Çð ð2 =
3
12Ã 0.06 +
4
12Ã 0.05 +
5
12Ã 0.0464 = 0.051
â¹
ð=1
3
áðð Ò§ð¥ð â Ò§ð¥2=
3
12Ã 1 â 1.525 2 +
4
12Ã 2 â 1.525 2 +
5
12Ã 1.46 â 1.525 2
= 0.145875
â¹ Çð 2 = 0.051 + 0.145875 = 0.196875
TatsÀchlich erhÀlt man diesen Wert auch auf âkonventionellem Wegeâ:
Çð 2 =1
12
ð=1
12
ð¥ð2 â Ò§ð¥2 =
1
1212 + 1.32 +â¯+ 1.62 â 1.5252 = 0.196875
Intern Extern Gesamt
4.5 Spezielle Streuungskennwerte
108
Beispiel 4.5.2: QuantilsabstÀnde der Einkommensverteilung
16168
ð0.1 = ð¥0.9 â ð¥0.1 = 35731 â 9913 = 25818
ð¥0.8 â ð¥0.2 = 29039 â 12871 = 16168ð0.2 =
4.5 Spezielle Streuungskennwerte
109
4.5.3 Variationskoeffizient
â Hintergrund â
> Verschiebungsinvarianz der Varianz ist manchmal störend:
1, 2, 3, 4, 5 â identische Varianz â 15, 16, 17, 18, 19
> Beispiel:
Angenommen, im Rahmen einer Marktstudie wird die Streuung von Preisen
fÃŒr bestimmte Produkte bei 3 verschiedenen Lebensmitteldiscountern vergli-
chen. Dabei ergeben sich folgende Preise fÃŒr
100g Speisezalz: 0.29, 0.39, 0.49 Euro
1kg Waschmittel: 19.79, 19.89, 19.99 Euro
Somit erhalten wir:
Ò§ð¥ðððð§ = 0.39 Çð ðððð§ = 0.0816
Ò§ð¥ððð ðâðð = 19.89 Çð ððð ðâðð = 0.0816
Bezogen auf das Preisniveau variiert der Preis des Waschmittels
relativ betrachtet weniger als der Preis des Salzes
Identisch!
4.5 Spezielle Streuungskennwerte
110â Interpretation â
â Definition und Berechnung â
> Variationskoeffizient als Maà der relativen Streuung:
> Beispiel von zuvor:
> Variationskoeffizient entspricht der Standardabweichung der
prozentualen Abweichungen vom arithmetischen Mittel
ð£ =Çð
Ò§ð¥nichtnegative Werte mit Ò§ð¥ > 0 vorausgesetzt
ð£ðððð§ =Çð ðððð§Ò§ð¥ðððð§
=0.0816
0.39â 0.209
ð£ððð ðâðð =Çð ððð ðâðð
Ò§ð¥ððð ðâðð=0.0816
19.89â 0.004
4.5 Spezielle Streuungskennwerte
> Im Beispiel des Salzes mit Ò§ð¥ðððð§ = 0.39
Preise: 0.29 0.39 0.49
Abweichung in %: â25.64% 0% 25.64%
111
z. B. 0.49â0.39
0.39Ã 100% = 25.64%Standardabweichung :
Çð = Çð 2 =1
3â25.64 â 0 2 + 0 â 0 2 + 25.64 â 0 2 â 20.9
4.5 Spezielle Streuungskennwerte
112
Beispiel 4.5.3: Variationsvergleich von Wechselkursen
Ò§ð¥ðð¢ðð = 9.49 Çð ðð¢ðð = 0.93 ð£ðð¢ðð = 0.10
Ò§ð¥ð·ððððð = 1.33 Çð ð·ððððð = 0.09 ð£ð·ððððð = 0.07
4.6 Standardisierung mittels Lage und Streuung
113
â Hintergrund â
> Beispiel: Einkommensvergleich in zwei unterschiedlichen LÀndern
Deutscher: 2800 Euro bei einem Durchschnitt von 2500 Euro und einer
Standardabweichung von 150 Euro
Schweizer: 5500 Franken bei einem Durchschnitt von 5000 Franken und
einer Standardabweichung von 400 Franken
â Berechnung und Interpretation â
> Allgemeine Form:
> Spezialfall Z-Standardisierung:
> Beobachtungswerte aus unterschiedlichen Grundgesamtheiten lassen
sich nicht immer sinnvoll vergleichen
ð§ð =ð¥ð â Ò§ð¥
Çð ð
4.6 Standardisierung mittels Lage und Streuung
114
â Eigenschaften z-standardisierter Werte â
> Im Beispiel von zuvor
Deutscher:2800 â 2500
150= 2 Schweizer:
5500 â 5000
400= 1.25
Fazit: Deutscher (Schweizer) liegt 2 (1.25) Standardabweichungen ÃŒber
dem Durchschnitt
> Mittelwert z-standardisierter Werte ist stets 0:
Ò§ð§ =1
ð
ð=1
ð
ð§ð =1
ð
ð=1
ðð¥ð â Ò§ð¥
Çð ð
=1
ð Çð ð
ð=1
ð
ð¥ð â Ò§ð¥ = 0 (vgl. Folie 69)
4.6 Standardisierung mittels Lage und Streuung
Çð ð2 =
1
ð
ð=1
ð
ð§ð â Ò§ð§ 2 =1
ð
ð=1
ð
ð§ð2 â Ò§ð§2 =
1
ð
ð=1
ð
ð§ð2
> Varianz (Standardabweichung) z-standardisierter Werte ist stets 1:
=1
ð
ð=1
ðð¥ð â Ò§ð¥ 2
Çð ð2 =
1
Çð ð2 Ã
1
ð
ð=1
ð
ð¥ð â Ò§ð¥ 2 =1
Çð ð2 Ã Çð ð
2 = 1
115
4.7 Messung von Schiefe
117
â Konzept und Definition â
> Feststellung: Bei schiefen Verteilungen liegen obere und untere Quantile
gewöhnlich unterschiedlich weit vom Median entfernt
> Erster Vorschritt: Zerlegung des Quantilsabstands im Sinne von
ð¥1âðŒ â ð¥ðŒ = ð¥0.5 â ð¥ðŒ + ð¥1âðŒ â ð¥0.5
ððŒ
4.7 Messung von Schiefe
â Interpretation â
QS
118
> Quantilskoeffizient der Schiefe setzt die Differenz der beiden AbstÀnde
ins VerhÀltnis zum Quantilsabstand (siehe Kasten)
... siehe Kasten
119
Beispiel 4.7.1: Schiefe der Einkommensverteilung
4.7 Messung von Schiefe
ðð0.1 =ð¥0.9 â ð¥0.5 â ð¥0.5 â ð¥0.1
ð¥0.9 â ð¥0.1=
35731 â 19595 â 19595 â 9913
35731 â 9913
â 0.25
ðð0.1 = 0.25
ðð0.2 = 0.17
ðð0.3 = 0.10
4.8 Darstellung und Messung von Konzentration
4.8.1 Lorenz-Kurve
â Was versteht man unter Konzentration? â
â Beispiel 4.8.1 â
Man vergleiche die folgenden beiden DatensÀtze
Merkmalssumme jeweils = 20
Wie verteilt sich diese auf die einzelnen MerkmalstrÀger?
Wie stark ist die Ungleichverteilung (Konzentration) ausgeprÀgt?
Man stelle sich 3 Branchen mit jeweils 5 Firmen vor:
120Feststellung: PhÀnomen der Konzentration wird durch her-
kömmliche MaÃe nicht adÀquat gemessen
4.8 Darstellung und Messung von Konzentration
â Interpretation â
122
> Die FlÀche zwischen Lorenzkurve und Winkelhalbierender wird immer
dann groÃ, wenn
> Keine Konzentration liegt vor, wenn die Lorenzkurve mit der Winkel-
halbierenden zusammenfÀllt. Dann
> Beispiel: Koordinatenpunkte der Lorenzkurve, falls Branche mit 5 Unter-
nehmen keinerlei Konzentration aufweist:
wenige MerkmalstrÀger (relativ) viel von der Merkmalssumme
auf sich vereinigen.
sind alle Werte gleich. Damit verteilt sich die Merkmalssumme
gleichmÀÃig auf die MerkmalstrÀger.
(0, 0), (0.2, 0.2), (0.4, 0.4), (0.6, 0.6), (0.8, 0.8), (1, 1)
4.8 Darstellung und Messung von Konzentration
123
4.8.2 Gini-Koeffizient
â Definition und Interpretation â
> (Nichtnormierter) Gini-Koeffizient:
Zweifaches der FlÀche zwischen Lorenzkurve und Winkelhalbierender
> Gini-Koeffizient = 0, falls alle Werte gleich sind
> Gini-Koeffizient â 1 bei maximaler Konzentration, d. h. wenn ein ein-
zelner MerkmalstrÀger die gesamte Merkmalssumme auf sich vereint
4.8 Darstellung und Messung von Konzentration
â Berechnung â
124
Formel: G =2Ï ðð¥ ð
ðÏð¥ðâð + 1
ð
Beispielrechnung fÃŒr Branche 3:
20, 40, 60, 80, 100 (geordnet!)
â ðº3 =2 1 à 20 + 2 à 40 + 3 à 60 + 4 à 80 + 5 à 100
5 Ã 300â6
5
â 0.2667
Analog: ðº1 = 0.76, ðº2 = 0.1975
4.8 Darstellung und Messung von Konzentration
â Wertebereich und Normierung â
ðº ist maximal ðâ1
ð; soll der Maximalwert = 1 sein:
ðºâ =ð
ð â 1ðº
Normierter Gini-Koeffizient
4.8 Darstellung und Messung von Konzentration
â Vorsicht bei der Interpretation â
126vgl. Fahrmeir et al. (2010)
Fazit:
ðºðŽ = 0.4 ðºðµ = 0.4
Gini-Koeffizient allein verrÀt nicht alles!
4.8 Darstellung und Messung von Konzentration
Beispiel 4.8.2: Konzentration von Einkommen in Deutschland
127
4.9 Spezifische Eigenschaften empirischer Kennwerte
4.9.1 Minimumeigenschaft des arithmetischen Mittels
128
â Hintergrund â
> Bekannt: Çð 2 =1
ðÏð=1ð ð¥ð â Ò§ð¥ 2 verwendet Ò§ð¥ als Referenzpunkt in
der Frage âWie stark streuen die Werte um ...?â
> Frage: Welcher Referenzpunkt c minimiert den Ausdruck1
ðÏð=1ð ð¥ð â ð 2?
> Antwort: Die Lösung lautet tatsÀchlich ð = Ò§ð¥
â Analytischer Nachweis â
> Minimierungsproblem: minð
ð ð mit ð ð =1
ðÏð=1ð ð¥ð â ð 2
ðð ð
ðð= â
2
ð
ð=1
ð
ð¥ð â ð = â2
ð
ð=1
ð
ð¥ð +2
ð
ð=1
ð
ð
4.9 Spezifische Eigenschaften empirischer Kennwerte
129
> Alternativ: Betrachte allgemeine Verschiebungsformel (Folie 101)
1
ð
ð=1
ð
ð¥ð â Ò§ð¥ 2 =1
ð
ð=1
ð
ð¥ð â ð 2 â Ò§ð¥ â ð 2
Çð 2
â1
ð
ð=1
ð
ð¥ð â ð 2 = Çð 2 + Ò§ð¥ â ð 2
= â2 Ò§ð¥ + 2ð = 2 ð â Ò§ð¥
â ð minimal fÃŒr ð = Ò§ð¥
Ist minimal, falls ð = Ò§ð¥
4.9 Spezifische Eigenschaften empirischer Kennwerte
â Beispiel 4.9.1 â
130
Fall 1 : 1, 0, 0, 1, 3, 5, 6
â Ò§ð¥ = 2, Çð 2= 6.28571
Fall 2 : 1, 0, 0, 1, 3, 4, 5, 6
â Ò§ð¥ = 2.25, Çð 2= 5.9375
â ð1 ð = 2 â ð 2 + 6.28571 â ð2 ð = 2.25 â ð 2 + 5.9375
4.9.2 Minimumeigenschaft des Medians
132
â Hintergrund â
4.9 Spezifische Eigenschaften empirischer Kennwerte
> Bekannt: ð =1
ðÏð=1ð ð¥ð â ð¥0.5 verwendet ð¥0.5 als Referenzpunkt in
der Frage âWie stark streuen die Werte um ...?â
> Frage: Welcher Referenzpunkt c minimiert den Ausdruck 1
ðÏð=1ð ð¥ð â ð ?
> Antwort: Die Lösung lautet tatsÀchlich ð = ð¥0.5
â Analytischer Nachweis â
> Minimierungsproblem: minð
áð ð mit áð ð =1
ðÏð=1ð ð¥ð â ð
> Jedoch: áð analytisch nicht gut handhabbar (teils nicht differenzierbar)
> Minimumeigenschaft jedoch einsichtig (âinformaler Beweisâ)
auch keine Streuungzerlegungsformel
4.9 Spezifische Eigenschaften empirischer Kennwerte
134
Fall 1 : 1, 0, 0, 1, 3, 5, 6
â ð¥0.5 = 1
Fall 2 : 1, 0, 0, 1, 3, 4, 5, 6
â áð1 ð =1
7០â1 â ð + 0 â ð
á¿+â¯+ 6 â ð
â ð¥0.5 = 2
â áð2 ð =1
8០â1 â ð + |0 â ð|
á¿+â¯+ 6 â ð
4.9.3 Transformationseigenschaften
â Arten von Transformationen â
4.9 Spezifische Eigenschaften empirischer Kennwerte
136
> Verschiebung:
> Ursprungswerte ð¥1, ð¥2, ⊠, ð¥ð sollen einheitlich transformiert werden
> Umskalierung:
> Beispiel:
Ursprungswerte: 1, 0, 0, 1, 3, 5, 6
Verschiebung um ð = 9:
Umskalierung mit ð = 2:
ð¢ð = ð¥ð + ð fÃŒr ð = 1, ⊠, ð
ð¢ð = ðð¥ð fÃŒr ð = 1,⊠, ð und ð > 0
8, 9, 9, 10, 12, 14, 15
2, 0, 0, 2, 6, 10, 12
4.9 Spezifische Eigenschaften empirischer Kennwerte
138
â VerschiebungsÀquivarianz und Verschiebungsinvarianz â
> Ãquivarianz ... âGleichartige VerÀnderlichkeitâ bei Transformation
> Invarianz ... âUnverÀnderlichkeit â bei Transformation
> Beispiel 1: VerschiebungsÀquivarianz des arithmetischen Mittels:
àŽ€ð¢ =1
ð
ð=1
ð
ð¢ð =1
ð
ð=1
ð
ð¥ð + ð =
Transformation: ð¢ð = ð¥ð + ð
= Ò§ð¥ +1
ðà ðð = Ò§ð¥ + ð
= Ò§ð¥ + ð
4.9 Spezifische Eigenschaften empirischer Kennwerte
139
> Beispiel 2: Verschiebungsinvarianz der (empirischen) Varianz
â SkalenÀquivarianz und Skaleninvarianz â
> Beispiel 3: SkalenÀquivarianz des arithmetischen Mittels
Çð ð2 =
1
ð
ð=1
ð
ð¢ð â àŽ€ð¢ 2 =1
ð
ð=1
ð
ð¥ð + ð â Ò§ð¥ â ð 2
=1
ð
ð=1
ð
ð¥ð â Ò§ð¥ 2
= Çð ð2
Transformation: ð¢ð = ðð¥ð
àŽ€ð¢ =1
ð
ð=1
ð
ð¢ð =1
ð
ð=1
ð
ðð¥ð = ð Ã1
ð
ð=1
ð
ð¥ð = ð Ò§ð¥
4.9 Spezifische Eigenschaften empirischer Kennwerte
140
> Beispiel 4: SkalenÀquivarianz der Standardabweichung
Transformation: ð¢ð = ðð¥ð mit ð > 0
Çð ð2 =
1
ð
ð=1
ð
ð¢ð â àŽ€ð¢ 2 =1
ð
ð=1
ð
ðð¥ð â ð Ò§ð¥ 2
= ð2 Ã1
ð
ð=1
ð
ð¥ð â Ò§ð¥ 2
= ð2 Çð ð2
=> Fazit: Varianz ist weder Àquivariant noch invariant, aber
Çð ð = Çð ð2 = ð2 Çð ð
2 = ð Çð ð
=> Fazit: Standardabweichung ist skalenÀquivariant
Beachte: ð > 0
4.9 Spezifische Eigenschaften empirischer Kennwerte
142
â Eigenschaften standardisierter Werte â
> Bei Verschiebung ð¢ð = ð¥ð + ð gilt: àŽ€ð¢ = Ò§ð¥ + ð und Çð ð = Çð ð
> Bei Umskalierung ð¢ð = ðð¥ð gilt: àŽ€ð¢ = ð Ò§ð¥ und Çð ð = ð Çð ð
Daraus folgt bei einer Standardisierung verschobener Werte:
Daraus folgt bei einer Standardisierung verschobener Werte:
> Fazit: Verschiebungen und Umskalierungen wirken sich nicht
auf standardisierte Werte aus
ð§ð =ð¢ð â àŽ€ð¢
Çð ð=ð¥ð + ð â Ò§ð¥ â ð
Çð ð=ð¥ð â Ò§ð¥
Çð ð
ð§ð =ð¢ð â àŽ€ð¢
Çð ð=ðð¥ð â ð Ò§ð¥
ð Çð ð=ð¥ð â Ò§ð¥
Çð ð