4ek211 základy ekonometrie - nb.vse.cznb.vse.cz/~figlova/4ek211_2.pdf · 4ek211 základy...
TRANSCRIPT
4EK211 Základy ekonometrie
Odhad klasického lineárního regresního modelu I
Cvičení 2
Zuzana Dlouhá
2
Metodologický postup tvorby EM
1. Specifikace modelu
• určení proměnných
• určení vzájemných vazeb mezi proměnnými
• formulace hypotéz – v podobě algebraických vztahů (tj. jedné či více rovnic)
• specifikace náhodných vlivů
2. Odhad parametrů (tj. kvantifikace)
• využití disponibilní (tj. výběrové) informace z dat
• použití vhodné odhadové techniky
3. Verifikace
• jak se odhadnutý model shoduje s teorií a napozorovanými daty
– ekonomická (jestli proměnné modelu mají správný směr a intenzitu)
– statistická (ověření přesnosti a významnosti výsledků)
– ekonometrická (zda byly dodrženy podmínky pro použití dané odhadové techniky a statistických testů)
3
Metodologický postup tvorby EM
4. Využití
• kvalitativní a kvantitativní analýza minulého vývoje
• předpovědi (predikce, prognózy)
• volba hospodářské politiky
– analýza různých scénářů
– simulační experimenty
• aplikace na mikroúrovni
– banky (nesplácení úvěru, odhad ztráty dané nesplácením úvěru, odhad pravděpodobnosti podvodu)
– marketing (odchod zákazníka, pořízení produktu – cross-sell)
– cena komodity ve vztahu k poptávanému množství
– příjem spotřebitele versus cena komodity
– velikost prodeje versus prostředky na reklamu
4
Klasický lineární regresní model (KLRM)
Obecný model (maticový zápis)
y = Xβ + u
X = matice (n x (k+1)) pozorování exogenních proměnných, včetně úrovňové konstanty
y = sloupcový vektor (n x 1) endogenních proměnných
β = sloupcový vektor ((k+1) x 1) parametrů
u = sloupcový vektor náhodné složky, u ~ N (0, δ2)
k = počet vysvětlujících proměnných
k+1 = počet odhadovaných parametrů
n = počet pozorování
Zápis KLRM po složkách
y = β0 + β1x1 + β2x2 +…+βkxk + u
• za předpokladu: n > k
• odhadnout koeficienty β – tj. určit b (resp. - odhady β)β
5
Klasický lineární regresní model (KLRM)
Abstraktní vs. konkrétní model
y = Xβ → y = Xβ + u
• model „naplníme“ daty (tj. provedeme kvantifikaci modelu)
→ y = Xb + e
kde y jsou napozorované hodnoty, e jsou rezidua
→
kde jsou vyrovnané hodnoty, rezidua jsou 0
Rezidua vs. náhodná složka
rezidua = rozdíl mezi napozorovanými a vyrovnanými hodnotami:
náhodná složka = rozdíl mezi napozorovanými hodnotami a jejich
střední hodnotou:
u = y – E(y)
Xby
y
yye
6
Klasický lineární regresní model (KLRM)
Bodová odhadová funkce „b“
• vzniká z podmínky, aby součet čtverců reziduí byl minimální
• součet čtverců reziduí: eTe
b … ∑ eTe → min
• kdy je funkce minimální:
– první derivace funkce je nulová
– druhá derivace funkce je kladná
• metoda nejmenších čtverců (MNČ / OLS) – nejznámější
technika
• funkční předpis odhadové funkce:
b = (XTX)-1XTy
- poskytuje odhady:
- nestranné (resp. nevychýlené)
- vydatné
bT = (b0, b1, b2,…,bk)
7
Klasický lineární regresní model (KLRM)
Odvození bodové odhadové funkce „b“
b … ∑ eTe → min
yXXXb
yXXXbXXXX
yXbXX
XbXyX
XbXyXb
XbXbyXbyy
b
ee
yXbXbyXby
XbXbyXbyy
XbXbXbyyXbyyXbyXbyee
TT
TTTT
TT
TT
TTTTTTTT
TTTTT
TTTTT
TTTTTTTT
)(
)()()(
)(
)(
)()(
1
11
22
2202
)(žeplatí,kde
,2
8
Klasický lineární regresní model (KLRM) - příklad
Příklad 1:
yi = (1, 4, 7, 9)
xi = (4, 3, 1, 1)
yi = β0 + β1xi + ui, i = 1, 2,...,4
• stanovte odhad parametrů β0 a β1, aby součet čtverců odchylek vyrovnaných hodnot od hodnot napozorovaných byl minimální
• napište odhadnutou regresní nadrovinu
• vypočítejte vyrovnané hodnoty ŷi
• vypočítejte rezidua ei
• proveďte výpočty v programu MS Excel (využijte maticové počty)
• proveďte výpočty v programu EViews
• řešení: b0 = 31/3 = 10,33
b1 = -61/27 = -2,26
9
Klasický lineární regresní model (KLRM) - příklad
Příklad 2:
yi = (5, 4, 6, 4, 3)
xi = (3, 2, 3, 2, 3)
yi = β0 + β1xi + ui, i = 1, 2,...,5
• stanovte odhad parametrů β0 a β1, aby součet čtverců odchylek vyrovnaných hodnot od hodnot napozorovaných byl minimální
• napište odhadnutou regresní nadrovinu
• vypočítejte vyrovnané hodnoty ŷi
• vypočítejte rezidua ei
• proveďte výpočty v programu MS Excel (využijte maticové počty)
• proveďte výpočty v programu EViews
• řešení: b0 = 2,67
b1 = 0,67
10
Klasický lineární regresní model (KLRM)
Náhodná složka: Gauss-Markovy předpoklady
1. E(u) = 0
– náhodné vlivy se vzájemně vynulují
2. E(u uT) = σ2 In
– konečný a konstantní rozptyl = homoskedasticita
→ porušení: heteroskedasticita
– náhodné složky jsou sériově nezávislé
→ porušení: autokorelace
3. X je nestochastická matice – E(XTu) = 0
– veškerá náhodnost je obsažena v náhodné složce
4. X má plnou hodnost k
– matice X neobsahuje žádné perfektně lineárně závislé sloupce
pozorování vysvětlujících proměnných
→ porušení: multikolinearita
11
Klasický lineární regresní model (KLRM)
Vlastnosti bodového odhadu, n < 30
• nestrannost (nevychýlenost / nezkreslenost) odhadu:
E(b) = β
b – získáme z více výběrových vzorků
pokud E(b) > β – odhady jsou nadhodnoceny,
E(b) < β – odhady jsou podhodnoceny
ß
f(b)
Nestrannost
b
12
Klasický lineární regresní model (KLRM)
Vlastnosti bodového odhadu, n < 30
• vydatnost odhadu: standardní chyba regresního koeficientu sb
musí být minimální ze všech jiných postupů
– to způsobuje, že intervalové odhady jsou nejmenší
– jako nevychýlený odhad může sloužit více statistik, z nichž
nejvhodnější je ta, která má minimální rozptyl
ß
f(b)
Vydatnost
b
13
Klasický lineární regresní model (KLRM)
Vlastnosti bodového odhadu, n ≥ 30
• konzistentní – bodový odhad b je konzistentním odhadem,
jestliže jeho hodnota s rostoucím počtem pozorování n
konverguje ke skutečnému = populačnímu parametru
βbpn
lim
β
f(b
)
n=1000
n=200
Konzistence
b
n=500
14
Klasický lineární regresní model (KLRM)
Vlastnosti bodového odhadu, n ≥ 30
• asymptoticky nestranný – je to slabší vlastnost, (pokud je
odhad asymptoticky nestranný tak je i konzistentní)
βbpn
)E(lim
ß
f(b) n=200
n=500
Asymptotická nestrannost
E(b)
15
Klasický lineární regresní model (KLRM)
Vlastnosti bodového odhadu, n ≥ 30
• asymptotická vydatnost – rozptyl konverguje k nule rychleji
než s použitím jiné odhadové funkce
ß
f(b)
n=500
n=200
Asymptotická vydatnost
b