lineare gemischte modelle zur sch¨atzung von strukturiert ... · – station¨are gauss-felder...

23
Lineare gemischte Modelle zur Sch¨ atzung von strukturiert additiven Regressionsmodellen Thomas Kneib Institut f¨ ur Statistik, LMU M¨ unchen 1. Strukturiert additive Regression 2. Modellkomponenten und Priori-Verteilungen 3. Reparametrisierung als lineares gemischtes Modell 4. Inferenz in linearen gemischten Modellen 5. Beispiel: Modellierung von Waldsch¨ aden 6. Vergleich mit MCMC-Verfahren 7. Erweiterungen I + II 12.05.2004

Upload: truongkien

Post on 16-Aug-2019

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Lineare gemischte Modelle zur Schatzung vonstrukturiert additiven Regressionsmodellen

Thomas KneibInstitut fur Statistik, LMU Munchen

1. Strukturiert additive Regression

2. Modellkomponenten und Priori-Verteilungen

3. Reparametrisierung als lineares gemischtes Modell

4. Inferenz in linearen gemischten Modellen

5. Beispiel: Modellierung von Waldschaden

6. Vergleich mit MCMC-Verfahren

7. Erweiterungen I + II

12.05.2004

Page 2: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Strukturiert additive Regression

Strukturiert additive Regression

• Generalisierte lineare Modelle:

E(yit|uit, γ) = µit = h(ηit) ηit = u′itγ

mit Regressionsparametern γ und Responsefunktion h.

• Probleme einer rein parametrischen Modellierung:

– nicht-lineare Effekte metrischer Kovariablen,

– zeitliche Korrelationen,

– raumliche Korrelationen,

– unbeobachtete Heterogenitat,

– komplexe Interaktionen zwischen Kovariablen.

=⇒ Strukturiert additive Regressionsmodelle

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 1

Page 3: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Strukturiert additive Regression

• Idee: Ersetze den linearen Pradiktor durch einen flexiblen, semiparametrischenPradiktor.

• Raum-Zeit-Modell mit Haupteffekten

ηit = f1(xit1) + . . . + fl(xitl) + ftime(t) + fspat(si) + u′itγ

– f1, . . . , fl glatte Funktionen der metrischen Kovariablen x1, . . . , xl,

– ftime nichtlinearer Effekt der Zeit,

– fspat glatter raumlicher Effekt,

– u′γ ublicher parametrischer Teil des Pradiktors.

• Haufig ist es sinnvoll des zeitlichen Effekt aufzuspalten in Trend- und Saison-Komponente:

ftime(t) = ftrend(t) + fseason(t).

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 2

Page 4: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Strukturiert additive Regression

• Analog lasst sich der raumliche Effekt in einen strukturierten und einenunstrukturierten Anteil zerlegen:

fspat(s) = fstr(s) + funstr(s).

• Erweiterungen des Haupteffekt-Modells

– Individuenspezifische Effekte:

ηit = f1(xit1) + . . . + u′γ + w′itbi

mit u.i.v. zufalligen Effekten bi.

– Modelle mit Interaktionen

ηit = . . . + ftime(t) + g(t)uit + . . .

ηit = . . . + f1(xit1) + f2(xit2) + f1|2(xit1, xit2) + . . .

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 3

Page 5: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Strukturiert additive Regression

• Einheitliche Schreibweise

ηit = f1(zit1) + . . . + fp(zitp) + u′itγ

wobei

– f1, . . . , fp Funktionen verschiedenen Typs,

– z1, . . . , zp generische Kovariablen.

– Beispiele:

f(v) = f(x) v = x nonparametrische Funktion einer metrischenKovariablen

f(v) = fspat(s) v = s raumlicher Effekt

f(v) = g(x)u v = (x, u) Effekt mit variierenden Koeffizienten

f(v) = f(x1, x2) v = (x1, x2) Interaktionsoberflache

etc.

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 4

Page 6: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Modellkomponenten und Priori-Verteilungen

Modellkomponenten und Priori-Verteilungen

• Alle Effekte konnen als Produkt einer Designmatrix Zj und eines Vektors vonRegressionsparametern βj beschrieben werden:

fj = Zjβj.

• Bayesianischer Ansatz: Priori-Verteilung fur βj.

• Allgemeine Form:

p(βj|τ2j ) ∝ exp

(− 1

2τ2j

β′jKjβj

)

wobei Kj eine Strafmatrix ist und τ2j ein Glattungsparameter.

• Verbindung zu penalisierter ML-Schatzung:

P (βj) = log[p(βj|τ2

j )]

= −12λjβ

′jKjβj, λj = 1/τ2

j

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 5

Page 7: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Modellkomponenten und Priori-Verteilungen

Stetige Kovariablen und Zeitskalen

• Bayesianische P-Splines:

– Approximiere fj(xj) durch einen B-Spline mit großer Knotenzahl, d.h.

fj(xj) ≈∑m

βjmBm(xj).

– Die Designmatrix Zj enthalt die Auswertungen der Basisfunktionen an denbeobachteten Werten von xj.

– Random Walk-Priori fur die B-Spline-Koeffizienten βj, d.h.

βjm = βj,m−1 + ujm oder βjm = 2βj,m−1 − βj,m−2 + ujm

mit ujm ∼ N(0, τ2j ).

– Die Strafmatrix hat dann die Form Kj = D′D mit Differenzenmatrix D.

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 6

Page 8: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Modellkomponenten und Priori-Verteilungen

• Random Walk-Prioris

– Popular zur Modellierung von Zeittrends.

– Konnen als P-Splines vom Grad 0 mit Knoten an allen verschiedenenBeobachtungswerten aufgefasst werden.

• Autoregressive Prioris

– Zur Modellierung flexibler Saisonkomponenten.

– Priori fur Saisonkomponente fseason(t) =: βt mit Periode per:

βt = −per−1∑

j=1

βt−j + ut

wobei ut ∼ N(0, τ2season).

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 7

Page 9: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Modellkomponenten und Priori-Verteilungen

Raumliche Kovariablen

• Stationare Gauss-Felder

– Exakte raumliche Information s = (sx, sy).

– Annahme: fspat(s) folgt einem stationaren Gauss-Prozess mit

fspat(s) ∼ N(0, τ2spat)

und isotroper Korrelationsfunktion

C(s, s′) = C(||s− s′||).

– Die Strafmatrix K wird durch die Korrelationsfunktion bestimmt.

– Stationare Gauss-Felder konnen als Oberflachenschatzer mit speziellenBasisfunktionen betrachtet werden.

– Alternative: Zweidimensionale P-splines.

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 8

Page 10: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Modellkomponenten und Priori-Verteilungen

• Markov Zufallsfelder

– Keine exakten Lokationen, sondern s ∈ {1, . . . , S} gibt Zugehorigkeit zu Regionenan.

– Definiere geeignete Nachbarschaften.

– Annahme: fspat(s) ist das gewichtete Mittel der Funktionswerte der benachbartenRegionen.

– Die Strafmatrix hat die Form einer Nachbarschaftsmatrix.

Zufallige Effekte

• Konnen verwendet werden zur Modellierung von

– unbeobachteter Heterogenitat zwischen Clustern,

– individuenspezifischen Effekten,

– unstrukturierten raumlichen Effekten.

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 9

Page 11: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Modellkomponenten und Priori-Verteilungen

Interaktionen

• Variierende Koeffizienten

– Modellierung von Interaktionen der Form

f(z1, z2) = g(z1)z2

d.h. der Effekt von z2 variiert uber den Wertebereich von z1.

– Haufig ist z2 kategorial.

– g(z1) kann prinzipiell jede beliebige Funktion sein, z.B. ein P-Spline, eineSaisonkomponente, ein Markov-Zufallsfeld, . . .

• Oberflachenschatzer: Zweidimensionale P-Splines

– Verwende Tensorprodukte eindimensionaler B-Splines als Basisfunktionen.

– Definiere zweidimensionalen Random Walk als Priori fur die Koeffizienten.

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 10

Page 12: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Reparametrisierung als lineares gemischtes Modell

Reparametrisierung als lineares gemischtes Modell

• Fur gegebene Glattungsparameter konnen die Regressionsparameter uber modifiziertesFisher-Scoring bestimmt werden.

• Problem: Wie bestimmt man die Glattungsparameter?

– Generalisierte Kreuzvalidierung,

– Voller Bayes-Ansatz mit MCMC-Verfahren,

– Verwendung von Methoden fur lineare gemischte Modelle.

• Ziel: Strukturiert additive Regressionsmodelle umschreiben zu linearen gemischtenModellen (genauer: zu Varianzkomponenten-Modellen).

• Jeder Parametervektor βj kann zerlegt werden in einen unpenalisierten Teil (mitflacher Priori) und einen penalisierten Teil (mit i.i.d. Normalverteilungspriori):

βj = Xunpj βunp

j + Xpenj βpen

j .

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 11

Page 13: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Reparametrisierung als lineares gemischtes Modell

• Fall 1: Strafmatrix mit vollem Rang

– Kein unpenalisierter Anteil.

– Xpenj βpen

j = K−1/2j βpen

j , d.h. βpenj erhalt man durch Standardisierung von βj.

• Fall 2: Strafmatrix mit Rangabfall

– Xunpj enthalt eine Basis des Nullraums von Kj. (Was wird nicht von Kj

penalisiert?)

– Xpenj enthalt eine orthonormale Basis der Abweichungen von diesem Nullraum

(orthogonal zur Basis in Xunpj ).

• Die unpenalisierten Anteile von fj entsprechen der Funktionsschatzung fur λj →∞,z.B.

– einem Polynom vom Grad k − 1 fur P-splines mit RW-k Priori,

– einer starren Saisonkomponente fur einen flexiblen saisonalen Effekt,

– einem konstanten Effekt fur Markov Zufallsfelder.

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 12

Page 14: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Reparametrisierung als lineares gemischtes Modell

• Aus der Zerlegung von βj folgt eine Zerlegung von fj:

fj = ZjXunpj βunp

j + ZjXpenj βpen

j

= Zunpj βunp

j + Zpenj βpen

j .

• Insgesamt erhalt man ein Varianzkomponenten-Modell mit

η = Xβunp + Pβpen

p(βunp) ∝ const βpen ∼ N(0, Λ)

Λ = blockdiag(τ21 I, . . . , τ2

pI).

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 13

Page 15: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Inferenz in linearen gemischten Modellen

Inferenz in linearen gemischten Modellen

• Es werden abwechelnd neue Schatzungen fur die Regressionsparameter und dieVarianzparameter bestimmt.

• Neue Regressionsparameter erhalt man durch Losen des Gleichungssystems

(X ′WX X ′WPP ′WX P ′WP + Λ−1

)(βunp

βpen

)=

(X ′WyP ′Wy

)

mit den ublichen GLM-Gewichten W und Arbeitsbeobachtungen y.

• Varianzparameter werden durch Maximieren der marginalen Likelihood (RestrictedLikelihood) gewonnen:

L(Λ) =∫

L(βunp, βpen, Λ)p(βpen)dβpendβunp → maxΛ

.

• Man erhalt empirische Bayes-Schatzer / Posteriori-Modus-Schatzer.

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 14

Page 16: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Beispiel: Modellierung von Waldschaden

Beispiel: Modellierung von Waldschaden

• Daten stammen aus jahrlichen Waldschadens-Beurteilungen in Nordbayern in denJahren 1983 bis 2001.

• 83 Beobachtungspunkte mit Buchen.

• yit Entlaubungsgrad von Baum i im Jahr t in drei geordneten Kategorien:

yit = 1 keine Entlaubung,yit = 2 25% Entlaubung oder weniger,yit = 3 mehr als 25% Entlaubung.

• Kovariablen:t Kalenderzeit,si Standort der Buche,ait Alter in Jahren,uit weitere (hauptsachlich kategoriale) Kovariablen.

• ηit = f1(t) + f2(ait) + f3(t, ait) + fspat(si) + u′itγ

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 15

Page 17: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Beispiel: Modellierung von Waldschaden

calendar time1983 1989 1995 2001

0

.25

.5

.75

1

Abbildung 2: Raumliche Verteilung der Baume

und Anteil der Zeitpunkte zu denen ein Baum als

geschadigt eingestuft wurde.

Abbildung 1: Zeitliche Entwicklung des Anteils der

verschiedenen Schadigungsstufen .

— keine Schadigung,

- - - mittlere Schadigung,

· · · schwere Schadigung.

0.0 1.0

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 16

Page 18: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Beispiel: Modellierung von Waldschaden

calendar time1983 1989 1995 2001

-2.5

0

2.5

Abbildung 3: Effekt der Kalenderzeit (Trend).

Abbildung 4: Alterseffekt.

age in years7 39 71 103 135 167 199 231

-6

-3

0

3

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 17

Page 19: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Beispiel: Modellierung von Waldschaden

-2.0 0 2.0

Abbildung 5: Strukturierter raumlicher Effekt.

Abbildung 6: Unstrukturierter raumlicher Effekt.-2.0 0 2.0

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 18

Page 20: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Beispiel: Modellierung von Waldschaden

1985

1990

1995

2000

calendar time

50

100

150

200

age of the tree

-1-0

.5 0

0.5

11.

5

Abbildung 7: Interaktionseffekt.

Tabelle 1: Klassifikationen mit und

ohne raumlichem Effekt .

yy 1 2 31 904 64 02 108 426 53 0 16 24

12.5%

yy 1 2 31 850 118 02 150 386 33 0 34 6

19.7%

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 19

Page 21: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Vergleich mit MCMC-Verfahren

Vergleich mit MCMC-Verfahren

Nachteile:

D Nicht modular aufgebaut. Der numerische Aufwand wachst schnelleran.

D Kredibilitatsintervalle nur asymptotisch.

D Nur Plug-in Schatzungen fur Funktionale der Parameter.

D Schwieriger zu erweitern.

Vorteile:

U Keine Fragen nach Konvergenz und Mixing.

U Liefert etwas bessere Punktschatzungen.

U In einfachen Modellen wesentlich schneller.

U Bayesianische Betrachtungsweise ist nicht notwendig (?)

U Weniger Vorwissen zur statistischen Theorie notig (?)

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 20

Page 22: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Erweiterungen I: Multikategorialer Response

Erweiterungen I: Multikategorialer Response

• Bereits entwickelt: Modelle fur ”einfache” multinomiale Logit-Modelle sowie ordinaleLogit- und Probit-Modelle.

• Mogliche Weiterentwicklungen:

– Multinomiale Probit-Modelle, insbesondere basierend auf korrelierten latentenVariablen.

– Kategorienspezifische Effekte bei nominalem Response.

– Kovariablenabhangige Schwellenwerte bei ordinalem Response.

• Probleme:

– Bestimmung von Wahrscheinlichkeiten aus multivariaten Normalverteilungen.

– Identifizierbarkeit bei ordinalen Modellen.

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 21

Page 23: Lineare gemischte Modelle zur Sch¨atzung von strukturiert ... · – Station¨are Gauss-Felder k¨onnen als Oberfl¨achensch¨atzer mit speziellen Basisfunktionen betrachtet werden

Thomas Kneib Erweiterungen II: Verweildaueranalyse

Erweiterungen II: Verweildaueranalyse

• Bereits entwickelt (nicht von uns): Nonparametrische Modellierung der Baseline-Hazardrate.

• Ziel: Erweiterung auf allgemeinen strukturiert additiven Pradiktor.

• Mogliche Methoden:

– Numerische Maximierung der marginalen Likelihood bezuglich denGlattungsparametern.

– Anpassung von Methoden fur Frailty-Modelle im Cox-Modell.

Lineare gemischte Modelle zur Schatzung von strukturiert additiven Regressionsmodellen 22