intro vrais loc-print

139
institut de science financiere et d’assurances laboratoire saf Université Claude Bernard Lyon 1 Institut de Science Financière et d’Assurances Introduction aux méthodes de lissage par vraisemblance locale Applications à l’assurance dépendance Julien Tomas Institut de Science Financière et d’Assurances Laboratoire de recherche de Sciences Actuarielle et Financière 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles Slide 1/138

Post on 21-Oct-2014

29.218 views

Category:

Documents


2 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Université Claude Bernard Lyon 1Institut de Science Financière et d’Assurances

Introduction aux méthodes de lissagepar vraisemblance localeApplications à l’assurance dépendance

Julien TomasInstitut de Science Financière et d’AssurancesLaboratoire de recherche de Sciences Actuarielle et Financière

30/11/2012 - ISFA - Modèles de durée - Applications actuariellesSlide 1/138

Page 2: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 2/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 3: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 3/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 4: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

L’assurance dépendance

• Mix de prestations sociales et santé fournit sur une basejournalière, à domicile ou dans une institution, à des individussouffrant d’une perte de mobilité ou d’autonomie dans leur activitéjournalière.

• Peut être individuelle ou collective.• Garantit le paiement d’une indemnité, sous la forme d’un bénéfice

numéraire qui peut être proportionnel au degré de dépendance.• Voir Kessler (2008) et Courbage et Roudaut (2011) pour des

études sur le marché français de l’assurance dépendance.

Slide 4/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 5: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

L’assurance dépendance

• Niveaux des primes et des réserves ainsi que la gestion d’uneportefeuille d’assurance dépendance sont très sensibles au choix dela table de mortalité adoptée.

• Construction d’une table est un exercice difficile :• petits portefeuilles et taux de mortalité très volatiles,• lien fort entre l’âge de survenance et la pathologie.

Nécessite de construire des tables de mortalité en fonction de l’âgede survenance et l’ancienneté,

• les taux de mortalité diminuent très rapidement avec l’ancienneté.• En pratique, on utilise des méthodes qui s’appuient lourdement sur

les opinions d’expert.• Le but : avoir des méthodes plus rigoureuses

Slide 5/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 6: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

L’assurance dépendanceAnalyse de la mortalité

Analyser les variations de la mortalité en fonction de• l’âge de survenance de la pathologie v ,• et de l’ancienneté u (mois).

On a donc 2 variables temporelles, mais elles n’ont pas le même statut :• v représente l’hétérogénéité,• u est la variable de durée.

Slide 6/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 7: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 7/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 8: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Notions démographiques et notationDurée de vie restante

• Soit Tu(v) la durée de vie restante d’un individu dont lapathologie survient à l’âge v et dont l’ancienneté est u, i.e.

P[Tu(v) > ξ] = P[T (v) > u + ξ|T (v) > u] = ξpu(v).

• Donc, un individu dont la pathologie survient à l’âge v etd’ancienneté u décèdera à l’ancienneté u + Tu(v).

• La fdc de Tu(v) est

ξqu(v) = 1− ξpu(v) = P[Tu(v) < ξ] = P[T (v) ≤ u + ξ|T (v) > u].

Slide 8/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 9: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Notions démographiques et notationProbabilité de survie / décès dans le mois

• La probabilité de décès dans le mois lorsque la pathologie survientà l’âge v et dont l’ancienneté est u est définie par

qu(v) = P[Tu(v) ≤ 1] = P[T (v) ≤ u + 1|T (v) > u].

• La probabilité de survie dans le mois lorsque la pathologie survientà l’âge v et dont l’ancienneté est u est

pu(v) = P[Tu(v) > 1] = P[T (v) > u + 1|T (v) > u].

• On a donc pour un entier k,

kpu(v) = P[Tu(v) > k] = pu(v)× pu+1(v)× . . .× pu+k−1(v).

Slide 9/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 10: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Notions démographiques et notationNombre espéré de survivants

• Soit Lu,v le nombre d’individus vivant lorsque la pathologie estsurvenue à l’âge v et dont l’ancienneté est u en commençant par`0(v) individus touché par la pathologie. Le nombre espéréd’individus atteignant l’ancienneté u à partir de `0(v) individus est

E[Lu,v ] = `u,v = `0(v)× up0(v).

• La fonction (u, v) 7→ `u,v est assumée être continue etdifférenciable.

• Du,v = Lu,v − Lu+1,v est le nombre de décès à l’ancienneté u etlorsque la pathologie est survenue à l’âge v , et

E[Du,v ] = du,v = `u,v − `u+1,v = `u,v (1− pu(v)) = `u,vqu(v).

Slide 10/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 11: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Notions démographiques et notationExposition au risque

• L’exposition au risque mesure le temps durant lequel les individussont exposés au risque (de décès) après survenance de lapathologie. Il s’agit de la durée totale vécue par ces individus aprèsla survenance de la maladie.

• La durée espérée vécue par les individus entre l’ancienneté u etu + 1 est donnée par

ERu,v =

∫ 1

ξ=0Lu+ξ,v dξ et E[ERu,v ] =

∫ 1

ξ=0`u+ξ,v dξ.

• le taux de mortalité à l’ancienneté u lorsque la pathologie survientà l’âge v est

mu(v) =du,v

E[ERu,v ].

Slide 11/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 12: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Notions démographiques et notationForces de mortalité

• La force de mortalité à l’ancienneté u + τ lorsque la pathologiesurvient à l’âge v , notée ϕu+τ (v) est définie par

ϕu+τ (v) = lim∆τ→0+

P [τ < Tu(v) ≤ τ + ∆τ |Tu(v) > τ ]

∆τ

=1

τpu(v)

∂ττqu(v).

• Une expansion de Taylor au premier ordre donne

∆τqu(v) =ϕu(v)∆τ + o(∆τ)⇒ ∆τqu(v) ≈ ϕu(v)∆τ

∆τpu(v) = 1− ϕu(v)∆τ + o(∆τ)⇒ ∆τpu(v) ≈ 1− ϕu(v)∆τ

Pour ∆τ suffisamment petit.

Slide 12/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 13: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Notions démographiques et notationQuelques formules utiles...

• On remarque que ∂∂τ ln τpu(v) = −ϕu+τ (v). On obtient, avec la

condition 0pu(v) = 1,

τpu(v) = exp(−∫ τ

ξ=0ϕu+ξ(v) dξ

).

• La fonction de densité de Tu(v) est ∂∂τ τqu(v) = τpu(v)ϕu+τ (v)

et en résolvant cette équation différentielle avec 0qu(v) = 0, onobtient

τqu(v) = exp(−∫ τ

ξ=0ξpu(v)ϕu+ξ(v) dξ

).

Slide 13/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 14: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Notions démographiques et notationEspérance de vie

• La durée de vie restante moyenne d’un individu dont la pathologieest apparue à l’âge v et d’ancienneté u est notée eu(v).

• Concrètement on s’attend à ce qu’un individu d’ancienneté u etdont la pathologie survient à l’âge v décède à l’anciennetéu + eu(v).

• On exprime eu(v) par

eu(v) =E[Tu(v)] =

∫ξ≥0

ξ dξqu(v) =

∫ξ≥0

ξpu(v) dξ

=1`u,v

∫ξ≥0

`u+ξ,v dξ.

Slide 14/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 15: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 15/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 16: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Hypothèse de mortalité constante par morceauxHypothèse

• Dorénavant on fait l’hypothèse de constance par morceaux desforces de mortalité, i.e.

ϕu+ξ(v + ζ) = ϕu(v) pour 0 ≤ ξ < 1 et 0 ≤ ζ < 1 et u, v entiers

• Sous cette hypothèse,

ϕu(v) = − ln pu(v)

E[ERu,v ] =

∫ 1

ξ=0`u+ξ,v dξ = `u,v

∫ 1

ξ=0ξpu(v) dξ

= `u,v

∫ 1

ξ=0(pu(v))ξ dξ =

−`u,v qu(v)

ln(1− qu(v))

mu(v) =1

E[ERu,v ]

∫ 1

ξ=0`u+ξ,v ϕu+ξ(v) dξ = ϕu(v).

Slide 16/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 17: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Hypothèse de mortalité constante par morceauxModélisation

• A chacune des observations, on associe une indicatrice δi indiquantsi l’individu est décédé ou non,

δi =

1 si l’individu i est décédé,0 sinon,

pour i = 1, . . . , Lu,v .• On définie τi , le temps durant lequel l’individu a été observé (c’est

l’exposition au risque).• On suppose avoir à disposition pour chacun des Lu,v individus les

observations (δi ,τi).

Slide 17/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 18: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Hypothèse de mortalité constante par morceauxContribution de l’individu i à la vraisemblance

• La contribution du ième individu à la vraisemblance s’écrit,• si l’individu survie à la (u + 1)ème ancienneté (δi = 0, τi = 1) alors :

pu(v) = exp(−ϕu(v));

• si l’individu décède avant la (u + 1)ème ancienneté (δi = 1, τi < 1)alors :

τipu(v) ϕu+τi (v) = exp(−τiϕu(v))ϕu(v).

• La contribution de l’individu i à la vraisemblance vaut donc

exp(−τiϕu(v))(ϕu(v))δi .

Slide 18/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 19: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Hypothèse de mortalité constante par morceauxEcriture de la vraisemblance

• On définitLu,v∑i=1

τi = ERu,v etLu,v∑i=1

δi = Du,v .

• Sous ces hypothèses, la vraisemblance devient

L(ϕu(v)) =

Lu,v∏i=1

exp(−τiϕu(v))(ϕu(v))δi

= exp(−ERu,v ϕu(v))(ϕu(v))Du,v ,

• et la log-vraisemblance associée est

logL(ϕu(v)) = −ERu,v ϕu(v) + Du,v logϕu(v).

Slide 19/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 20: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Hypothèse de mortalité constante par morceauxLien avec la loi de Poisson

• En Maximisant la log-vraisemblance logL(ϕu(v)) on obtientl’estimateur du maximum de vraisemblance de ϕu(v), à savoir

ϕu(v) = Du,v/ERu,v

qui coïncide avec le taux de mortalité mu(v).• La vraisemblance L(ϕu(v)) est proportionnelle à la vraisemblance

de Poisson basée sur Du,v ∼ Poisson(ERu,v ϕu(v)).• Il est équivalent de travailler avec la vraie vraisemblance ou à

partir d’une vraisemblance de Poisson.• Donc sous l’hypothèse de la mortalité constante par morceaux

entre des valeurs non-entières u and v , on considère

Du,v ∼ Poisson(ERu,v ϕu(v)), (1)

pour pouvoir utiliser le cadre de travail des modèles linéairesgénéralisés (GLMs).

Slide 20/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 21: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 21/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 22: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Présentation des données

Analyse les variations de la mortalité en fonction de l’âge de survenancede la pathologie v et de l’ancienneté u (mois). On observe :

• la plage d’âge de survenance : v ∈ [70, 90] ans pour la survenance,• la durée de dépendance (l’ancienneté) : u ∈ [0, 119] mois,• sur la période : 01/01/1998 à 31/12/2010.

Les données on été agrégées selon l’âge de survenance et l’ancienneté.Les pathologies sont composées entre autres de démences, maladiesneurologiques et de cancers en phase terminale. Les données sontcomposées de 2/3 de femmes et 1/3 d’hommes.

Slide 22/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 23: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Présentation des données (suite)

(a) Nombre de décès,Du,v

(b) Exposition au risque,ERu,v

(c) Forces de mortalité,ϕu(v)

Figure: Statistiques observéesSlide 23/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 24: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Présentation des données (suite)Notation

Par la suite, on réécrit les données en un vecteur colonne• Une matrice A de dimension m × n est réécrite en un vecteur

colonne mn × 1 en empilant les colonnes de la matrice A l’une surl’autre :

vec(A) = (a1,1, . . . , am,1, a1,2, . . . , am,2, . . . , a1,n, . . . , am,n)T .

• On dispose de n quintuplets d’observations(ui , vi ,ERi ,Di , ϕi )ni=1, ou n = 2520.

Pour simplifier, le point (ui , vi ) est noté xi .

Slide 24/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 25: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 25/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 26: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Prémisses sur les modèles de lissageIrrégularités dans la progression des taux observées

• Ces estimations brutes, sur lesquelles se basent les tables demortalité, peuvent être considérées comme un échantillonprovenant d’une population plus importante et sont, parconséquent, soumises à des fluctuations aléatoires.

• Toutefois, l’actuaire souhaite la plupart du temps lisser cesquantités afin de mettre en avant les caractéristiques de lamortalité du groupe qu’il pense être régulières.

• Ces irrégularités dans la progression des forces de mortalitépourraient être réduites en augmentant le nombre Lu,v depersonnes observées.

• Une méthode plus pratique est de graduer les données pouréliminer partiellement ces erreurs aléatoires.

Slide 26/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 27: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Prémisses sur les modèles de lissageApproche paramétrique VS non-paramétrique

Plusieurs approches de graduation peuvent être adoptée.• Approches paramétriques, impliquant l’utilisation de loi de

mortalité• Approches non-paramétriques

La relation entre les forces de mortalité, l’ancienneté et l’âge à lasurvenance peut être modélisée par

ϕi = ψ(xi ) + εi , i = 1, . . . , n,

où ψ est une fonction de régression inconnue et εi un terme d’erreurreprésentant les erreurs aléatoires dans les observations ou variationsqui ne sont pas incluses dans les xi = (ui , vi ).Le but de toute régression est de fournir une analyse raisonnable de lafonction de réponse inconnue ψ.

Slide 27/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 28: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Prémisses sur les modèles de lissageApproche paramétrique VS non-paramétrique (suite)

• Les approches paramétriques supposent que la fonction de réponseψ à une forme pré-spécifiée (par exemple, loi de Thiele, loi dePerks, modèles de classe Gompertz-Makeham, etc...). La relationest alors pleinement décrite par un nombre fini de paramètres.

• Un modèle paramétrique pré-sélectionné peut être trop restrictifpour modéliser les caractéristiques de la mortalité.

• La modélisation non-paramétrique offre un outil flexible dansl’analyse de la relation. Comme les méthodes paramétriques, ellessont susceptibles de donner des estimations biaisées, mais de tellessorte qu’il est possible d’équilibrer une augmentation du biais avecune diminution de la variation d’échantillonnage.

Slide 28/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 29: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Prémisses sur les modèles de lissageApproche paramétrique VS non-paramétrique (suite)

La question de quelle approche devrait être adoptée dans l’analyse dedonnées était l’une des raisons d’un discussion houleuse entre Pearsonet Fisher dans les années 1920.

• Fisher soulignant que l’approche non-paramétrique estgénéralement peu efficace alors que Pearson était plus préoccupépar la question de spécification.

• Les deux points de vue sont intéressants en eux-mêmes :• Pearson a fait remarquer que le prix que nous devons payer pour

une modélisation purement paramétrique est la possibilité d’uneerreur de spécification lourde entraînant un biais de modèle élevé.

• Fisher était préoccupé par la considération de modèles sansparamètres qui peuvent résulter dans des estimations plus variablessurtout pour des échantillons de taille réduite.

Slide 29/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 30: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Prémisses sur les modèles de lissageNatura non agit per saltum : L’idée basique du lissage

• Chaque force de mortalité est lié étroitement à ses voisines.• Les observations ϕj dans le voisinage de ϕi contiennent de

l’information à propos de la valeur de ψ à xi = (ui , vi ).• Les forces de la nature opèrent graduellement et leurs effets

deviennent visibles de façon continue et non par des sautsbrusques.

• Cela implique que les observations ϕj , dans un rayon d’un point xi ,peuvent être utilisées pour augmenter l’information que nous avonsà xi et une estimation améliorée de ϕi peut être obtenue en lissantles estimations individuelles ϕj .

Slide 30/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 31: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Prémisses sur les modèles de lissageNatura non agit per saltum : L’idée basique du lissage (suite)

• Cette procédure d’approximation de la fonction de réponse ψ estcommunément appelée lissage.

• Ainsi la mortalité n’est pas résumé en a petit nombre deparamètres mais décrite par les n forces de mortalité.

• Dans la littérature actuarielle, ce procédé est connu sous le termede graduation. Les petites collines et vallées des données brutessont graduées jusqu’à devenir lisses, comme lorsque l’on construitune route sur un terrain accidenté.

Slide 31/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 32: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Prémisses sur les modèles de lissageDéveloppement historique

• Les méthodes de lissage sont des extensions directes des modèlesparamétriques, si naturelles qu’elles se sont développées à despériodes et dans des pays différents à la fin du 18ème siècle. Laplupart sont apparues dans des études actuarielles. Les taux demortalité et de maladies étaient lissés selon une fonction de l’âge.

• Premières références : Johann Lambert en 1765, John Finlaison en1823, Wesley Woolhouse en 1866, De Forest en 1873, ThomasSprague en 1887, John Spencer en 1904, Robert Henderson en1916 and Edmund Whittaker en 1923.

• Cependant les régressions locales ont reçu que peu d’attentionjusqu’à la fin des années 1970. Voir Seal (1982), Haberman (1996)et Loader (1999) pour une revue historique.

Slide 32/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 33: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Prémisses sur les modèles de lissageDéveloppement historique (suite)

• Les méthodes de régression locale sont originaires des méthodes ànoyaux introduites par Rosenblatt (1956) et Parzen (1962).

• La méthode à noyaux est un cas spécial de la régression locale oùla famille paramétrique est une fonction constante.

• Applications actuarielles des méthodes à noyaux : Copas etHaberman (1983) et Gavin et collab. (1993).

• Les régressions locales ont connu un regain d’intérêt après lesdéveloppements de Stone (1977) et Stone (1982) et la procédureloess de Cleveland (1979).

• Tibshirani et Hastie (1987) ont introduit la procédure devraisemblance locale, et ont étendu le domaine des méthodes delissage à d’autres distributions que gaussienne. Extensions : Loader(1996), Fan et collab. (1998) et Loader (1999).

Slide 33/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 34: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 34/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 35: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Les modèles linéaires généralisés

• Durant les trente dernières années, l’utilisation des GLMs (Nelderet Wedderburn (1972)) a reçu beaucoup d’attention depuis lesapplications de McCullagh et Nelder (1989).

• Les GLMs sont idéalement adaptés à l’analyse de donnéesnon-normales que l’on rencontre typiquement lorsque l’ons’intéresse à des sujets relatifs à l’assurance.

• La modélisation diffère des modèles linéaires gaussiens par deuximportants aspects :

• La distribution de la variable dépendante est choisie dans la familleexponentielle et n’est donc pas spécifiquement Normale mais peutêtre explicitement non-Normale.

• Une transformation de l’espérance de la variable dépendante estlinéairement liée aux variables explicatives.

Slide 35/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 36: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Les modèles linéaires généralisésCaractéristiques

Les modèles linéaires généralisés possèdent 3 caractéristiques :• Un élément aléatoire, qui établit que les observations sont des

variables aléatoires indépendantes Yi , i = 1, . . . , n avec une densitéappartenant à la famille exponentielle linéaire.

• Un élément systématique qui attribut à chaque observation unprédicteur linéaire ηi .

• Un troisième élément qui connecte les deux premiers éléments : µil’espérance de Yi est lié au prédicteur linéaire ηi par une fonctionde lien.

Slide 36/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 37: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Les modèles linéaires généralisésLa famille exponentielle linéaire

• La technique des GLMs s’applique à toutes distributionsappartenant à la famille exponentielle, i.e. lorsque la variabledépendante Yi à une loi de probabilité de la forme

f (yi |θi , φ) = expyiθi − b(θi )

a(φ)+ c(yi , φ)

,

pour des fonctions a(), b() and c() spécifiques. Les fonctions aand c sont telles que a(φ) = φ and c = c(yi , φ).θi est le paramètre canonique (ou paramètre naturel) et φ est leparamètre de dispersion.

Slide 37/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 38: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Les modèles linéaires généralisésLa famille exponentielle linéaire (suite)

Exemple d’une loi de Poisson :.

Distribution de yi θi a(φ) b(θi) c(yi , φ) E[Yi ] V[µi ] =V[Yi ]a(φ)

Poisson(µi) ln(µi) 1 exp(θi) − log yi ! µi µi

Table: Loi de Poisson appartenant à la famille exponentielle.

L’espérance et la variance sont calculées comme la première et secondedérivées de b(θi ) :

E[Yi ] =∂

∂θb(θi ) =

∂b∂µi

∂µi∂θi

= µi

V[Yi ] = a(φ)∂2

∂θ2ib(θi ) = a(φ)

(∂2b∂µ2i

(∂µi∂θi

)2+∂b∂µi

∂2µi∂θ2i

)= a(φ)µi .

Slide 38/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 39: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Les modèles linéaires généralisésQu’est-ce que veut dire linéaire dans GLMs

• "Linéaire" signifie que les variables explicatives sont combinéeslinéairement pour modéliser l’espérance.

• Si x1, x2, . . . , xp sont des variables explicatives alors descombinaisons linéaires de la forme β0 + β1 x1 + . . .+ βp xp serventcomme des prédicteurs linéaires de l’espérance de la variabledépendante.

• La linéarité dans les GLMs se réfère seulement à la linéarité dansles coefficients βj , non dans les variables explicatives.

• Par exemple,

β0 + β1 x1 + β2 x21 and β0 + β1 x1 + β2 x2 + β3 x1 x3

sont "linéaires" au sens définie par les GLMs, mais

β0 + β1 x1 + exp(β2 x2)

ne l’est pas.Slide 39/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 40: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Les modèles linéaires généralisésFonction de lien

• µi = E [Yi |xi ], i = 1, 2, . . . , n, est liée au prédicteur linéaire ηi parune fonction de lien g() monotone et différenciable

g(µi ) = ηi ⇔ µi = g−1(ηi )

• La fonction de lien est dite canonique lorsque θi = ηi , où θi est leparamètre canonique.

• la fonction de lien canonique assure donc que g(µi ) = θi etg−1 = b′() (puisque µi = b′(θi )).

Lien canoniquePoisson ηi = log(µi)

Table: Lien canonique pour la loi de Poisson

Slide 40/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 41: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 41/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 42: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Des GLMs à la vraisemblance locale• L’approche GLM fait l’hypothèse que θi a une forme paramétrique

spécifique, e.g.

θi =β0 + β1ui + β2vi + β3u2i + β4ui vi + β5v2i≡ xT β,

où x = (1, ui , vi , u2i , uivi , v2i )T et β = (β0, . . . , β5)T .• L’approche de la vraisemblance locale ne fait plus l’hypothèse queθi a une forme paramétrique rigide.

• On suppose que θi est une fonction lisse non-spécifiée ψ(xi ) qui a(p + 1) dérivées continues au point xi .

• L’idée est : ajuster un modèle polynomial à l’intérieur d’une fenêtred’observation.

⇒ Penser au développement de Taylor.

Slide 42/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 43: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Des GLMs à la vraisemblance localeExpansion de Taylor

• Pour xj dans le voisinage de xi , on va approximer ψ(xj) via uneexpansion de Taylor par un polynôme de degré p, e.g. uneapproximation quadratique :

ψ(xj) = ψ(uj , vj)

≈ ψ(ui , vi ) +∂ψ(ui , vi )

∂ui(uj − ui ) +

∂ψ(ui , vi )

∂vi(vj − vi )

+12∂2ψ(ui , vi )

∂u2i(uj − ui )

2 +∂ψ(ui , vi )

∂vi∂ui(uj − ui )(vj − vi )

+12∂2ψ(ui , vi )

∂v2i(vj − vi )

2 ≡ xT β,

où x =(1, uj − ui , vj − vi , (uj − ui )

2, (uj − ui )(vj − vi ), (vj − vi )2)T

et β =(ψ(ui , vi ),

∂ψ(ui ,vi )∂ui

, ∂ψ(ui ,vi )∂vi

, 12∂2ψ(ui ,vi )

∂u2i

, ∂ψ(ui ,vi )∂vi∂ui

12∂2ψ(ui ,vi )

∂v2i

).

Slide 43/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 44: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Des GLMs à la vraisemblance localeEcriture de la vraisemblance

• La log vraisemblance d’un GLM s’écrit :

l(β; y , φ) =n∑

i=1ln f (yi |θi , φ) =

n∑i=1

yi θi − b(θi )

a(φ)+

n∑i=1

c(yi , φ).

• La fonction de log vraisemblance locale à xi s’écrit :

l(β; y ,wj(xi ), φ) =n∑

j=1wj ln f (yj |θj , φ) =

n∑j=1

wjyj θj − b(θj)

a(φ)+

n∑j=1

wjc(yj , φ).

• Maximiser la vraisemblance locale par rapport à β donne le vecteurdes estimateurs β.

• Dans le cas d’une approximation quadratique β = (β0, . . . , β5), etl’estimateur de ψ(xi ) est donné par : ψ(xi ) = β0.

• Ainsi le rôle des GLMs est celui d’un modèle en arrière-plan qui estajusté localement.

Slide 44/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 45: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Des GLMs à la vraisemblance localeLa fonction de poids

La localisation s’effectue via la fonction depoids :

wj =

W (ρ(xi , xj)/h) if ρ(xi , xj)/h ≤ 1,0 otherwise.

W (.) est une fonction de poids non né-gative qui dépend de la distance ρ(xi , xj),e.g. la distance Euclidienne :

ρ(xi , xj) =√

(uj − ui)2 + (vj − vi)2.

Fonction de poids W (a)

Uniforme 12 I(|a| ≤ 1)

Triangulaire (1− |u|)I(|a| ≤ 1)Epanechnikov 3

4 (1− a2)I(|a| ≤ 1)Quartic (Biweight) 15

16 (1− a2)2I(|a| ≤ 1)Triweight 35

32 (1− a2)3I(|a| ≤ 1)

Tricube (1−∣∣u3∣∣)3I(|a| ≤ 1)

Gaussienne 1√2π exp( 12a2)

avec a = ρ(xi , xj)/h

Slide 45/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 46: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Des GLMs à la vraisemblance localeLa fonction de poids (suite)

(a) Epanechnikov (b) Triangulaire (c) Triweight

Figure: Système de pondération pour des fonctions de poids avec h = 7

Slide 46/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 47: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 47/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 48: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Illustration de l’idée généraleComment estimer ψ ? Par un ajustement local...

Slide 48/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 49: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Illustration de l’idée généraleComment estimer ψ ? Par un ajustement local...

Slide 49/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 50: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Illustration de l’idée généraleComment estimer ψ ? Par un ajustement local...

Slide 50/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 51: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Illustration de l’idée généraleComment estimer ψ ? Par un ajustement local...

Slide 51/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 52: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Illustration de l’idée généraleComment estimer ψ ? Par un ajustement local...

Slide 52/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 53: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Illustration de l’idée généraleComment estimer ψ ? Par un ajustement local...

Slide 53/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 54: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Illustration de l’idée généraleComment estimer ψ ? Par un ajustement local...

Slide 54/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 55: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Illustration de l’idée généraleComment estimer ψ ? Par un ajustement local...

Slide 55/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 56: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Illustration de l’idée généraleComparaison de l’ajustement avec différents voisinages

(a) h = 3 (29 obs.) (b) h = 5 (81 obs.) (c) h = 10 (317 obs.)

Figure: Comparaison de l’ajustement avec différents voisinagesSlide 56/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 57: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Illustration de l’idée généraleLe but

• Trouver les paramètres de lissage :• la fenêtre d’observation : h• le degré d’approximation : p• la fonction de poids : W (.)

• Obtenir une surface aussi lisse que possible sans altérer la forme dela dépendance de la réponse sur les variables explicatives.

• On veut ψ avec un biais faible et une variance faible.

Slide 57/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 58: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 58/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 59: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Equations de vraisemblanceParallèle entre GLM et vraisemblance locale

GLMs Vraisemblance localeLes paramètres β sont estimés par maximum de vraisemblance.

• La log vraisemblance pour les obser-vations yi , i = 1, . . . , n, s’écrit :

l(βj ; yi) =

n∑i=1

yi θi − b(θi)

a(φ) +

n∑i=1

c(yi , φ).

• La fonction de log vraisemblance lo-cale à xi s’écrit :

l(βv ; y ,wj(xi)) =

n∑j=1

wjyj θj − b(θj)

a(φ) +

n∑j=1

wjc(yj , φ).

On résout les équations normales :

n∑i=1

∂βjl(β0, . . . , βp; yi) = 0, j = 0, . . . , p.

n∑j=1

wj∂

∂βvl(β0, . . . , βp; yj) = 0, v = 1 . . . , p.

Slide 59/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 60: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Equations de vraisemblanceParallèle entre GLM et vraisemblance locale (suite)

GLMs Vraisemblance locale• La dérivée de l par rapport à βj est :

∂l∂βj

=∂l∂θi

∂θi

∂µi

∂µi

∂ηi

∂ηi

∂βj,

où∂l∂θi

=yi − b′(θi)

a(φ) =yi − µi

a(φ) ,

∂µi

∂θi= b′′(θi) =

V[Yi ]

a(φ) ,

∂ηi

∂β0= 1, ∂ηi

∂β1= ui ,

∂ηi

∂β2= vi ,

∂ηi

∂β3= u2

i ,

∂ηi

∂β4= ui vj ,

∂ηi

∂β5= v 2

i .

• De même,

∂l∂βv

=∂l∂θj

∂θj

∂µj

∂µj

∂ηj

∂ηj

∂βv,

où∂l∂θj

=yj − µj

a(φ) ,

∂µj

∂θj= b′′(θj) =

V[Yj ]

a(φ) ,

∂ηj

∂β0= 1, ∂ηj

∂β1= uj − ui ,

∂ηj

∂β2= vj − vi ,

∂ηj

∂β3= (uj − ui)

2,

∂ηj

∂β4= (uj − ui)(vj − vi),

∂ηj

∂β5= (vj − vi)

2.

Slide 60/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 61: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Equations de vraisemblanceParallèle entre GLM et vraisemblance locale (suite)

GLMs Vraisemblance localeOn obtient les équations de vraisemblance suivantes :

n∑i=1

∂l∂β0

=

n∑i=1

(yi − µi)

V[Yi ]

∂µi

∂ηi= 0

...n∑

i=1

∂l∂β5

=

n∑i=1

(yi − µi)

V[Yi ]

∂µi

∂ηiv 2

i = 0.

n∑j=1

∂l∂β0

=

n∑j=1

wj(yj − µj)

V[Yj ]

∂µj

∂ηj= 0

...n∑

j=1

∂l∂β5

=

n∑j=1

wj(yj − µj)

V[Yj ]

∂µj

∂ηj(vj − vi)

2 = 0.

Slide 61/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 62: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Equations de vraisemblanceParallèle entre GLM et vraisemblance locale (suite)

GLMs Vraisemblance localeEn notation matricielle :

XT V (y − µ) = 0, où

X =

1 u1 v1 u2

1 u1v1 v 21

1 u2 v2 u22 u2v2 v 2

2...

......

......

...1 un vn u2

n unvn v 2n

,et V est une matrice diagonale avec

1V[Yi ]

∂µi∂ηi

comme ième éléments sur sadiagonale.

XT W V (y − µ) = 0, où

X =

1 u1 − ui v1 − vi . . . (v1 − vi)

2

1 u2 − ui v2 − vi . . . (v2 − vi)2

......

......

...1 un − ui vn − vi . . . (vn − vi)

2

,et W est une matrice diagonale avec wjcomme jème éléments sur sa diagonale.

La fonction de lien η = g(µ) détermine ∂µi/∂ηi = ∂g−1(ηi)/∂ηi .Ces équations ne possèdent en général pas de solutions explicites et doiventêtre résolues numériquement. On utilise une modification de l’algorithmede Newton-Raphson qui porte le nom de méthode de scoring de Fisher.

Slide 62/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 63: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 63/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 64: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Résolution des équations de vraisemblanceParallèle entre GLM et vraisemblance locale (suite)

Dans le cadre d’un GLM,• chaque étape de l’algorithme constitue un ajustement de type

moindres carrées pondérés,• c’est une généralisation des MCO qui prend en compte la

non-constance de la variance de Yi .• les observations recueillies en des points où la variabilité est plus

faible sont affectées d’un poids plus important dans ladétermination des paramètres.

• à chaque itération les poids sont remis à jours.• on emploie le terme de moindres carrés itérativement re-pondérés

ou IRWLS.Dans le cadre de la vraisemblance locale, on emploiera une versionlocalisée de l’IRWLS.

Slide 64/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 65: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Résolution des équations de vraisemblanceParallèle entre GLM et vraisemblance locale (suite)

• L’algorithme de Newton-Raphson utilise la matrice d’informationde Fisher.

• Cette matrice contient l’information concernant la courbure de lafonction de log vraisemblance au point d’estimation.

• Plus grande est la courbure, plus l’information apportée au sujetdes paramètres du modèles est importante.

• (En effet les écarts-types des estimateurs sont les racines carréesdes éléments diagonaux de l’inverse de la matrice d’information deFisher. Plus la courbure de la fonction de vraisemblance estimportante, plus les écarts-types sont petits.)

• Pour un GLM, la dérivée partielle seconde est :

∂2l∂βjβk

=∂2l∂η2i

xijxik .

Slide 65/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 66: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Résolution des équations de vraisemblanceParallèle entre GLM et vraisemblance locale (suite)

• En utilisant la règle de dérivation en chaine, on obtient :

∂2l∂η2i

=∂

∂ηi

(∂l∂θi

∂θi∂ηi

)=

∂ηi

(∂2l

∂θi∂ηi

)+

∂l∂θi

∂2θi∂η2i

=∂2l∂θ2i

(∂θi∂ηi

)2+

∂l∂θi

∂2θi∂η2i

• Comme ∂l/∂θi = (yi − µi )/a(φ), sa dérivée est ∂2l/∂θ2i =−1/a(φ)∂µi/∂θi . De plus ∂µi/∂θi = b′′(θi ), on obtient

∂2l∂η2i

=1

a(φ)

[−b′′(θi )

(∂θi∂µi

)2 (∂µi∂ηi

)2+ (yi − µi )

∂2θi∂η2i

]

=1

a(φ)

[− 1b′′(θi )

(∂µi∂ηi

)2+ (yi − µi )

∂2θi∂η2i

].

• SI θ ≡ η, alors ∂2θi/∂η2i = 0.

Slide 66/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 67: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Résolution des équations de vraisemblanceParallèle entre GLM et vraisemblance locale (suite)

• Dans la méthode de scoring de Fisher, l’actuelle matrice hessiennedans l’itération de Newton-Raphson est remplacé par sa valeurespérée, qui est la négative de la matrice d’information de FisherI. Dans ce cas là aussi le second terme disparait. On obtient

Ijk =E[− ∂2l∂βjβk

]=

n∑i=1

1b′′(θi )

(∂µi∂ηi

)2xijxik

=n∑

i=1

ωiixijxikφ

=1φ

(XTΩX)jk

où Ω est un matrice diagonale avec ωii = 1b′′(θi )

(∂µi∂ηi

)2qui dépend

de µi . Car ηi = g(µi ), on a ∂ηi/∂µi = g ′(µi ).• Dans le cadre de la vraisemblance locale, on obtient

Ivk =1φ

(XT WΩX)vk

Slide 67/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 68: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Résolution des équations de vraisemblanceParallèle entre GLM et vraisemblance locale (suite)

GLMs Vraisemblance locale

La liste d’équations normale∂l/∂βj = 0, j = 0, . . . , 5,peut s’écrire comme :

∂l∂βj

=

n∑i=1

ωii xij(yi − µi)

φg ′(µi)

ou ∂l∂β

=1φ

XTΩu,

avec ui = (yi − µi)g ′(µi).

∂l/∂βv = 0, v = 0, . . . , 5, et

∂l∂β

=1φ

XT WΩu,

avec uj = (yj − µj)g ′(µj).

On trouve alors une estimation améliorée b∗ de β à partir d’un précédentb comme suit :

b∗ = b + I−1 ∂l∂β⇔ I(b∗ − b) = ∂l

∂β.

Slide 68/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 69: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Résolution des équations de vraisemblanceParallèle entre GLM et vraisemblance locale (suite)

GLMs Vraisemblance localeSoit η et µ, les vecteurs des prédicteurs linéaires et des réponses estiméeslorsque le paramètre est égale à b, donc

η = Xb et µ = g−1(η),

alors

Ib =1φ

XTΩXb =1φ

XTΩη.

alors

Ib =1φ

XT WΩη.

On peut réécrire les équations itératives de Fisher comme suit :

Ib∗ = 1φ

XTΩXz,

où zi = ηi + (yi − µi)g ′(µi).

Ib∗ = 1φ

XT WΩXz,

où zj = ηj + (yj − µj)g ′(µj).

Les éléments zi sont appelés pseudo réponses.

Slide 69/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 70: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Résolution des équations de vraisemblanceParallèle entre GLM et vraisemblance locale (suite)

GLMs Vraisemblance localeEnfin, on trouve une estimation du maximum de vraisemblance deβ par la procédure itérative suivante :

On répèteb∗ :=

(XTΩX

)−1XTΩz ;

On répèteb∗ :=

(XT WΩX

)−1XT WΩz ;

en utilisant b∗, on révise les pseudo poids Ω,ainsi que les pseudo réponses zjusqu’à convergence.

• Ainsi dans le cadre de la vraisemblance locale, l’estimation de β estaccomplie par la méthode du score de Fisher dans chaque voisinage, en allantdans l’ordre où i va de 1 à n.

Slide 70/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 71: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 71/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 72: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Implémentation de l’algorithme sous RR Development Core Team (2012)

• On considère le cas d’un Poisson GLM pour estimer les forces demortalité comme dans le modèle (1) : Di ∼ Poisson(ERi ϕi ).

• Lorsque l’on modèle des données d’expérience provenant del’assurance vie, on souhaite généralement prendre en comptel’exposition. Le prédicteur linéaire ηj devient

ηj = log(E[Y |X = xj ]) = log(µj) = log(ERj ϕj) = log(ERj)+log(ϕj).

• Le terme ERj est appelé l’offset et peut-être facilement incorporédans la régression.

• C’est un élément du prédicteur linéaire dont son coefficient estcontraint à 1.

Slide 72/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 73: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Implémentation de l’algorithme sous R (suite)R Development Core Team (2012)

• Pour cet exemple, on reprend lesample utilisé lors de lal’illustration de l’idée générale.

• On va estimer ϕi pour i = 221,i.e. ϕ221 = 0.01983471.

Slide 73/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 74: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Implémentation de l’algorithme sous R (suite)R Development Core Team (2012)

• Pour cet exemple, on reprend lesample utilisé lors de lal’illustration de l’idée générale.

• On va estimer ϕi pour i = 221,i.e. ϕ221 = 0.01983471.

• On choisit une fenêtred’observation dont le rayonh = 7.

Slide 74/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 75: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Implémentation de l’algorithme sous R (suite)R Development Core Team (2012)

• Pour cet exemple, on reprend lesample utilisé lors de lal’illustration de l’idée générale.

• On va estimer ϕi pour i = 221,i.e. ϕ221 = 0.01983471.

• On choisit une fenêtred’observation dont le rayonh = 7.

• On applique une fonction depoids Epanechnikov, i.e.W (a) = 3

4 (1− a2)I(|a| ≤ 1)pour a = ρ(xi , xj)/h, où ρ(xi , xj)est la distance euclidienne.

Slide 75/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 76: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Implémentation de l’algorithme sous R (suite)R Development Core Team (2012)

• Fonction qui donne la matrice du design, X , avec un ajustement quadratique :1 Xmat = function(u_j, v_j, u_i, v_i) 2 MAT <- matrix(1, length(u_j) * length(v_j), 6)3 u_j.vec <- rep(u_j, times = length(v_j))4 v_j.vec <- rep(v_j, each = length(u_j))5 MAT[, 2] <- u_j.vec - u_i6 MAT[, 3] <- v_j.vec - v_i7 MAT[, 4] <- (u_j.vec - u_i) * (v_j.vec - v_i)8 MAT[, 5] <- (u_j.vec - u_i)^29 MAT[, 6] <- (v_j.vec - v_i)^2

10 return(MAT)

X =

1 u1 − ui v1 − vi . . . (v1 − vi)

2

1 u2 − ui v2 − vi . . . (v2 − vi)2

......

......

...1 un − ui vn − vi . . . (vn − vi)

2

.

• Fonction qui donne la distance euclidienne :1 euc.dist = function(u_j, v_j, u_i, v_i) 2 u_j.vec <- rep(u_j, times = length(v_j))3 v_j.vec <- rep(v_j, each = length(u_j))4 VEC <- sqrt((u_j.vec - u_i)^2 + (v_j.vec - v_i)^2)5 return(VEC)

ρ(xi , xj) =√

(uj − ui)2 + (vj − vi)2.

Slide 76/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 77: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Implémentation de l’algorithme sous R (suite)R Development Core Team (2012)

• Fonction qui donne le système de pondération (Epanechnikov) :1 kernel = function(e.d, h) 2 VEC <- as.vector(e.d[e.d <= h] / h)3 VAL <- (3/4)*(1 - VEC^2)4 return(VAL)

W (a) = 34 (1 − a2)I(|a| ≤ 1) pour a =

ρ(xi , xj)/h, où ρ(xi , xj) est la distanceeuclidienne.

• Fonction qui donne la matrice de poids, W :1 wmat = function(h, u_j, v_j, u_i, v_i) 2 n <- length(u_j) * length(v_j)3 e.d <- euc.dist(u_j, v_j, u_i, v_i)4 kr <- vector(, n)5 kr[1 : n] <- 06 kr[which(e.d <= h)] <- kernel(e.d, h)7 Wmat <- diag(kr, n, n)8 return(Wmat)

Matrice diagonale avec comme jèmeélément

wj =

W (ρ(xi , xj)/h) if ρ(xi , xj)/h ≤ 1,0 otherwise.

Slide 77/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 78: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Implémentation de l’algorithme sous R (suite)R Development Core Team (2012)• Fonction qui donne les moindres carrés itérativement re-pondérés ou IRWLS :

1 irwls = function(d, u_j, v_j, h, u_i, v_i, Wmat,2 offset)3 XM <- Xmat(u_j, v_j, u_i, v_i)4 z <- log(d + ( d == 0 ))5 offset <- offset + (offset == 0)6 b <- solve(crossprod(XM, Wmat) %*% XM) %*%7 crossprod(XM, Wmat) %*% z8 n <- length(u_j) * length(v_j)9 g.prim <- OM <- matrix(0,n,n)

10 cat("Start", b , "\n")11 for (it in 1 : 200) 12 eta <- (XM %*% b) + log(offset)13 mu <- exp(eta)14 g.prim <- 1/mu15 diag(OM) <- diag(mu)16 z <- XM %*% b + g.prim * (d - mu)17 F1 <- solve(crossprod(XM, Wmat) %*% OM %*% XM)18 b.star <- tcrossprod(F1,XM) %*% Wmat %*% OM %*% z19 cat("it =", it, b.star , "\n")20 VAL <- abs(b - b.star)21 if(all(VAL < 1e-6) == TRUE) break 22 b <- b.star 23 return(b.star)

Valeurs initiales :• X , matrice de design.• z = g(y), (fonction de lien).• β = (XT W X)−1XT W z.

Procédure itérative :• η = Xβ + log(offset).• µ = g−1(η), (i.e. exp(η)).• ∂η

∂µ= g ′(µ) = 1

mu .• Ω, matrice diagonale avec éléments

ωjj =1

V[µj ]

(∂µj∂ηj

)2= µj .

• z = Xβ + y−µµ

.

• β = (XT WΩX)−1XT WΩz.Résultats :

• b∗, estimate of β.

Slide 78/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 79: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Implémentation de l’algorithme sous R (suite)R Development Core Team (2012)

1 load("Data/Original data/dij.RData")2 load("Data/Original data/eij.RData")34 d <- D_i.j[1:21,1:21]; offset <- E_i.j[1:21,1:21]5 u_j <- 0:20; v_j <- 70:90; u_i <- 10; v_i <- 806 h <- 778 Wmat <- wmat(h, u_j, v_j, u_i, v_i)9

10 > b <- irwls(c(d), u_j, v_j, h, u_i, v_i, Wmat, c(offset))11 Start 2.283744 -0.0616927 0.08938239 0.003371329 0.005613695 -0.014845712 it = 1 1.285481 -0.06162731 0.08921188 0.003371619 0.005615199 -0.0147915413 it = 2 0.290194 -0.06145029 0.08875103 0.003372459 0.005619259 -0.0146451914 it = 3 -0.6970451 -0.06097459 0.08751762 0.003375117 0.005630085 -0.0142537615 it = 4 -1.662737 -0.05972105 0.08430269 0.003384938 0.005658006 -0.0132354216 it = 5 -2.572236 -0.05658603 0.07649214 0.003427692 0.005723854 -0.0107738617 it = 6 -3.345498 -0.04974172 0.06065755 0.003615231 0.00584605 -0.00585004718 it = 7 -3.8479 -0.0390258 0.03980308 0.004193585 0.005966555 0.00040899219 it = 8 -4.018391 -0.03094496 0.02870773 0.004888365 0.006001288 0.00341277520 it = 9 -4.033062 -0.02944871 0.02775906 0.00500892 0.006075062 0.00352739821 it = 10 -4.033277 -0.02941503 0.02776782 0.005007262 0.00610412 0.00351240422 it = 11 -4.033292 -0.02940931 0.02776473 0.005008167 0.006105367 0.00351300423 it = 12 -4.033293 -0.02940906 0.02776484 0.00500816 0.006105498 0.0035129442425 > c(exp(b))26 [1] 0.0177159 0.9710192 1.0281539 1.0050207 1.0061242 1.0035191

• Charge les données.

• Fixe les valeurs deuj , vj , ui , vi , ainsi que lerayon de fenêtred’observation h.

• Les valeurs de b∗produit par le code R.

• On obtientψ(x221) = exp(β0) =0.0177159

Slide 79/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 80: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Implémentation de l’algorithme sous R (suite)R Development Core Team (2012)

• Illustration sous

Slide 80/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 81: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 81/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 82: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Modification de la fonction de poids aux borduresTraitement spécifique

• Modification asymétrique dusystème de pondération.

• Toujours utiliser le même nombred’observations.

• Correction la plus courammentemployée, e.g. fonction loess oulocfit sous R.

• Par exemple, un rayon h = 7entraîne 149 obs.

Slide 82/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 83: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Modification de la fonction de poids aux borduresTraitement spécifique

• Modification asymétrique dusystème de pondération.

• Toujours utiliser le même nombred’observations.

• Correction la plus courammentemployée, e.g. fonction loess oulocfit sous R.

• Par exemple, un rayon h = 7entraîne 149 obs.

Slide 83/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 84: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Modification de la fonction de poids aux borduresTraitement spécifique

• Modification asymétrique dusystème de pondération.

• Toujours utiliser le même nombred’observations.

• Correction la plus courammentemployée, e.g. fonction loess oulocfit sous R.

• Par exemple, un rayon h = 7entraîne 149 obs.

Slide 84/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 85: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 85/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 86: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Variance, influence et degrés de libertéApproximation de la variance

• Soit A(β) le vecteur gradient de la log vraisemblance dont la vèmecomposante est

Av (β) =∂

∂βvl(β|y),

• et H(β) la matrice hessienne de l(β|y), dont l’élément (v , k) est

∂2

βvβkl(β|y).

• Une approximation linéaire donne

0 = A(β) ≈ A(β) + H(β)(β − β),

• ce qui entraîneβ − β ≈ −H(β)−1A(β).

Slide 86/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 87: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Variance, influence et degrés de libertéApproximation de la variance (suite)

• Ainsi une approximation de la variance de β est :

Var[β]≈ E

[−H(β)−1

]β=β

E[A(β)A(β)T ]

β=βE[−H(β)−1

]β=β

= I−1β

( n∑j=1

wj E[∂l(β|y)

∂βT∂l(β|y)

∂β

])I−1

β.

• En notation matricielle, on obtient :

Var[β]

=(XT W ΩX

)−1(XT W VE[y − µ

]2V W X)(

XT W ΩX)−1

,

• On sait que E[yj − µj

]2 ≡ b′′(θj), donc

VE[y − µ

]2V = Ω,

• en conséquence,

Var[β]≈(XT W ΩX

)−1(XT W 2ΩX)(

XT W ΩX)−1

.

Slide 87/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 88: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Variance, influence et degrés de libertéApproximation de la variance (suite)Une estimation de Var

[η]est obtenue de la façon suivante : Pour

η(xi ) = β0(xi ),

η(xi ) = η(xi ) +∂k(β)

∂βT0

(β − β

)+ o

∥∥∥β − β∥∥∥ ,

et,E [η(xi )] = η(xi ) +

∂k(β)

∂βT0

E[β − β

].

On obtient l’estimation de la variance suivante

Var [η(xi )] =∂k(β)

∂βT0

E[(

β(xi )− β(xi ))2] ∂k(β)

∂β0.

Sachant que ∂k(β)/∂βT0 = eT

1 , on a

Var[η(xi )

]≈ eT

1(XT W ΩX

)−1(XT W 2ΩX)(

XT W ΩX)−1e1,

où ev est un vecteur de longueur p + 1 ayant 1 à la vème composante et zéroà toutes les autres.

Slide 88/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 89: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Variance, influence et degrés de libertéApproximation de la variance (suite)En notant S =

(XT W ΩX

)−1XT W Ω, on obtient

Var[η(xi )

]≈ Ω−1SST .

La matrice S est appelée smooth weight diagram, dont les lignes sont

s(xi )T = (s1(xi ), s2(xi ), . . . , sn(xi )) = eT

1(XT W ΩX

)−1XT W Ω.

Ainsi l’approximation de la variance peut être écrite sous une forme compacte :

Var[η(xi )

]=[ωii]−1µ=µ

n∑j=1

s2j (xi ) = b′′(θi )(g ′(µi )

)2‖s(xi )‖2.

Par la delta method et comme µi = g−1(ηi ), on obtient une estimation de lavariance de µi ,

Var[µ(xi )

]≈[∂g−1(ηi )/∂ηi

]η=η

Var[η(xi )

]=[∂g−1(ηi )/∂ηi

]η=η

b′′(θi )(g ′(µi )

)2‖s(xi )‖2.

Slide 89/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 90: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Variance, influence et degrés de libertéDimension effective du modèle

• La dimension effective du modèle ajusté est un concept importantde la modélisation.Pour un modèle linéaire, ce concept est clair et intuitive : lenombre de paramètres détermine sa dimension.

• Pour un modèle linéaire, la matrice chapeau H est idempotentetr(H HT ) = tr(H) = rank(H).Ainsi la trace de la matrice chapeau est égale au nombre deparamètres du modèle ajusté.

• Etant donné cette caractéristique des modèles linéaires, la trace dela matrice chapeau peut être utilisée comme une approximationdes degrés de liberté et donc de la dimension effective du modèle.

Slide 90/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 91: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Variance, influence et degrés de libertéDimension effective du modèle

• Les degrés de liberté fournissent une mesure du montant delissage. Cette mesure est comparable avec différents paramètresappliqués à un même ensemble de données.Par exemple, 10 degrés de liberté représentent un modèle lisse avecpeu de flexibilité, alors que 30 degrés de liberté représentent unmodèle montrant beaucoup de caractéristiques.

• Pour les modèles de vraisemblance locale, on définit υ comme

υ = tr(S) =n∑

i=1infl(xi ) ωii ,

où infl(xi ) = eT1(XT WΩX

)−1e1 denote l’influence.• L’influence mesure la sensibilité de la courbe ajustée aux points

individuels. Par exemple, si infl(xi ) approche 1, les résiduscorrespondants approchent zéro.

Slide 91/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 92: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 92/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 93: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Intervalles de confianceApproximation normale

• Les intervalles de confiance devraient idéalement prendre encompte la famille de la distribution.

• Cependant, on utilise des méthodes basées sur l’approximationnormale : Le maximum de vraisemblance locale estasymptotiquement normal, voir Fan et collab. (1995, p.143-145).Ainsi

β − β → N(0,Var

[β]1/2)

.

• La fonction µ(xi ) est dans l’intervalle avec (1− α) probabilité

µ(xi )± c µ1/2i ‖s(xi )‖,• et un intervalle de confiance pour les forces de mortalité est donné

parψ(xi )± c ψ1/2

i ER−1i ‖s(xi )‖,où c est choisi comme le (1− α/2) quantile de la distributionstandard normale.

Slide 93/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 94: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 94/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 95: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Sélection des paramètresEquilibre entre le biais et la variance

• On doit garder à l’esprit que l’ajustement et donc la sélection desparamètres de lissage est un compromis entre deux objectifs :

• L’élimination des irrégularités, et• l’ajustement désiré dans la progression des forces de mortalité.

• Ceci souligne l’importance de l’expérience, et par dessus tout d’uneinvestigation poussée comme conditions d’un jugement fiable.

• En pratique on va choisir les paramètres de lissage pour équilibrerle compromis entre le biais et la variance.

• Pour trouver une telle constellation, la stratégie est d’évaluer unnombre d’ajustements candidats et d’utiliser un critère poursélectionner parmi les ajustements celui qui aura le score le plusfaible.

Slide 95/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 96: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Sélection des paramètresEquilibre entre le biais et la variance (suite)

• Une possible fonction de perte est la déviance pour uneobservation individuelle (xi , yi ), définie par

D(yi , θ(xi )) = 2(supθ

l(yi , θ(yi )

)− l(yi , θ(µi )

))= 2

(yi(θ(yi )− θ(µi )

)− bθ(yi )+ bθ(µi )

).

• La déviance totale est ∑ni=1D(yi , θ(xi )).

• Cas de Poisson D(yi , θ(xi )) = 2 (yi log(yi/µi )− (yi − µi )).• Cela entraine une généralisation de l’Akaike information criterion

(AIC) basée sur la deviance

AIC =n∑

i=1D(yi , (θ(µi ))) + 2 υ,

où υ sont les degrés de liberté.Slide 96/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 97: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Sélection des paramètresAIC-plot

• Utiliser un graphique : AIC-plot.• On utilise les degrés de liberté

plutôt que la fenêtred’observation comme l’axehorizontal.

• Cela permet de comparer desajustements obtenus avecdifférents paramètres de lissage.

• Cleveland et Devlin (1988) ontrecommandé de choisir lesparamètres de lissage au pointlorsque le critère atteint unplateau après une descenteabrupte.

Slide 97/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 98: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Sélection des paramètresAIC-plot

• Utiliser un diagnostic graphique :AIC-plot.

• On utilise les degrés de libertéplutôt que la fenêtred’observation comme l’axehorizontal.

• Cela permet de comparer desajustements obtenus avecdifférents paramètres de lissage.

• Cleveland et Devlin (1988) ontrecommandé de choisir lesparamètres de lissage au pointlorsque le critère atteint unplateau après une descenteabrupte.

Slide 98/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 99: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Sélection des paramètresPlot des résidus

• En conjonction, on va toujours regarder le graphique des résidus.L’analyse des résidus est aussi important pour les procéduresnon-paramétriques que pour les modèles paramétriques.

• Dans les cas des GLMs, on dénotei. Résidus de la réponse : ri = yi − µi ;ii. Résidus de Pearson : ri = (yi − µi )/

√Var [µi ];

iii. Résidus de la déviance : ri = sign(yi − µi )D(yi , θ(µi ))1/2.• Ces graphiques des résidus fournissent un diagnostic qui complète

le critère de sélection.• Le but est de déterminer si de larges résidus correspondent à des

caractéristiques qui ont été mal modélisées.• Aucune tendance forte devrait apparaître dans les résidus de la

réponse et de Pearson. De plus, si les résidus de la dévianceexhibent plusieurs résidus successifs ayant un même signe, ceciindique que les données sont sur-lissées

Slide 99/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 100: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 100/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 101: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Conclusion• La vraisemblance locale combine d’excellentes propriétés théoriques

avec simplicité et flexibilité. Elle est très adaptable, et estégalement pratique sur le plan statistique.

• Malheureusement, comme nous faisons face à une situation où lesdonnées ont une structure importante aux bordures, cettesimplicité a des défauts.

• Aux bordures, la fonction de poids est asymétrique et l’estimationpeut avoir un biais important.

• Cela force les critères à sélectionner une fenêtre d’observation pluspetite pour réduire le biais, mais cela conduit à un sous-lissage aucentre de la table.

• En conséquence, dans certains cas, aucun paramètre global delissage fournit un ajustement adéquat des données.

• Plutôt que de restreindre les paramètres de lissage à une valeurfixe, une approche plus souple est de permettre aux paramètres delissage de varier selon l’emplacement.

Slide 101/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 102: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Méthodes adaptatives de vraisemblance locale

• On évalue une constellation différente pour chaque point auquel lacourbe est estimée.

• On traite les choix de la fenêtre d’observation, du degréd’approximation et de la fonction de poids comme si on modélisedes données.

• On choisit ces paramètres pour équilibrer le compromis entre biaiset variance.

Slide 102/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 103: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Méthodes adaptatives de vraisemblance locale

• On distingue la méthode adaptative ponctuelle qui utilise la règlede l’intersection des intervalles de confiance et une méthodeglobale qui utilise des facteurs de correction de la fenêtred’observation.

• On varie le montant de lissage selon l’emplacement et permet desajustements selon la fiabilité des données.

• Il est bien connu que parmi les paramètres de lissage, la fonctionde poids a beaucoup moins d’influence sur le compromis biaisvariance que la fenêtre d’observation ou le degré d’approximation.Le choix n’est pas déterminant. Par convenance, on utilise lafonction de poids Epanechnikov.

Slide 103/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 104: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 104/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 105: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Intersection des intervalles de confianceIntroduction

• La règle de l’intersection des intervalles de confiance a étéintroduite par Goldenshulger et Nemirovski (1997) et développéepar Katkovnik (1999).

• Application à la vraisemblance locale de Poisson pour larestauration adaptive des images a été étudiée par Katkovniket collab. (2005).

• Voir aussi la thèse de doctorat de Chichignoud (2010).• La règle de l’intersection des intervalles de confiance donne une

méthode alternative pour évaluer un ajustement locale.

Slide 105/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 106: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Intersection des intervalles de confiancePrincipes

• On définit un ensemble fini de fenêtres d’observation :

Λ = λ1 < λ2 < . . . < λK.

• On détermine la fenêtre d’observation optimale en évaluant lesajustements obtenus.

• Soit ψ(xi , λk) l’estimation à xi pour la fenêtre d’observation λk .• Pour sélectionner la fenêtre d’observation, la règle d’intersection

des intervalles de confiances examine une séquence des intervallesde confiance des estimations ψ(xi , λk) :

I(xi , λk) =[L(xi , λk), U(xi , λk)

],

U(xi , λk) = ψ(xi , λk) + c σ(xi )‖s(xi , λk)‖,L(xi , λk) = ψ(xi , λk)− c σ(xi )‖s(xi , λk)‖,

où c est le paramètre du seuil de l’intervalles de confiance.Slide 106/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 107: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Intersection des intervalles de confiancePrincipes (suite)

• A partir des intervalles de confiance, on définie

L(xi , λk) = max[L(xi , λk−1), L(xi , λk)

],

U(xi , λk) = min[U(xi , λk−1), U(xi , λk)

],

k = 1, 2, . . . ,K and L(xi , λ0) = U(xi , λ0) = 0.

• La valeur la plus large de k de telle sorte que U(xi , λk) ≥ L(xi , λk)donne k∗.

• Cela entraine la fenêtre λ∗k , qui est la fenêtre optimale selon larègle des intervalles de confiance.

Slide 107/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 108: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Intersection des intervalles de confiancePrincipes (suite)

• En d’autres termes, si on dénote Dj =⋂K

j=k I(xi , λj) pourk = 1, 2, . . . ,K , on choisit k∗ de telle sorte que Dj 6= ∅, ∀j ≥ k∗,

Dk∗−1 = ∅.

• Comme la fenêtre λk augmente, la déviation standard de ψ(xi , λk),et donc de ‖s(xi , λk)‖ diminue.

• L’intervalle de confiance devient plus petit. Si λk est trop large,l’estimation ψ(xi , λk) sera largement biaisée et les intervalles deconfiance seront inconsistants dans le sens que les intervallesconstruits à des fenêtres différentes n’auront pas d’intersectionscommunes.

• La fenêtre optimale λk∗ est le k le plus large de telle sorte queU(xi , λk) ≥ L(xi , λk) soit satisfait, i.e. quand Dj 6= ∅.

Slide 108/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 109: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Intersection des intervalles de confianceIllustration

Slide 109/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 110: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Intersection des intervalles de confianceIllustration (suite)

Slide 110/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 111: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Intersection des intervalles de confianceIllustration (suite)

Slide 111/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 112: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Intersection des intervalles de confianceIllustration (suite)

Slide 112/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 113: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Intersection des intervalles de confiancePrincipes (suite)

• Le paramètre c joue une part importante dans la performance del’algorithme car il décide de la fenêtre d’observation optimale.

• Lorsque c est grand, le segment I(xi , λk) devient large et λ∗k aussi.On obtient un sur-lissage.

• Au contraire, lorsque c est petit, le segment I(xi , λk) devient petitet tout comme λ∗k . Les irrégularités ne peuvent pas être éliminéesde manière effective.

• En théorie, on peut appliquer le critère AIC pour déterminer unevaleur raisonnable de c.

Slide 113/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 114: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 114/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 115: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Facteurs de correction de la fenêtre d’observationIntroduction

• On va incorporer de l’information additionnelle dans une procédureglobale en permettant à la fenêtre d’observation de varier selon lafiabilité des données.

• Extension de l’estimateur à noyaux variable proposé par Gavinet collab. (1995, pp.190-193).

• La fenêtre locale à chaque point est simplement la fenêtre globalemultipliée par un facteur de correction.

• Comme on a obtenu les facteurs de corrections de la fenêtred’observation, on utilise un critère globale, e.g. AIC, pourdéterminer la fenêtre globale.

Slide 115/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 116: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Facteurs de correction de la fenêtre d’observationIntroduction (suite)

• Les facteurs de correction dépendent de l’exposition ou du nombrede décès (dans le cas d’annuités ou de prestations de décès).

• Pour des régions on l’exposition est large, une petite fenêtred’observation induit une estimation qui reflète plus précisément lestaux de mortalité.

• Pour des régions où l’exposition est faible, une fenêtre plus largepermet aux estimations des forces de mortalité de progresser demanière plus lisse. On utilise un plus grand nombre d’observationsce qui réduit la variance des forces de mortalité graduées mais avecun biais potentiel plus large.

Slide 116/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 117: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Facteurs de correction de la fenêtre d’observationPrincipes

• La fenêtre d’observation à chaque point est la fenêtre globalemultipliée par un facteur de correction : hi = h × δs

i fori = 1, . . . , n.

• La variation de l’exposition ou du nombre de décès dans une basede données peut être énorme. Pour atténuer l’effet de cettevariation, on choisit :

δsi ∝ ξ−s

i , pour i = 1, . . . , n et 0 ≤ s ≤ 1,

où s est un paramètre de sensibilité et

ξi =

ERi/∑n

j=1 ERj pour i = 1, . . . , n pour des annuités,di/

∑nj=1 dj pour i = 1, . . . , n pour des prestations décès.

Slide 117/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 118: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Facteurs de correction de la fenêtre d’observationPrincipes (suite)

• Choisir s = 0 donne un modèle avec une fenêtre fixe, alors ques = 1 peut entrainer une grande variation du montant de lissage.

• L’exposition décide de la forme des facteurs de correction, et leparamètre de sensibilité s détermine l’amplitude de cette forme, endevenant plus prononcée lorsque s se rapproche de 1.

(a) Exposition ERu,70 (b) Facteurs de corrections δu,70

Figure: ERu,70, et δu,70, pour plusieurs paramètres de sensibilité.Slide 118/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 119: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Facteurs de correction de la fenêtre d’observationPrincipes (suite)Si l’exposition est faible, alors δs

u,v est large. Cela permet d’appliquer unlissage plus important. Inversement si l’exposition est large.

(a) Facteurs de correction δu,v (b) Fenêtre d’observations (rayon)

Figure: δu,v pour s = 0.15 et les fenêtres d’observations correspondantes.

Slide 119/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 120: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 120/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 121: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

ApplicationsSurfaces ajustées

(a) Vraisemblance locale (b) ICI (c) Facteurs de correction

Figure: Surface ajustées ϕu,v

(a) Fonction de poids Epanechnikov, polynome de degré 2 et une fenêtre (rayon)de 13 observations.

(b) Ordre d’approximation fixe (quadratique), et fonction de poids Epanechnikov etc = 0.1.

(c) idem, et s = 0.15.Slide 121/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 122: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

ApplicationsSurfaces ajustées (suite)

(a) v = 70 (b) v = 80 (c) v = 90

Figure: Forces de mortalité observées et ajustées pour plusieurs âges à lasurvenance.

Slide 122/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 123: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

ApplicationsSurfaces ajustées (suite)

(a) u = 0 (b) u = 60 (c) u = 119

Figure: Forces de mortalité observées et ajustées pour plusieurs anciennetés.

Slide 123/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 124: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 124/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 125: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

ApplicationsAnalyse des résidus (Pour âge à la survenance v = 70)

Slide 125/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 126: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Table des matières

1 IntroductionL’assurance dépendanceNotions démographiques et notationHypothèse de mortalité constantepar morceauxPrésentation des donnéesPrémisses sur les modèles de lissageRappel sur les GLMs

2 Méthode de vraisemblance localeDes GLMs à la vraisemblance localeIllustration de l’idée généraleEquations de vraisemblanceRésolution des équations devraisemblanceImplémentation de l’algorithme sousR

Modification de la fonction de poidsaux borduresVariance, influence et degrés delibertéIntervalles de confianceSélection des paramètresConclusion

3 Méthodes adaptatives devraisemblance locale

Intersection des intervalles deconfianceFacteurs de correction de la fenêtred’observation

4 ApplicationsSurfaces ajustéesAnalyse des résidusComparaisons

5 Conclusions

Slide 126/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 127: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

ApplicationsTests pour comparer les ajsutements

Vrais. loc. Adapt. vrais. ICI Adapt. vrais. facteurs

Degrés de liberté 29.25 10.76 16.16

Déviance 2259.91 2440.81 2311.04

Résidus > 2 108 127 115standardisés > 3 25 38 32

Signs +(−) 910(1610) 891(1629) 900(1620)Test p-value < 2.2e − 16 < 2.2e − 16 < 2.2e − 16

Runs Nb de seq 1028 971 1019test Valeur −6.25 −8.19 −6.47

p-value 4.05e − 10 2.57e − 16 9.69e − 11

Kolmogorov Valeur 0.4401 0.4829 0.4786Smirnov test p-value 0.00 0.00 0.00

χ2 2433.56 2616.08 2458.71

R2 0.2406 0.2433 0.2476

MAPE (%) 46.11 48.18 46.99

Slide 127/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 128: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

ApplicationsComparaisons de marqueurs résumant les durées de vie

(a) v = 70 (b) v = 80 (c) v = 90

Figure: Espérances de vie observées et ajustées pour plusieurs âges à lasurvenance.

Slide 128/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 129: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

ApplicationsComparaisons de marqueurs résumant les durées de vie (suite)

(a) u = 0 (b) u = 60 (c) u = 119

Figure: Espérances de vie observées et ajustées pour plusieurs anciennetés.

Slide 129/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 130: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

ApplicationsComparaisons de marqueurs résumant les durées de vie (suite)

(a) Mois médian au décès (b) Déviation (c) Entropie

Figure: Marqueurs des durées de vie en fonction de l’âge à la survenance.

Slide 130/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 131: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Conclusions

• Avoir un estimateur adaptatif plutôt que global peut êtreavantageux pour plusieurs raisons :

• L’estimateur peut s’adapter à la structure de la fonction et selon lafiabilité des données,

• lissant d’avantage lorsque le volume d’observations est faible, etinversement.

• Que ceux soit les procédures globales ou adaptatives, il n’y a pasde méthode déterministe pour obtenir la constellation optimale desparamètres de lissage.

• L’analyse des résidus et des critères de sélection sont aussiimportants pour juger de l’ajustement.

• Le but final de la table de mortalité doit être gardé clairement àl’esprit, et le choix final de l’ajustement est toujours sujet aujugement.

Slide 131/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 132: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Conclusions

• Avoir un estimateur adaptatif plutôt que global peut êtreavantageux pour plusieurs raisons :

• L’estimateur peut s’adapter à la structure de la fonction et selon lafiabilité des données,

• lissant d’avantage lorsque le volume d’observations est faible, etinversement.

• Que ceux soit les procédures globales ou adaptatives, il n’y a pasde méthode déterministe pour obtenir la constellation optimale desparamètres de lissage.

• L’analyse des résidus et des critères de sélection sont aussiimportants pour juger de l’ajustement.

• Le but final de la table de mortalité doit être gardé clairement àl’esprit, et le choix final de l’ajustement est toujours sujet aujugement.

Slide 131/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 133: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Conclusions

• ICI : Parce qu’une classe plus large d’estimateurs est disponible,cela peut affecter l’élimination des irrégularités. Pour y remédier,on choisit des fenêtres d’observation relativement large.

• ICI : Procédure demande un temps de calcul plus élevé : l’effort estmultiplié par le nombre d’observations.

• Facteurs de corrections : permet d’inclure dans une procédureglobale l’information additionnelle obtenue par le changement del’exposition. Le changement d’exposition détermine la forme desfacteurs, et l’amplitude est donnée par un paramètre de sensibilité.

• Il apparait que la méthode permet un ajustement satisfaisant oùles autres méthodes ne parviennent pas à modéliser cescaractéristiques.

Slide 132/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 134: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Conclusions

• Les méthodes proposées s’adaptent nettement à la complexité dela surface de mortalité, du fait du choix adaptatif des paramètresde lissage.

• Cependant, le mérite de ces procédures dépendront de l’objet finalde la table de mortalité. Si on explore essentiellement les données,alors l’information additionnelle obtenue ne justifie peut-être pasces efforts.

• Néanmoins, l’usage potentiel de approches adaptatives suggèrentqu’elles ont beaucoup à apporter et méritent de faire partie desoutils mis à disposition de l’actuaire.

Slide 133/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 135: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Bibliography I

Chichignoud, M. 2010, Performances statistiques d’estimateurs non-linéaires, thèsede doctorat, Université de Provence - U.F.R Mathématiques.

Cleveland, W. S. 1979, «Robust locally weighted regression and smoothingscatterplots», Journal of the American Statistical Association, vol. 74, no 368, p.829–836.

Cleveland, W. S. et S. J. Devlin. 1988, «Locally weighted regression : An approachto regression analysis by local fitting», Journal of the American StatisticalAssociation, vol. 83, p. 596–610.

Copas, J. B. et S. Haberman. 1983, «Non-parametric graduation using kernelmethods», Journal of the Institute of Actuaries, vol. 110, p. 135–156.

Courbage, C. et N. Roudaut. 2011, «Long-term care insurance : The Frenchexample», European Geriatric Medecine, vol. 2, no 1, p. 22–25.

Fan, J., M. Farmen et I. Gijbels. 1998, «Local maximum likelihood estimation andinference», Journal of the Royal Statistical Society, vol. 60, no 3, p. 591–608.

Fan, J., N. E. Heckman et M. P. Wand. 1995, «Local polynomial kernel regressionfor generalized linear models and quasi likelihood functions», Journal of theAmerican Statistical Association, vol. 90, no 429, p. 141–150.

Slide 134/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 136: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Bibliography IIGavin, J. B., S. Haberman et R. J. Verrall. 1993, «Moving weighted graduation using

kernel estimation», Insurance : Mathematics & Economics, vol. 12, no 2, p.113–126.

Gavin, J. B., S. Haberman et R. J. Verrall. 1995, «Graduation by kernel and adaptivekernel methods with a boundary correction», Transactions of the Society ofActuaries, vol. 47, p. 173–209.

Goldenshulger, A. et A. Nemirovski. 1997, «On spatially adaptive estimation ofnonparametric regression», Mathematical methods of statistics, vol. 6, no 2, p.135–170.

Haberman, S. 1996, «Landmarks in the history of actuarial science (up to 1919)»,Actuarial Research Paper No. 84, Dept. of Actuarial Science and Statistics, CityUniversity, London.

Katkovnik, V. 1999, «A new method for varying adaptive bandwidth selection», IEEETransactions on signal processing, vol. 47, no 9, p. 2567–2571.

Katkovnik, V., A. Foi, K. O. Egiazarian et J. T. Astola. 2005, «Anisotropic locallikelihood approximations : Theory, algorithm, applications», dans Proceedings ofthe SPIE - Image processing algorithms and systems IV, vol. 5672, édité par E. R.Dougherty, J. T. Astola et K. O. Egiazarian, p. 181–192.

Slide 135/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 137: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Bibliography IIIKessler, D. 2008, «The long-term care insurance market», The Geneva Papers on

Risk and Insurance - Issues and Practice, vol. 33, no 1, p. 33–40.Loader, C. R. 1996, «Local likelihood density estimation», The Annals of Statistics,

vol. 24, no 4, p. 1602–1618.Loader, C. R. 1999, Local Regression and Likelihood, Statistics and Computing

Series, New York : Springer Verlag.McCullagh, P. et J. A. Nelder. 1989, Generalized Linear Models, Monographs on

Statistics and Applied Probability, vol. 37, 2e éd., Boca Raton : Chapman &Hall / CRC Press.

Nelder, J. A. et R. W. M. Wedderburn. 1972, «Generalized linear models», Journal ofthe Royal Statistical Society, vol. 135, p. 370–384.

Parzen, E. 1962, «On estimation of a probability density function and mode», Annalsof Mathematical Statistics, vol. 33, no 3, p. 1065–1076.

R Development Core Team. 2012, R : A Language and Environment for StatisticalComputing, R Foundation for Statistical Computing, Vienna, Austria.http ://www.R-project.org.

Rosenblatt, M. 1956, «Remarks on some nonparametric estimates of a densityfunction», Annals of Mathematical Statistics, vol. 27, no 3, p. 832–837.

Slide 136/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 138: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Bibliography IV

Seal, H. L. 1982, «Graduation by piecewise cubic polynomials : a historical review»,Blätter der Deutschen Gesellschaft für Versicherungsmathematik, vol. 15, p.89–114.

Stone, C. J. 1977, «Consistent nonparametric regression (with discussion)», Annalsof Statistics, vol. 5, no 4, p. 595–645.

Stone, C. J. 1982, «Optimal rates of convergence for nonparametric regression», TheAnnals of Statistics, vol. 10, no 4, p. 1040–1053.

Tibshirani, R. J. et T. J. Hastie. 1987, «Local likelihood estimation», Journal of theAmerican Statistical Association, vol. 82, no 398, p. 559–567.

Tomas, J. 2011, «A local likelihood approach to univariate graduation of mortality»,Bulletin Français d’Actuariat, vol. 11, no 22, p. 105–153.

Tomas, J. 2012a, «Univariate graduation of mortality by local polynomialregression», Bulletin Français d’Actuariat, vol. 12, no 23, p. 5–58.

Tomas, J. 2012b, «Essays on boundaries effects and practical considerations forunivariate graduation of mortality by local likelihood models», Insurance and RiskManagement, p. 1–31. Forthcoming.

Slide 137/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles

Page 139: Intro vrais loc-print

i n s t i t u t d e s c i e n c e f i n a n c i e r e e t d ’ a s s u r a n c e s l a b o r a t o i r e s a f

Bibliography V

Tomas, J. et F. Planchet. 2012, «Multidimensional smoothing by adaptive localkernel-weighted log-likelihood with application to long-term care insurance», ISFA- Laboratoire SAF Working paper - Submitted to Insurance : Mathematics &Economics, , no 2012.8, p. 1–28.

Slide 138/138 — Julien Tomas — Introduction aux méthodes de lissage par vraisemblance locale — 30/11/2012 - ISFA - Modèles de durée - Applications actuarielles