slides udm-010910
DESCRIPTION
TRANSCRIPT
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Statistique de l’assurance, STT 6705Statistique de l’assurance II
Arthur Charpentier
Universite Rennes 1 & Universite de Montreal
[email protected] ou ou [email protected]
http ://freakonometrics.blog.free.fr/
1er septembre 2010
1
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
References
Denuit, M. & Charpentier, A. (2005). Mathematiques de l’assurance non-vie, tome
II. Economica.
Charpentier, A., Goulet, V. & Planchet, F. (2010). Actuariat avec R. Springer
Verlag (a paraıtre)
Denuit, M. Marechal, X., Pitrebois, S. & Wahlin, J.F. (2009). Actuarial
Modelling of Claim Counts : Risk Classification, Credibility and Bonus-Malus Systems.
Wiley.
Frees, E. (2009). Regression Modeling with Actuarial and Financial Applications.
Cambridge University Press.
de Jong, P. & Helle, G. (2008). Generalized Linear Models for Insurance Data.
Cambridge University Press.
Kaas, R., Goovaerts, M., Dhaene, J. & Denuit, M. (2006). Modern Actuarial Risk
Theory. Springer Verlag.
2
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Bareme du cours
Le bareme pour l’evaluation du cours consistera en– un projet (50) de tarification– un projet (25) de provisionnement– un projet (25) de mortalite prospective
3
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Programmation et langage
Les graphiques presentes en cours, et les applications sont programmes en R.
Les codes seront mis en ligne sur le blog, ainsi que les bases de donnees.
4
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Plan du cours
• Introduction generale• La tarification a priori• Les provisions pour sinistres a payer (IBNR)• Les tables de mortalite prospectives
5
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
• Plan du cours
• Introduction generale
◦ Le modele collectif en tarification, E(∑N
i=1 Yi
)= E(N) · E(Yi)
◦ Les modeles lineaires generalises, E(Yi|Xi) = g−1(Xi)◦ Les modeles dynamiques Yi,t
• La tarification a priori
• Les provisions pour sinistres a payer (IBNR)
• Les tables de mortalite prospectives
6
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Le modele collectif
En tarification, on cherche a predire la charge totale de sinistre sur une annee decouverture. Soit N le nombre (aleatoire) de sinistres survenu sur un an, etY1, · · · , YN les couts des sinistres (si N > 0). La charge totale annuelle estS = Y1 + · · ·+ YN . Sous des hypotheses d’independance,
E(S) = E(N) · E(Yi)
La probabilite P peut etre remplacee par n’importe quelle mesure garantissantl’independance, et l’identique distribution des nombres et des couts,
E(S|X ) = E(N |X ) · E(Yi|X )
ou X designe le facteur d’heterogeneite (i.e. la classe tarifaire). Un proxy seraobtenu a l’aide de variables de tarificaiton {X1, · · · , Xk}
E(S|X1, · · · , Xk) = E(N |X1, · · · , Xk) · E(Yi|X1, · · · , Xk)
◦7
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Le modele lineaire generalise
En econometrie lineaire (classique), on cherche a approcher E(Y |X1, · · · , Xk) parune forme lineaire
Y = β0 + β1X1 + · · ·+ βkXk + ε = Xβ + ε
ou generallement ε est suppose N (0, σ2), i.e.
(Y |X) ∼ N (Xβ, σ2)
Or les modeles gaussiens ne sont pas appropries en assurance. On peut considererun modele Poisson,
(N |X) ∼ P(exp(Xβ))
i.e. on change la loi et le lien entre E(Y ) et le score Xβ
◦
8
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Les approches dynamiques
En provisionnement, on s’interessera aux cadences de paiements, i.e. combien aete paye l’annee t pour les sinistres survenus l’annee i, Yi,t.
En assurance-vie, on s’interessera aux nombres de deces l’anne t d’individus d’agei.
Le vieillissement des sinistres et des assures se visualise classiquement via undiagramme de Lexis.
9
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Lexis diagram in insurance
Lexis diagrams have been designed to visualize dynamics of life among severalindividuals, but can be used also to follow claims’life dynamics, from theoccurrence until closure,
in life insurance in nonlife insurance
10
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Lexis diagram in insurance
but usually we do not work on continuous time individual observations(individuals or claims) : we summarized information per year occurrence untilclosure,
in life insurance in nonlife insurance
11
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Lexis diagram in insurance
individual lives or claims can also be followed looking at diagonals, occurrenceuntil closure,occurrence until closure,occurrence until closure,occurrence untilclosure,
in life insurance in nonlife insurance
12
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Lexis diagram in insurance
and usually, in nonlife insurance, instead of looking at (calendar) time, we followobservations per year of birth, or year of occurrence occurrence untilclosure,occurrence until closure,occurrence until closure,occurrence until closure,
in life insurance in nonlife insurance
13
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Lexis diagram in insurance
and finally, recall that in standard models in nonlife insurance, we look at thetransposed triangle occurrence until closure,occurrence until closure,occurrenceuntil closure,occurrence until closure,
in life insurance in nonlife insurance
14
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Lexis diagram in insurance
note that whatever the way we look at triangles, there are still three dimensions,year of occurrence or birth, age or development and calendar time,calendar timecalendar time
in life insurance in nonlife insurance
15
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Lexis diagram in insurance
and in both cases, we want to answer a prediction question...calendar timecalendar time calendar time calendar time calendar time calendar time calendartime calendar timer time calendar time
in life insurance in nonlife insurance
16
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
What can be modeled in those triangles ?
In life insurance,• Li,j , number of survivors born year i, still alive at age j• Di,j , number of deaths of individuals born year i, at age j, Di,j = Li,j −Li,j−1,• Ei,j , exposure, i.e. i, still alive at age j(if we cannot work on cohorts, exposure is needed).
In nonlife insurance,• Ci,j , total claims payments for claims occurred year i, seen after j years,• Yi,j , incremental payments for claims occurred year i, Yi,j = Ci,j − Ci,j−1,• Ni,j , total number of claims occurred year i, seen after j years,◦
17
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
• Plan du cours
• Introduction generale• La tarification a priori◦ Tarification a priori vs. a posteriori◦ Les variables explicatives : par classes vs. continues◦ Modeliser la frequence de sinistres : regression de Poisson◦ La non declaration de sinistres et les modeles a inflation de zeros◦ Modeliser les couts de sinistres : regression Gamma vs. lognormale◦ Ecreter les gros sinistres
• Les provisions pour sinistres a payer (IBNR)• Les tables de mortalite prospectives
18
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Tarification a priori vs. a posteriori
A la fin de l’annee t, on souhaite estimer la prime a demander a l’assure,
πt = E(St+1|X )
En assurance a priori, on recherche un proxi de X , i.e. la classe de risque, a l’aidede variables exogenes, X1, · · · , Xk, alors qu’en assurance a posteriori, un proxi deX est obtenu a l’aide de l’historique de l’assure, Yt−h, · · · , Yt−1, Yt.
◦
19
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Les variables explicatives
Les variables explicatives peuvent etre discretes (classes ou facteurs)....
5%
6%
7%
8%
9%
10%
20
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Les variables explicatives
... mais aussi continues...
●
●
●
●
●
●
●
● ●
● ● ●● ● ●
●● ● ● ● ● ● ● ● ● ●
● ●
●
●● ● ● ● ● ● ●
● ● ● ● ● ●● ●
● ●●
● ● ●● ●
●
●● ●
● ●●
● ● ●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
● ● ●
●
●
20 40 60 80 100
0.00
0.05
0.10
0.15
0.20
0.25
0.30
Age du conducteur principal
Fré
quen
ce a
nnue
lle d
e si
nist
re
21
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Les variables explicatives
... que l’on pourra chercher a lisser
20 40 60 80 100
0.02
0.04
0.06
0.08
0.10
0.12
Age du conducteur principal
Fré
quen
ce a
nnue
lle d
e si
nist
res
3 degrés de liberté5 degrés de liberté10 degrés de liberté
22
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Les variables explicatives
On parlera aussi des arbres de regression afin de constituer des classes (e.g.d’age)◦
|zone:bcdef
puissance < 5.5
zone:bdf zone:bce
agevehicule < 10.5
puissance < 7.5
agevehicule < 2.5
0.001162 0.003053
0.004648 0.002260
0.001323
0.004592
0.004274
0.005648
23
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Les nombres de sinistres N
La loi la plus classique pour modeliser les nombres de sinistres est la loi dePoisson,
P(N = n) =e−λλk
k!qui verifie E(N) = Var(N) (equidispersion). Cette loi est de la familleexponentielle,
P(N = n) = exp(n log λ− λ
1− log(n!)
)avec comme parametre naturel, θ = log λ = log E(Y ).
◦
24
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
La surdispersion et la non-declaration
Si N ∼ P(λ), alors E(N) = Var(N).
Si N suit une loi Poisson melange, de facteur d’heterogeneite (inobservable) Θ,i.e. (N |Θ) ∼ P(λΘ), alors E(N) < Var(N) En pratique, si la variance est plusgrande que l’esprance, c’est qu’il reste de l’heterogeneite au sein des classes.
Il est possible d’utiliser une loi binomiale negative, ou quasi-Poisson
P(N = n) = exp(n log λ− λ
ϕ− log(n!)
)avec ϕ ∈ R+ le parametre de surdispersion.
25
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
La surdispersion et la non-declaration
Il est aussi possible de considerer un modele a inflation de zeros,
P(Ni = k) =
πi + [1− πi] · pi(0) si k = 0,
[1− πi] · pi(k) si k = 1, 2, · · ·
Si pi correspond un modele Poissonnien, on peut alors montrer facilement que
Var(Ni) = πiµi + πiµ2i [1− πi] > E(Ni) = [1− πi]µi
26
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
La surdispersion et la non-declaration
si
P(Ni = k|Xi) =
πi(Xi) + [1− πi(Xi)] · pi(0|Xi) si k = 0,
[1− πi(Xi)] · pi(k|Xi) si k = 1, 2, · · ·
la forme de πi(Xi) est ici ◦
20 30 40 50 60 70 80
0.5
0.6
0.7
0.8
0.9
Age du conducteur princpal
Pro
babi
lité
de n
e pa
s dé
clar
er u
n si
nist
re
27
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Les couts de sinistres
La loi Gamma est une loi de la famille exponentielle mais pas la loi lognormale.
Mais si log Y = Xβ+ (modele lognormale), alors
E(Y ) = exp(Xβ +
12σ2
)6= exp (Xβ)
◦
28
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Les gros sinistres
Il est possible de mutualiser les gros sinistres parmi tous les assures, passeulement ceux de la classe tarifaire, ◦
29
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
20 30 40 50 60 70 80 90
0.2
0.8
1.4
Age du conducteur principal
Impa
ct r
elat
if
20 30 40 50 60 70 80 90
0.2
0.8
1.4
Age du conducteur principal
Impa
ct r
elat
if
30
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
• Plan du cours
• Introduction generale• La tarification a priori• Les provisions pour sinistres a payer (IBNR)◦ La problematique des provisions, et les IBNR◦ La methode Chain Ladder◦ Le modele de Mack, E(Ci,t) = λt · Ci,t−1
◦ Les modeles factoriels, E(Yi,t) = exp[αi + βt]◦ Incertitude a ultime vs. incertitude a un an◦ Bornhuter-Ferguson, Cape-Code et les modeles bayesiens
• Les tables de mortalite prospectives
31
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Introduction au provisionnement
“ Les provisions techniques sont les provisions destinees a permettre le reglementintegral des engagements pris envers les assures et beneficaires de contrats. Ellessont liees a la technique meme de l’assurance, et imposees par la reglementation.”
◦
32
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Chain Ladder
0 1 2 3 4 5
0 3209 4372 4411 4428 4435 4456
1 3367 4659 4696 4720 4730
2 3871 5345 5398 5420
3 4239 5917 6020
4 4929 6794
5 5217
et et
0 1 2 3 4 5
0 3209 4372 4411 4428 4435 4456
1 3367 4659 4696 4720 4730 4752.4
2 3871 5345 5398 5420 5430.1 5455.8
3 4239 5917 6020 6046.15 6057.4 6086.1
4 4929 6794 6871.7 6901.5 6914.3 6947.1
5 5217 7204.3 7286.7 7318.3 7331.9 7366.7
Le montant total de provision est 2427 ◦.
33
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Le modele de Mack
H1 E (Ci,j+1|Ci,1, ..., Ci,j) = λj · Cij pour tour i = 0, 1, .., n et j = 0, 1, ..., n− 1
H2 (Ci,j)j=1,...,n et (Ci′,j)j=1,...,n sont independant pour i 6= i′.
H3 Var (Ci,j+1|Ci,1, ..., Ci,j) = Ci,jσ2j pour tout i = 0, 1, ..., n et j = 0, 1, ..., n− 1
E(
[Ri − Ri]2|Fi)
= R2i
(n−i−1∑k=0
σ2i+k
λ2i+k
∑C·,i+k
+σ2n−1
[λn−1 − 1]2∑C·,i+k
)◦
34
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Les modeles factoriels
Assume thatYi,j ∼ P(µi,j) where µi,j = exp[αi + βj ].
the occurrence factor αi the development factor βj
35
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
The log-Poisson regression model
Assume thatYi,j ∼ P(µi,j) where µi,j = exp[αi + βj ].
It is then extremely simple to calibrate the model,◦
Yi,j = exp[αi + βj ] Yi,j = exp[αi + βj ]
on past observations on the future
36
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Modeliser l’incertitude
●
●
●
●
0 2 4 6 8 10
02
46
8
●
●
●
●
●
37
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Bootstrap and GLM log-Poisson in triangles
Total amount of reserves ('000 000$)
10 15 20 25 30
(log-Poisson + bootstrap versus lognormal distribution + Mack) ◦
38
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Les modeles bayesiens
◦
39
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
• Plan du cours •
• Introduction generale• La tarification a priori• Les provisions pour sinistres a payer (IBNR)• Les tables de mortalite prospectives◦ La modelisation de la mortalite en actuariat, hpx = P(T > x+ h|T > x)◦ Lecture transversale ou longitudinale du diagramme de Lexis◦ Le modele de Lee & Carter, E(µi,t) = exp[αi + βiγt]◦ De la modelisation du taux de deces aux tables prospectives
40
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Les notions classiques en assurance vie
Pour calculer la probabilite de survie, on note que
hpx = P(T > x+ h|T > x) = P(T > x+ 1|T > x) · · ·P(T > x+ h|T > x+ h− 1)
i.e.
hpx = 1px · 1px+1 · · · 1px+h−1 =h−1∏i=0
px+i
autrement dit seul le vecteur des px suffit pour calculer toutes les probabilites.
Mais ces probabilites ne prennent pas en compte le vieilissement, i.e.
hptx = Pt(T > x+ h|T > x) = Pt(T > x+ 1|T > x) · Pt+1(T > x+ 2|T > x+ 1)
· · ·Pt+h−1(T > x+ h|T > x+ h− 1)
◦
41
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Lecture transversable vs. lecture longitudinale
Taux de mortalite µx,t, ◦
Age
0
20
4060
80
Année
1900
1920
1940
19601980
2000
taux de mortalité
−8
−6
−4
−2
42
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Le modele de Lee & Carter
Assume here that E(D|α,β,γ) = Var(D|α,β,γ), thus a Poisson model can beconsidered. Then
Dj,t ∼ P(Ej,t · µj,t) where µj,t = exp[αj + βjγt]
the age factors (αj , βj) the time factor t
43
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
A stochastic model for mortality
Two sets of parameters depend on the age, α = (α0, α1, · · · , α110) andβ = (β0, β1, · · · , β110).
●
●
●
●●
●●
●●●●●●
●
●●
●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●
●●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●●●●
0 20 40 60 80
●
●●
●
●
●
●●
●●●●●●
●●
●●
●
●●
●●●●●
●●
●
●●
●●
●
●
●
●
●
●
●●
●●
●●
●●
●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●
0 20 40 60 80
44
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
A stochastic model for mortality
and one set of parameters depends on the time, γ = (γ1899, γ1900, · · · , γ2005).
●●●●●●●●●
●●●
●
●●
●●
●
●
●
●
●●●●●●●
●●●
●●●●●●●●●●
●
●●
●
●
●
●●
●●
●●
●●●●●
●
●●●●
●●
●●●●●●
●●●●●●●●●●●●
●●●●
●●●●
●●●●
●●●●●●
●●●●
●●
1900 1920 1940 1960 1980 2000
45
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Errors and predictions
exp[αj + βj γt] exp[αj + βj γt]
on past observations on the future
46
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Forecasting γ
Based on γ = (γ1899, · · · , γ2005), we need to forecast γ = (γ2006, · · · , γ2050).
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●
●●●●
●
●●●
●●●●●●●●●●●●●●●●●●
●
●●●
●
●
●●
●●●●
●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●
1900 1950 2000 2050
47
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Forecasting γ
Classically integrated ARIMA processes are considered, ◦
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●
●●●●
●
●●●
●●●●●●●●●●●●●●●●●●
●
●●●
●
●
●●
●●●●
●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●
1900 1950 2000 2050
48
Arthur CHARPENTIER, Statistique de l’assurance, sujets speciaux, STT 6705V
Des taux de deces aux tables
◦
49