universidade federal de lavras -...
TRANSCRIPT
Universidade Federal de Lavras Departamento de Ciências Exatas
Dependência via Cópulas Devanil Jaques de Souza Lucas Monteiro Chaves
27/11/2009
Variável aleatória bi-dimensional
( ) ( ),~ ,, X YF x yX Y
As marginais: ( )XF x e ( )YF y
Variável aleatória bi-dimensional
( ) ( ),~ ,, X YF x yX Y
As marginais: ( )XF x e ( )YF y
A estrutura de dependência entre X e Y
Variável aleatória bi-dimensional
( ) ( ),~ ,, X YF x yX Y
As marginais: ( )XF x e ( )YF y
A estrutura de dependência entre X e Y
O coeficiente de correlação de Pearson
( )( )
( ) ( )2 2,,
X Y
X YX Y
X Y E X E Y
E X YCov X Y
μ μ
μ μσ σρ
⎡ ⎤⎡ ⎤ ⎢ ⎥⎣ ⎦ ⎣ ⎦=⎡ ⎤ ⎡ ⎤− −⎣ ⎦ ⎣ ⎦
− −=
, ,X Y aX b cY dρ ρ + +=
Problema: Capta dependência linear
1Y aX b ρ= + ⇒ = ±
Como modelar outras dependências:
Tau de Kendall amostral
Uma amostra bivariada de tamanho n:
( )1 1,x y , ( )2 2,x y , ..., ( ),n nx y
c – número de pares concordantes ( )( ) 0i j i jx x y y− − >
d – número de pares discordantes ( )( ) 0i j i jx x y y− − <
O coeficiente Tau de Kendall amostral:
c dtc d−=+
Tau de Kendall populacinal
( )1 1,X Y e ( )2 2,X Y duas cópias independentes de uma população ,X YF .
Probabilidade de concordância do tipo 1
1cP ( )( )2 1 2 1P 0X X Y Y= − − >⎡ ⎤⎣ ⎦
( ) ( ), ,2 , ,X Y X YF x y f x y dx dy∞ ∞
−∞ −∞= ∫ ∫ ,
Probabilidade de discordância do tipo 1
1dP ( ) ( )2 1 2 1 1P 0 1 cX X Y Y= − − < = −⎡ ⎤⎣ ⎦ P
Tau de Kendall populacional 1 1c dτ = −P P
Se X e Y têm distribuição conjunta normal bivariada então
` 2 arcsinτ = ρπ
( ) ( )sgn sgni j j i j iA X X Y Y= − − ( )j i≠
( )1 caso 0
sgn-1 caso 0
uu
u>⎧
= ⎨ <⎩
( )
1
1 1
21
n n
i ji j i
T An n
−
= = +=
− ∑ ∑
T é um estimador não viesado e consistente de τ .
O RHO de Spearman amostral
Amostra ( ) ( ) ( )1 1 2 2, , , ,..., ,n nx y x y x y de uma população bivariada
( ),X Y . Sejam ( ) ( ) ( )1 1 2 2, , , ,..., ,n np q p q p q os respectivos postos.
( )2
1
n
i ii
S p q=
= −∑ .
O Rho de Spearman amostral
( )( )( )
( ) ( )2
2 2
1
1 1
611
n
i ii
n n
i ii i
P P Q QSR
n nP P Q Q
=
= =
− −= − =
−− −
∑
∑ ∑
O RHO de Spearman populacional
( ),i iX Y , ( ),j jX Y e ( ),k kX Y três cópias independentes de uma
população bivariada e contínua ( ),X Y .
Probabilidade de concordância do tipo 2:
2cP ( )( )P 0j i ikX X Y Y⎡ ⎤= − − >⎣ ⎦
Probabilidade de discordância do tipo 2:
2dP ( )( )P 0j i ikX X Y Y⎡ ⎤= − − <⎣ ⎦
RHO de Spearman populacional
( )2 22 23 6 3 3 6S c cd dρ = − = − = −P P P P
Relação entre o RHO de Spearman e o coeficiente de correlação produto- momento de Pearson
X e Y com distribuição conjunta normal bivariada:
6 arcsin2Sρ⎛ ⎞ρ = ⎜ ⎟π ⎝ ⎠
Variável aleatória bidimensional ( ),X Y
( )( )
( )( )
, ,,
X Y
X
Y
F x yF xF y
x y⎧⎪⎪→ ⎨⎪⎪⎩
( ) ( )( ) ( ),, ,X Y X YF x F y F x y→ Uma cópula
Sejam 0,1I ⎡ ⎤⎣ ⎦= ( ) 2,u v I∈
Cópula bi-dimensional: uma função 2:C I I→
P1 - ( ) ( )0, ,0 0C v C u= = , ( ),1C u u= e ( )1,C v v=
P2 - ( ) ( ) ( ) ( ), , , , 0C b d C a d C b c C a c− − + ≥
em que a b< c d<
v
C(u,v)
u
Exemplos de Cópulas
E1 - ( ),IC u v u v=
E2 - ( ) { }0 , max 1,0C u v u v= + −
E3 - ( ) { }1 , min ,C u v u v=
Desigualdade de Fréchet-Hoeffding:
Se ( ) { }0 , max 1,0C u v u v= + −
e ( ) { }1 , min ,C u v u v=
então
( ) ( ) ( )0 1, , ,C u v C u v C u v≤ ≤
Teorema de Sklar:
Sejam X e Y variáveis aleatórias com distribuições marginais
( ) [ ]PXF x X x= ≤ ( ) [ ]PYG y Y y= ≤
e distribuição conjunta
( ) [ ], , P ,X YH x y X x Y y= ≤ ≤ .
Então, tomando-se ( )Xu F x= e ( )Yv G y= ,
( ) ( ) ( )( )1 1,, ,X Y X YC u v H F u G v− −= é uma cópula.
Além disso:
• para quaisquer ( )XF x e ( )YG y e qualquer cópula
( ),C u v , ( ) ( ) ( )( ), , ,X Y X YH x y C F x G y= é uma conjunta
admissível.
• se ( )XF x e ( )YG y são contínuas, para cada conjunta
( ), ,X YH x y admissível existe uma e somente uma cópula
( ),C u v tal que ( ) ( ) ( )( ), , ,X Y X YH x y C F x G y= .
Propriedade: Se ( ).f e ( ).g são funções
estritamente crescentes então
, ,U V f U g VC C
⎛ ⎞ ⎛ ⎞⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠
=
Cópulas e o TAU de Kendall
τ ( ) ( ), ,4 , , 1X Y X YF x y f x y dx dy∞ ∞
−∞ −∞= −∫ ∫
( ) ( )21 1
0 0
,4 , 1
C u vC u v du dv
u v∂
= −∂ ∂∫ ∫
Cópulas e o RHO de Spearman
Sρ ( ) ( ) ( ),12 , 3X Y X YF x F y f x y∞ ∞
−∞ −∞
= −∫ ∫
( )21 1
0 0
,12 3
C u vu v du dv
u v∂
= −∂ ∂∫ ∫
Construção de Cópulas
- Método da mistura (compound)
Exemplo:
( ) ( )P | 1
P P | 1 1~ ,
xrX x e
X x E X x xGama r
γ
γγ
γ λγ λ
−−⎧ ⎡ ⎤ =⎪ ⎣ ⎦ ⎡ ⎤⎡ ⎤⎡ ⎤⎨ ⎣ ⎦ ⎣ ⎦⎣ ⎦⎪⎩
≤ −→ ≤ = ≤ = − +
1X e 2X independentes, a menos de um risco γ .
( )1 2,F x x ( ) ( ) ( )( ) ( )( )1 11 1 2 2 1 1 2 21 1 1 1
rr rF x F x F x F x
− − −⎡ ⎤= + − − + − −⎢ ⎥⎣ ⎦
( ),C u v ( ) ( )1 11 1 1 1rr ru v u v− − −
⎡ ⎤= + − − + − −⎣ ⎦
Construção de Cópulas
- Cópulas Arquimedianas
: 0,1 0,φ ⎡ ⎤ ⎡ ⎤⎣ ⎦ ⎣ ⎦→ ∞ função convexa estritamente decrescente
( ) ( )( ) ( )1 ,u v C u vφ φ φ⎡ ⎤⎣ ⎦− + =
( )( ) ( )
( )
11 0
0 0t t
tt
φ φφ
φ⎡ ⎤⎣ ⎦
−−
⎧⎪⎨⎪⎩
≤=
≥
( ).φ função geradora da cópula ( ) ( ) ( )( )1,C u v u vφ φ φ⎡ ⎤⎣ ⎦−= +
Ajuste de Cópulas: τ ( ) ( )21 1
0 0
,4 , 1
C u vC u v du dv
u v∂
= −∂ ∂∫ ∫
Os dados: X – índice de estresse hídrico da região de Castro – Paraná
Y – produtividade de soja no município de Castro – Paraná
Período de 1980/1981 a 2007/2008
( )1.156, 1.147, ..., 1.2446X =
( )2200, 2134, ..., 3126Y =
( ), 0.47Corr X Y =
As cópulas e a relação entre os parâmetros e o Tau de Kendall
( )
( )
( ) ( )
( ) ( )( ) ( )
( )( )
1
11
1 1,
Família Expressão , parâmetro Tau de Kendall
Clayton max 1 ,0 1 +2
Gumbel exp ln ln 1 1
2Normal , 1 1 arcsin
2Morgenstern 1 1- 1 1 19
U VX Y
C u v
u v
u v
N N u N u
uv u v
θθ θ
θθ θ
θ θ θ
θ θ
ρ ρπ
θ θ θ
−
−
− −
− −⎛ ⎞⎡ ⎤+ − ≥ −⎜ ⎟⎣ ⎦⎝ ⎠⎧ ⎫⎡ ⎤− − + − ≥ −⎨ ⎬⎣ ⎦⎩ ⎭
− ≤ ≤
+ − − ≤ ≤⎡ ⎤⎣ ⎦
Clayton 1.024Gumbel 1.512
0.3386Normal 0.518Morgenstern NA
θθ
τρ
=⎧⎪ =⎪= → ⎨ =⎪⎪⎩
Qualidade do ajuste
Método gráfico: comparar o scatter plot de uma amostra grande da
cópula ajustada e os pontos ( ) ( )( )1 , 1i iR n S n+ + (suporte da cópula
empírica)
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Clayton(1,024)
samp.clayton[, 1]
sam
p.cl
ayto
n[, 2
]
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Gumbel-Hougaard(1,512)
samp.gumbel[, 1]
sam
p.gu
mbe
l[, 2
]
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Clayton(1,024)
samp.clayton[, 1]
sam
p.cl
ayto
n[, 2
]
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Normal(0,518)
samp.normal[, 1]
sam
p.no
rmal
[, 2]
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Gumbel-Hougaard(1,512)
samp.gumbel[, 1]
sam
p.gu
mbe
l[, 2
]
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Normal(0,518)
samp.normal[, 1]
sam
p.no
rmal
[, 2]
Referências Anjos, U.U., Ferreira, F.H., Kolev, N.V., Mendes, B.V.M., 2004. Modelando dependências via
Cópulas. ABE. 16º SINAPE. Joe, H., 1997, Multivariate Models and Dependence Concepts, Chapman&Hall-CRC Nelsen, R.B., 2005. Dependence Modeling with Archimedian Copulas. Proceedings of the First
Brazilian Conference on Statistical Modeling in Insurance and Finance. IME-USP. http://www.lclark.edu/~mathsci/nelsen.html
Nelsen, R.B., 2002. Concordance and copulas: A survey. Kluwer Academic Publishers,
Dordrecht, pp. 169-178. http://www.lclark.edu/~mathsci/nelsen.html
Nelsen, R.B. 1999, An Introduction to Copulas, Springer.
Yan, J. 2007, Enjoy the joy of copulas: With a package copula. Journal of Statistical Software,
Volume 21, Issue 4. http://www.jstatso.org/
Genest, C., Rémillard, B. e Beaudoin, D. 2007, Goodness-of-fit for copulas: A review and a power study. Insurance:Mathematics and Economics 44, 199-213, www.sciencedirect.com
Genest, C. e Favre, A.C. , 2007. Everything You Always Wanted to Know about Copula
Modeling but Were Afraid to Ask. Journal of Hydrological Engineering . Frees, E.W. e Valdez, E.A., 1998, Understanding Relationships Using Copulas. North
American Actuarial Journal, volume 2, number 1.1