facultad de estadÍstica e informÁtica - uv.mx · resumen en el presente ... 1.6 estructura de la...
TRANSCRIPT
UNIVERSIDAD VERACRUZANA
FACULTAD DE ESTADÍSTICA E INFORMÁTICA
Modelación de los Retornos del Índice de Precios y Cotizaciones de
México con la Distribución Pareto y Censura de Tipo II
TESIS
Que para obtener el Título de:
Licenciado en Ciencias y Técnicas Estadísticas
PRESENTA:
Genoveva Lorenzo Landa
ASESOR:
Dr. Héctor F. Coronel Brizio
Xalapa-Enríquez, Ver. Diciembre 2011
ii
AGRADECIMIENTOS
Este trabajo fue realizado bajo la supervisión del Dr. Héctor Fco Coronel Brizio. A él
quiero agradecerle profundamente, haber aceptado dirigir esta tesis, todos los
conocimientos que de él he recibido y lo más importante: su entrañable amistad.
Finalmente agradezco a mis sinodales por haber dedicado tiempo a la revisión de
este trabajo:
Dr. Sergio Fco Juárez Cerrillo
M. en C. Jesús Hernández Suarez
iii
Para Ximena Desirée
iv
RESUMEN
En el presente documento se demuestra que la distribución Pareto es un modelo
adecuado para los retornos del Índice de Precios y Cotizaciones (IPC) de México.
Lo adecuado de esta distribución se evalúa con la prueba de bondad de ajuste de
Anderson-Darling para la distribución Pareto con datos con censura de tipo II. Esta
prueba fue desarrollada por Coronel-Brizio y Hernández-Montoya (2010). La
distribución Pareto ajustada a los retornos del IPC proporciona un instrumento de
análisis de riesgo del mercado accionario y bursátil de México.
v
CONTENIDO
1.INTRODUCCIÓN ..................................................................................................... 1
1.1 El IPC de México ................................................................................................ 1
1.2 Riesgo Financiero ................................................................................................ 4
1.3 Ley de Potencia para el IPC ................................................................................ 8
1.4 Pruebas de Bondad de Ajuste ............................................................................ 11
1.4.1 Prueba Ji-Cuadrada ..................................................................................... 12
1.4.2 Prueba de Kolmogorov-Smirnov ................................................................ 15
1.4.3 Prueba de Anderson-Darling ...................................................................... 18
1 . 5 Objetivo de la Tesis ......................................................................................... 19
1.6 Estructura de la Tesis ........................................................................................ 19
2.PRUEBA DE BONDAD DE AJUSTE PARA LA DISTRIBUCIÓN PARETO .... 21
2.1 La Distribución Pareto ...................................................................................... 21
2.2 Estimación de Máxima Verosimilitud con Censura Tipo II ............................. 23
2.3 Prueba de Anderson-Darling ............................................................................. 25
2.4 Procedimiento de Prueba................................................................................... 26
3.MODELO PARA EL IPC MEXICANO ................................................................. 28
3.1 Resultados ......................................................................................................... 28
3.2 Valor en Riesgo VaR ........................................................................................ 32
3.2 Conclusiones ..................................................................................................... 34
REFERENCIAS ......................................................................................................... 35
RUTINAS EN S-PLUS .............................................................................................. 36
Capítulo 1
INTRODUCCIÓN
El propósito de este capítulo es introducir el problema que motiva a este
trabajo: proporcionar un instrumento de manejo de riesgo financiero en el medio
bursátil mexicano. Este problema se traduce en ajustar una distribución de
probabilidad a las colas de la distribución de los retornos del Índice de Cotizaciones y
Precios de México. Se presenta una justificación de la distribución Pareto como
modelo para las colas de los retornos. También se presenta brevemente la
metodología básica de las pruebas de bondad de ajuste. La discusión en las Secciones
1.1 y 1.2 está basada en Cano (2010).
1.1 El IPC de México
Los índices de precios se integran por muestras de acciones del mercado que
se consideran representativas de éste debido a diversos factores, entre los que
destacan el tamaño de las empresas emisoras de las acciones así como su importancia
dentro del sector económico. En el medio bursátil, los índices sirven como medio de
pronóstico de precios. En el mercado financiero internacional destacan los índices de
las economías más fuertes, entre estos el Standard & Poors (S&P), el Índice Industrial
(Dow Jones), y el Nikkei de Japón.
En México el principal indicador que calcula la Bolsa Mexicana de Valores
(BMV) es el Índice de Precios y Cotizaciones (IPC). El IPC expresa el rendimiento
del mercado accionario en función de las variaciones de precios de una muestra de 35
2
acciones que cotizan en la BMV (véase la Tabla 1.1) y operan en diferentes sectores
de la economía. Esta muestra de emisiones es una muestra balanceada, ponderada y
representativa del conjunto total de acciones cotizadas en la Bolsa.
El IPC es un fiel indicador de las fluctuaciones del mercado accionario
mexicano y tiene como principal objetivo ser un indicador representativo de este
considerando dos conceptos fundamentales: 1) Representatividad.- La muestra que lo
compone, refleja el comportamiento y la dinámica operativa del mercado mexicano.
2) Invertibilidad.- Las series accionarias que lo integran cuentan con las cualidades de
operación y liquidez que facilitan las transacciones de compra y venta para responder
a las necesidades del mercado mexicano.
El IPC se calcula con la siguiente fórmula:
(∑
∑ )
donde:
índice en el día
Precio de la serie accionaria en el día
Acciones de la serie accionaria en el día
Factor de ajuste por acciones flotantes de la serie accionaria
Factor de ajuste por ex-derechos de la serie accionaria en el día
La siguiente tabla muestra las 35 series accionarias que conforma la muestra del IPC
al cierre del 8 de diciembre del 2011.
3
Emisora Serie Precio Anterior Ultimo PPP
AC * 60.38 59.53 59.69
ALFA A 164.59 161.50 161.73
ALSEA * 13.91 13.91 13.88
AMX L 15.97 15.55 15.61
ARA * 3.86 3.79 3.77
ASUR B 78.25 77.69 77.69
AXTEL CPO 4.37 4.29 4.30
AZTECA CPO 8.73 8.75 8.67
BIMBO A 28.24 28.00 28.00
BOLSA A 24.04 23.84 23.83
CEMEX CPO 6.86 6.54 6.54
CHDRAUI B 33.98 33.25 33.26
COMERCI UBC 21.22 21.09 21.06
COMPARC * 18.21 18.10 18.13
ELEKTRA * 1,389.41 1,390.00 1,389.60
FEMSA UBD 92.29 91.30 91.25
GAP B 47.50 47.84 47.82
GEO B 17.38 16.95 17.04
GFNORTE O 45.28 44.10 44.26
GMEXICO B 37.90 37.50 37.45
GMODELO C 88.90 88.95 88.48
GRUMA B 27.58 27.25 27.24
HOMEX * 32.34 32.10 31.88
ICA * 18.78 18.09 18.09
KIMBER A 73.60 74.00 73.62
LAB B 28.72 28.00 27.96
LIVEPOL C-1 98.03 98.97 98.96
MEXCHEM * 46.57 46.50 46.30
MFRISCO A-1 53.46 54.56 54.14
OHLMEX * 22.17 21.59 21.70
PE&OLES * 616.97 613.00 612.69
SORIANA B 33.31 32.07 32.24
TLEVISA CPO 56.84 56.69 56.66
URBI * 16.58 16.35 16.31
WALMEX V 36.99 37.45 37.29
Tabla 1.1 Emisoras que se usan para calcular el IPC, al cierre de 8/12/2011.
4
1.2 Riesgo Financiero
Dentro de un mercado financiero los instrumentos financieros se valoran de
acuerdo a su rendimiento y riesgo. El rendimiento o rentabilidad de un instrumento
financiero (ya sea un bono, una acción) en un período de tiempo dado ,
denotado por , se determina por el incremento del precio de la acción entre el
período final y el período inicial , con respecto al periodo inicial
El retorno en el tiempo t es el rendimiento expresado en relación al tiempo anterior
Las políticas económicas de una economía de mercado, es decir una economía
donde gobierna el mercado, poco pueden hacer ante la volatilidad de los mercados en
un corto plazo, ya que esta volatilidad se determina fuera del área de influencia
directa de estas políticas. Es así como, junto a la integración financiera global, la
volatilidad en los mercados financieros se ha convertido en un tema de particular
relevancia para los diferentes agentes económicos.
Para anticipar la volatilidad de los mercados, se ha desarrollado metodología
estadística para cuantificar el riesgo. Esta metodología se denomina Valor en Riesgo
(VaR). Sin embargo, la metodología VaR no considera a los eventos extremos ya que
se enfoca en toda la distribución de los retornos. Por lo que se requiere de
metodología para un mejor manejo del riesgo financiero, en particular, de modelos
5
que permitan analizar el comportamiento de los retornos extremos de los diversos
instrumentos financieros.
Bajo el supuesto de que los inversionistas son adversos al riesgo, tendríamos
que estos estarían dispuestos a asumir cierto nivel de riesgo siempre y cuando
obtengan compensaciones adicionales por este riesgo. Es decir, existe un efecto de
trade-off entre el riesgo y la utilidad esperada. En situaciones de crisis financiera,
como la que está ocurriendo actualmente desde el 2008, dicha compensación se eleva
aún más. En este contexto de trade-off entre el riesgo y la utilidad, los instrumentos
financieros se valoran de acuerdo con el rendimiento que ofrecen y el riesgo que se
deriva de ellos. La volatilidad de los precios financieros principales se percibe como
principal medida del riesgo financiero y, por lo tanto, se utiliza para tomar decisiones
de inversión.
Uno de los objetivos del manejo del riesgo financiero es el cálculo adecuado
de las magnitudes y probabilidades de grandes pérdidas así como anticipar eventos
extremos tales como choques financieros y crisis monetarias. En este sentido, el
manejo del riesgo se traduce en estimar el VaR, el cual es básicamente el cuantil de
una distribución o un proceso subyacente.
La importancia del manejo del riesgo financiero está en que permite estimar
posibles movimientos extremos del mercado financiero. El objetivo del análisis del
riesgo financiero es cuantificar el movimiento probabilístico de grandes pérdidas
inusuales y desarrollar herramientas para el manejo de riesgos extremos.
En este trabajo nos enfocamos en el análisis del riesgo financiero derivado de
la volatilidad del mercado de valores medido a través del IPC. Este tipo de riesgo se
6
conoce como riesgo de mercado, y es el riesgo de que el valor de una inversión
disminuya al mismo tiempo que los movimientos en el mercado.
En el panel superior de la Figura 1.1 observamos el comportamiento del IPC
al cierre, desde el 11 de noviembre de 1991 hasta el 29 de noviembre del 2011. Se
excluyen sábados y domingos, ya que en estos días no labora el mercado mexicano.
En total se tienen 5012 observaciones. Se puede apreciar un pronunciado crecimiento
del valor promedio de las acciones a partir del año 2003. Esto es producto de
reformas financieras realizadas principalmente durante el gobierno de Carlos Salinas
de Gortari cuando se realizó la desregulación del sistema financiero. De este proceso
de desregularización cabe mencionar la Ley de Instituciones de Crédito y la Ley
Reguladora para Grupos Financieros en 1990 y la autonomía del Banco de México a
partir de 1994. Así también, el sistema financiero mexicano, una vez sentadas las
bases para su modernización, se ve beneficiado por la puesta en marcha del Tratado
de Libre Comercio para Norte América.
Los retornos para el IPC se definen por
donde es el valor de cierre del IPC en el tiempo . En el panel inferior de la Figura
1.1 se presentan los retornos diarios del IPC para el mismo período de tiempo.
Podemos observar que el retorno negativo más elevado fue de –0.143 y se alcanzó
durante los últimos meses de 1997. En 1999 hubo otro salto importante y a
continuación se redujo la volatilidad en el mercado accionario. Debido al choque
financiero global que desde el 2008 y hasta la actualidad afecta a las economías del
mundo, vemos que la volatilidad volvió a aumentar significativamente desde finales
de 2008, alcanzó sus niveles más extremos en el 2009, para bajar un poco en el 2010
7
y el 2011. La Figura 1.2 muestra a los retornos del IPC estandarizados, que son
propiamente los datos que se analizan en el Capítulo 3.
En los retornos del IPC se puede observar mejor la volatilidad del mercado
accionario. Por lo que el análisis en este trabajo se enfoca al estudio del
comportamiento de los retornos diarios del IPC. En concreto, buscamos estimar el
VaR de estos retornos utilizando la distribución de ley de potencia también llamada
distribución de Pareto.
Tiempo
IPyC
Cie
rre
1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
50
00
15
00
03
50
00
Tiempo
Reto
rnos
1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
-0.0
60
.02
0.1
0
Figura 1.1. IPC de México, del 8/11/1991 al 29/11/2011. Arriba: Cierres. Abajo:
Retornos. Fuente: http://mx.finance.yahoo.com/q/hp?s=%5EMXX
8
-4 -2 0 2 4 6 8
02
00
40
06
00
80
01
00
01
20
0
Retornos del IPyC
Figura 1.2. Retornos estandarizados del IPC de México, de 8/11/1991 a 29/11/2011.
Fuente: http://mx.finance.yahoo.com/q/hp?s=%5EMXX
1.3 Ley de Potencia para el IPC
Se dice que una cantidad sigue la ley de potencia cuando la probabilidad de medir un
valor de esta cantidad varía inversamente como una potencia del valor. Para entender
esto, veamos el histograma a la izquierda en la Figura 1.3. Este histograma presenta
la población de los municipios de México con una población mayor a 1,000
habitantes. Vemos que el histograma tiene un pronunciado sesgo hacia la derecha.
Esto indica que la mayoría de los municipios en México tiene una población
relativamente pequeña mientras que son unos cuantos municipios que tiene población
mucho mayor que la mayoría de los municipios. Sea la fracción de
municipios que tiene una población entre y habitantes. El histograma a la
izquierda en la Figura 1.3 muestra los mismos datos que en le histograma de la
derecha pero en una escala log-log. Vemos que un interesante patrón sale a relucir,
este histograma es aproximadamente una línea recta en la escala log-log. Es decir
9
, donde y son constantes. Si exponenciamos ambos lados
de esta última expresión tenemos donde . Esto motiva a las
distribuciones de probabilidad de la forma
(1)
Las distribuciones de probabilidad que siguen la forma (1) se llaman distribuciones
de la ley de potencia. La constante se llama el exponente de la ley de potencia. La
constante es sólo una contante normalizadora para que integre 1.
Poblacion
Por
cent
aje
5*10^5 10^6 1.5*10^6
020
4060
80
log(Poblacion)
log(
Por
cent
aje)
11.5 12.0 12.5 13.0 13.5 14.0 14.5
-20
24
Figura 1.3. Izquierda: Histograma de las poblaciones de los 2322 municipios de
México con una población mayor a 1,000 habitantes. Derecha: Histograma con los
mismos datos pero una escala log-log. Fuente: Censo de Población INEGI 2000.
10
Las distribuciones de ley de potencia aparecen en una gran cantidad de
fenómenos en física, biología, demografía, ciencias de la Tierra, economía, finanzas,
por mencionar sólo algunas de las áreas en que aparece. En este trabajo se formula
la hipótesis de que las colas de la distribución de los retornos del IPC, véase el
histograma en la Figura 1.2, se describen adecuadamente por distribuciones de ley de
potencia.
Para explorar la hipótesis de ley de potencia para los retornos utilizamos los
histogramas en las figuras 1.4 y 1.5. Vemos el comportamiento lineal en los
histogramas en escala log-log, lo cual da evidencia de soporte empírico de que la ley
de potencia es un modelo que describe adecuadamente a los retornos del IPC.
Retornos
Por
cent
aje
3 4 5 6 7 8 9
020
4060
log(Retornos)
log(
Por
cent
aje)
1.2 1.4 1.6 1.8 2.0 2.2
01
23
4
Figura 1.4 Izquierda: Histograma de los retornos positivos del IPC. Derecha:
Histograma de los mismos datos pero en una escala log-log.
11
Retornos
Por
cent
aje
2.5 3.0 3.5 4.0 4.5 5.0
1020
3040
50
log(Retornos)
log(
Por
cent
aje)
1.0 1.2 1.4 1.6
1.5
2.0
2.5
3.0
3.5
4.0
Figura 1.5 Izquierda: Histograma de los retornos negativos (valor absoluto) del IPC.
Derecha: Histograma de los mismos datos pero en una escala log-log.
1.4 Pruebas de Bondad de Ajuste
Como ya se mencionó en la sección anterior, en este trabajo se busca ajustar
una distribución de ley de potencia a los retornos del IPC. Esto se hará postulando
como modelo a la distribución Pareto, ajustándola a los retornos y evaluando la
bondad del ajuste obtenido. Esto nos conduce a las llamadas pruebas de bondad de
ajuste. Estas pruebas son procedimientos que permiten decidir si un conjunto de datos
observados es consistente con una distribución de probabilidad dada. Generalmente
estas pruebas miden el grado de ajuste que existe entre la función de distribución de
los datos y la distribución teórica que se supone debe seguir esa muestra.
Una forma de obtener una muestra con censura tipo II a partir de una muestra,
es seleccionando a los r estadísticos de orden más grandes de la muestra. Este
procedimiento es precisamente el que se llevará a cabo cuando centremos la atención
en la cola derecha (izquierda) de la distribución de los retornos.
12
Formalmente una prueba de bondad de ajuste es un procedimiento para probar
la siguiente hipótesis: Sea una muestra aleatoria de una distribución y
sea es una distribución completamente especificada a excepción posiblemente de
sus parámetros. Una prueba de bondad de ajuste es una pruebe estadística de la
siguiente hipótesis nula
(2)
Algunas de las pruebas de bondad de ajuste más utilizas son la prueba ji-cuadrada, la
prueba de Kolmogorov-Smirnov, y la prueba de Anderson-Darling. La primera
prueba se emplea tanto para distribuciones continuas como discretas, mientras que la
de Kolmogorov-Smirnov y la de Anderson-Darling son para distribuciones
absolutamente continuas.
1.4.1 Prueba Ji-Cuadrada
La distribución ji-cuadrada tiene muchas aplicaciones en inferencia
estadística, por ejemplo se utiliza en la estimación de varianza y para probar
homogeneidad e independencia en tablas de contingencia.
Para probar la hipótesis (1) el rango de se particiona en intervalos y se
calculan las frecuencias observadas en cada intervalo. Luego se calculan
las frecuencias esperadas en cada intervalo bajo la distribución . El
estadístico de prueba está dado por
∑
13
Tenemos que donde es la probabilidad de que una observación caiga en
el intervalo . Por ejemplo, si es continua y es su densidad, entonces
∫
Vemos que la prueba ji-cuadrado se basa en la comparación entre la frecuencia
observada en un intervalo y la frecuencia esperada en dicho intervalo, esta frecuencia
esperada se calcula de acuerdo con la distribución formulada en la hipótesis nula. El
estadístico de prueba determina si las frecuencias observadas en la muestra están lo
suficientemente cerca de las frecuencias esperadas bajo la hipótesis nula. Vemos que
cuanto más se aproxima a cero el valor de , mejor será el ajuste de a los datos
observados. Si las diferencias entre las frecuencias observadas y esperadas son
significativas, entonces el valor del estadístico será grande indicando que se
debe rechazar.
La distribución asintótica de es la ji-cuadrada con grados de libertad
si está completamente especificada. Por otro lado, si se tienen que estimar
parámetros de , entonces la distribución asintótica de es la ji-cuadrada con
grados de libertad. Generalmente se requiere la condición de que todas las
frecuencias observadas sean mayores o iguales a cinco. Cuando no se dé esta
condición hay que proceder a un reagrupamiento con otros intervalos hasta que se
cumpla la condición.
Como ya se mencionó, la prueba ji-cuadrada se puede aplicar para cualquier
distribución ya sea discreta o continua. También es recomendable, para una mejor
calidad de la aproximación a través de la distribución asintótica, que los intervalos se
construyan de tal manera que sus probabilidades sean aproximadamente iguales.
14
Para ilustrar a la prueba ji-cuadrada, consideremos a la Tabla 1.2 que presenta
los pesos de 61 estudiantes hombres de la licenciatura en Geografía de la U.V. La
Figura 1.6 muestra el histograma de los pesos de la Tabla 1.1.
____________________________________________________________________
90 63 60 63 62 78 80 70 59 55 70 74 49 57 74 69 74 68 86 64 95 72
85 70 65 60 72 68 40 50 66 59 68 75 83 70 71 63 55 69 74 68 60 53
50 80 63 63 78 86 64 95 72 85 60 70 68 68 83 69 71
____________________________________________________________________
Tabla 1.2 Pesos de 61 hombres estudiantes de Geografía.
Interesa probar si los pesos pueden ser bien representados por una distribución
normal con media kg y desviación estándar kg. De modo que la
hipótesis nula es
es una distribución normal con y .
40 50 60 70 80 90
05
10
15
Peso
Figura 1.6. Pesos de 61 hombres estudiantes de Geografía.
15
Las probabilidades están dadas por
∫
√ ,
(
)
-
Al realizar la prueba con S-Plus, se obtiene los resultados presentados en la siguiente
tabla.
____________________________________________________________________________
Chi-square Goodness of Fit Test
data: Peso in HombresGeog
Chi-square = 3.1803, df = 4, p-value = 0.5281
alternative hypothesis: True cdf does not equal the normal Distn. for at
least one sample point.
____________________________________________________________________________
Tabla 1.3 Resultados de la prueba ji-cuadrada arrojados por S-Plus.
El estadístico de prueba es y el valor-p es , por lo que no se
rechaza y se concluye que se puede usar una distribución normal con media 68 y
desviación estándar 11 para describir a los pesos de los estudiantes.
1.4.2 Prueba de Kolmogorov-Smirnov
Sea una muestra aleatoria de la distribución . La función de
distribución empírica se define por
∑
donde
16
{
Sean los estadísticos de orden observados de la muestra
aleatoria. El estadístico de prueba de la prueba de Kolmogorov-Smirnov (KS) es
| | { [ ( ) (
)
]}
Vemos que el estadístico de prueba es la distancia vertical más grande entre la
función de distribución empírica y la distribución . La hipótesis nula se rechaza
para valores grandes de . Se demuestra que
(√ ) ∑
De modo que la prueba de KS es de distribución libre en el sentido de que los valores
críticos no dependen de la distribución La hipótesis nula (2) se rechaza con un
nivel de significancia si , donde el valor crítico se encuentra tabulado
en las tablas de la prueba de KS. La prueba de KS es aplicable para variables
aleatorias continuas; y es de especial interés para muestras pequeñas en las cuales no
es factible aplicar la prueba ji-cuadrada.
Ilustramos a la prueba K-S con los mismos datos de la Tabla 1.1 y la misma
hipótesis de normalidad. La Figura 1.7 muestra la función de distribución empírica
de los datos de la Tabla 1.1 (función escalonada) junto con la función de distribución
de la normal con media 68 y desviación estándar 11.
17
Peso
40 50 60 70 80 90
0.0
0.2
0.4
0.6
0.8
1.0
Figura 1.7. Función de distribución empírica de los pesos junto con la distribución
normal con media 68 kg y desviación estándar 11 kg.
Al realizar la prueba de KS con S-Plus se obtienen los siguientes resultados.
____________________________________________________________________
One-sample Kolmogorov-Smirnov Test
Hypothesized distribution = normal
data: Peso in HombresGeog
ks = 0.1066, p-value = 0.4927
alternative hypothesis: True cdf is not the normal distn. with the specified
parameters
____________________________________________________________________________
Tabla 1.4 Resultados de la prueba KS arrojados por S-Plus.
El valor observado del estadístico de prueba es y el valor-p es 0.4927,
por lo que no se rechaza , y se concluye que los pesos se pueden representar
adecuadamente con una distribución normal con media y desviación estándar
.
18
1.4.3 Prueba de Anderson-Darling
La prueba de Anderson-Darling (ver Stephens, 1986) se utiliza para probar si
una muestra de los datos proceden de una distribución absolutamente continua con
vector de parámetros . El estadístico de prueba de Anderson-Darling pertenece a una
clase de medidas de discrepancia, conocidas como estadísticas cuadráticas
∫
donde es la función de distribución empírica de la muestra aleatoria y
es una función que pondera a las discrepancias cuadradas. Cuando , el
estadístico se conoce como la estadística de Cramér-von Mises. La estadística de
Anderson-Darling (1954) se obtiene con { } La
estadística de Anderson-Darling utiliza a la distribución para el cálculo de valores
críticos. Esto tiene la ventaja de que se obtiene una prueba más sensible que la de KS.
Sin embargo, tiene la desventaja de que los valores críticos deberán calcularse para
cada distribución .
El estadístico de prueba de Anderson-Darling está dado por
∑ [ ( ) ( )]
∑
donde . Cuando la distribución está completamente especificada
(no hay parámetros que estimar) la distribución de no depende de aunque si
depende de . Cuando el parámetro se estima La distribución además de depender de
, también depende de la estimación del parámetro.
19
Probamos la hipótesis de normalidad del Ejemplo 1 pero ahora usando la
prueba de Anderson-Darling. El valor observado del estadístico de prueba es
, el cual es menor que el valor crítico , con , tomado de
la Tabla 4.2 de D’Agostino y Stephens (1986). Por lo que no se rechaza la hipótesis
nula .
1 . 5 Objetivo de la Tesis
El objetivo de esta tesis es proporcionar un modelo (una distribución de probabilidad)
que describa a los retornos del IPC. La distribución que se postula es la Pareto, por lo
que, después de haberla ajustado a los retornos, se evalúa la bondad del ajuste con la
prueba de Anderson-Darling para la distribución Pareto cuando ésta se ajusta a la cola
derecha de la distribución empírica de los retornos. Esta prueba fue desarrollada por
Coronel-Brizio y Hernández-Montoya (2010).
Otro objetivo que se persigue con este trabajo, es hacer disponible para estudiantes y
profesores de la Facultad de Estadística e Informática un documento introductorio
sobre bondad de ajuste. También se desarrolló código en S-Plus para implementar la
prueba de Anderson-Darling para muestras censuradas por la izquierda.
1.6 Estructura de la Tesis
El resto de este trabajo está estructurado de la siguiente forma. En el Capítulo
2 se presenta a la distribución Pareto así como los detalles de la estimación por
máxima verosimilitud de sus parámetros con muestras con censura de tipo II. Se
explica detalladamente el procedimiento de prueba de bondad de ajuste de Anderson-
Darling para la distribución Pareto, Coronel-Brizio y Hernández-Montoya (2010). En
el Capítulo 3 se ajusta la distribución Pareto a los retornos del Índice del IPC.
20
Finalmente, en el apéndice se expone con detalle el uso de los programas
desarrollados con S-Plus. También en el apéndice se incluye el código fuente S-Plus
de estos programas.
21
Capítulo 2
PRUEBA DE BONDAD DE AJUSTE PARA LA DISTRIBUCIÓN PARETO
En este capítulo se presenta a la distribución Pareto. También se presenta la
prueba de bondad de ajuste de Anderson-Darling para esta distribución cuando se
tienen muestras censuradas por la izquierda y los parámetros se estiman con máxima
verosimilitud. Esta prueba fue desarrollada por Coronel-Brizio y Hernández-Montoya
(2010).
La teoría asintótica para una muestra doblemente censurada cuando los parámetros
son conocidos se desarrolló en Pettitt y Stephens (1976). Pettitt (1976) modificó la
teoría de Durbin para probar normalidad con muestras censuradas y parámetros
estimados por máxima de verosimilitud. Coronel-Brizio y Hernández-Montoya
(2010), utilizan estos resultados para obtener la distribución asintótica de la
estadística de Anderson-Darling para la distribución Pareto bajo censura tipo II.
2.1 La Distribución Pareto
La distribución Pareto fue formulada por el profesor de economía Vilfredo
Pareto (1848-1923) originalmente para modelar distribuciones de ingreso, Pareto
(1897). A partir del trabajo de Pareto se han propuesto una gran variedad de
generalizaciones de esta distribución incluyendo algunas versiones discretas y
extensiones multivariadas.
22
Se dice que la variable aleatoria sigue la distribución Pareto con parámetros
y , denotado esto , si su función de distribución es
(
)
donde es un parámetro positivo de escala y es un parámetro positivo de
pendiente. Al parámetro se le conoce como índice de Pareto y corresponde al
negativo de la pendiente de vs . La función de densidad de la
Pareto es
La Figura 2.1 muestra la distribución y la densidad de la Pareto para distintos valores
del parámetro .
0 5 10 15 20 25 30
0.0
0.2
0.4
0.6
0.8
1.0
alfa=2alfa=1.5alfa=1alfa=.5
5 10 15 20
0.0
0.2
0.4
0.6
0.8
1.0
alfa=2alfa=1.5alfa=1alfa=.5
Figura 2.1 Funciones de distribución y densidad de la Pareto para diferentes
valores del parámetro y .
23
El valor esperado de una variable aleatoria con distribución Pareto es
La varianza de es
2.2 Estimación de Máxima Verosimilitud con Censura Tipo II
Consideremos a las observaciones más grandes
de una muestra aleatoria de la distribución Pareto. La función de
log-verosimilitud basada en esta muestra censurada por la izquierda es
* (
)
+
∑
Los estimadores de máxima verosimilitud de los parámetros y son la solución de
las ecuaciones
∑
(
)
(
)
(
)
* (
)
+
24
Al resolver las ecuaciones anteriores se obtienen los estimadores de máxima
verosimilitud
[∑
]
Consideremos a la matriz de información de Fisher
[
]
Supongamos que la proporción de censura por laaizquierda se mantiene
constante conforme . Entonces
[
]
Por lo que la matriz asintótica de varianza-covarianzas de los estimadores de máxima
verosimilitud es , donde
[
]
25
Para el caso de muestras completas ( ), el estimador es muy eficiente
en el sentido de que su varianza asintótica es , de modo que
( ) . De hecho, para , ( )
. En aplicaciones prácticas, esto significa que los resultados
distribucionales serán idénticos al caso cuando el parámetro es conocido. Por otra
parte, ⁄ ⁄ .
2.3 Prueba de Anderson-Darling
Para probar la hipótesis de que las observaciones provienen de la
distribución Pareto en base a las observaciones más grandes, se supondrá que la
proporción de censura de la muestra , permanece constante conforme el tamaño de
muestra tiende a infinito. Denotemos por el estimador de máxima
verosimilitud de los parámetros de la distribución Pareto y a la distribución con los
parámetros estimados. Recordemos que denota a la función de distribución
empírica. El proceso √ { }, evaluado en , converge a un
proceso Gaussiano { }, con cierta función de covarianza . Los
límites de la distribución dependerán de la forma funcional de y de los parámetros
estimados. Se puede demostrar que la estadística
∫
con { } , es asintóticamente una funcional del proceso
y converge débilmente a ∫
donde (√ )
Los
procesos y son Gaussianos definidos en , con funciones de
covarianza y , respectivamente, para
26
. Se sabe que la distribución límite es la de ∑ , donde son
variables aleatorias independientes ji-cuadrada, con un grado de libertad y son los
eigenvalores de la ecuación integral
∫
donde denota la función de covarianza correspondiente al proceso límite sobre la
cual se basó la prueba estadística, para este caso .
2.4 Procedimiento de Prueba
Para probar la hipótesis nula de que las observaciones , provienen de la
distribución Pareto basándonos en las observaciones más grandes
de la muestra, seguimos los siguientes pasos:
1. Obtenemos los estimadores de máxima verosimilitud de los parámetros
y de la Pareto.
2. Con los estadísticos de orden más grandes
, se calcula para .
3. Se calcula el valor de la estadística de Anderson-Darling para una muestra
con censura tipo II
∑ { } ∑
27
4. Utilizando el valor de la proporción de censura , se compara el valor
observado de con el valor adecuado de la Tabla 1.
5. Si el valor calculado de la estadística excede el valor correspondiente de la
Tabla 1, se rechaza la hipótesis nula y se concluye que, para el nivel de
significancia elegido existe evidencia estadística de que la cola derecha de la
distribución de la cual se extrajo la muestra no sigue la distribución Pareto.
La tabla 2.1 presenta los valores críticos de . Esta tabla se obtuvo numéricamente
en Coronel-Brizio y Hernández-Montoya (2010), y se reproduce a continuación con
permiso de los autores.
Proporción censurada Nivel de significancia
0.15 0.01 0.05 0.025 0.01
0.00 0.9123 1.0588 1.3181 1.5873 1.9554
0.05 0.7364 0.8566 1.0695 1.2905 1.5925
0.10 0.6354 0.7388 0.9217 1.1114 1.3706
0.15 0.5584 0.6489 0.8087 0.9743 1.2005
0.20 0.4950 0.5748 0.7157 0.8616 1.0607
0.25 0.4406 0.5114 0.6361 0.7652 0.9414
0.30 0.3928 0.4557 0.5663 0.6808 0.8368
0.35 0.3500 0.4058 0.5039 0.6054 0.7436
0.40 0.3111 0.3606 0.4474 0.5372 0.6594
0.45 0.2755 0.3191 0.3957 0.4748 0.5825
0.50 0.2425 0.2808 0.3480 0.4173 0.5117
0.55 0.2118 0.2451 0.3036 0.3639 0.4460
0.60 0.1830 0.2118 0.2621 0.3141 0.3847
0.65 0.1559 0.1804 0.2232 0.2673 0.3273
0.70 0.1303 0.1507 0.1864 0.2231 0.2731
0.75 0.1060 0.1226 0.1515 0.1813 0.2219
0.80 0.0829 0.0958 0.1184 0.1417 0.1732
0.85 0.0608 0.0703 0.0868 0.1039 0.1270
0.90 0.0397 0.0459 0.0567 0.0677 0.0828
0.95 0.0195 0.0225 0.0278 0.0332 0.0405
Tabla 2.1 Valores críticos de la distribución asintótica de la estadística para
diferentes proporciones de censura.
28
Capitulo 3
MODELO PARA EL IPC MEXICANO
En este capítulo se ajusta la distribución Pareto a los retornos estandarizados
del IPC. Se evalúa la bondad del ajuste con la prueba de Anderson-Darling y
concluimos que el ajuste es adecuado. Con la distribución Pareto ajustada a los
retornos se dispone ya de un instrumento con el que calculamos el valor en riesgo del
IPC.
3.1 Resultados
Una forma de medir el riesgo de mercado financiero es mediante lo que se
conoce como valor en riesgo, VaR, el cual se define por
donde es la función de distribución de las pérdidas. Por ejemplo, el 1% del VaR
diario sobre un portafolio es el cuantil 0.99 de . Esto significa
que con una probabilidad de 0.01, se tendrá una pérdida de . De tal manera que
en finanzas se requiere estimar el valor en riesgo financiero, VaR, de manera que la
probabilidad de exceder tal valor sea pequeña. El VaR permite que los reguladores
financieros pongan un número a su peor escenario y así planear de acuerdo a este
escenario. El VaR está basado en un cuantil que mide la pérdida esperada de un
portafolio sobre un período específico de tiempo para un nivel de probabilidad dado.
Un modelo VaR permite cuantificar el riesgo al determinar cuánto caería el
valor del portafolio en un período de tiempo dado y dada la probabilidad . La
mayoría de los modelos VaR utilizan la distribución normal para modelar la
29
distribución de la variable de mercado. Sin embargo, los cambios en esta variable
exhiben en muchos casos un marcado sesgo, por lo que se deben usar otras
distribuciones en lugar de la normal. En la Sección 1.3 vimos una justificación
empírica para usar a la distribución Pareto como modelo para los retornos del IPC.
En la Figura 3.1 se muestran los retornos del IPC que se analizan en este
trabajo y en la Tabla 3.1 se presenta los resultados del ajuste, mediante máxima
verosimilitud, de la distribución Pareto a los retornos del IPC.
0 2 4 6 8
020
040
060
080
010
00
Retornos positivos del IPyC
0 1 2 3 4 5
020
040
060
080
010
0012
00
Retornos negativos (valor absoluto) del IPyC
Figura 3.1 Izquierda: Retornos positivos del IPC. Derecha: Retornos negativos (en
valor absoluto) del IPC.
Retornos positivos 0.85 389 2.397 0.596
0.9 260 2.617 0.664
Retornos negativos 0.9 259 3.149 0.737
0.95 130 3.973 0.943
Tabla 3.1 Parámetros estimados a los retornos del IPC.
30
Para los retornos positivos, el estadístico de Anderson-Darling es con
, mientras que para es . De la inspección de la Tabla 2.1
en el capítulo anterior, vemos que ninguno de los valores observados del estadístico
de prueba es mayor que el valor crítico asociado con un nivel de significancia del
0.15. Por lo que no se rechaza la distribución Pareto para ninguna de las fracciones de
censura.
¿Cuál distribución se debería elegir para los retornos positivos? Ambas distribuciones
Pareto proporcionan una descripción adecuada de la cola derecha de los retornos.
Para responder esta cuestión, supongamos que sigue la distribución Pareto con
parámetros y ; sea un valor fijo y calculemos la distribución de
probabilidad de la variable aleatoria |
|
(
)
[ ( )
]
( )
(
)
De manera que si sigue la distribución Pareto con parámetros y , entonces la
variable aleatoria | también es Pareto con el mismo parámetro y
parámetro de escala . De acuerdo a esto, es conveniente elegir como modelo para la
cola derecha de los retornos positivos a la distribución con menor fracción de
censura. Para los retornos negativos (en valor absoluto) se tiene que para
, y para , los cuales no resultan ser significativos a un
nivel de significancia del 0.15. De la misma manera que para los retornos positivos
31
elegimos a la distribución Pareto con menor fracción de censura. La Figura 3.2
muestra el ajuste de de las distribuciones de Pareto a las colas de las distribución de
los retornos estandarizados del IPC. Vemos que la distribución Pareto proporciona un
muy buen ajuste a la distribución de los retornos.
Retornos estandarizados del IPyC
2 4 6 8
0.8
50.9
00.9
51.0
0
(a)
Retornos estandarizados del IPyC
2 4 6 8
0.9
00.9
40.9
8
(b)
Retornos estandarizados del IPyC
2 3 4 5
0.9
00.9
40.9
8
(c)
Retornos estandarizados del IPyC
2.0 2.5 3.0 3.5 4.0 4.5 5.0
0.9
50.9
70.9
9
(d)
Figura 3.2 (a) y (b) ajuste de la Pareto a los retornos negativos con y
, respectivamente. (c) y (b) ajuste de la Pareto a los retornos negativos en
valor absoluto con y , respectivamente.
32
3.2 Valor en Riesgo VaR
Supongamos que y denotemos por la función de distribución de
. Sea el valor tal que para . Tenemos que
Por lo que la cola derecha de que excede a , , está dada por
|
Si , entonces una estimación de basada en los estadísticos de
orden más grandes está dada por . En la sección anterior vimos que es Pareto
con el mismo exponente que y con parámetro de escala . De modo que si se
dispone de estimaciones de y basadas en las estadísticas de orden más grandes,
una estimación de la cola derecha de es
(
)
De tal manera que un estimador del cuantil de se obtiene resolviendo la
ecuación para , es decir, resolviendo para a la ecuación
( ) ( )
(
)
33
Lo que resulta en
(
)
Si , entonces
(
)
es el nivel que es excedido en promedio una vez cada observaciones. Este valor
particular de VaR se llama nivel de retorno .
Para los retornos negativos (en valor absoluto) estandarizados del IPC y con
tenemos, de la Tabla 3.1, que el valor en riesgo es
(
)
donde . La Figura 3.3 muestra
las estimaciones del valor en riesgo de los retornos negativos desestandarizados
donde y son la media y la desviación estándar muestrales de los retornos
negativos.
34
m
Va
R
0 200 400 600 800 1000
-0.0
26
3-0
.026
2-0
.026
2
Figura 3.3. Valor en riesgo VaR estimado para los retornos negativos del IPC.
3.2 Conclusiones
En este trabajo se ha demostrado empíricamente que la distribución Pareto
proporciona un muy buen ajuste a los retornos máximos y mínimos estandarizados
del IPC. Es interesante notar el hecho de que los índices de Pareto estimados para
el IPC son muy similares a los estimados para el índice Dow Jones en Coronel-Brizio
y Hernández-Montoya (2010). El criterio de evaluación de la bondad del ajuste del
modelo fue la prueba de bondad de ajuste de Anderson-Darling para muestras
censurada tipo II que se obtiene al analizar sólo la cola derecha de la distribución.
35
REFERENCIAS
Cano Medina, J.L. (2010). Valor en Riesgo del IPC de México, 1991-2008. Tesis de
Maestría en Estadística Aplicada, Facultad de Estadística e Informática,
Universidad Veracruzana.
Coronel-Brizio, H.F., and Hernández-Montoya, A.R. (2010). The Anderson-Darling
Test of Fit for the Power-law distribution from Left-Censored Samples.
Physica A 389, 3508-3515.
Coronel-Brizio, H.F., and Hernández-Montoya, A.R. (2010). On fitting the Pareto
Levy Distribution to Stock Market Index Data. Physica A 389, 3508-3515.
D’Agostino, R.B., and Stephens, M. A., eds. (1986). Goodness of Fit Techniques.
Marcel Dekker: New York.
Pareto, V. (1897). Cours d´ Economie Politique. Paris: Rouge et Cie.
Pettitt, A.N., and Stephens, M.A. (1976) Modified Cramér-von Mises Statistics for
Censored Data. Biometrika 63 (2), 291-298.
Pettitt, A.N. (1976). Cramér-von Mises Statistics for Testing Normality with
Censored Samples. Biometrika 63 (3), 475-481
36
Apéndice
RUTINAS EN S-PLUS
Todos los cálculos y gráficas en este trabajo se hicieron con S-Plus. Los datos del IPC
están disponibles con la autora de la tesis. Los programas desarrollados se
proporcionan a continuación.
fd Función que calcula la función de distribución de la Pareto.
fdp Función que calcula la función de densidad de la Pareto.
fde Función que calcula la función de distribución de la Pareto.
fdp.x Función que calcula la función de distribución empírica de un vector de
datos.
fde.pl Función que grafica la función de distribución empírica de un vector de
datos.
genpareto Función que genera un valor de la distribución Pareto.
censura Función que censura por la izquierda y deja a las observaciones más
grandes.
A2 Función que calcula el estadístico de Anderson-Darling
emv Función que calcula a los estimadores de máxima verosimilitud de la Pareto con
censura a la izquierda.
A2.normal.a Función que calcula el estadístico de Anderson-Darling para la
distribución normal.
37
Para ilustrar las funciones, inicializamos el generador de números aleatorios de S-
Plus y generamos una muestra de tamaño de la Pareto con y .
> set.seed(432)
> x <- genpareto(100,2,1)
> x
[1] 1.687216 2.667046 1.017458 1.069660 1.152603 1.431605
[7] 3.799420 1.195529 1.705044 2.121521 1.553031 1.051674
[13] 1.151596 1.556263 5.117358 1.233053 2.003647 2.283544
[19] 1.736541 1.123736 1.082231 1.154423 1.033706 1.152212
[25] 1.126433 1.167067 1.373517 8.114096 1.513935 1.252752
[31] 1.154932 1.286329 1.527050 1.092684 1.121349 1.308099
[37] 2.898308 1.689457 4.128898 1.356980 1.738313 1.102319
[43] 1.168519 1.227944 2.452619 2.334055 1.782781 1.520594
[49] 6.941220 1.214688 1.274487 2.979003 1.497816 5.451926
[55] 1.194129 1.064556 2.459160 2.216537 2.680982 1.770505
[61] 1.093560 1.338959 2.216390 1.082154 1.105839 4.519783
[67] 1.571613 1.045683 1.312738 1.550378 6.184972 1.107790
[73] 1.162152 1.259858 3.795919 1.188155 1.165379 1.089060
[79] 2.038047 1.074481 1.313160 3.249544 1.138232 1.124086
[85] 1.462360 1.137820 1.070920 1.393945 1.129202 3.613703
[91] 2.466538 1.073348 1.900893 1.071854 1.716322 2.803998
[97] 4.465105 1.016972 1.192603 1.051170
Graficamos la función de distribución empírica y el histograma de los datos x
> fde.pl(x)
x
2 4 6 8
0.0
0.2
0.4
0.6
0.8
1.0
38
> hist(x)
2 4 6 8
02
04
06
0
x
Las estimaciones de máxima verosimilitud de la muestra con 50 observaciones
censuradas por la izquierda son
> emv(x,50)
$alfa:
[1] 1.794845
$teta:
[1] 0.9100138
Finalmente, calculamos el estadístico de Anderson-Darling
> A2(x,50)
[1] 0.0987323
El código fuente de los programas en S-Plus se presenta a continuación.
# Funcion de distribucion de la Pareto
# Entrada: y, parametros alfa y teta
# Salida: Funcion de distribucion en y
fd <- function(y,alfa,teta)
{
p <- 1 - (teta/y)^alfa
return(p)
}
39
# Funcion de densidad de la Pareto
# Entrada: valor y, parametros alfa y teta
# Salida: Funcion de densidad en y
fdp <- function(y,alfa,teta)
{
z <- (alfa*(teta^alfa))/(y^(alfa+1))
return(z)
}
# Funcion de ditribucion empirica en el punto x
# Entrada: valor x, vector de observaciones datos
# Salida: Funcion de distribucion en x
fde <- function(x,datos)
{
n <- length(datos)
length(datos[datos<=x])/n
}
# Funcion de distribucion empirica del vector x
# Entrada: vector de observaciones x
# Salida: Funcion de distribucion empirica del vector x
fde.x <- function(x)
{
p <- 0
x <- sort(x)
for(i in 1:length(x)) p[[i]] <- fde(x[[i]],x)
p
}
# Grafica de la funcion de distribucion empirica
# Entrada: vector de observaciones d
# Salida: Funcion de distribucion empirica del vector d
fde.pl <- function(d)
{
y <- 0
d <- sort(d)
for(i in 1:length(d)) y[[i]] <- fde(d[[i]],d)
plot(stepfun(d,y,type="right"), type="l",xlab="x",ylab=" ")
}
# Funcion que genera un valor de la Pareto
# Entrada: tamaño de muestra n, parametros alfa y teta
# Salida: vector de datos generados de la distribucion Pareto
genpareto <- function(n,alfa,teta)
{ y <- teta/(runif(n))^(1/alfa)
return(y) }
40
# Funcion que censura por la izquierda
# y deja a a las r observaciones mas grandes
# Entrada: vector de datos y, numero de observaciones que se
censura r
# Salida: muestra con las r observaciones más grandes
censura <- function(y,r)
{
n <- length(y)
x <- sort(y)
if(r < n)
{x <- x[-c(seq(1,(n-r)))]}
return(x)
}
# Funcion que calcula el estadistico de Anderson-Darling para
muestras
# censuradas por la izquierda
# Entrada: vector de observaciones y, numero de observaciones
se censura r
# Salida: Estadistico de Anderson-Darling para la Pareto
A2 <- function(y,r)
{
n <- length(y)
estimaciones <- emv(y,r)
alfa <- estimaciones$alfa
teta <- estimaciones$teta
# Aqui se censura a la muestra y
x <- censura(y,r)
# Aqui se calcula el estadistico de A-D
z <- fd(x,alfa,teta)
i <- seq(r,1)
a <- -(1/n)*sum((2*i - 1)*(log(1-z)-log(z)))
b <- -2*sum(log(z))
c <- -(1/n)*((r - n)^2*log(z[1]) - r^2*log(1 - z[1]) +
n^2*(1 - z[1]))
AD <- a + b + c
return(AD)
}
# Estimadores de maxima verosimilitud de la Pareto
# con censura a la izquierda
# Entrada: vector de observaciones y, numero de observaciones
se censura r
# Salida: Estimaciones de maxima verosimilitud de los
parametros de la Pareto
41
emv <- function(y,r)
{
n <- length(y)
x <- censura(y,r)
a <- sum(log(x)-log(x[1]))
alfa <- r/a
teta <- ((r/n)^(1/alfa))*x[1]
return(alfa,teta)
}
# Anderson-Darling para la normal sin estimar los parametros
# Entrada: vector de observaciones x, parametros de la normal
media y desv
# Salida: Estadistico de Anderson-Darling para la normal
A2.normal.a <- function(x,media,desv)
{
n <- length(x)
z <- (x - media)/desv
z <- sort(z)
# Aqui se calcula el estadistico de A-D
p <- pnorm(z)
i <- seq(1,n)
a <- -n - (1/n)*sum((2*i - 1)*(log(p)) + (2*n + 1 -
2*i)*log(1-p))
return(a)
}
# Anderson-Darling para la normal estimando los parametros
# Entrada: vector de observaciones x
# Salida: Estadistico de Anderson-Darling para la normal
A2.normal.b <- function(x)
{
n <- length(x)
media <- mean(x)
desv <- sqrt(var(x))
z <- (x - media)/desv
z <- sort(z)
# Aqui se calcula el estadistico de A-D
p <- pnorm(z)
i <- seq(1,n)
a <- -n - (1/n)*sum((2*i - 1)*(log(p)) + (2*n + 1 -
2*i)*log(1-p))
return(a)
}