josé miguel cerda olivares
TRANSCRIPT
PAIRS TRADING DE ALTA FRECUENCIA Y DINÁMICO OPTIMIZADO CON
OPTIMIZACIÓN DE COLONIA DE HORMIGAS.
Tesis de Grado presentado por
José Miguel Cerda Olivares
como requisito parcial para optar al título de
Ingeniero Civil Industrial
y al grado de
Magíster en Ciencias de la Ingeniería Industrial
Profesor Referente:Dr. Werner Kristjanpoller Rodríguez
Profesor Coreferente Interno:Dr. Javier Scavia dal Pozzo
Profesor Coreferente Externo:Dr. Nicolás Rojas Morales
Febrero 2019
UNIVERSIDAD TÉCNICA FEDERICO SANTA MARÍADEPARTAMENTO DE INDUSTRIAS
PAIRS TRADING DE ALTA FRECUENCIA Y DINÁMICO OPTIMIZADO CON
OPTIMIZACIÓN DE COLONIA DE HORMIGAS.
Tesis de Grado presentado por
José Miguel Cerda Olivares
como requisito parcial para optar al título de
Ingeniero Civil Industrial
y al grado de
Magíster en Ciencias de la Ingeniería Industrial
Profesor Referente:Dr. Werner Kristjanpoller Rodríguez
Profesor Coreferente Interno:Dr. Javier Scavia dal Pozzo
Profesor Coreferente Externo:Dr. Nicolás Rojas Morales
VALPARAÍSO, Febrero 2019
TITULO DE LA TESIS:
PAIRS TRADING DE ALTA FRECUENCIA Y DINÁMICO OPTIMIZADO CON
OPTIMIZACIÓN DE COLONIA DE HORMIGAS.
AUTOR:
José Miguel Cerda Olivares
TRABAJO DE TESIS, presentado en cumplimiento parcial de los requisitos para el Grado
de Magíster en Ciencias de la Ingeniería Industrial y de Ingeniero Civil Industrial de la
Universidad Técnica Federico Santa María.
Dr. Werner Kristjanpoller Rodríguez ....................................................................
Dr. Javier Scavia dal Pozzo ....................................................................
Dr. Nicolás Rojas Morales ....................................................................
VALPARAÍSO, Chile. Febrero 2019
AGRADECIMIENTOS
En primer lugar quisiera agradecer a Dios por darme esta bendición.
Agradecer también a mi familia, a los que están y a los que ya partieron, sin ellos nada
de esto hubiera sido posible, en especial a mis padres y a mi bisabuela que lo han dado todo
por mi.
A mis amigos y a Maca, que fueron parte fundamental de esta etapa universitaria.
A todos los profesores que formaron parte de este proceso de aprendizaje. En especial
al profe Werner y a Nicolás Rojas, que fueron un gran apoyo en la misión de realizar el
paper.
También destacar a Caneo y a tío Kevin, por su disposición y ayuda en el proceso
de investigación, gracias a su ayuda la investigación llegó a buen puerto y en un tiempo
esperado.
RESUMEN EJECUTIVO
Se propone un algoritmo metaheurístico para la optimización de los umbrales de
decisión de Pairs Trading. Este modelo fue aplicado a datos de alta frecuencia del mercado
Forex, con una frecuencia de 15 minutos. El Pairs Trading tiene un enfoque de PCA y la
optimización de umbrales se hizo basado en Colonia de Hormigas. Para la creación de
Ant Colony Optimization to Pairs Trading (ACO-PT) se inspiró en ACO-FRS, generando
modificaciones como por ejemplo la discretización de las variables.
Se generaron 3 algoritmos de ACO-PT, para así evaluar la efectividad de cada com-
ponente. Respecto al caso de no haber optimizado los umbrales, ACO-PT1, mostró una
mejora en la rentabilidad anualizada de 13.21 % y una mejora en el índice de Sharpe de
9.01 %. ACO-PT2 mostró una mejora de 13.09 % en rentabilidad y de 7.85 % en el índice
de Sharpe. Con respecto al algoritmo ACO-PT3, no fue posible confirmar estadísticamente
una mejora después de aplicar la prueba de Wilcoxon. Como resultado, podemos concluir
que la variación del algoritmo propuesto que mostró el mejor rendimiento (ACO-PT1)
también fue el algoritmo con menos pasos y, por lo tanto, el más simple y más rápido.
Palabras Clave: Ant Colony Optimization, FOREX, Meteheurística.
Departamento de Industrias, Universidad Técnica Federico Santa María iv
ABSTRACT
En los últimos años ha habido una explosión de investigaciones con metaheurísticas,
que proporcionan soluciones eficientes, es decir, casi óptimas con tiempos de computación
razonables. Dado esto tiene sentido aplicar las metaheurísticas en las finanzas, debido a
que muchas de las decisiones financieras deben tomarse en un tiempo muy corto, minutos
o segundos, como es el caso del trading de alta frecuencia. En esta tésis se propone un
algoritmo basado en metaheurísticas de Optimización de Colonias de Hormigas para
optimizar dinámicamente los umbrales de decisión ofrecidos por la estrategia de inversión
de Pairs Trading, este algoritmo se denomina Optimización de Colonias de Hormigas para
Pairs Trading (ACO-PT). El modelo se optimiza moviendo ventanas de entrenamiento-
trading. La propuesta se aplica a datos de Forex en alta frecuencia, que consta de 38 divisas,
con una frecuencia de 15 minutos, desde el 22 de septiembre del 2017, desde las 00:00:00
horas hasta el 6 de julio de 2018 a las 16:45:00. Está comprobado que ACO-PT se puede
usar en mercados profundos de manera eficiente, obteniendo un rendimiento anualizado
de 30.3357 %, lo que se traduce en una mejora de 13.2064 % sobre el caso base con
umbrales fijos. De los resultados se concluye que la variación del algoritmo que tiene mejor
rendimiento es también la variación más simple y, por lo tanto, la más rápida.
Palabras Clave: Ant Colony Optimization, FOREX, Meteheurística.
Departamento de Industrias, Universidad Técnica Federico Santa María v
ÍNDICE DE CONTENIDOS ÍNDICE DE CONTENIDOS
Índice de Contenidos
1. Introduccion 11.1. Motivacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.1. Objetivo Principal . . . . . . . . . . . . . . . . . . . . . . . . . 41.2.2. Objetivos Secundarios . . . . . . . . . . . . . . . . . . . . . . . 4
1.3. Alcance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2. Marco Teorico 52.1. Forex . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.1. Características de Forex . . . . . . . . . . . . . . . . . . . . . . 62.2. Principal Components Analysis . . . . . . . . . . . . . . . . . . . . . . . 62.3. Pairs Trading . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82.4. Ant Colony Optimization . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3. Algoritmo Propuesto 143.1. ACO-FRS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143.2. ACO-PT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4. Resultados 254.1. Principal Components Analysis . . . . . . . . . . . . . . . . . . . . . . . 254.2. ACO-PT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5. Conclusiones 30
Bibliografía 32
A. Titulo del anexo... 35
Departamento de Industrias, Universidad Técnica Federico Santa María vi
ÍNDICE DE TABLAS ÍNDICE DE TABLAS
Índice de Tablas
3.1. Condiciones para evaluación ACO-FRS. . . . . . . . . . . . . . . . . . . 18
4.1. Fijación de parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . . 284.2. Resultados para cada algoritmo . . . . . . . . . . . . . . . . . . . . . . . 29
Departamento de Industrias, Universidad Técnica Federico Santa María vii
ÍNDICE DE FIGURAS Nomenclatura
Índice de Figuras
4.1. Rendimiento Acumulado para distintos M . . . . . . . . . . . . . . . . . 264.2. Rendimiento Acumulado para distintas Varianzas . . . . . . . . . . . . . 27
Departamento de Industrias, Universidad Técnica Federico Santa María viii
CAPÍTULO 1. INTRODUCCIÓN
Capitulo 1
Introduccion
1.1. Motivacion
La estrategia de Trading cuantitativo conocida como Pairs Trading se ha vuelto cada
vez más popular desde mediados de los años ochenta. Esta estrategia ha sido ampliamente
utilizada por traders y fondos de cobertura con el objetivo de mejorar el rendimiento de
la inversión. Los algoritmos que se han basado en esta estrategia no son accesibles para
los investigadores ni para el público en general debido a la naturaleza propietaria del
área (por ejemplo, datos de alta frecuencia). Esto ha resultado en una cantidad limitada
de investigaciones publicadas en este campo hasta un reciente estallido de interés en el
tema como por ejemplo en [1] y [2]. Tras este reciente aumento de interés, los estudios de
investigación en este campo se han realizado de forma empírica, estudiando el comercio de
alta frecuencia de forma indirecta a través del comportamiento comercial observado, tal
como en [3]y en [4], se declaró cautelosamente que la brecha entre las finanzas académicas
y la industria financiera está evolucionando progresivamente. El presente estudio tiene
como objetivo ayudar a reducir esta brecha entre el estudio académico de las finanzas y la
industria financiera.
En este estudio, utilizamos el método de arbitraje estadístico, que se define como una
estrategia de inversión que explota modelos matemáticos para generar retornos a partir
de movimientos sistemáticos en los precios de los valores. Un aspecto importante del
arbitraje estadístico es obtener resultados positivos y superiores para el mercado a través
Departamento de Industrias, Universidad Técnica Federico Santa María 1
1.1. MOTIVACIÓN CAPÍTULO 1. INTRODUCCIÓN
de un libro de contabilidad neutral tal como se expresó en [5]. Como se demostró en
[6], el arbitraje estadístico se puede usar para identificar cuándo surge una brecha por
ineficiencias en el mercado. En [7] se postula que Pairs Trading se considera el antepasado
del arbitraje estadístico. En [8] se explicó que aunque la investigación académica de esta
estrategia es aún pequeña en comparación con la investigación centrada en otras estrategias
(p. ej., estrategias Contrarian y Momentum), la investigación de Pairs Trading está ganando
impulso en cinco áreas de investigación: enfoque de distancia, enfoque de cointegración,
enfoque de serie de tiempo, enfoque de control estocástico y otros enfoques. Existen tres
categorías en el campo de otros enfoques que fueron presentadas en [8], las cuales son:
Enfoque de Machine Learning y pronóstico combinado, Enfoque de cópula y Enfoque de
análisis de componentes principales.
Los estudios principales en el primer grupo de Otros enfoques fueron presentados
en [9] y [2]. Estos estudios proponen combinaciones de Machine Learning (ML) y el
enfoque de pronósticos combinados. Específicamente, se proponen tres etapas: Pronóstico,
Outranking y Trading. En la etapa de pronóstico, se utilizan redes neuronales. En las etapas
de clasificación y cambios en el comercio, se utiliza un Método de decisión de criterios
múltiples (MCDM) llamado ELECTRE III. Otro estudio aplicado en este contexto es el
enfoque de la cópula que, según lo expresado en [8], puede clasificarse como: Método de
la cópula basada en el retorno y Método de la cópula basada en el nivel. Hay estudios que
analizan datos de Forex de alta frecuencia utilizando estos métodos como por ejemplo en
[10].
Con respecto al tercer grupo de Otros enfoques, en [7] se propuso el uso del Análisis de
componentes principales (PCA) para crear eigenportfolios y hacerlos parte de un modelo
multifactor del cual su residual se modela como un proceso Ornstein-Uhlenbeck que luego
se usa para generar una señal de compra-venta. Una vez que se han obtenido las señales,
la decisión de compra-venta se determina comparándola con los umbrales fijos que se
han determinado empíricamente. Para maximizar el beneficio a largo plazo, es necesario
utilizar los valores correctos de los umbrales. Por ejemplo, si los valores de los umbrales
son demasiado similares, requerirá menos tiempo para completar la operación y será menos
beneficioso que si los valores de los umbrales fueran muy diferentes tal como se expresa en
Departamento de Industrias, Universidad Técnica Federico Santa María 2
1.1. MOTIVACIÓN CAPÍTULO 1. INTRODUCCIÓN
[11].
El Trading de alta frecuencia (HFT) es un tipo de comercio algorítmico, lo que significa
que utiliza herramientas tecnológicas para automatizar las decisiones comerciales. Estas
decisiones se caracterizan por una relación entre la velocidad de toma de decisiones y el
beneficio de cada decisión, esto se explica en [3]. Una opción para aplicar HFT es Forex, el
mercado más líquido del mundo, con una facturación de 5,1 billones de dólares por día,
con operaciones 24/5 y una gran cantidad de apalancamiento. Esto permite a los operadores
responder casi inmediatamente a las fluctuaciones en las divisas como se expresa en [12] y
[13]. Sin embargo, esta técnica no solo acentúa la liquidez característica de este mercado,
sino que también acentúa el riesgo lo cual es afirmado en [13].
En finanzas, hay muchos estudios y aplicaciones que usan métodos exactos. Debido a
que la resolución de problemas de NP-hard tradicionalmente requeriría demasiado tiempo
de computo, ha habido una oleada de investigaciones que involucran metaheurísticas,
proporcionando soluciones eficientes que están cerca de ser óptimas y ofrecen tiempos de
computo razonables. Esto hace que el uso de estos métodos algorítmicos sea razonable, ya
que muchas decisiones financieras deben tomarse en un lapso de tiempo muy corto, como
minutos o segundos tal como se afirma en [14].
En este estudio, la metodología presentada en [7] se aplica a la toma de decisiones de
inversión en el mercado Forex a través de la Optimización de Colonia de Hormigas para
datos de alta frecuencia. Este algoritmo es una metaheurística inspirada en la naturaleza,
que se utiliza para resolver problemas difíciles de optimización combinatoria (CO) como
se muestra en [15], en este estudio se usó para encontrar los umbrales óptimos de los pares,
operar dinámicamente en términos de las decisiones que se realizan cada quince minuto, y
en un tiempo de computación razonable.
Departamento de Industrias, Universidad Técnica Federico Santa María 3
1.2. OBJETIVOS CAPÍTULO 1. INTRODUCCIÓN
1.2. Objetivos
1.2.1. Objetivo Principal
El objetivo de este estudio es proponer un algoritmo basado en Optimización de Colonia
de Hormigas para optimizar de forma dinámica los umbrales de decisión de Pairs Trading.
1.2.2. Objetivos Secundarios
Mejorar el uso de las metaheurísticas de Optimización de Colonias de Hormigas
cuando se aplique a una estrategia de Trading.
Aportar a la literatura sobre los algoritmos de Trading de alta frecuencia.
Obtener una mejor precisión y rendimiento que el caso base con umbrales fijos y que
el mercado.
1.3. Alcance
En este estudio, la metodología presentada en [7] se aplica a la toma de decisiones de
inversión en el mercado Forex a través de la optimización de colonia de hormigas de alta
frecuencia. La novedad que ofrece este enfoque es el uso de la Optimización de la Colonia
de Hormigas para optimizar los umbrales de Pairs Trading. Según lo que se conoce, este
estudio es único en el uso de Pairs Trading en el mercado Forex a través de High Frequency
Trading con un enfoque de PCA. En particular, se creó un algoritmo metaheurístico para
abordar mejor la estrategia de inversión basada en Pairs Trading dada la alta frecuencia de
los datos a los que se aplicó, es decir, la Optimización de Colonias de Hormigas para Pairs
Trading (ACO-PT).
Departamento de Industrias, Universidad Técnica Federico Santa María 4
CAPÍTULO 2. MARCO TEÓRICO
Capitulo 2
Marco Teorico
Pairs Trading es uno de los primeros métodos de comercio cuantitativo que se utilizan
en Wall Street y su uso se remonta a la década de 1980 como se afirma en [16]. Pairs
Trading es una estrategia comercial que aprovecha las ineficiencias del mercado basadas en
un par de acciones (o divisas como es el caso). Por ejemplo, si las divisas P y Q están en la
misma industria o tienen características similares y una sigue a la otra, se puede esperar
que los rendimientos de las dos sea modelable. El objetivo es identificar dos acciones que
se mueven juntas y tomar posiciones largas y cortas simultáneamente cuando divergen de
manera anormal. Por lo tanto, se espera que los precios de las dos acciones converjan en el
futuro tal como fue expreado en [17], [18], [19] y [7].
La metodología consiste en generar eigenportfolios por medio de un análisis de com-
ponentes principales (PCA) y de un modelo paramétrico simple, el cual es llamado proceso
Ornstein-Uhlenbeck, que genera un parámetro definido como s-score, el cual representa la
distancia en desviaciones estándar a su equilibrio.
Al comparar s-score con umbrales, se define una decisión de inversión. En la literatura
los umbrales se determinaron de manera fija para todos los períodos, en este trabajo se
propone un enfoque de optimización del problema. Esto significa que se buscaran los
umbrales que optimizan dinámicamente la ventana de entrenamiento definida previamente,
para así pronosticar su uso para futuras ventanas de trading.
Departamento de Industrias, Universidad Técnica Federico Santa María 5
2.1. FOREX CAPÍTULO 2. MARCO TEÓRICO
2.1. Forex
Forex es el mercado en donde se comercializan las divisas, siendo este, el mercado más
grande del mundo. Este mercado es un descentralizado y es categorizado como Over The
Counter (OTC), es decir no se realiza en una bolsa formal, siendo así más rápidas, baratas,
y además se completan sin la supervisión de un supervisor.
2.1.1. Características de Forex
Liquidez: El término de liquidez a nivel de mercado se utiliza para caracterizar el
movimiento que existe en un mercado, siendo el caso de Forex el más líquido del
mundo, como se mencionó anteriormente Forex mueve 5,1 billones de dólares por
día. También se suele decir que el tipo de cambio EUR/USD durante un año mueve
más dinero que todos los activos de Wall Street.
Apalancamiento: Forex ofrece grandes apalancamientos a sus inversores, llegando
incluso al 400:1, es decir que con 1 USD, se pueden comerciar 400 USD.
Siempre Abierto: Otra gran característica que tiene Forex es que en cualquier día, a
cualquier hora se puede encontrar actividad, esto debido a que los mercadores se van
relevando dado su uso horario.
Software Estándar: Todos los brokers ofrecen acceso al mismo software, Metatrader,
pudiendo cambiar la interfaz.
2.2. Principal Components Analysis
El objetivo de esta sección es determinar las entradas que se utilizará en la estrategia
de Pairs Trading. Estas entradas se denominan como eigenportfolios, que se utilizarán para
modelar el s-score en la siguiente sección.
Considere que fi,t sea el precio del tipo de cambio i, (i = 1, ...,N), en el período t,
Departamento de Industrias, Universidad Técnica Federico Santa María 6
2.2. PRINCIPAL COMPONENTS ANALYSIS CAPÍTULO 2. MARCO TEÓRICO
(t = 1, ...,T ), la rentabilidad logarítmica de la serie de precios de divisas i se define como:
ri,t = logfi,t
fi,t−1(i = 1, ...,N) (t = 1, ...,T ) (2.1)
Para una ventana que contiene M datos, que se moverá en un total de T periodos, se
define:
ri,t =1M
t∑l=t−M+1
ri,l (i = 1, ...,N) (t = 1, ...,T ) (2.2)
y se define como:
σi,t =1
M − 1
t∑l=t−M+1
ri,l − ri,t)2 (i = 1, ...,N) (t = 1, ...,T ) (2.3)
Con el objetivo de buscar y tratar la diferencia de medias y desviaciones estándar de
cada serie de rendimientos en el mercado de divisas, se utilizó la siguiente estandarización:
Yi,t =Ri,t − Ri,t
σi,t(i = 1, ...,N) (t = 1, ...,T ) (2.4)
Una vez que se normaliza la serie de rendimientos de la divisa, hay una desviación
estándar unitaria y, por lo tanto, la matriz de covarianza es idéntica a la matriz de correlación
de Pearson, que se define como:
ρi, j,t =1
M − 1
t∑l=t−M+1
Yi,tY j,t (i, j = 1, ...,N) (t = 1, ...,T ) (2.5)
Sea λi,t el i-ésimo valor propio en el período t de la matriz ρi, j,t, con:
N ≥ λ1,t ≥ λ2,t ≥ .... ≥ λN,t ≥ 0 (2.6)
La cantidad de varianza explicada por el i-ésimo eigenvalue viene dada por la siguiente
expresión:
(S )2i,t =
λi,t∑Nj=1 λ j,t
i = 1, ...,N t = 1, ...,T (2.7)
Departamento de Industrias, Universidad Técnica Federico Santa María 7
2.3. PAIRS TRADING CAPÍTULO 2. MARCO TEÓRICO
Los vectores propios se definen como:
v( j)t ,= (v( j)
1,t , ...., v( j)N,t) ( j = 1, ...,N) (t = 1, ...,T ) (2.8)
La selección de un buen par de divisas para la negociación es la etapa más importante
de la reversión de la estrategia de arbitraje estadístico neutral del mercado [6]. El parámetro
m se usa para determinar el número de componentes principales que explican una cierta
cantidad de varianza explicada (N ≥ m), que luego se agregan a un modelo multifactorial.
Para cada valor propio λi,t, se asigna una eigenportfolio compuesta por los N divisas
analizadas que se propone en [7]. El peso de estas divisas en cada eigenportfolio viene
dado por la siguiente expresión:
Q( j)i,t =
v( j)i,t
σi,tj = 1, ...,m t = 1, ...,T (2.9)
Para obtener posteriormente los rendimientos de cada eigenportfolio, se calcula el
porcentaje que tendrá cada divisa dentro de la cartera, mediante la siguiente fórmula:
Q( j)i,t =
Q( j)i,t∑N
i=1 Q( j)i,t
j = 1, ...,m t = 1, ...,T. (2.10)
La expresión que representa el retorno de la eigenportfolio j en el período t es:
F j,t =
N∑i=1
Q( j)i,t ri,t j = 1, ...,m t = 1, ...,T (2.11)
2.3. Pairs Trading
Esta subsección describe la metodología utilizada para modelar el s-score que luego
se usará para interpretar la información junto con las reglas impuestas desde los umbrales.
Para modelar el s-score se utilizó el proceso conocido como Ornstein-Uhlenbeck.
Como se señaló en [6], dada la importancia de la selección de dos pares buenos, se usa
un modelo multifactorial para representar cada divisa frente al grupo de m eigenportfolios.
Departamento de Industrias, Universidad Técnica Federico Santa María 8
2.3. PAIRS TRADING CAPÍTULO 2. MARCO TEÓRICO
Se utilizó el siguiente modelo multifactorial expresado en [7]:
d fi(t)fi(t)
= αidt +
m∑j=1
βi, jdI j(t)I j(t)
+ dXi(t) i = 1, ...,N t = 1, ...,T (2.12)
fi(t) representa el precio de una divisa i en el período t. El lado derecho es una regresión
lineal, donde la variable explicativa I j(t) representa al eigenportfolio j, ya que la suma
es el m eigenportofolio que se seleccionó anteriormente. Xi(t) corresponde al diferencial
entre la divisa i y el grupo de eigenportfolios, lo que significa que dXi(t) es el aumento del
diferencial.
A nivel de estrategia, por cada αi dólares que se invierten en una posición larga en la
divisa i, se debe invertir βi, j dólares en una posición corta para cada eigenportfolio j. Por
ejemplo, cuando invierte αi dólares en posiciones cortas en la divisa i, debe invertir βi, j
dólares en posiciones largas para cada eigenportfolio j.
A continuación, se propone un modelo paramétrico simple para Xi(t), es decir, el
proceso Ornstein-Uhlenbeck tal como se propone en [7],
dXi(t) = ki(mi − Xi(t))dt + σidWi(t) i = 1, ...,N t = 1, ...,T (2.13)
Este es un proceso AR-1, estacionario y autorregresivo con rezago 1. La expectativa
condicional viene dada por la siguiente expresión:
E(dXi(t)|Xi(s), s ≤ t) = ki(mi − Xi(t))dt i = 1, ...,N t = 1, ...,T (2.14)
El parámetro mi es la reversión media, ki representa la velocidad de la reversión media.
Resolviendo:
Xi(t0 + ∆t) = e−ki∆tXi(t0) + (1 − e−ki∆t)mi + σi
∫ t0+∆t
t0e−ki(t0+∆t−s)dWi(s) (2.15)
i = 1, ...,N t = 1, ...,T
Este proceso normalmente se distribuye con media mi y varianza σ2i
2ki.
Departamento de Industrias, Universidad Técnica Federico Santa María 9
2.3. PAIRS TRADING CAPÍTULO 2. MARCO TEÓRICO
La señal si se define como:
si,t =Xi(t) − mi
σi/√
2kii = 1, ...,N t = 1, ...,T (2.16)
Donde σi/√
2ki representa la desviación de equilibrio.
El parámetro si,t se define como el s-score, que representa la distancia en desviaciones
a la reversión media mi. Teniendo en cuenta los últimos M datos, se define como:
Ri,t = β0 +
m∑j=1
βi, jI j,t + εi,t t = 1, ...,T (2.17)
Siendo I j,t el retorno del eigenportfolio j en el período t. Del residual εi,t se puede
obtener la forma discreta de Xi,t:
Xi,t =
t∑l=1
εi,t t = 1, ...,T i = 1, ...,N (2.18)
Expresando la Ecuación 2.15 de la forma AR (1) para luego despejar mi, σi, ki:
Xi,t+1 = ai + biXi,t + δi,t+1 t = 1, ...,T − 1 i = 1, ...,N (2.19)
Para poder definir umbrales que son independientes de la divisa que se está analizando,
cambiando el centro del parámetro mi, tal como se propone en [7]:
mi = mi +1N
N∑j=1
m j i = 1, ...,N (2.20)
Dado que una de las condiciones para usar los mínimos cuadrados ordinarios es que la
suma de los residuales sea cero, para la ventana de datos de M, es necesario que Xi,T = 0
sea el último dato de la ventana.
Para tomar la decisión de inversión, se debe utilizar la siguiente regla:
Abrir posición larga si si < −sbo
Cerrar posición larga si si > −ssc
Abrir posición corta si si > sso
Departamento de Industrias, Universidad Técnica Federico Santa María 10
2.3. PAIRS TRADING CAPÍTULO 2. MARCO TEÓRICO
Cerrar posición corta si si < sbc
Los umbrales presentados en [7] son de la siguiente forma:
sbo = 1,25
sso = 1,25
ssc = 0,50
sbc = 0,75
Como requisito para abrir una posición en la divisa i, se requiere que ki � 1. Por cada
compra (venta) de la divisa i, βi dólares del índice de mercado seleccionado se venderán
(comprarán). Para este caso en particular se utilizó el dollar index.
El dollar index de los Estados Unidos es el índice de divisas más popular y más
negociado. También se reconoce entre los inversores como el punto de referencia más
importante en términos del valor general del dólar estadounidense, tal como se expresa en
[20].
Respecto a la cartera, se consideró la siguiente ecuación:
Et+∆t = Et + Etr∆t +
N∑j=1
Qi,tRi,t + Qdxy,tRdxy,t −
N∑j=1
Qi,tr∆t − Qdxy,tr∆t (2.21)
Sea Et la cantidad de dinero en la cartera en el período t, r la tasa libre de riesgo
Qi,t la cantidad de dinero invertido en la divisa i en el período t, Qdxy,t cantidad de dinero
invertido en Dollar Index. Para determinar el monto invertido en cada divisa Qi,t, se utiliza
la proporción de 2/N del portafolio Et si se invierte.
A través de pruebas, se determinó que los mejores umbrales se dan dinámicamente.
Como resultado, se propuso estudiar un período de entrenamiento y luego un período
de negociación, donde se propuso la mejor combinación de umbrales del período de
entrenamiento.
Departamento de Industrias, Universidad Técnica Federico Santa María 11
2.4. ANT COLONY OPTIMIZATION CAPÍTULO 2. MARCO TEÓRICO
Los umbrales óptimos encontrados en el siguiente problema de optimización no lineal,
con la siguiente función objetivo presentada en [21], donde tanto el retorno como la
desviación estándar tienen el mismo peso, serán:
mın σE − µE (2.22)
s.t: − sbo ≤ −ssc (2.23)
sbc ≤ −sso (2.24)
0,9 ≤ sbo, sso ≤ 2 (2.25)
0 ≤ sbc, ssc ≤ 0,9 (2.26)
sbo, sbc, sso, ssc ∈ R (2.27)
2.4. Ant Colony Optimization
La optimización de colonias de hormigas (ACO) es una metaheurística inspirada en el
comportamiento social de las colonias de hormigas, con el objetivo de resolver problemas
difíciles de optimización combinatorial (CO) a través de soluciones suficientemente buenas
que requieren un tiempo de cómputo razonable. Las hormigas exploran diferentes fuentes
de alimentos, que serían similares al valor de la función objetivo, y, en estas fuentes de
alimentos, las hormigas evalúan la calidad del alimento (función objetivo) y durante la ruta
de retorno depositan feromonas en la solución que condujo a encontrar este valor para la
función objetivo. De esta manera, las hormigas comunican a la siguiente hormiga el camino
que tomó para encontrar esa fuente de alimento, tal como se expresa en [14], [22] y [15].
Aunque cada hormiga es lo suficientemente compleja como para poder encontrar
soluciones viables, mediante la comunicación indirecta con las feromonas mencionadas
anteriormente existe una mejora de esta solución, al realiza iteraciones de cada hormiga.
Las hormigas modifican de manera adaptativa la forma en que se explica un problema y,
por lo tanto, la forma en como se resuelve, tal como se expresa en [23]. La heurística ACO
es notablemente eficiente y también flexible en casos donde las entradas de un modelo dado
cambian constantemente, esto según lo visto en [24].
Departamento de Industrias, Universidad Técnica Federico Santa María 12
2.4. ANT COLONY OPTIMIZATION CAPÍTULO 2. MARCO TEÓRICO
Para realizar la optimización presentada recientemente, se utilizó el algoritmo ACO,
que se inspiró específicamente en el algoritmo ACO con selección de región factible para
espacios continuos (ACO-FRS) presentado en [25].
Departamento de Industrias, Universidad Técnica Federico Santa María 13
CAPÍTULO 3. ALGORITMO PROPUESTO
Capitulo 3
Algoritmo Propuesto
Este capítulo presenta el algoritmo desarrollado en este estudio, Ant Colony Optimi-
zation to Pairs Trading (ACO-PT). ACO-PT es un algoritmo basado en hormigas que se
utiliza para resolver problemas de Pairs Trading. Este algoritmo se inspiró principalmente
en ACO-FRS, un algoritmo basado en hormigas que se creó para resolver problemas de
optimización continua, el cual fue propuesto en [25].
En esta sección, primero presentamos ACO-FRS y sus componentes principales. Luego,
se describe en detalle el enfoque propuesto, ACO-PT.
3.1. ACO-FRS
Para presentar ACO-FRS, definamos un ejemplo de optimización continua que consi-
dere las variables x j ( j = 1, ..., nvar), donde el dominio es x j ∈ [a j, b j] ( j = 1, ..., nvar), y una
función objetivo se define como:
maxnvar∑j=1
x j (3.1)
Considerando el dominio de cada variable x j, se genera una matriz de regiones r ji
( j = 1, ..., nvar) (i = 1....NR). La definición de cada región se realiza mediante el siguiente
Departamento de Industrias, Universidad Técnica Federico Santa María 14
3.1. ACO-FRS CAPÍTULO 3. ALGORITMO PROPUESTO
proceso probabilístico:
r ji = U[a j, b j] (3.2)
Donde j = 1, ..., nvar, i = 1....NR y U una distribución uniforme.
r ji =
a1
1 · · · anvar1
.... . .
...
a1NR · · · anvar
NR
(3.3)
La ecuación 3.3 presenta un ejemplo de matriz de regiones. Estas regiones se definen
con el objetivo de dividir el dominio y reducir el espacio de búsqueda para facilitar el
proceso de intensificación de la feromona.
ACO-FRS contiene tres componentes principales: un proceso de construcción esto-
cástica típico que usa una regla de transición de estado, un componente de perturbación
estocástica llamado Búsqueda de Camino y un componente de exploración llamado Bús-
queda Aleatoria.
ACO-FRS considera una matriz de feromonas, τ ji ( j = 1, ..., nvar) (i = 1....NR), la cual
depende en el número de regiones (NR) y el número de variables (nvar).
Como se mencionó anteriormente, la estructura de la matriz de regiones permite que una
estructura de feromonas sea manejada más fácilmente, evitando un aumento en el tamaño
de un dominio continuo. En la matriz de feromonas, cuanto mayor es el valor del elemento
de la matriz, más prometedora es la región. Dado que ACO-FRS se basa en el Algoritmo de
Optimización de Colonia de Hormigas Simples (SACO) [26], el conocimiento heurístico
no se considera en el diseño de este algoritmo. El algoritmo 1 muestra la estructura de
ACO-FRS.
En el Proceso de Construcción una solución para el problema propuesto considerando
que es una optimización continua, consiste en una región por variable del problema. Por
lo tanto, el valor representativo de la región está asociado con la variable resuelta. Esto se
Departamento de Industrias, Universidad Técnica Federico Santa María 15
3.1. ACO-FRS CAPÍTULO 3. ALGORITMO PROPUESTO
Inicialización;while Criterio do
for k ← 1 to NA dofor j← 1 to nvar do
Proceso de Construcción;Proceso de Búsqueda de Camino;
endProceso de Búsqueda Aleatoria;Proceso de Comparación ;Actualización de Feromonas;
endend
Algoritmo 1: ACO-FRS
puede expresar como:
X ={x1, ..., xnvar
}(3.4)
Cada elemento de la matriz de feromonas se inicializa con un valor τ0. Una hormiga
k decide incluir la siguiente región considerando solo las NS R regiones candidatas (Nk)
como factibles en cada iteración it (línea 5). El objetivo de utilizar un subconjunto de
regiones factibles en cada decisión es reducir el número de regiones factibles a evaluar y
disminuir los tiempos computacionales. Para decidir cuál será la próxima región a visitar a
continuación, se consideró la siguiente regla de transición de estado:
Pr ji
=
τ
ji∑
l∈Nk τjl
Si i ∈ Nk
0 e.o.c i < Nk(3.5)
Donde τ jl es la cantidad de feromonas de la región candidata i y la expresión
∑l∈Nk τ
jl
representa la suma de la cantidad de feromonas contenidas dentro de las regiones que
pertenecen a Nk.
Una vez que la hormiga k haya construido una solución completa, los valores asignados
a x j,k se pueden modificar utilizando el componente Búsqueda de Camino con una probabi-
lidad dada S P (línea 6). Este componente puede modificar o mantener el valor seleccionado
Departamento de Industrias, Universidad Técnica Federico Santa María 16
3.1. ACO-FRS CAPÍTULO 3. ALGORITMO PROPUESTO
(a través de la regla de transición de estado) considerando la siguiente ecuación:
r js j + U[−1, 1] · abs(r j
s j − r jα) (3.6)
El objetivo de este componente es evaluar una solución cercana a la propuesta del
proceso anterior, asumiendo que es de mejor calidad.
La magnitud de la perturbación del valor r js j está limitada por la diferencia entre su
valor y un valor seleccionado al azar que pertenece al conjunto de regiones factibles.
Finalmente, se aplica el componente Búsqueda aleatoria (línea 8). Aquí, una solución
candidata se genera aleatoriamente. El objetivo es aumentar la exploración del algoritmo
considerando la información de manera diferente a los datos obtenidos de las feromonas.
Cuando cada hormiga ha construido una solución candidata, la mejor solución en-
contrada y alcanzada durante la ejecución del proceso es almacenada (rB), y se actualiza
la matriz de feromonas (línea 9-10). Primero, una feromona se evapora considerando el
parámetro τevep lo que reduce los valores de cada celda en la matriz de feromonas de la
siguiente manera:
τji ← τ
ji − ∆τevep (3.7)
Luego, se deposita una feromona en cada región que forma parte de la solución de
mejor calidad obtenida (rb) en la iteración actual:
τji ← τ
ji + ∆τint (3.8)
Hay tres posibles criterios de parada. El primer criterio corresponde al número máximo
de iteraciones (IterMAX). El segundo criterio corresponde al número máximo de funciones
a evaluar (NFEMAX) y el último criterio corresponde a un cierto número de iteraciones
que no resultan en la mejora de la solución encontrada (S CMAX). Lo primero que suceda
es la terminación de la iteración.
La Tabla 3.1 muestra un resumen de las condiciones para la evaluación del algoritmo
ACO-FRS.
ACO-FRS se seleccionó como un algoritmo de referencia debido a que la optimización
Departamento de Industrias, Universidad Técnica Federico Santa María 17
3.2. ACO-PT CAPÍTULO 3. ALGORITMO PROPUESTO
Parametro Valor Sugerido Tipo
NR 10*nvar SintonizableNA NR Fijoτ NR FijoNS R 2*nvar Sintonizable
S P 0.5 Sintonizable∆τint 1 Fijo∆τevep 1 Fijo
Tabla 3.1: Condiciones para evaluación ACO-FRS.
de los valores de los umbrales se puede tratar como un problema continuo. Sin embargo,
dado que el objetivo es tomar decisiones rápidamente y reducir el tiempo de cálculo, se
decide hacer que el dominio de cada umbral tome valores discretos.
De ahora en adelante, el problema considerará un punto representativo para cada región
y para cada variable que se determinó como el punto medio de la región. Esto se debe a
que una muy pequeña diferencia entre los umbrales no genera grandes cambios en el valor
de la función objetivo. En la siguiente sección, presentamos los detalles de nuestro enfoque
que fue inspirado por ACO-FRS.
3.2. ACO-PT
En este estudio, se propone un algoritmo basado en hormigas que fue inspirado por
ACO-FRS. Se proponen algunas modificaciones para abordar la toma de decisiones en
relación con Pairs Trading. El algoritmo es llamado Ant Colony Optimization to Pairs
Trading (ACO-PT), que tiene el objetivo de optimizar los valores de los umbrales que
contribuyen a la toma de las decisiones de Pairs Trading.
En cuanto a las regiones, éstas se manejan de manera diferente en ACO-PT que en
ACO-FRS.
Es importante mencionar que, a diferencia de ACO-FRS, que realiza iteraciones durante
un período fijo, ACO-PT funciona de forma dinámica y se optimiza en diferentes períodos
de tiempo, denominados por la indexación t. El primer período al que se aplicó el algoritmo
es el dato CE, que representa la cola de entrenamiento que contiene los datos donde no hay
Departamento de Industrias, Universidad Técnica Federico Santa María 18
3.2. ACO-PT CAPÍTULO 3. ALGORITMO PROPUESTO
señales debido al PCA. Los datos que sirvieron de entrenamiento ayudaron al algoritmo
a tomar decisiones de trading durante los próximos TR días (siendo TR el parámetro que
representa los días de trading). Al considerar el dominio de cada variable x j (umbral), una
matriz de regiones r ji (t) ( j = 1, ..., nvar) (i = 1....NR) (t = CE....T ) es generada. Es necesario
determinar el tamaño que ocupará el espacio representado por cada región. Este tamaño
variará dependiendo de la variable j ( j = 1, ..., nvar). La definición de cada región (punto
representativo de la región) se realiza mediante la expresión:
r ji (t) = sr j ·
(2 · i − 1)2
+ x jmin (3.9)
A partir de este momento, el algoritmo funcionará como un problema discreto con
el fin de reducir el espacio de búsqueda, mejorando la velocidad del algoritmo. La razón
principal de esta decisión está relacionada con la siguiente situación. La diferencia en el
nivel de precisión es más costosa que lo que mejora el valor de la función objetivo debido
a su definición binaria en un nivel comparativo (compra o no compra, vende o no vende).
Por ejemplo, un umbral de 1.0001 no produce una diferencia significativa en el valor de la
función objetivo a que si se calculara con umbral de 1.
Al igual que en ACO-FRS, ACO-PT contiene tres componentes principales: un proceso
de construcción estocástica, Búsqueda de camino y Búsqueda aleatoria.
La principal diferencia entre los dos es que, en ACO-PT, cada proceso se utiliza
para identificar el índice i (para cada variable j) de la región que formará parte de la
solución propuesta. Una vez que se haya identificado el índice i para la variable j, el punto
representativo asociado con esa región i se puede obtener en la matriz de regiones (r ji (t)).
El uso de las feromonas es el mismo que en ACO-FRS, excepto que la matriz τ ji (t)
( j = 1, ..., nvar) (i = 1....NR) (t = 1....T ) también se indexa en t porque una solución que es
buena para t = t0 no significa que sea buena para un t diferente a t0 debido al hecho de que
los umbrales responden a un cierto ciclo económico. El algoritmo 2 muestra la estructura
de ACO-PT.
Se definen los siguientes parámetros: NA como el número de hormigas, NS R como
el número de regiones factibles que pueden ser visitadas por cada hormiga, S P como
una probabilidad dada, ∆τint como la intensificación de las feromonas, ∆τevep como la
Departamento de Industrias, Universidad Técnica Federico Santa María 19
3.2. ACO-PT CAPÍTULO 3. ALGORITMO PROPUESTO
Inicialización;for t ← CE to T by TR do
while minit ≤ it ≤ maxit and Criterio dofor k ← 1 to NA do
for j← 1 to nvar doProceso de Construcción;Proceso de Búsqueda de Camino;
endProceso de Búsqueda Aleatoria;Proceso de Comparación ;Actualización de Feromonas;
endProceso de Trading;
endend
Algoritmo 2: ACO-PT3
evaporación de las feromonas. Las feromonas al comienzo de cada período t son τ0.
Para inicializar el proceso, se establece el vector rit,k, jB (t) ( j = 1, ..., nvar), que representa
la mejor solución encontrada hasta ese momento para el período t y cuando t = CE, it = 1
y k = 1 contienen los umbrales propuestos en el caso base expuesto en [7].
El Proceso de Construcción de ACO-PT es similar al utilizado en ACO-FRS. Cada
celda de la matriz de feromonas se inicializa con un valor τ0. Una hormiga k decide la
próxima región que se incluirá (usando el punto representativo) considerando solo las
NS R regiones candidatas (Nk) que son factibles en cada iteración it (línea 6). Para cada
variable, se seleccionó una región s j considerando la función probabilística expresada en la
Ecuación 3.5.
Una vez que la hormiga k ha construido una solución completa, los valores asignados a
x j,k se pueden modificar utilizando el componente Búsqueda de Camino con una probabi-
lidad dada S P (línea 7). Al igual que en ACO-FRS, este componente puede modificar o
mantener el componente seleccionado según la regla de transición de estado considerando
Departamento de Industrias, Universidad Técnica Federico Santa María 20
3.2. ACO-PT CAPÍTULO 3. ALGORITMO PROPUESTO
la siguiente ecuación:
i =
s j + round(U[−1, 1] · (s j − α)) Si U[0, 1] ≤ S P α ∈ I
s j e.o.c(3.10)
Siendo U[−1, 1] una variable aleatoria con una distribución uniforme entre -1 y 1, y
U[0, 1] una variable aleatoria con una distribución uniforme entre 0 y 1.
Una vez que se selecciona el índice de la región i para todas las variables j, los índices
de las regiones seleccionadas se almacenan en el subconjunto Mk. En el caso de que i esté
fuera de los límites, se selecciona una región aleatoria con la siguiente ecuación :
i = round(U[0, 1] · NR) (3.11)
Con los índices almacenados en Mk, la matriz de regiones r ji (t) se busca la región
asociada con el índice para construir la solución candidata Xkj (t).
Finalmente, se aplica el componente Búsqueda aleatoria (línea 9). Consiste en buscar
un índice de región aleatorio que pertenezca al subconjunto Mk. La selección del índice se
realiza mediante la siguiente ecuación:
gk(t) = sround(U[0,1]·nvar) (3.12)
Luego procedemos a construir la solución candidata llamada Random Point RPk,itj (t),
que está formada por los elementos de la matriz r ji (t), en cada dimensión j que tienen un
índice:
i = gk(t) (3.13)
Si Xk,itj (t) es más rentable, se reemplazan las regiones de RPk,it
j (t). Como resultado, la
matriz de regiones debe reiniciarse para cada período t.
El siguiente proceso es el Proceso de comparación (línea 10), donde las soluciones
candidatas (RPk,itj (t) y Xk,it
j (t)) se evalúan (si es necesario) y luego se comparan con rit,k, jB (t),
Departamento de Industrias, Universidad Técnica Federico Santa María 21
3.2. ACO-PT CAPÍTULO 3. ALGORITMO PROPUESTO
con la función objetivo de la mejor solución entre ellas elegidas. La función objetivo del
algoritmo se calcula utilizando el promedio de las funciones objetivo presentadas en 2.22
de T N períodos anteriores mediante la fijación de las variables con la solución candidata
para analizar.
Los parámetros de la mejor función objetivo se reemplazan en rit,k, jB (t) para ejecutar la
estrategia para los TR siguientes períodos en el proceso llamado proceso de trading y para
servir como rit,k, jB (t) para la siguiente hormiga o en la próxima iteración del caso.
Las feromonas se evaporan mediante la ecuación:
τji (t)← τ
ji (t) − ∆τevep (3.14)
En el caso de que f (Xk,otj (t)) ≥ f (RPk,it
j (t)), las feromonas deben intensificarse con la
ecuación:
τji (t)← τ
ji (t) + ∆τint (3.15)
Finalmente, en Proceso de Trading (línea 12), la estrategia de los TR siguientes
periodos se ejecuta y las señales de compra y venta se realizan a través de los procesos
antes mencionados.
Para cada período en el que se aplica el algoritmo, hay ciertas iteraciones, se determina
un mínimo minit y un máximo maxit de iteraciones. Como criterio para la finalización del
proceso, la función objetivo se debe mejora con respecto a la iteración anterior en cada
iteración, de no ocurrir esto, se finaliza.
Para analizar y evaluar el efecto de cada componente ACO-PT, se propuso tres variantes
de ACO-PT para diseñar un algoritmo más simple que requiera menos tiempo y contenga
solo los componentes que producen un efecto positivo en la función objetivo: ACO-PT1:
solo considera el proceso de construcción, el pseudocódigo de esta variación se puede ver
en el Algoritmo 3. ACO-PT2: el componente de Road Search se agrega a ACO-PT1, el
pseudocódigo de esta variación se puede ver en el Algoritmo 4. ACO-PT3: el componente
de búsqueda aleatoria se agrega a ACO-PT2, el pseudocódigo de esta variación se puede
ver en el algoritmo 2.
Departamento de Industrias, Universidad Técnica Federico Santa María 22
3.2. ACO-PT CAPÍTULO 3. ALGORITMO PROPUESTO
Inicialización;for t ← CE to T by TR do
while minit ≤ it ≤ maxit and Criterio dofor k ← 1 to NA do
for j← 1 to nvar doProceso de Construcción;Proceso de Búsqueda de Camino;
endActualización de Feromonas;
endProceso de Trading;
endend
Algoritmo 3: ACO-PT1
Inicialización;for t ← CE to T by TR do
while minit ≤ it ≤ maxit and Criterio dofor k ← 1 to NA do
for j← 1 to nvar doProceso de Construcción;Proceso de Búsqueda de Camino;
endProceso de Comparación ;Actualización de Feromonas;
endProceso de Trading;
endend
Algoritmo 4: ACO-PT2
Departamento de Industrias, Universidad Técnica Federico Santa María 23
3.2. ACO-PT CAPÍTULO 3. ALGORITMO PROPUESTO
En la siguiente sección, presentamos la evaluación experimental de los tres algoritmos.
Departamento de Industrias, Universidad Técnica Federico Santa María 24
CAPÍTULO 4. RESULTADOS
Capitulo 4
Resultados
En este estudio, se utilizaron las treinta y ocho divisas con mayor liquidez en alta
frecuencia. La frecuencia de los datos fue cada quince minutos y se utilizaron desde el 22
de septiembre de 2017 a las 00:00:00 horas hasta el 6 de julio de 2018 a las 16:45:00, tanto
el BID como el ASK de cada divisa. Los datos utilizados en este estudio se obtuvieron en
[27].
4.1. Principal Components Analysis
Primero, se debe establecer el parámetro M, ya que representa la cantidad de datos a
considerar en la ventana que encontrará los parámetros de PCA. De acuerdo con lo que se
expresa en [7], solo se debe ingresar información económicamente relevante, ya que tener
una ventana de tiempo M mucho mayor que la cantidad de divisas que se están analizando
dañaría la estrategia al agregar información del pasado lejano.
Se analizó empíricamente el uso de ventanas correspondientes a una hora, un día y una
semana. Teniendo en cuenta que Forex está abierto 24/5 y la frecuencia de los datos es cada
quince minutos, esto se representa como M = 4, M = 4 · 24, M = 4 · 24 · 5, para hora, día y
semana, respectivamente.
Departamento de Industrias, Universidad Técnica Federico Santa María 25
4.1. PRINCIPAL COMPONENTS ANALYSIS CAPÍTULO 4. RESULTADOS
Figura 4.1: Evolución a lo largo del año 2018 del rendimiento acumulado de la estrategia con 55 %de varianza explicada, umbrales fijos y los casos: ventana de una hora (M = 4), un día (M = 4 · 24))y una semana (M = 4 · 24 · 5).
En [7] se declaró que el uso de demasiados factores en la PCA conduce a captar ruido,
por lo que en este trabajo se propuso y utilizó una varianza explicada de 55 %. Además,
este parámetro se verificó empíricamente aplicando el modelo base presentado en [7], es
decir, con umbrales fijos.
Departamento de Industrias, Universidad Técnica Federico Santa María 26
4.1. PRINCIPAL COMPONENTS ANALYSIS CAPÍTULO 4. RESULTADOS
Figura 4.2: Evolución a lo largo del año 2018 del rendimiento acumulado de la estrategia conM = 4 · 24, umbrales fijos y los casos: 30 %; 40 %; 50 %; 55 %; 60 %; 70 % de varianza explicada.
La estrategia con M = 4 · 24, 55 % de varianza explicada y umbrales fijos fue notable-
mente superior y, como resultado, se mencionará a partir de ahora como caso base.
El retorno anualizado del caso base es 26.7968 % y su desviación estándar es 2.6115 %.
Por lo tanto, su índice de Sharpe es 9.4952.
El índice de Sharpe se calculó como (µ − r)/σ donde µ y σ son los rendimientos
anualizados y la desviación estándar respectivamente. La tasa de interés libre de riesgo r
fue considerada como 2 %.
Además, la output de la estrategia con M = 4 · 24 y 55 % de varianza explicada se usará
como entrada para el modelo ACO-PT.
Departamento de Industrias, Universidad Técnica Federico Santa María 27
4.2. ACO-PT CAPÍTULO 4. RESULTADOS
Parameters Suggested Value Type
NR 300 Empíricanants 60 Empíricaτ NR LiteraturaNS R 2*nvar LiteraturaS P 0.5 Literaturamaxit 10 Empíricaminit 3 Empírica∆τint 1 Literatura∆τevep 1 Literatura
Tabla 4.1: Fijación de parámetros
4.2. ACO-PT
Para iniciar el algoritmo, se deben definir sus parámetros. El parámetro NR, que
representa la cantidad de regiones que tendrá cada variable, está determinado por 300
regiones para tener una precisión de entre 0.003 y 0.00333 desviaciones estándar. Con
respecto al número de variables (nvar), se representan los 4 umbrales mostrados en [7].
El número de hormigas (NA) se define como 60, para explorar inicialmente un 20 % del
número total de regiones iniciales.
Un mínimo de iteraciones (minit) y un máximo de iteraciones (maxit) se definieron como
3 y 10, respectivamente. La probabilidad dada S P se estableció en 0.5, como se expresa
en [25]. Tanto la intensificación (∆τint) como la evaporación (∆τevap) de las feromonas se
fijaron en 1 como se menciona en [25].
La tabla 4.1 muestra los parámetros utilizados en el algoritmo, diferenciando el tipo de
fijación que tiene, si se derivó de la literatura existente o si fue empírica.
A continuación se muestra una tabla que resume los resultados de las diferentes
configuraciones de los 3 algoritmos propuestos.
Para validar nuestro objetivo, que era obtener un ACO-PT con una rentabilidad y un
índice de Sharpe mejor que el caso base, decidimos realizar una prueba de medias para
demostrar estadísticamente nuestro objetivo. Para poder realizar esta prueba, la normalidad
de la serie de rentabilidad será verificada por Kolmogorov-Smirnov Test el cual es propuesto
en [28].
Departamento de Industrias, Universidad Técnica Federico Santa María 28
4.2. ACO-PT CAPÍTULO 4. RESULTADOS
Trading Hour Day Week
Training One Hour Two Hours Three Hours One Day Two Days Three Days One Week Two Weeks Three Weeks
ACO-PT1 28.4853 * 28.2920 29.2317 * 29.2883 * 28.3249 30.3357 * 29.5547 * 27.1386 26.1544Annualized STD 2.7647 2.7609 2.7926 2.7349 2.7546 2.7375 2.7475 2.7332 2.6366Sharpe ratio 9.5798 9.5230 9.7514 9.9778 9.5567 10.3509 10.0290 9.1975 9.1612
ACO-PT2Annualized return 30.3043 * 29.6463 * 28.4460 29.1351 * 29.2641 * 27.3185 27.8919 28.3028 28.9355 *Annualized STD 2.7638 2.7767 2.7491 2.7697 2.7224 2.7072 2.6615 2.7822 2.7639Sharpe ratio 10.2411 9.9565 9.6199 9.7971 10.0147 9.3523 9.7283 9.4540 9.7455
ACO-PT3Annualized return 27.7902 27.4466 27.3218 26.6782 26.8199 26.6901 26.7806 26.6133 27.4169Annualized STD 2.6698 2.6431 2.6233 2.6124 2.6226 2.6132 2.6127 2.6194 2.6237Sharpe ratio 9.6600 9.6276 9.6527 9.4466 9.4639 9.4482 9.4847 9.3965 9.6874
Tabla 4.2: Los retornos, la desviación estándar, el índice de Sharpe y la prueba de Wilcoxon seanalizaron mediante la aplicación de los 3 algoritmos en análisis. Se utilizaron tres períodos detrading: una hora, un día y una semana. Para la negociación de la estrategia utilizamos: una, dos ytres veces el período de trading. Cuando la prueba de Wilcoxon con un nivel de significación de5 % rechazó la hipótesis de que la media del Caso Base es mayor o igual que la de la configuraciónanalizada ACO-PT, se denota con un *.
Dado que la hipótesis nula es que los datos en el vector provienen de una distribución
normal estándar, podemos confirmar con un nivel de significancia de 5 % que la serie de
retornos no es de una distribución normal estándar. Debido a la ausencia de normalidad en
la serie, se utilizó el test de Wilcoxon, que es una prueba no paramétrica y se aplica sin la
necesidad de asumir la normalidad de las muestras como se presenta en [29].
La prueba de Wilcoxon se realizó para la mejor configuración de cada algoritmo.
Como resultado, el algoritmo ACO-PT1 fue superior a ACO-PT2 y ACO-PT3. Dado que
las configuraciones candidatas de ACO-PT1 y ACO-PT2 son mejores que el caso base
y debido a que no fue posible asegurar la superioridad de las configuraciones ACO-PT3
en comparación con el caso base, fue posible determinar que ACO-PT1 tuvo un mejor
desempeño que ACO-PT3 y ACO-PT2.
Departamento de Industrias, Universidad Técnica Federico Santa María 29
CAPÍTULO 5. CONCLUSIONES
Capitulo 5
Conclusiones
Las contribuciones de este trabajo son las siguientes: El uso de metaheurísticas de
optimización de colonias de hormigas aplicadas a una estrategia de trading; La optimización
de los umbrales de toma de decisiones en la estrategia de inversión de Pairs Trading,
optimización que podría proponerse bajo diferentes enfoques; Finalmente, la evaluación
del algoritmo propuesto (ACO-PT).
En el paso de PCA, algunos parámetros se configuraron para generar la entrada nece-
saria para evaluar ACO-PT. Con respecto al parámetro M, que representa la cantidad de
datos que deben considerarse dentro de la ventana para las señales, este tenía la intención
de integrar solo la información económicamente relevante. Así, se propuso considerar los
datos de un día. Es posible apreciar en la Figura 4.1 el hecho de que el uso de la data de
un día es correcto, mostrando una clara tendencia positiva en la rentabilidad acumulada
durante el período evaluado, siendo esta tendencia mayor que la estrategia que usó datos de
un hora y una semana.
Se observó que la estrategia con datos de una hora era altamente volátil, debido al
hecho de que utilizar esa cantidad de datos hace imposible integrar la información necesaria
para aclarar una tendencia en la serie, lo que agrega un componente de aleatoriedad a la
decisión. Por otro lado, en el caso de la ventana que utilizó una semana de datos, esto
agrega información de ciclos económicos pasados, lo que perturba la toma de decisiones
tal como se explica en [7].
Con respecto a la cantidad de varianza explicada por los factores de PCA, se propuso
Departamento de Industrias, Universidad Técnica Federico Santa María 30
CAPÍTULO 5. CONCLUSIONES
usar un 55 % como fue propuesto en [7]. La figura 4.2 muestra que, al igual que en [7],
55 % de varianza explicada se ajusta mejor a nuestra estrategia.
El desempeño positivo del algoritmo propuesto es evidente en la tabla provista. En
el caso de ACO-PT1, hubo una mejora en la rentabilidad anualizada de 13.21 % y una
mejora en el índice de Sharpe de 9.01 % con respecto al caso base. ACO-PT2 mostró una
mejora de 13.09 % en rentabilidad y de 7.85 % en el índice de Sharpe. Con respecto al
algoritmo ACO-PT3, no fue posible confirmar estadísticamente una mejora con respecto al
caso base después de aplicar la prueba de Wilcoxon. Como resultado, podemos concluir
que la variación del algoritmo propuesto que mostró el mejor rendimiento (ACO-PT1)
también fue el algoritmo con menos pasos y, por lo tanto, el más simple y más rápido.
En términos de investigaciones futuras, vale la pena examinar la sensibilización de
los grupos de parámetros del algoritmo propuesto tal como son, el número de hormigas,
el número de regiones, entre otros. También sería interesante evaluar la implementación
de este trabajo en grupos de umbrales. Esto se traduciría en trabajar con una matriz de
feromonas con una dimensión más grande, donde la cantidad de una feromona se asigna a
un grupo de umbrales relacionados.
Departamento de Industrias, Universidad Técnica Federico Santa María 31
BIBLIOGRAFÍA BIBLIOGRAFÍA
Bibliografía
[1] Amir E. Khandani and Andrew W. Lo. What happened to the quants in August2007? Evidence from factors and transactions data. Journal of Financial Markets,14(1):1–46, 2011.
[2] Nicolas Huck. Pairs trading and outranking: The multi-step-ahead forecasting case.European Journal of Operational Research, 207(3):1702–1716, 2010.
[3] Álvaro Cartea and José Penalva. Where is the Value in High Frequency Trading?Quarterly Journal of Finance, 2(3):1–46, 2011.
[4] Christopher Krauss, Xuan Anh Do, and Nicolas Huck. Deep neural networks, gradient-boosted trees, random forests: Statistical arbitrage on the S&P 500. European Journalof Operational Research, 259(2):689–702, 2017.
[5] Andrew Pole. Statistical arbitrage : algorithmic trading insights and techniques. J.Wiley & Sons, 2007.
[6] George J. Miao. High Frequency and Dynamic Pairs Trading Based on StatisticalArbitrage Using a Two-Stage Correlation and Cointegration Approach. InternationalJournal of Economics and Finance, 6(3):96–110, 2014.
[7] Marco Avellaneda and Jeong Hyun Lee. Statistical arbitrage in the US equities market.Quantitative Finance, 10(7):761–782, 2010.
[8] Christopher Krauss. Statistical Arbitrage Pairs Trading Strategies: Review andOutlook. Journal of Economic Surveys, 31(2):513–545, 2017.
[9] Nicolas Huck. Pairs selection and outranking: An application to the S&P 100 index.European Journal of Operational Research, 196(2):819–825, 2009.
[10] Carlin C F Chu. Mining Profitable High Frequency Pairs Trading Forex Signal UsingCopula and Deep Neural Network. In 2018 19th IEEE/ACIS International Conferenceon Software Engineering, Artificial Intelligence, Networking and Parallel/DistributedComputing (SNPD), pages 312–316. IEEE, 2018.
[11] Zhengqin Zeng and Chi Guhn Lee. Pairs trading: optimal thresholds and profitability.Quantitative Finance, 14(11):1881–1893, 2014.
[12] Forex. Why Trade Forex | FOREX.com, 2016.
Departamento de Industrias, Universidad Técnica Federico Santa María 32
BIBLIOGRAFÍA BIBLIOGRAFÍA
[13] Investopedia. Should you trade forex or stocks?, 2018.
[14] Marco Dorigo and Christian Blum. Ant colony optimization theory: A survey. Theo-retical Computer Science, 344(2-3):243–278, 2005.
[15] Amparo Soler-Dominguez, Angel A. Juan, and Renatas Kizys. A Survey on FinancialApplications of Metaheuristics. ACM Computing Surveys, 50(1):1–23, 2017.
[16] Ganapathy. Vidyamurthy. Pairs trading : quantitative methods and analysis. J. Wiley,2004.
[17] Marcelo Scherer Perlin. Evaluation of pairs-trading strategy at the brazilian financialmarket. Journal of Derivatives and Hedge Funds, 15(2):122–136, 2009.
[18] Robert J. Elliott, John Van Der Hoek *, and William P. Malcolm. Pairs trading.Quantitative Finance, 5(3):271–276, jun 2005.
[19] João Caldeira and Guilherme V. Moura. Selection of a Portfolio of Pairs Based onCointegration: A Statistical Arbitrage Strategy. SSRN Electronic Journal, jan 2013.
[20] Tradingview. Currency Indices — Quotes and Overview — TradingView, 2018.
[21] T.-J. Chang, N. Meade, J.E. Beasley, and Y.M. Sharaiha. Heuristics for cardinalityconstrained portfolio optimisation. Computers & Operations Research, 27(13):1271–1302, nov 2000.
[22] M. Dorigo, V. Maniezzo, and A. Colorni. Ant system: optimization by a colony ofcooperating agents. IEEE Transactions on Systems, Man and Cybernetics, Part B(Cybernetics), 26(1):29–41, 1996.
[23] Marco Dorigo and Gianni Di Caro. Ant colony optimization: A new meta-heuristic.Proceedings of the 1999 Congress on Evolutionary Computation, CEC 1999, 2:1470–1477, 1999.
[24] M. David Albritton and Patrick R. McMullen. Optimal product design using a colonyof virtual ants. European Journal of Operational Research, 176(1):498–520, jan2007.
[25] J. A. Fernández-Vargas and A. Bonilla-Petriciolet. Desarrollo de un algoritmo deoptimización global en colonias de hormigas con selección de región factible paraespacios continuos. Revista Internacional de Metodos Numericos para Calculo yDiseno en Ingenieria, 30(3):178–187, 2014.
[26] Marco Dorigo and Thomas Stützle. An Experimental Study of the Simple Ant ColonyOptimization Algorithm. Proceedings of 2001 WSES International Conference onEvolutionary Computation (EC’01), (i):253–258, 2001.
[27] Dukascopy. Fuentes de datos históricas :: Dukascopy Bank SA | Swiss Forex Bank |
ECN Broker | Managed accounts | Swiss FX trading platform, 2018.
Departamento de Industrias, Universidad Técnica Federico Santa María 33
BIBLIOGRAFÍA BIBLIOGRAFÍA
[28] Hubert W. Lilliefors. On the Kolmogorov-Smirnov Test for Normality with Mean andVariance Unknown. Journal of the American Statistical Association, 62(318):399–402,jun 1967.
[29] Frank Wilcoxon. Individual Comparisons by Ranking Methods. Biometrics Bulletin,1(6):80, dec 1945.
Departamento de Industrias, Universidad Técnica Federico Santa María 34
ANEXO A. TITULO DEL ANEXO...
Anexo A
Titulo del anexo...
Departamento de Industrias, Universidad Técnica Federico Santa María 35