josé miguel cerda olivares

PAIRS TRADING DE ALTA FRECUENCIA Y DINÁMICO OPTIMIZADO CON

OPTIMIZACIÓN DE COLONIA DE HORMIGAS.

Tesis de Grado presentado por

José Miguel Cerda Olivares

como requisito parcial para optar al título de

Ingeniero Civil Industrial

y al grado de

Magíster en Ciencias de la Ingeniería Industrial

Profesor Referente:Dr. Werner Kristjanpoller Rodríguez

Profesor Coreferente Interno:Dr. Javier Scavia dal Pozzo

Profesor Coreferente Externo:Dr. Nicolás Rojas Morales

Febrero 2019

UNIVERSIDAD TÉCNICA FEDERICO SANTA MARÍADEPARTAMENTO DE INDUSTRIAS



Tesis de Grado presentado por


como requisito parcial para optar al título de

Ingeniero Civil Industrial

y al grado de

Magíster en Ciencias de la Ingeniería Industrial

Profesor Referente:Dr. Werner Kristjanpoller Rodríguez

Profesor Coreferente Interno:Dr. Javier Scavia dal Pozzo

Profesor Coreferente Externo:Dr. Nicolás Rojas Morales

VALPARAÍSO, Febrero 2019

TITULO DE LA TESIS:



AUTOR:


TRABAJO DE TESIS, presentado en cumplimiento parcial de los requisitos para el Grado

de Magíster en Ciencias de la Ingeniería Industrial y de Ingeniero Civil Industrial de la

Universidad Técnica Federico Santa María.

Dr. Werner Kristjanpoller Rodríguez ....................................................................

Dr. Javier Scavia dal Pozzo ....................................................................

Dr. Nicolás Rojas Morales ....................................................................

VALPARAÍSO, Chile. Febrero 2019

AGRADECIMIENTOS

En primer lugar quisiera agradecer a Dios por darme esta bendición.

Agradecer también a mi familia, a los que están y a los que ya partieron, sin ellos nada

de esto hubiera sido posible, en especial a mis padres y a mi bisabuela que lo han dado todo

por mi.

A mis amigos y a Maca, que fueron parte fundamental de esta etapa universitaria.

A todos los profesores que formaron parte de este proceso de aprendizaje. En especial

al profe Werner y a Nicolás Rojas, que fueron un gran apoyo en la misión de realizar el

paper.

También destacar a Caneo y a tío Kevin, por su disposición y ayuda en el proceso

de investigación, gracias a su ayuda la investigación llegó a buen puerto y en un tiempo

esperado.

RESUMEN EJECUTIVO

Se propone un algoritmo metaheurístico para la optimización de los umbrales de

decisión de Pairs Trading. Este modelo fue aplicado a datos de alta frecuencia del mercado

Forex, con una frecuencia de 15 minutos. El Pairs Trading tiene un enfoque de PCA y la

optimización de umbrales se hizo basado en Colonia de Hormigas. Para la creación de

Ant Colony Optimization to Pairs Trading (ACO-PT) se inspiró en ACO-FRS, generando

modificaciones como por ejemplo la discretización de las variables.

Se generaron 3 algoritmos de ACO-PT, para así evaluar la efectividad de cada com-

ponente. Respecto al caso de no haber optimizado los umbrales, ACO-PT1, mostró una

mejora en la rentabilidad anualizada de 13.21 % y una mejora en el índice de Sharpe de

9.01 %. ACO-PT2 mostró una mejora de 13.09 % en rentabilidad y de 7.85 % en el índice

de Sharpe. Con respecto al algoritmo ACO-PT3, no fue posible confirmar estadísticamente

una mejora después de aplicar la prueba de Wilcoxon. Como resultado, podemos concluir

que la variación del algoritmo propuesto que mostró el mejor rendimiento (ACO-PT1)

también fue el algoritmo con menos pasos y, por lo tanto, el más simple y más rápido.

Palabras Clave: Ant Colony Optimization, FOREX, Meteheurística.

Departamento de Industrias, Universidad Técnica Federico Santa María iv

ABSTRACT

En los últimos años ha habido una explosión de investigaciones con metaheurísticas,

que proporcionan soluciones eficientes, es decir, casi óptimas con tiempos de computación

razonables. Dado esto tiene sentido aplicar las metaheurísticas en las finanzas, debido a

que muchas de las decisiones financieras deben tomarse en un tiempo muy corto, minutos

o segundos, como es el caso del trading de alta frecuencia. En esta tésis se propone un

algoritmo basado en metaheurísticas de Optimización de Colonias de Hormigas para

optimizar dinámicamente los umbrales de decisión ofrecidos por la estrategia de inversión

de Pairs Trading, este algoritmo se denomina Optimización de Colonias de Hormigas para

Pairs Trading (ACO-PT). El modelo se optimiza moviendo ventanas de entrenamiento-

trading. La propuesta se aplica a datos de Forex en alta frecuencia, que consta de 38 divisas,

con una frecuencia de 15 minutos, desde el 22 de septiembre del 2017, desde las 00:00:00

horas hasta el 6 de julio de 2018 a las 16:45:00. Está comprobado que ACO-PT se puede

usar en mercados profundos de manera eficiente, obteniendo un rendimiento anualizado

de 30.3357 %, lo que se traduce en una mejora de 13.2064 % sobre el caso base con

umbrales fijos. De los resultados se concluye que la variación del algoritmo que tiene mejor

rendimiento es también la variación más simple y, por lo tanto, la más rápida.

Palabras Clave: Ant Colony Optimization, FOREX, Meteheurística.

Departamento de Industrias, Universidad Técnica Federico Santa María v

ÍNDICE DE CONTENIDOS ÍNDICE DE CONTENIDOS

Índice de Contenidos

1. Introduccion 11.1. Motivacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2.1. Objetivo Principal . . . . . . . . . . . . . . . . . . . . . . . . . 41.2.2. Objetivos Secundarios . . . . . . . . . . . . . . . . . . . . . . . 4

1.3. Alcance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2. Marco Teorico 52.1. Forex . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.1.1. Características de Forex . . . . . . . . . . . . . . . . . . . . . . 62.2. Principal Components Analysis . . . . . . . . . . . . . . . . . . . . . . . 62.3. Pairs Trading . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82.4. Ant Colony Optimization . . . . . . . . . . . . . . . . . . . . . . . . . . 12

3. Algoritmo Propuesto 143.1. ACO-FRS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143.2. ACO-PT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

4. Resultados 254.1. Principal Components Analysis . . . . . . . . . . . . . . . . . . . . . . . 254.2. ACO-PT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

5. Conclusiones 30

Bibliografía 32

A. Titulo del anexo... 35

Departamento de Industrias, Universidad Técnica Federico Santa María vi

ÍNDICE DE TABLAS ÍNDICE DE TABLAS

Índice de Tablas

3.1. Condiciones para evaluación ACO-FRS. . . . . . . . . . . . . . . . . . . 18

4.1. Fijación de parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . . 284.2. Resultados para cada algoritmo . . . . . . . . . . . . . . . . . . . . . . . 29

Departamento de Industrias, Universidad Técnica Federico Santa María vii

ÍNDICE DE FIGURAS Nomenclatura

Índice de Figuras

4.1. Rendimiento Acumulado para distintos M . . . . . . . . . . . . . . . . . 264.2. Rendimiento Acumulado para distintas Varianzas . . . . . . . . . . . . . 27

Departamento de Industrias, Universidad Técnica Federico Santa María viii

CAPÍTULO 1. INTRODUCCIÓN

Capitulo 1

Introduccion

1.1. Motivacion

La estrategia de Trading cuantitativo conocida como Pairs Trading se ha vuelto cada

vez más popular desde mediados de los años ochenta. Esta estrategia ha sido ampliamente

utilizada por traders y fondos de cobertura con el objetivo de mejorar el rendimiento de

la inversión. Los algoritmos que se han basado en esta estrategia no son accesibles para

los investigadores ni para el público en general debido a la naturaleza propietaria del

área (por ejemplo, datos de alta frecuencia). Esto ha resultado en una cantidad limitada

de investigaciones publicadas en este campo hasta un reciente estallido de interés en el

tema como por ejemplo en [1] y [2]. Tras este reciente aumento de interés, los estudios de

investigación en este campo se han realizado de forma empírica, estudiando el comercio de

alta frecuencia de forma indirecta a través del comportamiento comercial observado, tal

como en [3]y en [4], se declaró cautelosamente que la brecha entre las finanzas académicas

y la industria financiera está evolucionando progresivamente. El presente estudio tiene

como objetivo ayudar a reducir esta brecha entre el estudio académico de las finanzas y la

industria financiera.

En este estudio, utilizamos el método de arbitraje estadístico, que se define como una

estrategia de inversión que explota modelos matemáticos para generar retornos a partir

de movimientos sistemáticos en los precios de los valores. Un aspecto importante del

arbitraje estadístico es obtener resultados positivos y superiores para el mercado a través

Departamento de Industrias, Universidad Técnica Federico Santa María 1

1.1. MOTIVACIÓN CAPÍTULO 1. INTRODUCCIÓN

de un libro de contabilidad neutral tal como se expresó en [5]. Como se demostró en

[6], el arbitraje estadístico se puede usar para identificar cuándo surge una brecha por

ineficiencias en el mercado. En [7] se postula que Pairs Trading se considera el antepasado

del arbitraje estadístico. En [8] se explicó que aunque la investigación académica de esta

estrategia es aún pequeña en comparación con la investigación centrada en otras estrategias

(p. ej., estrategias Contrarian y Momentum), la investigación de Pairs Trading está ganando

impulso en cinco áreas de investigación: enfoque de distancia, enfoque de cointegración,

enfoque de serie de tiempo, enfoque de control estocástico y otros enfoques. Existen tres

categorías en el campo de otros enfoques que fueron presentadas en [8], las cuales son:

Enfoque de Machine Learning y pronóstico combinado, Enfoque de cópula y Enfoque de

análisis de componentes principales.

Los estudios principales en el primer grupo de Otros enfoques fueron presentados

en [9] y [2]. Estos estudios proponen combinaciones de Machine Learning (ML) y el

enfoque de pronósticos combinados. Específicamente, se proponen tres etapas: Pronóstico,

Outranking y Trading. En la etapa de pronóstico, se utilizan redes neuronales. En las etapas

de clasificación y cambios en el comercio, se utiliza un Método de decisión de criterios

múltiples (MCDM) llamado ELECTRE III. Otro estudio aplicado en este contexto es el

enfoque de la cópula que, según lo expresado en [8], puede clasificarse como: Método de

la cópula basada en el retorno y Método de la cópula basada en el nivel. Hay estudios que

analizan datos de Forex de alta frecuencia utilizando estos métodos como por ejemplo en

[10].

Con respecto al tercer grupo de Otros enfoques, en [7] se propuso el uso del Análisis de

componentes principales (PCA) para crear eigenportfolios y hacerlos parte de un modelo

multifactor del cual su residual se modela como un proceso Ornstein-Uhlenbeck que luego

se usa para generar una señal de compra-venta. Una vez que se han obtenido las señales,

la decisión de compra-venta se determina comparándola con los umbrales fijos que se

han determinado empíricamente. Para maximizar el beneficio a largo plazo, es necesario

utilizar los valores correctos de los umbrales. Por ejemplo, si los valores de los umbrales

son demasiado similares, requerirá menos tiempo para completar la operación y será menos

beneficioso que si los valores de los umbrales fueran muy diferentes tal como se expresa en


1.1. MOTIVACIÓN CAPÍTULO 1. INTRODUCCIÓN

[11].

El Trading de alta frecuencia (HFT) es un tipo de comercio algorítmico, lo que significa

que utiliza herramientas tecnológicas para automatizar las decisiones comerciales. Estas

decisiones se caracterizan por una relación entre la velocidad de toma de decisiones y el

beneficio de cada decisión, esto se explica en [3]. Una opción para aplicar HFT es Forex, el

mercado más líquido del mundo, con una facturación de 5,1 billones de dólares por día,

con operaciones 24/5 y una gran cantidad de apalancamiento. Esto permite a los operadores

responder casi inmediatamente a las fluctuaciones en las divisas como se expresa en [12] y

[13]. Sin embargo, esta técnica no solo acentúa la liquidez característica de este mercado,

sino que también acentúa el riesgo lo cual es afirmado en [13].

En finanzas, hay muchos estudios y aplicaciones que usan métodos exactos. Debido a

que la resolución de problemas de NP-hard tradicionalmente requeriría demasiado tiempo

de computo, ha habido una oleada de investigaciones que involucran metaheurísticas,

proporcionando soluciones eficientes que están cerca de ser óptimas y ofrecen tiempos de

computo razonables. Esto hace que el uso de estos métodos algorítmicos sea razonable, ya

que muchas decisiones financieras deben tomarse en un lapso de tiempo muy corto, como

minutos o segundos tal como se afirma en [14].

En este estudio, la metodología presentada en [7] se aplica a la toma de decisiones de

inversión en el mercado Forex a través de la Optimización de Colonia de Hormigas para

datos de alta frecuencia. Este algoritmo es una metaheurística inspirada en la naturaleza,

que se utiliza para resolver problemas difíciles de optimización combinatoria (CO) como

se muestra en [15], en este estudio se usó para encontrar los umbrales óptimos de los pares,

operar dinámicamente en términos de las decisiones que se realizan cada quince minuto, y

en un tiempo de computación razonable.


1.2. OBJETIVOS CAPÍTULO 1. INTRODUCCIÓN

1.2. Objetivos

1.2.1. Objetivo Principal

El objetivo de este estudio es proponer un algoritmo basado en Optimización de Colonia

de Hormigas para optimizar de forma dinámica los umbrales de decisión de Pairs Trading.

1.2.2. Objetivos Secundarios

Mejorar el uso de las metaheurísticas de Optimización de Colonias de Hormigas

cuando se aplique a una estrategia de Trading.

Aportar a la literatura sobre los algoritmos de Trading de alta frecuencia.

Obtener una mejor precisión y rendimiento que el caso base con umbrales fijos y que

el mercado.

1.3. Alcance

En este estudio, la metodología presentada en [7] se aplica a la toma de decisiones de

inversión en el mercado Forex a través de la optimización de colonia de hormigas de alta

frecuencia. La novedad que ofrece este enfoque es el uso de la Optimización de la Colonia

de Hormigas para optimizar los umbrales de Pairs Trading. Según lo que se conoce, este

estudio es único en el uso de Pairs Trading en el mercado Forex a través de High Frequency

Trading con un enfoque de PCA. En particular, se creó un algoritmo metaheurístico para

abordar mejor la estrategia de inversión basada en Pairs Trading dada la alta frecuencia de

los datos a los que se aplicó, es decir, la Optimización de Colonias de Hormigas para Pairs

Trading (ACO-PT).


CAPÍTULO 2. MARCO TEÓRICO

Capitulo 2

Marco Teorico

Pairs Trading es uno de los primeros métodos de comercio cuantitativo que se utilizan

en Wall Street y su uso se remonta a la década de 1980 como se afirma en [16]. Pairs

Trading es una estrategia comercial que aprovecha las ineficiencias del mercado basadas en

un par de acciones (o divisas como es el caso). Por ejemplo, si las divisas P y Q están en la

misma industria o tienen características similares y una sigue a la otra, se puede esperar

que los rendimientos de las dos sea modelable. El objetivo es identificar dos acciones que

se mueven juntas y tomar posiciones largas y cortas simultáneamente cuando divergen de

manera anormal. Por lo tanto, se espera que los precios de las dos acciones converjan en el

futuro tal como fue expreado en [17], [18], [19] y [7].

La metodología consiste en generar eigenportfolios por medio de un análisis de com-

ponentes principales (PCA) y de un modelo paramétrico simple, el cual es llamado proceso

Ornstein-Uhlenbeck, que genera un parámetro definido como s-score, el cual representa la

distancia en desviaciones estándar a su equilibrio.

Al comparar s-score con umbrales, se define una decisión de inversión. En la literatura

los umbrales se determinaron de manera fija para todos los períodos, en este trabajo se

propone un enfoque de optimización del problema. Esto significa que se buscaran los

umbrales que optimizan dinámicamente la ventana de entrenamiento definida previamente,

para así pronosticar su uso para futuras ventanas de trading.


2.1. FOREX CAPÍTULO 2. MARCO TEÓRICO

2.1. Forex

Forex es el mercado en donde se comercializan las divisas, siendo este, el mercado más

grande del mundo. Este mercado es un descentralizado y es categorizado como Over The

Counter (OTC), es decir no se realiza en una bolsa formal, siendo así más rápidas, baratas,

y además se completan sin la supervisión de un supervisor.

2.1.1. Características de Forex

Liquidez: El término de liquidez a nivel de mercado se utiliza para caracterizar el

movimiento que existe en un mercado, siendo el caso de Forex el más líquido del

mundo, como se mencionó anteriormente Forex mueve 5,1 billones de dólares por

día. También se suele decir que el tipo de cambio EUR/USD durante un año mueve

más dinero que todos los activos de Wall Street.

Apalancamiento: Forex ofrece grandes apalancamientos a sus inversores, llegando

incluso al 400:1, es decir que con 1 USD, se pueden comerciar 400 USD.

Siempre Abierto: Otra gran característica que tiene Forex es que en cualquier día, a

cualquier hora se puede encontrar actividad, esto debido a que los mercadores se van

relevando dado su uso horario.

Software Estándar: Todos los brokers ofrecen acceso al mismo software, Metatrader,

pudiendo cambiar la interfaz.

2.2. Principal Components Analysis

El objetivo de esta sección es determinar las entradas que se utilizará en la estrategia

de Pairs Trading. Estas entradas se denominan como eigenportfolios, que se utilizarán para

modelar el s-score en la siguiente sección.

Considere que fi,t sea el precio del tipo de cambio i, (i = 1, ...,N), en el período t,


2.2. PRINCIPAL COMPONENTS ANALYSIS CAPÍTULO 2. MARCO TEÓRICO

(t = 1, ...,T ), la rentabilidad logarítmica de la serie de precios de divisas i se define como:

ri,t = logfi,t

fi,t−1(i = 1, ...,N) (t = 1, ...,T ) (2.1)

Para una ventana que contiene M datos, que se moverá en un total de T periodos, se

define:

ri,t =1M

t∑l=t−M+1

ri,l (i = 1, ...,N) (t = 1, ...,T ) (2.2)

y se define como:

σi,t =1

M − 1

t∑l=t−M+1

ri,l − ri,t)2 (i = 1, ...,N) (t = 1, ...,T ) (2.3)

Con el objetivo de buscar y tratar la diferencia de medias y desviaciones estándar de

cada serie de rendimientos en el mercado de divisas, se utilizó la siguiente estandarización:

Yi,t =Ri,t − Ri,t

σi,t(i = 1, ...,N) (t = 1, ...,T ) (2.4)

Una vez que se normaliza la serie de rendimientos de la divisa, hay una desviación

estándar unitaria y, por lo tanto, la matriz de covarianza es idéntica a la matriz de correlación

de Pearson, que se define como:

ρi, j,t =1

M − 1

t∑l=t−M+1

Yi,tY j,t (i, j = 1, ...,N) (t = 1, ...,T ) (2.5)

Sea λi,t el i-ésimo valor propio en el período t de la matriz ρi, j,t, con:

N ≥ λ1,t ≥ λ2,t ≥ .... ≥ λN,t ≥ 0 (2.6)

La cantidad de varianza explicada por el i-ésimo eigenvalue viene dada por la siguiente

expresión:

(S )2i,t =

λi,t∑Nj=1 λ j,t

i = 1, ...,N t = 1, ...,T (2.7)


2.3. PAIRS TRADING CAPÍTULO 2. MARCO TEÓRICO

Los vectores propios se definen como:

v( j)t ,= (v( j)

1,t , ...., v( j)N,t) ( j = 1, ...,N) (t = 1, ...,T ) (2.8)

La selección de un buen par de divisas para la negociación es la etapa más importante

de la reversión de la estrategia de arbitraje estadístico neutral del mercado [6]. El parámetro

m se usa para determinar el número de componentes principales que explican una cierta

cantidad de varianza explicada (N ≥ m), que luego se agregan a un modelo multifactorial.

Para cada valor propio λi,t, se asigna una eigenportfolio compuesta por los N divisas

analizadas que se propone en [7]. El peso de estas divisas en cada eigenportfolio viene

dado por la siguiente expresión:

Q( j)i,t =

v( j)i,t

σi,tj = 1, ...,m t = 1, ...,T (2.9)

Para obtener posteriormente los rendimientos de cada eigenportfolio, se calcula el

porcentaje que tendrá cada divisa dentro de la cartera, mediante la siguiente fórmula:

Q( j)i,t =

Q( j)i,t∑N

i=1 Q( j)i,t

j = 1, ...,m t = 1, ...,T. (2.10)

La expresión que representa el retorno de la eigenportfolio j en el período t es:

F j,t =

N∑i=1

Q( j)i,t ri,t j = 1, ...,m t = 1, ...,T (2.11)

2.3. Pairs Trading

Esta subsección describe la metodología utilizada para modelar el s-score que luego

se usará para interpretar la información junto con las reglas impuestas desde los umbrales.

Para modelar el s-score se utilizó el proceso conocido como Ornstein-Uhlenbeck.

Como se señaló en [6], dada la importancia de la selección de dos pares buenos, se usa

un modelo multifactorial para representar cada divisa frente al grupo de m eigenportfolios.



Se utilizó el siguiente modelo multifactorial expresado en [7]:

d fi(t)fi(t)

= αidt +

m∑j=1

βi, jdI j(t)I j(t)

+ dXi(t) i = 1, ...,N t = 1, ...,T (2.12)

fi(t) representa el precio de una divisa i en el período t. El lado derecho es una regresión

lineal, donde la variable explicativa I j(t) representa al eigenportfolio j, ya que la suma

es el m eigenportofolio que se seleccionó anteriormente. Xi(t) corresponde al diferencial

entre la divisa i y el grupo de eigenportfolios, lo que significa que dXi(t) es el aumento del

diferencial.

A nivel de estrategia, por cada αi dólares que se invierten en una posición larga en la

divisa i, se debe invertir βi, j dólares en una posición corta para cada eigenportfolio j. Por

ejemplo, cuando invierte αi dólares en posiciones cortas en la divisa i, debe invertir βi, j

dólares en posiciones largas para cada eigenportfolio j.

A continuación, se propone un modelo paramétrico simple para Xi(t), es decir, el

proceso Ornstein-Uhlenbeck tal como se propone en [7],

dXi(t) = ki(mi − Xi(t))dt + σidWi(t) i = 1, ...,N t = 1, ...,T (2.13)

Este es un proceso AR-1, estacionario y autorregresivo con rezago 1. La expectativa

condicional viene dada por la siguiente expresión:

E(dXi(t)|Xi(s), s ≤ t) = ki(mi − Xi(t))dt i = 1, ...,N t = 1, ...,T (2.14)

El parámetro mi es la reversión media, ki representa la velocidad de la reversión media.

Resolviendo:

Xi(t0 + ∆t) = e−ki∆tXi(t0) + (1 − e−ki∆t)mi + σi

∫ t0+∆t

t0e−ki(t0+∆t−s)dWi(s) (2.15)

i = 1, ...,N t = 1, ...,T

Este proceso normalmente se distribuye con media mi y varianza σ2i

2ki.



La señal si se define como:

si,t =Xi(t) − mi

σi/√

2kii = 1, ...,N t = 1, ...,T (2.16)

Donde σi/√

2ki representa la desviación de equilibrio.

El parámetro si,t se define como el s-score, que representa la distancia en desviaciones

a la reversión media mi. Teniendo en cuenta los últimos M datos, se define como:

Ri,t = β0 +

m∑j=1

βi, jI j,t + εi,t t = 1, ...,T (2.17)

Siendo I j,t el retorno del eigenportfolio j en el período t. Del residual εi,t se puede

obtener la forma discreta de Xi,t:

Xi,t =

t∑l=1

εi,t t = 1, ...,T i = 1, ...,N (2.18)

Expresando la Ecuación 2.15 de la forma AR (1) para luego despejar mi, σi, ki:

Xi,t+1 = ai + biXi,t + δi,t+1 t = 1, ...,T − 1 i = 1, ...,N (2.19)

Para poder definir umbrales que son independientes de la divisa que se está analizando,

cambiando el centro del parámetro mi, tal como se propone en [7]:

mi = mi +1N

N∑j=1

m j i = 1, ...,N (2.20)

Dado que una de las condiciones para usar los mínimos cuadrados ordinarios es que la

suma de los residuales sea cero, para la ventana de datos de M, es necesario que Xi,T = 0

sea el último dato de la ventana.

Para tomar la decisión de inversión, se debe utilizar la siguiente regla:

Abrir posición larga si si < −sbo

Cerrar posición larga si si > −ssc

Abrir posición corta si si > sso



Cerrar posición corta si si < sbc

Los umbrales presentados en [7] son de la siguiente forma:

sbo = 1,25

sso = 1,25

ssc = 0,50

sbc = 0,75

Como requisito para abrir una posición en la divisa i, se requiere que ki � 1. Por cada

compra (venta) de la divisa i, βi dólares del índice de mercado seleccionado se venderán

(comprarán). Para este caso en particular se utilizó el dollar index.

El dollar index de los Estados Unidos es el índice de divisas más popular y más

negociado. También se reconoce entre los inversores como el punto de referencia más

importante en términos del valor general del dólar estadounidense, tal como se expresa en

[20].

Respecto a la cartera, se consideró la siguiente ecuación:

Et+∆t = Et + Etr∆t +

N∑j=1

Qi,tRi,t + Qdxy,tRdxy,t −

N∑j=1

Qi,tr∆t − Qdxy,tr∆t (2.21)

Sea Et la cantidad de dinero en la cartera en el período t, r la tasa libre de riesgo

Qi,t la cantidad de dinero invertido en la divisa i en el período t, Qdxy,t cantidad de dinero

invertido en Dollar Index. Para determinar el monto invertido en cada divisa Qi,t, se utiliza

la proporción de 2/N del portafolio Et si se invierte.

A través de pruebas, se determinó que los mejores umbrales se dan dinámicamente.

Como resultado, se propuso estudiar un período de entrenamiento y luego un período

de negociación, donde se propuso la mejor combinación de umbrales del período de

entrenamiento.


2.4. ANT COLONY OPTIMIZATION CAPÍTULO 2. MARCO TEÓRICO

Los umbrales óptimos encontrados en el siguiente problema de optimización no lineal,

con la siguiente función objetivo presentada en [21], donde tanto el retorno como la

desviación estándar tienen el mismo peso, serán:

mın σE − µE (2.22)

s.t: − sbo ≤ −ssc (2.23)

sbc ≤ −sso (2.24)

0,9 ≤ sbo, sso ≤ 2 (2.25)

0 ≤ sbc, ssc ≤ 0,9 (2.26)

sbo, sbc, sso, ssc ∈ R (2.27)

2.4. Ant Colony Optimization

La optimización de colonias de hormigas (ACO) es una metaheurística inspirada en el

comportamiento social de las colonias de hormigas, con el objetivo de resolver problemas

difíciles de optimización combinatorial (CO) a través de soluciones suficientemente buenas

que requieren un tiempo de cómputo razonable. Las hormigas exploran diferentes fuentes

de alimentos, que serían similares al valor de la función objetivo, y, en estas fuentes de

alimentos, las hormigas evalúan la calidad del alimento (función objetivo) y durante la ruta

de retorno depositan feromonas en la solución que condujo a encontrar este valor para la

función objetivo. De esta manera, las hormigas comunican a la siguiente hormiga el camino

que tomó para encontrar esa fuente de alimento, tal como se expresa en [14], [22] y [15].

Aunque cada hormiga es lo suficientemente compleja como para poder encontrar

soluciones viables, mediante la comunicación indirecta con las feromonas mencionadas

anteriormente existe una mejora de esta solución, al realiza iteraciones de cada hormiga.

Las hormigas modifican de manera adaptativa la forma en que se explica un problema y,

por lo tanto, la forma en como se resuelve, tal como se expresa en [23]. La heurística ACO

es notablemente eficiente y también flexible en casos donde las entradas de un modelo dado

cambian constantemente, esto según lo visto en [24].


2.4. ANT COLONY OPTIMIZATION CAPÍTULO 2. MARCO TEÓRICO

Para realizar la optimización presentada recientemente, se utilizó el algoritmo ACO,

que se inspiró específicamente en el algoritmo ACO con selección de región factible para

espacios continuos (ACO-FRS) presentado en [25].


CAPÍTULO 3. ALGORITMO PROPUESTO

Capitulo 3

Algoritmo Propuesto

Este capítulo presenta el algoritmo desarrollado en este estudio, Ant Colony Optimi-

zation to Pairs Trading (ACO-PT). ACO-PT es un algoritmo basado en hormigas que se

utiliza para resolver problemas de Pairs Trading. Este algoritmo se inspiró principalmente

en ACO-FRS, un algoritmo basado en hormigas que se creó para resolver problemas de

optimización continua, el cual fue propuesto en [25].

En esta sección, primero presentamos ACO-FRS y sus componentes principales. Luego,

se describe en detalle el enfoque propuesto, ACO-PT.

3.1. ACO-FRS

Para presentar ACO-FRS, definamos un ejemplo de optimización continua que consi-

dere las variables x j ( j = 1, ..., nvar), donde el dominio es x j ∈ [a j, b j] ( j = 1, ..., nvar), y una

función objetivo se define como:

maxnvar∑j=1

x j (3.1)

Considerando el dominio de cada variable x j, se genera una matriz de regiones r ji

( j = 1, ..., nvar) (i = 1....NR). La definición de cada región se realiza mediante el siguiente


3.1. ACO-FRS CAPÍTULO 3. ALGORITMO PROPUESTO

proceso probabilístico:

r ji = U[a j, b j] (3.2)

Donde j = 1, ..., nvar, i = 1....NR y U una distribución uniforme.

r ji =

a1

1 · · · anvar1

.... . .

...

a1NR · · · anvar

NR

(3.3)

La ecuación 3.3 presenta un ejemplo de matriz de regiones. Estas regiones se definen

con el objetivo de dividir el dominio y reducir el espacio de búsqueda para facilitar el

proceso de intensificación de la feromona.

ACO-FRS contiene tres componentes principales: un proceso de construcción esto-

cástica típico que usa una regla de transición de estado, un componente de perturbación

estocástica llamado Búsqueda de Camino y un componente de exploración llamado Bús-

queda Aleatoria.

ACO-FRS considera una matriz de feromonas, τ ji ( j = 1, ..., nvar) (i = 1....NR), la cual

depende en el número de regiones (NR) y el número de variables (nvar).

Como se mencionó anteriormente, la estructura de la matriz de regiones permite que una

estructura de feromonas sea manejada más fácilmente, evitando un aumento en el tamaño

de un dominio continuo. En la matriz de feromonas, cuanto mayor es el valor del elemento

de la matriz, más prometedora es la región. Dado que ACO-FRS se basa en el Algoritmo de

Optimización de Colonia de Hormigas Simples (SACO) [26], el conocimiento heurístico

no se considera en el diseño de este algoritmo. El algoritmo 1 muestra la estructura de

ACO-FRS.

En el Proceso de Construcción una solución para el problema propuesto considerando

que es una optimización continua, consiste en una región por variable del problema. Por

lo tanto, el valor representativo de la región está asociado con la variable resuelta. Esto se



Inicialización;while Criterio do

for k ← 1 to NA dofor j← 1 to nvar do

Proceso de Construcción;Proceso de Búsqueda de Camino;

endProceso de Búsqueda Aleatoria;Proceso de Comparación ;Actualización de Feromonas;

endend

Algoritmo 1: ACO-FRS

puede expresar como:

X ={x1, ..., xnvar

}(3.4)

Cada elemento de la matriz de feromonas se inicializa con un valor τ0. Una hormiga

k decide incluir la siguiente región considerando solo las NS R regiones candidatas (Nk)

como factibles en cada iteración it (línea 5). El objetivo de utilizar un subconjunto de

regiones factibles en cada decisión es reducir el número de regiones factibles a evaluar y

disminuir los tiempos computacionales. Para decidir cuál será la próxima región a visitar a

continuación, se consideró la siguiente regla de transición de estado:

Pr ji

=

τ

ji∑

l∈Nk τjl

Si i ∈ Nk

0 e.o.c i < Nk(3.5)

Donde τ jl es la cantidad de feromonas de la región candidata i y la expresión

∑l∈Nk τ

jl

representa la suma de la cantidad de feromonas contenidas dentro de las regiones que

pertenecen a Nk.

Una vez que la hormiga k haya construido una solución completa, los valores asignados

a x j,k se pueden modificar utilizando el componente Búsqueda de Camino con una probabi-

lidad dada S P (línea 6). Este componente puede modificar o mantener el valor seleccionado



(a través de la regla de transición de estado) considerando la siguiente ecuación:

r js j + U[−1, 1] · abs(r j

s j − r jα) (3.6)

El objetivo de este componente es evaluar una solución cercana a la propuesta del

proceso anterior, asumiendo que es de mejor calidad.

La magnitud de la perturbación del valor r js j está limitada por la diferencia entre su

valor y un valor seleccionado al azar que pertenece al conjunto de regiones factibles.

Finalmente, se aplica el componente Búsqueda aleatoria (línea 8). Aquí, una solución

candidata se genera aleatoriamente. El objetivo es aumentar la exploración del algoritmo

considerando la información de manera diferente a los datos obtenidos de las feromonas.

Cuando cada hormiga ha construido una solución candidata, la mejor solución en-

contrada y alcanzada durante la ejecución del proceso es almacenada (rB), y se actualiza

la matriz de feromonas (línea 9-10). Primero, una feromona se evapora considerando el

parámetro τevep lo que reduce los valores de cada celda en la matriz de feromonas de la

siguiente manera:

τji ← τ

ji − ∆τevep (3.7)

Luego, se deposita una feromona en cada región que forma parte de la solución de

mejor calidad obtenida (rb) en la iteración actual:

τji ← τ

ji + ∆τint (3.8)

Hay tres posibles criterios de parada. El primer criterio corresponde al número máximo

de iteraciones (IterMAX). El segundo criterio corresponde al número máximo de funciones

a evaluar (NFEMAX) y el último criterio corresponde a un cierto número de iteraciones

que no resultan en la mejora de la solución encontrada (S CMAX). Lo primero que suceda

es la terminación de la iteración.

La Tabla 3.1 muestra un resumen de las condiciones para la evaluación del algoritmo

ACO-FRS.

ACO-FRS se seleccionó como un algoritmo de referencia debido a que la optimización


3.2. ACO-PT CAPÍTULO 3. ALGORITMO PROPUESTO

Parametro Valor Sugerido Tipo

NR 10*nvar SintonizableNA NR Fijoτ NR FijoNS R 2*nvar Sintonizable

S P 0.5 Sintonizable∆τint 1 Fijo∆τevep 1 Fijo

Tabla 3.1: Condiciones para evaluación ACO-FRS.

de los valores de los umbrales se puede tratar como un problema continuo. Sin embargo,

dado que el objetivo es tomar decisiones rápidamente y reducir el tiempo de cálculo, se

decide hacer que el dominio de cada umbral tome valores discretos.

De ahora en adelante, el problema considerará un punto representativo para cada región

y para cada variable que se determinó como el punto medio de la región. Esto se debe a

que una muy pequeña diferencia entre los umbrales no genera grandes cambios en el valor

de la función objetivo. En la siguiente sección, presentamos los detalles de nuestro enfoque

que fue inspirado por ACO-FRS.

3.2. ACO-PT

En este estudio, se propone un algoritmo basado en hormigas que fue inspirado por

ACO-FRS. Se proponen algunas modificaciones para abordar la toma de decisiones en

relación con Pairs Trading. El algoritmo es llamado Ant Colony Optimization to Pairs

Trading (ACO-PT), que tiene el objetivo de optimizar los valores de los umbrales que

contribuyen a la toma de las decisiones de Pairs Trading.

En cuanto a las regiones, éstas se manejan de manera diferente en ACO-PT que en

ACO-FRS.

Es importante mencionar que, a diferencia de ACO-FRS, que realiza iteraciones durante

un período fijo, ACO-PT funciona de forma dinámica y se optimiza en diferentes períodos

de tiempo, denominados por la indexación t. El primer período al que se aplicó el algoritmo

es el dato CE, que representa la cola de entrenamiento que contiene los datos donde no hay



señales debido al PCA. Los datos que sirvieron de entrenamiento ayudaron al algoritmo

a tomar decisiones de trading durante los próximos TR días (siendo TR el parámetro que

representa los días de trading). Al considerar el dominio de cada variable x j (umbral), una

matriz de regiones r ji (t) ( j = 1, ..., nvar) (i = 1....NR) (t = CE....T ) es generada. Es necesario

determinar el tamaño que ocupará el espacio representado por cada región. Este tamaño

variará dependiendo de la variable j ( j = 1, ..., nvar). La definición de cada región (punto

representativo de la región) se realiza mediante la expresión:

r ji (t) = sr j ·

(2 · i − 1)2

+ x jmin (3.9)

A partir de este momento, el algoritmo funcionará como un problema discreto con

el fin de reducir el espacio de búsqueda, mejorando la velocidad del algoritmo. La razón

principal de esta decisión está relacionada con la siguiente situación. La diferencia en el

nivel de precisión es más costosa que lo que mejora el valor de la función objetivo debido

a su definición binaria en un nivel comparativo (compra o no compra, vende o no vende).

Por ejemplo, un umbral de 1.0001 no produce una diferencia significativa en el valor de la

función objetivo a que si se calculara con umbral de 1.

Al igual que en ACO-FRS, ACO-PT contiene tres componentes principales: un proceso

de construcción estocástica, Búsqueda de camino y Búsqueda aleatoria.

La principal diferencia entre los dos es que, en ACO-PT, cada proceso se utiliza

para identificar el índice i (para cada variable j) de la región que formará parte de la

solución propuesta. Una vez que se haya identificado el índice i para la variable j, el punto

representativo asociado con esa región i se puede obtener en la matriz de regiones (r ji (t)).

El uso de las feromonas es el mismo que en ACO-FRS, excepto que la matriz τ ji (t)

( j = 1, ..., nvar) (i = 1....NR) (t = 1....T ) también se indexa en t porque una solución que es

buena para t = t0 no significa que sea buena para un t diferente a t0 debido al hecho de que

los umbrales responden a un cierto ciclo económico. El algoritmo 2 muestra la estructura

de ACO-PT.

Se definen los siguientes parámetros: NA como el número de hormigas, NS R como

el número de regiones factibles que pueden ser visitadas por cada hormiga, S P como

una probabilidad dada, ∆τint como la intensificación de las feromonas, ∆τevep como la



Inicialización;for t ← CE to T by TR do

while minit ≤ it ≤ maxit and Criterio dofor k ← 1 to NA do

for j← 1 to nvar doProceso de Construcción;Proceso de Búsqueda de Camino;

endProceso de Búsqueda Aleatoria;Proceso de Comparación ;Actualización de Feromonas;

endProceso de Trading;

endend

Algoritmo 2: ACO-PT3

evaporación de las feromonas. Las feromonas al comienzo de cada período t son τ0.

Para inicializar el proceso, se establece el vector rit,k, jB (t) ( j = 1, ..., nvar), que representa

la mejor solución encontrada hasta ese momento para el período t y cuando t = CE, it = 1

y k = 1 contienen los umbrales propuestos en el caso base expuesto en [7].

El Proceso de Construcción de ACO-PT es similar al utilizado en ACO-FRS. Cada

celda de la matriz de feromonas se inicializa con un valor τ0. Una hormiga k decide la

próxima región que se incluirá (usando el punto representativo) considerando solo las

NS R regiones candidatas (Nk) que son factibles en cada iteración it (línea 6). Para cada

variable, se seleccionó una región s j considerando la función probabilística expresada en la

Ecuación 3.5.

Una vez que la hormiga k ha construido una solución completa, los valores asignados a

x j,k se pueden modificar utilizando el componente Búsqueda de Camino con una probabi-

lidad dada S P (línea 7). Al igual que en ACO-FRS, este componente puede modificar o

mantener el componente seleccionado según la regla de transición de estado considerando



la siguiente ecuación:

i =

s j + round(U[−1, 1] · (s j − α)) Si U[0, 1] ≤ S P α ∈ I

s j e.o.c(3.10)

Siendo U[−1, 1] una variable aleatoria con una distribución uniforme entre -1 y 1, y

U[0, 1] una variable aleatoria con una distribución uniforme entre 0 y 1.

Una vez que se selecciona el índice de la región i para todas las variables j, los índices

de las regiones seleccionadas se almacenan en el subconjunto Mk. En el caso de que i esté

fuera de los límites, se selecciona una región aleatoria con la siguiente ecuación :

i = round(U[0, 1] · NR) (3.11)

Con los índices almacenados en Mk, la matriz de regiones r ji (t) se busca la región

asociada con el índice para construir la solución candidata Xkj (t).

Finalmente, se aplica el componente Búsqueda aleatoria (línea 9). Consiste en buscar

un índice de región aleatorio que pertenezca al subconjunto Mk. La selección del índice se

realiza mediante la siguiente ecuación:

gk(t) = sround(U[0,1]·nvar) (3.12)

Luego procedemos a construir la solución candidata llamada Random Point RPk,itj (t),

que está formada por los elementos de la matriz r ji (t), en cada dimensión j que tienen un

índice:

i = gk(t) (3.13)

Si Xk,itj (t) es más rentable, se reemplazan las regiones de RPk,it

j (t). Como resultado, la

matriz de regiones debe reiniciarse para cada período t.

El siguiente proceso es el Proceso de comparación (línea 10), donde las soluciones

candidatas (RPk,itj (t) y Xk,it

j (t)) se evalúan (si es necesario) y luego se comparan con rit,k, jB (t),



con la función objetivo de la mejor solución entre ellas elegidas. La función objetivo del

algoritmo se calcula utilizando el promedio de las funciones objetivo presentadas en 2.22

de T N períodos anteriores mediante la fijación de las variables con la solución candidata

para analizar.

Los parámetros de la mejor función objetivo se reemplazan en rit,k, jB (t) para ejecutar la

estrategia para los TR siguientes períodos en el proceso llamado proceso de trading y para

servir como rit,k, jB (t) para la siguiente hormiga o en la próxima iteración del caso.

Las feromonas se evaporan mediante la ecuación:

τji (t)← τ

ji (t) − ∆τevep (3.14)

En el caso de que f (Xk,otj (t)) ≥ f (RPk,it

j (t)), las feromonas deben intensificarse con la

ecuación:

τji (t)← τ

ji (t) + ∆τint (3.15)

Finalmente, en Proceso de Trading (línea 12), la estrategia de los TR siguientes

periodos se ejecuta y las señales de compra y venta se realizan a través de los procesos

antes mencionados.

Para cada período en el que se aplica el algoritmo, hay ciertas iteraciones, se determina

un mínimo minit y un máximo maxit de iteraciones. Como criterio para la finalización del

proceso, la función objetivo se debe mejora con respecto a la iteración anterior en cada

iteración, de no ocurrir esto, se finaliza.

Para analizar y evaluar el efecto de cada componente ACO-PT, se propuso tres variantes

de ACO-PT para diseñar un algoritmo más simple que requiera menos tiempo y contenga

solo los componentes que producen un efecto positivo en la función objetivo: ACO-PT1:

solo considera el proceso de construcción, el pseudocódigo de esta variación se puede ver

en el Algoritmo 3. ACO-PT2: el componente de Road Search se agrega a ACO-PT1, el

pseudocódigo de esta variación se puede ver en el Algoritmo 4. ACO-PT3: el componente

de búsqueda aleatoria se agrega a ACO-PT2, el pseudocódigo de esta variación se puede

ver en el algoritmo 2.






endActualización de Feromonas;


endend





endProceso de Comparación ;Actualización de Feromonas;


endend




En la siguiente sección, presentamos la evaluación experimental de los tres algoritmos.


CAPÍTULO 4. RESULTADOS

Capitulo 4

Resultados

En este estudio, se utilizaron las treinta y ocho divisas con mayor liquidez en alta

frecuencia. La frecuencia de los datos fue cada quince minutos y se utilizaron desde el 22

de septiembre de 2017 a las 00:00:00 horas hasta el 6 de julio de 2018 a las 16:45:00, tanto

el BID como el ASK de cada divisa. Los datos utilizados en este estudio se obtuvieron en

[27].

4.1. Principal Components Analysis

Primero, se debe establecer el parámetro M, ya que representa la cantidad de datos a

considerar en la ventana que encontrará los parámetros de PCA. De acuerdo con lo que se

expresa en [7], solo se debe ingresar información económicamente relevante, ya que tener

una ventana de tiempo M mucho mayor que la cantidad de divisas que se están analizando

dañaría la estrategia al agregar información del pasado lejano.

Se analizó empíricamente el uso de ventanas correspondientes a una hora, un día y una

semana. Teniendo en cuenta que Forex está abierto 24/5 y la frecuencia de los datos es cada

quince minutos, esto se representa como M = 4, M = 4 · 24, M = 4 · 24 · 5, para hora, día y

semana, respectivamente.


4.1. PRINCIPAL COMPONENTS ANALYSIS CAPÍTULO 4. RESULTADOS

Figura 4.1: Evolución a lo largo del año 2018 del rendimiento acumulado de la estrategia con 55 %de varianza explicada, umbrales fijos y los casos: ventana de una hora (M = 4), un día (M = 4 · 24))y una semana (M = 4 · 24 · 5).

En [7] se declaró que el uso de demasiados factores en la PCA conduce a captar ruido,

por lo que en este trabajo se propuso y utilizó una varianza explicada de 55 %. Además,

este parámetro se verificó empíricamente aplicando el modelo base presentado en [7], es

decir, con umbrales fijos.


4.1. PRINCIPAL COMPONENTS ANALYSIS CAPÍTULO 4. RESULTADOS

Figura 4.2: Evolución a lo largo del año 2018 del rendimiento acumulado de la estrategia conM = 4 · 24, umbrales fijos y los casos: 30 %; 40 %; 50 %; 55 %; 60 %; 70 % de varianza explicada.

La estrategia con M = 4 · 24, 55 % de varianza explicada y umbrales fijos fue notable-

mente superior y, como resultado, se mencionará a partir de ahora como caso base.

El retorno anualizado del caso base es 26.7968 % y su desviación estándar es 2.6115 %.

Por lo tanto, su índice de Sharpe es 9.4952.

El índice de Sharpe se calculó como (µ − r)/σ donde µ y σ son los rendimientos

anualizados y la desviación estándar respectivamente. La tasa de interés libre de riesgo r

fue considerada como 2 %.

Además, la output de la estrategia con M = 4 · 24 y 55 % de varianza explicada se usará

como entrada para el modelo ACO-PT.


4.2. ACO-PT CAPÍTULO 4. RESULTADOS

Parameters Suggested Value Type

NR 300 Empíricanants 60 Empíricaτ NR LiteraturaNS R 2*nvar LiteraturaS P 0.5 Literaturamaxit 10 Empíricaminit 3 Empírica∆τint 1 Literatura∆τevep 1 Literatura

Tabla 4.1: Fijación de parámetros

4.2. ACO-PT

Para iniciar el algoritmo, se deben definir sus parámetros. El parámetro NR, que

representa la cantidad de regiones que tendrá cada variable, está determinado por 300

regiones para tener una precisión de entre 0.003 y 0.00333 desviaciones estándar. Con

respecto al número de variables (nvar), se representan los 4 umbrales mostrados en [7].

El número de hormigas (NA) se define como 60, para explorar inicialmente un 20 % del

número total de regiones iniciales.

Un mínimo de iteraciones (minit) y un máximo de iteraciones (maxit) se definieron como

3 y 10, respectivamente. La probabilidad dada S P se estableció en 0.5, como se expresa

en [25]. Tanto la intensificación (∆τint) como la evaporación (∆τevap) de las feromonas se

fijaron en 1 como se menciona en [25].

La tabla 4.1 muestra los parámetros utilizados en el algoritmo, diferenciando el tipo de

fijación que tiene, si se derivó de la literatura existente o si fue empírica.

A continuación se muestra una tabla que resume los resultados de las diferentes

configuraciones de los 3 algoritmos propuestos.

Para validar nuestro objetivo, que era obtener un ACO-PT con una rentabilidad y un

índice de Sharpe mejor que el caso base, decidimos realizar una prueba de medias para

demostrar estadísticamente nuestro objetivo. Para poder realizar esta prueba, la normalidad

de la serie de rentabilidad será verificada por Kolmogorov-Smirnov Test el cual es propuesto

en [28].


4.2. ACO-PT CAPÍTULO 4. RESULTADOS

Trading Hour Day Week

Training One Hour Two Hours Three Hours One Day Two Days Three Days One Week Two Weeks Three Weeks

ACO-PT1 28.4853 * 28.2920 29.2317 * 29.2883 * 28.3249 30.3357 * 29.5547 * 27.1386 26.1544Annualized STD 2.7647 2.7609 2.7926 2.7349 2.7546 2.7375 2.7475 2.7332 2.6366Sharpe ratio 9.5798 9.5230 9.7514 9.9778 9.5567 10.3509 10.0290 9.1975 9.1612

ACO-PT2Annualized return 30.3043 * 29.6463 * 28.4460 29.1351 * 29.2641 * 27.3185 27.8919 28.3028 28.9355 *Annualized STD 2.7638 2.7767 2.7491 2.7697 2.7224 2.7072 2.6615 2.7822 2.7639Sharpe ratio 10.2411 9.9565 9.6199 9.7971 10.0147 9.3523 9.7283 9.4540 9.7455

ACO-PT3Annualized return 27.7902 27.4466 27.3218 26.6782 26.8199 26.6901 26.7806 26.6133 27.4169Annualized STD 2.6698 2.6431 2.6233 2.6124 2.6226 2.6132 2.6127 2.6194 2.6237Sharpe ratio 9.6600 9.6276 9.6527 9.4466 9.4639 9.4482 9.4847 9.3965 9.6874

Tabla 4.2: Los retornos, la desviación estándar, el índice de Sharpe y la prueba de Wilcoxon seanalizaron mediante la aplicación de los 3 algoritmos en análisis. Se utilizaron tres períodos detrading: una hora, un día y una semana. Para la negociación de la estrategia utilizamos: una, dos ytres veces el período de trading. Cuando la prueba de Wilcoxon con un nivel de significación de5 % rechazó la hipótesis de que la media del Caso Base es mayor o igual que la de la configuraciónanalizada ACO-PT, se denota con un *.

Dado que la hipótesis nula es que los datos en el vector provienen de una distribución

normal estándar, podemos confirmar con un nivel de significancia de 5 % que la serie de

retornos no es de una distribución normal estándar. Debido a la ausencia de normalidad en

la serie, se utilizó el test de Wilcoxon, que es una prueba no paramétrica y se aplica sin la

necesidad de asumir la normalidad de las muestras como se presenta en [29].

La prueba de Wilcoxon se realizó para la mejor configuración de cada algoritmo.

Como resultado, el algoritmo ACO-PT1 fue superior a ACO-PT2 y ACO-PT3. Dado que

las configuraciones candidatas de ACO-PT1 y ACO-PT2 son mejores que el caso base

y debido a que no fue posible asegurar la superioridad de las configuraciones ACO-PT3

en comparación con el caso base, fue posible determinar que ACO-PT1 tuvo un mejor

desempeño que ACO-PT3 y ACO-PT2.


CAPÍTULO 5. CONCLUSIONES

Capitulo 5

Conclusiones

Las contribuciones de este trabajo son las siguientes: El uso de metaheurísticas de

optimización de colonias de hormigas aplicadas a una estrategia de trading; La optimización

de los umbrales de toma de decisiones en la estrategia de inversión de Pairs Trading,

optimización que podría proponerse bajo diferentes enfoques; Finalmente, la evaluación

del algoritmo propuesto (ACO-PT).

En el paso de PCA, algunos parámetros se configuraron para generar la entrada nece-

saria para evaluar ACO-PT. Con respecto al parámetro M, que representa la cantidad de

datos que deben considerarse dentro de la ventana para las señales, este tenía la intención

de integrar solo la información económicamente relevante. Así, se propuso considerar los

datos de un día. Es posible apreciar en la Figura 4.1 el hecho de que el uso de la data de

un día es correcto, mostrando una clara tendencia positiva en la rentabilidad acumulada

durante el período evaluado, siendo esta tendencia mayor que la estrategia que usó datos de

un hora y una semana.

Se observó que la estrategia con datos de una hora era altamente volátil, debido al

hecho de que utilizar esa cantidad de datos hace imposible integrar la información necesaria

para aclarar una tendencia en la serie, lo que agrega un componente de aleatoriedad a la

decisión. Por otro lado, en el caso de la ventana que utilizó una semana de datos, esto

agrega información de ciclos económicos pasados, lo que perturba la toma de decisiones

tal como se explica en [7].

Con respecto a la cantidad de varianza explicada por los factores de PCA, se propuso


CAPÍTULO 5. CONCLUSIONES

usar un 55 % como fue propuesto en [7]. La figura 4.2 muestra que, al igual que en [7],

55 % de varianza explicada se ajusta mejor a nuestra estrategia.

El desempeño positivo del algoritmo propuesto es evidente en la tabla provista. En

el caso de ACO-PT1, hubo una mejora en la rentabilidad anualizada de 13.21 % y una

mejora en el índice de Sharpe de 9.01 % con respecto al caso base. ACO-PT2 mostró una

mejora de 13.09 % en rentabilidad y de 7.85 % en el índice de Sharpe. Con respecto al

algoritmo ACO-PT3, no fue posible confirmar estadísticamente una mejora con respecto al

caso base después de aplicar la prueba de Wilcoxon. Como resultado, podemos concluir

que la variación del algoritmo propuesto que mostró el mejor rendimiento (ACO-PT1)

también fue el algoritmo con menos pasos y, por lo tanto, el más simple y más rápido.

En términos de investigaciones futuras, vale la pena examinar la sensibilización de

los grupos de parámetros del algoritmo propuesto tal como son, el número de hormigas,

el número de regiones, entre otros. También sería interesante evaluar la implementación

de este trabajo en grupos de umbrales. Esto se traduciría en trabajar con una matriz de

feromonas con una dimensión más grande, donde la cantidad de una feromona se asigna a

un grupo de umbrales relacionados.


BIBLIOGRAFÍA BIBLIOGRAFÍA

Bibliografía

[1] Amir E. Khandani and Andrew W. Lo. What happened to the quants in August2007? Evidence from factors and transactions data. Journal of Financial Markets,14(1):1–46, 2011.

[2] Nicolas Huck. Pairs trading and outranking: The multi-step-ahead forecasting case.European Journal of Operational Research, 207(3):1702–1716, 2010.

[3] Álvaro Cartea and José Penalva. Where is the Value in High Frequency Trading?Quarterly Journal of Finance, 2(3):1–46, 2011.

[4] Christopher Krauss, Xuan Anh Do, and Nicolas Huck. Deep neural networks, gradient-boosted trees, random forests: Statistical arbitrage on the S&P 500. European Journalof Operational Research, 259(2):689–702, 2017.

[5] Andrew Pole. Statistical arbitrage : algorithmic trading insights and techniques. J.Wiley & Sons, 2007.

[6] George J. Miao. High Frequency and Dynamic Pairs Trading Based on StatisticalArbitrage Using a Two-Stage Correlation and Cointegration Approach. InternationalJournal of Economics and Finance, 6(3):96–110, 2014.

[7] Marco Avellaneda and Jeong Hyun Lee. Statistical arbitrage in the US equities market.Quantitative Finance, 10(7):761–782, 2010.

[8] Christopher Krauss. Statistical Arbitrage Pairs Trading Strategies: Review andOutlook. Journal of Economic Surveys, 31(2):513–545, 2017.

[9] Nicolas Huck. Pairs selection and outranking: An application to the S&P 100 index.European Journal of Operational Research, 196(2):819–825, 2009.

[10] Carlin C F Chu. Mining Profitable High Frequency Pairs Trading Forex Signal UsingCopula and Deep Neural Network. In 2018 19th IEEE/ACIS International Conferenceon Software Engineering, Artificial Intelligence, Networking and Parallel/DistributedComputing (SNPD), pages 312–316. IEEE, 2018.

[11] Zhengqin Zeng and Chi Guhn Lee. Pairs trading: optimal thresholds and profitability.Quantitative Finance, 14(11):1881–1893, 2014.

[12] Forex. Why Trade Forex | FOREX.com, 2016.



[13] Investopedia. Should you trade forex or stocks?, 2018.

[14] Marco Dorigo and Christian Blum. Ant colony optimization theory: A survey. Theo-retical Computer Science, 344(2-3):243–278, 2005.

[15] Amparo Soler-Dominguez, Angel A. Juan, and Renatas Kizys. A Survey on FinancialApplications of Metaheuristics. ACM Computing Surveys, 50(1):1–23, 2017.

[16] Ganapathy. Vidyamurthy. Pairs trading : quantitative methods and analysis. J. Wiley,2004.

[17] Marcelo Scherer Perlin. Evaluation of pairs-trading strategy at the brazilian financialmarket. Journal of Derivatives and Hedge Funds, 15(2):122–136, 2009.

[18] Robert J. Elliott, John Van Der Hoek *, and William P. Malcolm. Pairs trading.Quantitative Finance, 5(3):271–276, jun 2005.

[19] João Caldeira and Guilherme V. Moura. Selection of a Portfolio of Pairs Based onCointegration: A Statistical Arbitrage Strategy. SSRN Electronic Journal, jan 2013.

[20] Tradingview. Currency Indices — Quotes and Overview — TradingView, 2018.

[21] T.-J. Chang, N. Meade, J.E. Beasley, and Y.M. Sharaiha. Heuristics for cardinalityconstrained portfolio optimisation. Computers & Operations Research, 27(13):1271–1302, nov 2000.

[22] M. Dorigo, V. Maniezzo, and A. Colorni. Ant system: optimization by a colony ofcooperating agents. IEEE Transactions on Systems, Man and Cybernetics, Part B(Cybernetics), 26(1):29–41, 1996.

[23] Marco Dorigo and Gianni Di Caro. Ant colony optimization: A new meta-heuristic.Proceedings of the 1999 Congress on Evolutionary Computation, CEC 1999, 2:1470–1477, 1999.

[24] M. David Albritton and Patrick R. McMullen. Optimal product design using a colonyof virtual ants. European Journal of Operational Research, 176(1):498–520, jan2007.

[25] J. A. Fernández-Vargas and A. Bonilla-Petriciolet. Desarrollo de un algoritmo deoptimización global en colonias de hormigas con selección de región factible paraespacios continuos. Revista Internacional de Metodos Numericos para Calculo yDiseno en Ingenieria, 30(3):178–187, 2014.

[26] Marco Dorigo and Thomas Stützle. An Experimental Study of the Simple Ant ColonyOptimization Algorithm. Proceedings of 2001 WSES International Conference onEvolutionary Computation (EC’01), (i):253–258, 2001.

[27] Dukascopy. Fuentes de datos históricas :: Dukascopy Bank SA | Swiss Forex Bank |

ECN Broker | Managed accounts | Swiss FX trading platform, 2018.



[28] Hubert W. Lilliefors. On the Kolmogorov-Smirnov Test for Normality with Mean andVariance Unknown. Journal of the American Statistical Association, 62(318):399–402,jun 1967.

[29] Frank Wilcoxon. Individual Comparisons by Ranking Methods. Biometrics Bulletin,1(6):80, dec 1945.


ANEXO A. TITULO DEL ANEXO...

Anexo A

Titulo del anexo...


josé miguel cerda olivares

Documents