um metodo para an´ alise de´ mercados de ac¸oes utilizando˜ s´eries temporais de ... · 2019....
TRANSCRIPT
Universidade Federal de Pernambuco
Centro de Informatica (CIn)
Pos-graduacao em Ciencia da Computacao
UM METODO PARA ANALISE DE
MERCADOS DE ACOES UTILIZANDO
SERIES TEMPORAIS DE INDICES
FINANCEIROS
Paulo Salgado Gomes de Mattos Neto
TESE DE DOUTORADO
Recife
Novembro de 2012
Universidade Federal de Pernambuco
Centro de Informatica (CIn)
Paulo Salgado Gomes de Mattos Neto
UM METODO PARA ANALISE DE MERCADOS DE ACOES
UTILIZANDO SERIES TEMPORAIS DE INDICES FINANCEIROS
Trabalho apresentado ao Programa de Pos-graduacao em
Ciencia da Computacao do Centro de Informatica (CIn)
da Universidade Federal de Pernambuco como requisito
parcial para obtencao do grau de Doutor em Ciencia da
Computacao.
Orientador: Prof. Dr. George Darmiton da Cunha Caval-
canti
Co-orientador: Prof. Dr. Tiago Alessandro Espınola Fer-
reira
Recife
Novembro de 2012
Dedico aos meus queridos pais e a minha futura esposa.
AGRADECIMENTOS
Nesses anos de doutorado diversas pessoas foram importantes para o desenvolvimentodesse trabalho. E, sem duvida, eu tive sorte de ser abencoado por uma famılia quesempre me apoiou e por grandes amigos que sempre estiveram ao meu lado. Por isso,primeiramente, agradeco a Deus e a Nossa Senhora por estar sempre me iluminando epor ter colocado essas pessoas maravilhosas na minha vida.
Agradeco aos meus pais, Alfredo e Rosa, pelo amor incondicional, pelo suporte queme deram em todos os momentos difıcieis, pelos conselhos e por sempre acreditarem emmim, mesmo quando nem eu acreditava. Sem eles nao teria chegado onde cheguei.
Agradeco ao meu orientador George pela amizade, tranquilidade, apoio e pelos con-selhos extremamentes importantes nao so para a construcao desse documento, mas paraminha construcao como pesquisador. Ainda lembro no comeco do doutorado, quando eledisse: “Paulo, voce so sai do doutorado, quando eu achar que voce esta pronto”. A partirdesse momento, compreendi que o final nao dependia apenas dos artigos publicados, oudos resultados alcancados, mas da minha postura como pesquisador.
Agradeco ao grande mestre jedi e orientador Tiago pela paciencia, conselhos, ensina-mentos e pela grande amizade construıda nesses 10 anos de convivencia. Com ele aprendique devemos acreditar em nos mesmos e em nosso trabalho, buscando sempre alcancar aexcelencia academica de forma etica.
Agradeco ao amigo e companheiro de pesquisa Francisco Madeiro, pela amizade, pelosconselhos e pela inspiracao desde os tempos de UNICAP.
Agradeco a minha famılia por parte de mae, que mesmo distante, sempre esteve muitopresente na minha vida. Sem duvida meus tios, tias, primos e primas foram fonte deinspiracao para que eu continuasse sempre em frente em busca de mais e mais conquistas.A amizade e o amor deles sempre fizeram com que eu me sentisse amparado e nuncasozinho.
Agradeco a minha famılia de Recife pelo carinho, amizade e apoio.Agradeco a Ia, minha segunda mae, pelo amor, pelo apoio e pela nossas conversas,
que sempre me fizeram pensar sobre a vida e como devemos lutar por uma sociedademais igual.
Agradeco aos meu amigos do Santa Maria que estao comigo desde sempre. Eles foramparte importante desse processo, ja que sempre estiveram ao meu lado fazendo com queesse percurso fosse menos pesado.
Agradeco a Yumi e sua famılia pelo apoio e companheirismo durante todo esse tempo.Com certeza sem Yumi nao teria chegado onde cheguei, seu apoio foi fundamental paraque eu conquistasse todos os meus objetivos, obrigado pelo amor, amizade, cumplicidadee apoio em todas as horas.
vi
“Se voce vai tentar, va ate o fim
caso contrario, nem comece”
—CHARLES BUKOWSKI
RESUMO
Diversos estudos economicos que abordam series temporais financeiras fazem uso daanalise das series de retorno. Os retornos correspondem as alteracoes no preco de umaacao num determinado perıodo, caracterizando o movimento de um determinado ativo oumercado. Tradicionalmente, o ramo que aborda o estudo de mercados utilizando seriestemporais financeiras e a Estatıstica. Metodos estatısticos, tais como AR, MA e ARIMA,sao largamente utilizados para analise de series temporais. Na Ciencia da Computacao,a Inteligencia Computacional e o ramo que tem abordado esse problema, principalmentea partir de sistemas que visam a previsao de series temporais. Entretanto, perspectivaspromissoras tem sido vislumbradas por um ramo de estudo interdisciplinar que advemda Fısica. A Econofısica analisa os mecanismos financeiros e economicos utilizando fer-ramentas e modelagens da Fısica Estatıstica. Assim, esse ramo de pesquisa pode serutilizado para o desenvolvimento de metodos e abordagens inovadoras para o estudo demercados de acoes. Esse trabalho apresenta um metodo para analise de mercados deacoes, utilizando os retornos de series temporais financeiras. Baseado na hipotese deque pode ser estabelecida uma analogia entre a dinamica dos mercados e o modelo degas ideal, um mercado simulado baseado em agentes foi desenvolvido. Nesse mercado osagentes e as acoes tem um comportamento semelhante a um gas ideal, que e um mo-delo teorico composto por partıculas que se movem aleatoriamente, nao interagindo, ouinteragindo fracamente entre si. Assim, a ideia e modelar a dinamica dos mercados deacoes, utilizando o modelo de um gas ideal. A partir de resultados obtidos analisando asseries de retorno do mercado artificial, ındices financeiros provenientes de mercados depaıses desenvolvidos e em desenvolvimento em diversas janelas temporais nos perıodos deum, dois, cinco, dez e quinze anos tambem foram analisados. Tanto no mercado artificialcomo nos mercados reais, os resultados corroboram com a hipotese que a dinamica domercado de acoes pode ser analogamente descrita por um modelo de gas ideal, tornandoo metodo uma opcao promissora. Como aplicacao, uma abordagem para classificacaode paıses baseado no metodo proposto foi desenvolvida. Os resultados obtidos com aabordagem foram comparados com classificacoes de organizacoes internacionais.
Palavras-chave: Series Temporais, Computacao Cientıfica, Mercado de Acoes, Modelode Gas Ideal.
viii
ABSTRACT
Several economic studies that address financial time series use return series for financialtime series analysis. The return series correspond to changes in the stock price over atime period. This measure characterizes the movement of a given share or market. Tra-ditionally, the branch that addresses the financial markets modeling using time series isStatistics. Statistical methods, such as AR, MA and ARIMA are widely used for timeseries analysis. In Computer Science, Computational Intelligence is the branch that hasaddressed this problem. Several intelligent systems have been developed for time seriesprediction. However, innovative approaches have been proposed by an interdisciplinarybranch that comes from Physics. Econophysics analyzes the financial and economic me-chanisms using tools and models of Statistical Physics. Thus, this new branch of researchcan be used to develop methods and innovative approaches for stock markets modeling.This work proposes the development of a method for stock markets analysis using re-turn series of financial time series. Based on the hypothesis that an analogy betweenthe dynamics of the markets and the ideal gas model can be established, an agent-basedmarket was developed. In this market, the agents and stocks behave like an ideal gas,that is a theoretical model composed by particles that move randomly, not interacting orweakly interacting. Thus, the idea is to model stock market dynamics using the modelof an ideal gas. From the results obtained from the return series analysis of the artifi-cial markets, real indices from developed and developing countries in period of one, two,five, ten and fifteen years were also analyzed. The results found in the artificial andreal markets corroborate the hypothesis that the dynamics of the stock market can besimilarly described by a model of ideal gas. So, the method is a promising option forstock market analysis. As an application, an approach to classification of countries basedon the method proposed was developed. The results obtained with the approach werecompared with international organizations.
Keywords: Time Series, Scientific Computation, Stock Market, Ideal Gas Model.
ix
SUMARIO
Capıtulo 1—Introducao 1
1.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Motivacao e Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.1 Abordagens Estatısticas para Series Temporais . . . . . . . . . . . 41.2.2 Abordagens da Inteligencia Computacional para Analise e Previsao
de Series Temporais . . . . . . . . . . . . . . . . . . . . . . . . . . 51.2.3 Abordagens da Econofısica para Series Temporais . . . . . . . . . 6
1.3 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.4 Estrutura da Tese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Capıtulo 2—Abordagens Utilizadas para Analise e Previsao de Series Temporais:
Definicao e Conceitos Basicos 10
2.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102.2 Analise e Previsao de Series Temporais . . . . . . . . . . . . . . . . . . . 11
2.2.1 Modelos Estatısticos para Analise e Previsao de Series Temporais 132.2.2 Modelos Inteligentes para Analise e Previsao de Series Temporais 162.2.3 Abordagens Utilizadas pela Econofısica para Analise de Series Tem-
porais Economico-Financeiras . . . . . . . . . . . . . . . . . . . . 172.3 Resumo do Capıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Capıtulo 3—Metodo Proposto para Analise de Series Temporais de Mercados
Financeiros 24
3.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.2 Abordagem Proposta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.2.1 Um Ambiente baseado em Agentes para Analise do Mercado de Acoes 313.2.2 Algoritmo Proposto para Analise dos Indices de Mercados Financeiros 34
3.3 Resumo do Capıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Capıtulo 4—Resultados Experimentais 37
4.0.1 Base de Dados Utilizada nos Experimentos . . . . . . . . . . . . . 374.1 Simulacao do Ambiente Artificial Baseado no Modelo do Gas Ideal . . . . 39
4.1.1 Resultados dos Experimentos com o Mercado de Acoes Artificial . 404.2 Resultados Experimentais com Dados Reais . . . . . . . . . . . . . . . . 48
4.2.1 Analise no Perıodo de Dois Anos . . . . . . . . . . . . . . . . . . 49
x
SUMARIO xi
4.2.2 Analise em Diversas Janelas de Tempo . . . . . . . . . . . . . . . 564.2.3 Aplicacao da Metodologia Proposta para Classificacao de Paıses
Desenvolvidos e em Desenvolvimento . . . . . . . . . . . . . . . . 584.2.4 Classificacao de Paıses de Acordo com Organizacoes Internacionais 614.2.5 Algoritmo Proposto para a Classificacao de Paıses . . . . . . . . . 654.2.6 Resultados para Classificacao de Paıses . . . . . . . . . . . . . . . 66
4.3 Resumo do Capıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
Capıtulo 5—Conclusoes 72
5.1 Resumo do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 725.2 Principais Contribuicoes da Tese . . . . . . . . . . . . . . . . . . . . . . . 745.3 Principais Limitacoes do Trabalho . . . . . . . . . . . . . . . . . . . . . . 755.4 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 755.5 Trabalhos Publicados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
LISTA DE FIGURAS
2.1 Estagios para a construcao de um modelo iterativo de Box & Jenkins(retirado de [1]). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2 Serie de resıduos do ındice Dow Jones de 01 de janeiro de 1998 ate 26 deagosto de 2003. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.1 A probabilidade P (E) de uma partıcula/acao sobreviver ate uma energiaE (serie de retorno) sem sofrer uma colisao [2]. . . . . . . . . . . . . . . . 29
3.2 Representacao do mercado de acoes desenvolvido com base na analogiacom o gas ideal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.1 Ajustes com a funcao exponencial e a lei de potencia usando o algoritmoTrust Region para a serie temporal gerada com σ = 0, 1. (a-b) Ajuste naescala semi-log. (c-d) Ajuste na escala log-log. A linha preta representa afuncao densidade de probabilidade (fdp) da serie temporal e a linha cinzarepresenta o ajuste encontrado pelo algoritmo. . . . . . . . . . . . . . . . 42
4.2 Comparacao entre a volatilidade e o coeficiente B. (a) Relacao das duasvariaveis nas simulacoes realizadas com a probabilidade constante de com-pra e venda dos agentes. (b) Relacao das duas variaveis nas simulacoesrealizadas com a probabilidade variavel de compra e venda dos agentes.No grafico, os pontos pretos sao as volatilidade e as estrelas cinzas sao oscoeficientes B das series temporais geradas artificialmente. Os resultadosestao em ordem decrescente de volatilidade. . . . . . . . . . . . . . . . . 43
4.3 O produto B · V olatilidade para cada mercado. A linha solida representao valor medio para o conjunto de pontos. . . . . . . . . . . . . . . . . . . 43
4.4 Histogramas normalizados das distribuicoes (ganho/perda) dos agentes(taxaAgente) com o uso de probabilidade de compra/venda constante.(a) Distribuicao do dinheiro dos agentes para a serie temporal gerada comσ = 0, 01. (b) Distribuicao do dinheiro dos agentes para a serie temporalgerada com σ = 2, 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.5 Histogramas normalizados das distribuicoes (ganho/perda) dos agentes(taxaAgente) com o uso de probabilidade de compra/venda variavel. (a)Distribuicao do dinheiro dos agentes para a serie temporal gerada comσ = 0, 01. (b) Distribuicao do dinheiro dos agentes para a serie temporalgerada com σ = 2, 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
xii
LISTA DE FIGURAS xiii
4.6 Relacao entre o coeficiente de Pearson e o coeficiente B em ordem crescentedo coeficiente B. No grafico, os pontos representam os coeficientes B eas estrelas correspondem aos coeficientes de Pearson das series temporaisartificiais. (a) Relacao para investidores com compra/venda constante. (b)Relacao para investidores com compra/venda variavel. . . . . . . . . . . 47
4.7 Evolucao temporal da volatilidade utilizando uma janela cumulativa de 50registros para os mercados com: (a) 25 agentes e σ = 0, 01, (b) 250 agentese σ = 0, 1 e (c) 500 agentes e σ = 2, 3 . . . . . . . . . . . . . . . . . . . . 49
4.8 Ajuste linear nas escalas log-log e semi-log, usando o algoritmo LS. (a-b)Indice Ibex 35 (Espanha). (c-d) Indice BSE Sensex (India). Os pontosescuros sao a fdp dos ındices e a linha cinza e o ajuste linear . . . . . . . 51
4.9 Ajustes com lei de potencia e funcao exponencial, usando o algoritmo TrustRegion na escala semi-log. (a-b) Indice Ibex 35 (Espanha). (c-d) IndiceBSE Sensex (India). A linha preta e a fdp dos ındices e a linha cinza e oajuste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.10 Ajustes com lei de potencia e funcao exponencial, usando o algoritmo TrustRegion na escala log-log. (a-b) Indice Ibex 35 (Espanha). (c-d) Indice BSESensex (India). A linha preta e a fdp dos ındices e a linha cinza e o ajuste. 54
4.11 Ajustes com lei de potencia e funcao exponencial, usando a Estimacao porMaxima Verossimilhanca na escala semi-log. (a-b) Indice Ibex 35 (Espa-nha). (c-d) Indice BSE Sensex (India). A linha preta e a fdp dos ındices ea linha cinza e o ajuste. . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.12 Ajustes com lei de potencia e funcao exponencial, usando a Estimacao porMaxima Verossimilhanca na escala log-log. (a-b) Indice Ibex 35 (Espanha).(c-d) Indice BSE Sensex (India). A linha preta e a fdp dos ındices e a linhacinza e o ajuste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.13 Relacao entre a volatilidade e o coeficiente B: (a)Least Squares, (b) TrustRegion, (c) Levenberg-Marquardt e (d) Maximum Likelihood Estimation.Nos graficos, os pontos sao as volatilidades dos ındices financeiros e asestrelas sao os coeficientes B dos ındices. . . . . . . . . . . . . . . . . . . 57
4.14 Relacionamento entre a volatilidade e o coeficiente B calculado por ((a)LeastSquares, (b) Trust Region, (c) Levenberg-Marquardt e (d) Maximum Like-lihood Estimation). Nos graficos, os pontos sao o resultado do produtoB · V olatilidade e a linha solida e o valor medio desses valores. . . . . . . 58
4.15 Relacionamento entre a volatilidade e o coeficiente B calculado para asjanelas de tempo de: (a) 1 ano, (b) 2 anos, (c) 5 anos, (d) 10 anos e (e) 15anos. Nos graficos, os pontos sao as volatilidades dos ındices financeiros eas estrelas sao os coeficientes B dos ındices. . . . . . . . . . . . . . . . . 62
4.16 Relacionamento entre a volatilidade e o coeficiente B calculado para asjanelas de tempo de: (a) 1 ano, (b) 2 anos, (c) 5 anos, (d) 10 anos e (e) 15anos. Nos graficos, os pontos sao as volatilidades dos ındices financeiros eas estrelas sao os coeficientes B dos ındices. Nos graficos, os pontos saoo resultado do produto B · V olatilidade e a linha solida e o valor mediodesses valores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
LISTA DE FIGURAS xiv
4.17 Relacao entre a volatilidade e o coeficiente B no dados correspondentes adois anos. Os pontos cinzas representam a volatilidade dos ındices e osquadrados pretos representam o coeficiente B. . . . . . . . . . . . . . . . 67
4.18 Constante de proporcionalidade entre a volatilidade e o coeficiente B. Ospontos sao o produto B · V olatilidade = C e a reta e o valor medio doproduto das grandezas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.19 Grafico combinando as medidas de flutuacao. O eixo x corresponde a vo-latilidade e o eixo y ao coeficiente B. As estrelas representam os mercadosdesenvolvidos e os pontos representam os mercados em desenvolvimento. 68
4.20 Etapa de classificacao, utilizando os centroides encontrados pelo o algo-ritmo K-means. As estrelas representam as economias classificadas comomercados desenvolvidos e pontos representam as economias classificadascomo mercados em desenvolvimento. As cruzes sao os centroides paracada grupo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
LISTA DE TABELAS
4.1 Erros (MSE) usando as leis de potencia e a abordagem proposta baseadana funcao exponencial com probabilidade de compra e venda constante . 41
4.2 Erros (MSE) usando as leis de potencia e a abordagem proposta baseadana funcao exponencial com probabilidade de compra e venda variavel . . 41
4.3 Estatısticas dos experimentos com 100000 iteracoes. . . . . . . . . . . . . 484.4 Erros de ajuste (MSE) em escala semi-log e log-log. . . . . . . . . . . . . 504.5 Erros de ajuste (MSE e verossimilhanca) usando leis de potencia e distri-
buicoes exponenciais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 534.6 Erro de ajuste (MSE) no perıodo de um ano. . . . . . . . . . . . . . . . . 594.7 Erro de ajuste (MSE) no perıodo de dois anos. . . . . . . . . . . . . . . . 594.8 Erro de ajuste (MSE) no perıodo de cinco anos. . . . . . . . . . . . . . . 604.9 Erro de ajuste (MSE) no perıodo de dez anos. . . . . . . . . . . . . . . . 604.10 Erro de ajuste (MSE) no perıodo de quinze anos. . . . . . . . . . . . . . 614.11 Dados dos ındices dos paıses. . . . . . . . . . . . . . . . . . . . . . . . . . 67
xv
LISTA DE ABREVIATURAS, SIGLAS E SIMBOLOS
Siglas Descricaos Desvio padrao amostral
t Indice temporalZt Valor da serie temporal no tempo tH Intervalo de amostragemG(t) Amplitude das flutuacoes da serie de retornosk Expoente da lei de potenciakb Constante de Boltzmann (kb = 1, 3806503 · 10−23 J/K)rt Termo de ruıdo∆t Intervalo de amostragemB Taxa de colisao de uma partıcula (taxa de decaimento)C Constante de proporcionalidade entre a volatilidade e o coeficiente BE Energia de uma partıcula ou acaoT TemperaturaVT(t) Volatilidade num intervalo TAEBH Alisamento Exponencial Biparametrico de HoltAELB Alisamento Exponencial Linear de BrowAES Alisamento Exponencial SimplesAR(p) Modelo estatıstico auto-regressivo de ordem pARIMA(p, d, q) Autoregressive Integrated Moving AverageEWMA Exponentially Weighted Moving AverageFA Filtragem AdaptativaGARCH General Autoregressive Conditional HeteroskedasticityIA Inteligencia ArtificialLM Levenberg-MarquardtLS Least SquaresMA(q) Moving Average of order qMLE Maximum Likelihood EstimationMLP Multi-Layer PerceptronMMS Medias Moveis SimplesMSE Mean Square ErrorPSO Particle Swarm OptimizationRNA Redes Neurais ArtificiaisRW Random WalkTR Trust Region
xvi
CAPITULO 1
INTRODUCAO
Neste capıtulo, sao introduzidos conceitos sobre analise de series temporais e alguns
metodos utilizados para essa tarefa. Tambem sao descritos a motivacao, a justificativa e
os objetivos da pesquisa. Ao final do capıtulo, e apresentada a organizacao deste trabalho.
1.1 INTRODUCAO
A ideia de observar fenomenos temporais e quase tao antiga quanto a humanidade. Ate
hoje, o intuito de se analisar comportamentos passados e procurar padroes temporais,
para que essas informacoes possam apoiar futuras tomadas de decisao. O objetivo e
compreender o passado na tentativa de minimizar perdas e maximizar os ganhos, possibi-
litando que haja um planejamento de acoes futuras. Desse modo, quando se analisa uma
manifestacao que evolui no tempo, primeiramente deseja-se modelar o fenomeno sob in-
teresse com a finalidade de descrever o comportamento temporal. A partir daı, e possıvel
fazer estimativas e avaliar os fatores que influenciaram a dinamica temporal, buscando
definir relacoes de causa e efeito [1, 3].
O interesse de observar, ou analisar o comportamento de uma determinada variavel
ao longo do tempo esta presente em diversas areas, como biologia, economia, financas,
meteorologia etc. Tradicionalmente, o ramo da ciencia que aborda esses fenomenos e
a Estatıstica. Diversas tecnicas estatısticas [3] foram desenvolvidas para a analise de
acontecimentos temporais com base nos dados historicos. Assim, a ideia e analisar o
passado, tentando estimar acontecimentos futuros.
Diversos fenomenos temporais sao gerados a partir de sistemas complexos. Por de-
finicao, um sistema complexo consiste de um certo numero de elementos (partes) que
interagem nao-linearmente entre si [4, 5]. Tais sistemas interagem com o meio ambiente
e constantemente tem sua estrutura modificada, adaptando-se a variacao das condicoes
externas [4]. Nesses sistemas a relacao nao-linear, proveniente das acoes de cada compo-
nente e do meio ambiente [5–7], resulta num comportamento que dificilmente pode ser
determinado. Matematicamente, um sistema complexo p pode ser descrito pela mudanca
de seus estados, de acordo com a Equacao 1.11
p(t) = f(p(t− δ)) + rt, (1.1)em que p(t) descreve o estado do sistema no tempo t, δ representa uma unidade de
tempo discreta, f e uma funcao nao-linear que muda o estado do sistema a cada unidade
de tempo e rt e um termo aleatorio. Nesse caso, o modelo apresentado na Equacao 1.1 e
uma descricao simplificada de um sistema complexo.
Quando sistemas complexos sao analisados, tenta-se compreender os efeitos coletivos
quando alguma mudanca ocorre no sistema. Essa tarefa e complexa, ja que a resposta
do sistema nao e simplesmente derivada da estrutura do sistema e das interacoes dos
seus elementos, mas tambem do relacionamento dos componentes do sistema com o am-
biente. Por isso, o estudo de sistemas complexos tem um importante papel para a mai-
oria das disciplinas cientıficas, incluindo a biologia (redes biologicas, ecologia, teoria da
evolucao, origem da vida, imunologia, neurobiologia, biologia molecular etc.), geologia
(estudo das placas tectonicas, terremotos, vulcoes, erosao, paisagens, meteorologia etc.),
economia (mercado de acoes) e outras ciencias sociais (incluindo cognicao, aprendizagem
distribuıda, interacao de agentes) [5–7].
Dentre os diversos sistemas conhecidos, os mercados financeiros sao considerados um
dos mais famosos. Duas razoes podem ser apontadas para isso [4]. Primeiro, os mercados
financeiros sao compostos por um conjunto de relacoes heterogeneas, complexas e desco-
nhecidas, onde todos os componentes sao interdependentes. Desse modo, e difıcil estimar
que fatores (internos ou externos) influenciam o mercado, a magnitude dessa influencia
e qual a resposta do proprio mercado para esses fatores. A segunda razao e que o mer-
cado de acoes e composto por diversos investidores, geralmente dotados de inteligencia e
conhecimento do sistema, que reagem com visao de futuro e diferentes estrategias.
Alem do mercado financeiro ser caracterizado como um ambiente fascinante e desafia-
dor para diversos pesquisadores, ele e um meio propıcio para se realizar diversas analises
devido a diversidade e a quantidade de dados existentes. Podem-se mencionar dois fatos
que contribuıram decisivamente para que isso ocorresse. A partir da decada de 1970, as
moedas dos paıses comecaram a ser negociadas nos mercados financeiros. Seus valores
comecaram a ser determinados pelo mercado de cambio, ou seja, um mercado financeiro
funcionando 24 horas por dia em todo o mundo. Por causa desse processo de globalizacao,
o volume de transacoes no mercado aumentou 80 vezes entre 1973 e 1995 [8], resultando
em um intenso intercambio entre os paıses e no aumento da importancia do mercado
acionario no cenario financeiro internacional.
Outro fator importante ocorreu na decada de 1980, quando os dados de compra e de
2
venda provenientes das transacoes do mercado comecaram a ser registrados eletronica-
mente. Por isso, atualmente diversos bancos de dados possuem registros de uma grande
quantidade de dados do mercado financeiro mundial em diferentes granularidades.
Por esses motivos, desde meados da decada de 1990, um ramo da ciencia tem ganhado
forca, a Econofısica. Esse campo de pesquisa interdisciplinar e resultado da cooperacao
entre economistas, matematicos e fısicos, que aplicam metodos da Fısica Estatıstica para
analisar e quantificar dados advindos da Economia e da Financas [8]. A Fısica Estatıstica
e uma area de estudo que utiliza metodos estatısticos e ferramentas matematicas para
tratar de problemas que possuem uma natureza inerentemente estocastica [9]. O termo
Econofısica foi introduzido em analogia a termos semelhantes, como astrofısica, geofısica
e biofısica, que descrevem as aplicacoes da Fısica em diferentes areas. Recentemente,
diversas teorias fısicas tem sido aplicadas com sucesso em Economia e Financas, contri-
buindo para um impulso consideravel as tecnicas de computacao para analise de dados,
mercados artificiais, macroeconomia, dentre outros.
O processo de analise do mercado, independente da ferramenta utilizada, e um grande
desafio pratico e teorico, ja que diversas variaveis podem ser relevantes para a descricao
do fenomeno. O estudo da dinamica dos mercado financeiros a partir da analise de dados
historicos e de novas ferramentas, a Econofısica por exemplo, pode dar novas ideias para
o desenvolvimento de abordagens promissoras.
1.2 MOTIVACAO E JUSTIFICATIVA
Grandes esforcos sao realizados na analise de series historicas, com o objetivo de de-
terminar e caracterizar acontecimentos temporais. De forma generica, a Estatıstica e o
ramo da ciencia que vem trabalhando sistematicamente na elaboracao de modelos para
analise de series temporais. Tais modelos sao baseados na analise cronologica de um de-
terminado fenomeno e suas respectivas interacoes com o meio e normalmente podem ser
utilizados tambem para realizar previsoes. Genericamente, as analises podem ser feitas
nos domınios da frequencia e do tempo. Ambas sao equivalentes, entretanto, neste traba-
lho, as analises serao feitas no domınio temporal, que e a forma mais popular encontrada
na literatura [3, 10–12].
De forma geral, os metodos para analise de series temporais sao usados para o es-
tudo de registros cronologicos dos precos de acoes ou ındices, tratando apenas as relacoes
temporais [13,14]. As abordagens estatısticas nao extrapolam as relacoes temporais para
que haja, de alguma forma, a descricao dos mecanismos ou dinamicas que envolvem os
mercados, ou relacoes de compra e venda. Assim, a Econofısica pode servir como base
3
para o desenvolvimento de ferramentas promissoras para a analise e entendimento dos
mercados financeiros. Contudo, para tal, e necessario primeiro que algumas abordagens
encontradas na literatura sejam descritas. Na Secao 1.2.1, abordagens classicas da Es-
tatıstica sao mencionadas. Tambem serao abordados, na Secao 1.2.2, algumas tecnicas
da Inteligencia Computacional (IC) utilizadas para analise e previsao de series tempo-
rais, dado o crescente uso na literatura. E por fim, na Secao 1.2.3, alguns conceitos da
Econofısica sao introduzidos.
1.2.1 Abordagens Estatısticas para Series Temporais
Varios modelos estatısticos ja foram propostos para analise de series temporais [3,10–12].
Dentre todos, os modelos de Box & Jenkins, conhecidos como modelos ARIMA (AutoRe-
gressive Integrate Moving Average) [3], sao os mais difundidos tanto no meio academico
como no meio comercial, principalmente em aplicacoes economicas e financeiras (bolsas
de valores, mercados financeiros etc.) [13, 14].
Os modelos de Box & Jenkins sao muito bem entendidos, porem sao modelos line-
ares, o que pode vir a ser um fator limitante se o fenomeno em estudo for governado
por leis de relacionamentos nao-lineares. Neste sentido, varios outros modelos nao-
lineares, tambem estatısticos, sao propostos, por exemplo, os modelos bilineares (bilinear
models) [15], os modelos auto-regressivos exponenciais (exponential autoregressive mo-
dels) [16], os modelos de limiar auto-regressivo (threshold autoregressive models) [17], os
modelos de estados dependentes (general state dependent models) [18], os modelos auto-
regressivos de transicao suave [19], os modelos auto-regressivos com coeficientes depen-
dentes do tempo [19], os modelos heterocedasticos condicionais auto-regressivos (ARCH
- Autoregressive Conditional Heterocedasticity) [20] e os modelos heterocedasticos condi-
cionais auto-regressivos gerais (GARCH - General Autoregressive Conditional Heteroce-
dasticity) [21].
Cada um dos modelos estatısticos nao-lineares citados tem suas vantagens e desvanta-
gens, sendo aplicados a determinadas situacoes. Embora o objetivo principal da inclusao
da nao-linearidade nos modelos de previsao seja o aumento da capacidade de descricao
dos fenomenos nao-lineares, os resultados praticos com esses modelos, de forma geral,
ainda sao insatisfatorios, sendo comparaveis aos modelos lineares [14, 19, 22].
4
1.2.2 Abordagens da Inteligencia Computacional para Analise e Previsao de Series
Temporais
Os metodos estatısticos utilizados para analise de series temporais tradicionalmente sao
lineares, contudo diversos fenomenos encontrados na natureza sao gerados por processos
nao-lineares, ou por processos estocasticos. Desse modo, na perspectiva de analise e
previsao de series temporais financeiras, ha uma grande motivacao para usar modelos nao-
lineares. A edicao especial do International Journal of Forecasting (IJF) de abril/junho
de 2004 - Forecasting Economic and Financial Time Series Using Nonlinear Methods [23]
evidencia tal preocupacao. Dentro desse contexto, a Inteligencia Computacional (IC) e
vista como uma alternativa para a analise e previsao de series temporais, com metodos e
procedimentos geralmente nao-lineares, e que, em termos praticos atuais, nao apresentam
tanta complexidade, quando comparados aos modelos estatısticos nao-lineares. Muitas
tecnicas de CI podem ser aplicadas ao problema de previsao, destacando-se na literatura
as tecnicas como as Redes Neurais Artificiais, Algoritmos de otimizacao bio-inspirados,
Programacao Genetica e Sistemas de Logica Difusa (fuzzy logic) [24–28].
Atualmente, muitos trabalhos tambem combinam tecnicas para gerar solucoes oti-
mizadas atraves da criacao de sistemas hıbridos inteligentes [29]. Esses sistemas sao
compostos pela combinacao de duas (ou mais) tecnica de CI, de tal forma que o ponto
forte de uma das tecnicas compense o ponto fraco da outra [30–32].
A pesquisa em previsao de series temporais utilizando CI e tao relevante que nos
ultimos 30 anos ha um aumento crescente de artigos publicados utilizando Redes Neu-
rais Artificiais, Computacao Evolucionaria e outros metodos inteligentes abordando essa
tarefa. Esse fato foi uma nova motivacao para o International Journal of Forecasting
(volume 27, edicao 3 e paginas 635 − 960) [22] lancar em 2011 uma edicao especial com
trabalhos envolvendo metodos de previsao baseados em Redes Neurais Artificiais e Inte-
ligencia Computacional.
Geralmente os metodos inteligentes direcionados para o estudo de series temporais
sao desenvolvidos com intuito de fazer previsao [31–36]. Desse modo, esses metodos nao
provem nenhuma explicacao do fenomeno gerador da serie temporal, sendo um mecanismo
voltado para previsao e nao para a compreensao dos fenomenos temporais que fazem parte
do sistema.
5
1.2.3 Abordagens da Econofısica para Series Temporais
Nas ultimas decadas do seculo XX, parte dos fısicos passou a se interessar intensamente
pela dinamica dos mercados de acoes, por ser um caso particular de um fenomeno extre-
mamente estudado pela Fısica: Sistemas Complexos [8, 37]. Existem varios exemplos de
sistemas complexos, tais como: sistemas sociais (redes sociais reais e virtuais), sistemas
biologicos (colonias de animais) e fısicos (clima) [4, 5, 9]. Tais sistemas tem como carac-
terıstica geral a interacao de inumeros agentes [4]. Desse modo, tres questoes podem
ser levantadas: de que maneira iteracoes locais levam a padroes coletivos? Como tais
sistemas podem ser descritos? Como sao formados esses sistemas (redes)?
No caso de mercados financeiros, as regras de administracao (compra, venda, custos,
tributacao etc.) sao claras e bem estabelecidas, nao envolvendo grandes mudancas com
o tempo. Alem disso, atualmente a evolucao dos mercados no tempo sao monitoradas
continuamente. Desse modo, e possıvel desenvolver modelos que podem ser largamente
testados e avaliados.
Devido ao crescimento na comunidade da Fısica de pesquisadores que estudam o com-
portamento dos mercados financeiros, um ramo de pesquisa foi criado: a Econofısica [8].
A Econofısica comecou sendo um campo da Mecanica Estatıstica e, atualmente, um dos
grupos mais ativos nessa area e coordenado por H. Eugene Stanley, que foi o criador
do termo “Econofısica” na decada de 90. Stanley introduziu esse termo pela primeira
vez numa conferencia de Sistemas Complexos em Calcuta, na India [?]. Em periodicos
o termo “Econofısica” apareceu na Physica A em 1996 [38]. Contudo, outros estudos ja
tinham sido realizados na decada de 60 [39, 40] por Mandelbrot e em 1900 por Bachelier
com sua tese de doutorado [41] sobre especulacao financeira orientada por Poincare. En-
tretanto, muitos estudiosos remetem sua origem ao trabalho de Pareto [42], realizado em
1897, sobre distribuicao de riqueza.
A maioria dos trabalhos da Econofısica tem como base a analise de grande quanti-
dade de dados economicos e financeiros. Tal fato foi impulsionado pela disponibilidade
dos dados, com a introducao massiva de computadores e da Internet [8]. Assim, as abor-
dagens cientıficas realizadas pela Econofısica podem ser aplicadas a diversas situacoes
dada a grande quantidade de dados e detalhamento (por exemplo granularidade, valores
de abertura e fechamento), devido ao registro dos precos de commodities (mercadorias
de origem primaria ou com pequeno grau de industrializacao), acoes, taxas de cambio,
ındices de mercado, volume de negociacao etc. Dentre as caracterısticas estatısticas estu-
dadas nos mercados financeiros, a volatilidade e uma das mais importantes. A volatilidade
representa a intensidade e a frequencia das oscilacoes nas cotacoes de um ativo financeiro
6
(acao, tıtulo, fundo de investimento ou ındice de bolsas de valores) num determinado
perıodo de tempo. Tal medida mensura o risco de um determinado ativo.
Existem diversas definicoes para volatilidade [8]:� Volatilidade Futura: e apenas uma abordagem teorica e descreve a distribuicao
de precos futuros de um ativo com base nos dados passados;� Volatilidade Prevista: e uma estimativa probabilıstica. Com base no processo
estocastico gerador da serie temporal sao aplicadas tecnicas de projecao, admitindo
a estacionariedade do processo;� Volatilidade Implıcita: e obtida atraves de um modelo teorico para estabelecer
precos de acoes/opcoes;� Volatilidade Historica: e o resultado de um calculo, ou medida realizada na
serie historica, que e composta pelos precos passados das acoes. Assim, deve-se
primeiro definir uma janela de tempo para o estudo. A ideia basica e estudar o
comportamento os valores das acoes nesse espaco de tempo (janela temporal), para
prever o valores futuros da volatilidade.
Normalmente, as analises realizadas pela Econofısica abordam as series de retorno de
precos (serie de volatilidade historica) de acoes e/ou ativos. As series de retorno podem
ser calculadas pela diferenca entre magnitudes de precos de acoes em tempos distintos.
Diversas analises sao realizadas com base nesses dados, que descrevem o movimento,
positivo ou negativo, de uma dada acao.
Esse campo de estudo pode ser inspiracao para novas ideias e insights para entender
e descrever o mercado de acoes. Diante dessa possibilidade, a analise de series temporais
financeiras e uma alternativa promissora que pode ser bastante utilizada.
1.3 OBJETIVOS
O objetivo deste trabalho e a proposicao de um metodo para analise do comportamento
dos diversos mercados mundiais, sejam eles desenvolvidos ou em desenvolvimento. O
metodo proposto visa modelar o comportamento dos mercados de acoes, usando series
temporais de ındices financeiros.
Assim, os objetivos especıficos deste trabalho podem ser enumerados como,
1. Desenvolver um mercado simulado composto por agentes, tendo como base o modelo
Random Walk [3, 43];
7
2. Estudos da funcao densidade de probabilidade (fdp) das series de retornos de ındices
financeiros artificiais e reais com o objetivo de analisar a relacao entre baixas e altas
volatilidades;
3. Verificar a relacao entre ganho/perda dos investidores artificiais nos diferentes mer-
cados (simulados) financeiros;
4. Utilizar as distribuicoes de lei de potencia e exponencial para analise da funcao
densidade de probabilidade das series de retornos com objetivo de verificar qual
descreve melhor os dados utlizados;
5. Analisar o comportamento da fdp das series de retorno das series temporais em
diversas janelas de tempo de ındices financeiros reais e artificiais;
6. A partir do estudos dos ındices financeiros, analisar se existe relacao entre a vola-
tilidade (ou nıvel de agitacao do mercado) e o coeficiente da funcao exponencial;
7. Propor uma metodo para analise do comportamento dos mercados de acoes a partir
da analise de series temporais de ındices financeiros.
Como aplicacao, uma metodologia para classificacao de paıses utilizando o metodo
proposto combinado com um algoritmo de agrupamento de dados [44] sera desenvolvida.
Os resultados serao comparados com algumas classificacoes tradicionais de organizacoes
internacionais.
1.4 ESTRUTURA DA TESE
A estrutura desta tese e composta por 5 capıtulos descritos a seguir:
Capıtulo 1 - Introducao: neste capıtulo e elaborada uma breve introducao dos
conceitos basicos sobre analise de series temporais, alguns termos e caracterısticas do
problema abordado sao definidos. Sao introduzidos conceitos relacionados a Estatıstica,
a Computacao e a Econofısica. Esses campos de estudo servirao como ferramenta para
analise em toda a tese. Tambem e abordada a motivacao desta pesquisa e os objetivos
que se deseja atingir.
Capıtulo 2 - Abordagens Utilizadas para Analise e Previsao de Series Tem-
porais: Definicao e Conceitos Basicos neste capıtulo sao definidas algumas das ca-
racterısticas mais comuns das series temporais e de sua analise. Partindo desse ponto, sao
expostos alguns detalhes importantes sobre modelos tradicionais estatısticos para analise
8
de series temporais (modelos de Box & Jenkins) [3], modelos computacionais (mais preci-
samente da Inteligencia Computacional) e algumas abordagens realizadas pela Econofısica
em torno das series de retornos.
Capıtulo 3 - Metodo Proposto para Analise de Series Temporais de Mer-
cados Financeiros: neste capıtulo alguns conceitos que servem como base para a pro-
posicao do metodo sao apresentados. Com base no modelo de gas ideal, um mercado
de acoes artificial e proposto, usando o modelo Random Walk. Esse modelo e a base
para as primeiras analises com a funcao exponencial e a lei de potencia. Um algoritmo
para analise dos mercados financeiros utilizando as series temporais financeiras, que e
aplicado em todas as analises nessa tese, tambem e apresentado. O algoritmo e utili-
zado para analise dos ındices financeiros reais, artificiais e como base para um metodo de
classificacao de paıses.
Capıtulo 4 - Resultados Experimentais: neste capıtulo sao apresentados o banco
de dados e os resultados dos experimentos realizados com o metodo proposto. O metodo
descrito no Capıtulo 3 e aplicado a um conjunto de series artificiais e reais (ındices
financeiros mundiais) em diversas janelas de tempo. Os resultados corroboram a analogia
estabelecida entre os mercados financeiros e o gas ideal tanto para ındices financeiros reais,
bem como para ındices gerados atraves da simulacao com agentes artificiais. Finalmente,
o metodo e aplicado para o agrupamento de paıses. Os resultados da classificacao sao
comparados com classificacoes de organizacoes internacionais tradicionais.
Capıtulo 5 - Conclusoes: neste capıtulo sao apresentadas as conclusoes do trabalho
desenvolvido a partir dos experimentos realizados com o metodo proposto aplicados as
series reais (ındices financeiros mundiais), artificiais (geradas a partir de um modelo
Random Walk) e no problema de classificacao de paıses. Por fim, e feita uma discussao
sobre a nova abordagem proposta, como tambem as suas limitacoes e trabalhos futuros.
9
CAPITULO 2
ABORDAGENS UTILIZADAS PARA ANALISE E
PREVISAO DE SERIES TEMPORAIS: DEFINICAO E
CONCEITOS BASICOS
Neste capıtulo, primeiramente alguns conceitos basicos e definicoes sobre series tempo-
rais sao apresentados. Tecnicas para analise de series temporais sao abordados posteri-
ormente. Na Secao 2.2.1, as metodologias estatısticas tradicionalmente mais usadas sao
apresentadas. Os metodos da Inteligencia Computacional sao definidos na Secao 2.2.2,
devido a sua importancia e crescente uso na literatura. E finalmente, alguns metodos e
abordagens da Econofısica sao explicados na Secao 2.2.3, bem como conceitos que serao
usadas nos proximos capıtulos.
2.1 INTRODUCAO
Em diversas areas, uma serie temporal [3,10,45] e vista como um conjunto de observacoes
capturadas consecutivamente sobre uma determinada variavel de interesse, resultando
numa sequencia de registros ordenados no tempo. O fenomeno pode ser observado sob
aspectos temporais discretos ou contınuos, e geralmente os registros sao realizados nos
mesmos perıodos de tempo. Contudo, os registros podem ser realizados irregularmente,
devido a alguma perda de informacao ou algum tipo de problema, como uma falha. A
analise do comportamento da serie temporal envolve a exploracao do fenomeno gerador
da sequencia. Alguns exemplos de series temporais sao: valores mensais da temperatura
da cidade de Petrolina, a producao anual de cafe no Brasil, a quantidade anual de chuva
na cidade de Recife e valores diarios de algum ındice ou acao da bolsa de valores.
Nos exemplos mencionados, as series temporais sao de natureza discreta, contudo
tambem podem ser encontradas series temporais contınuas, por exemplo, a vazao de
agua na barragem de Itaipu. Uma serie temporal e dita contınua quando o conjunto de
observacoes e gerado sequencialmente ao longo do tempo num intervalo contınuo.
Em alguns casos, o valor de um ponto de uma dada serie temporal e obtido acumu-
lando valores de outras series obedecendo o mesmo intervalo de tempo. Por exemplo, a
10
serie mensal de producao de cafe numa dada regiao e a soma dos valores diarios num
determinado mes.
Neste trabalho, apenas series discretas no tempo serao consideradas. Cada uma pode
ser obtida durante um determinado intervalo de tempo H, no qual ∆t e o intervalo de
amostragem, resultando numa serie com N = H/∆t pontos.
Sendo assim, a serie temporal considerada neste trabalho e do tipo
Zt = {xt, t = 1, ..., N}, (2.1)sendo t o ındice temporal e N o numero de observacoes. Desse modo, Zt e uma sequencia
igualmente espacada e ordenada no tempo.
O intervalo de amostragem e o tempo entre dois registros consecutivos, geralmente
determinado ou pela disponibilidade dos dados (ou fenomeno), ou pelo observador da
serie. Geralmente e considerado um intervalo de amostragem menor quanto possıvel,
objetivando a aquisicao de uma maior quantidade de dados, para que se possa fazer uma
melhor analise do problema. Neste trabalho, todas as observacoes utilizadas sao diarias
dada a impossibilidade de aquisicao sem custo de dados numa maior frequencia, como
hora ou minuto.
Podem-se enumerar diversos objetivos quando se deseja analisar uma serie temporal,
tais como: previsao, obtencao de informacoes em termos estatısticos sobre o fenomeno,
avaliacao da adequacao de um determinado modelo para previsao, classificacao temporal,
controle estatıstico de processos e, no caso estudado, mais especificamente, modelagem
do fenomeno sob observacao.
2.2 ANALISE E PREVISAO DE SERIES TEMPORAIS
Na literatura e encontrado uma grande quantidade de trabalhos em series temporais. A
maioria trata de metodos para analise e previsao. Assim, o objetivo de aplicar tecnicas de
analise e previsao para uma serie temporal Zt e identificar padroes historicos (correlacoes)
no conjunto de dados, criando um modelo que seja capaz de construir os proximos padroes
temporais. O problema de previsao de series temporais pode ser abordado, de forma bem
generica, em dois domınios: domınio espectral e domınio temporal. No domınio espectral,
a correta combinacao das frequencias e requerida para a determinacao do espectro da
serie, ja no domınio temporal, procura-se a combinacao correta dos retardos temporais
para a determinacao da estrutura temporal da serie. A abordagem no domınio temporal
e a forma mais utilizada na literatura.
11
A ideia e analisar uma certa janela temporal passada e/ou presente para prever os
pontos futuros da serie. A janela temporal e formada por pontos passados da serie que
contem informacoes relevantes para a determinacao de pontos futuros. Os pontos que
compoem a janela temporal sao chamados de retardos temporais (ou lags), que podem
ser quaisquer pontos da serie observada, localizados em quaisquer instante passado de
tempo.
Na tarefa de previsao, um fator primordial e a correta determinacao dos retardos tem-
porais relevantes. Desse modo, esses retardos poderao gerar estruturas de relacionamento
entre os dados historicos, de tal modo que possam detectar as leis geradoras da serie es-
tudada. A partir de estruturas de relacionamento de dados passados (lags), o fenomeno
gerador da serie temporal pode ser reconstruıdo [1].
Dentre os metodos para determinar os retardos temporais relevantes [1], ha uma me-
todologia grafica, denominada de lagplot por Percival e Walden [46], ou de phase portrait
(retrato da fase) por Kantz e Schreiber [12]. Essa metodologia consiste na construcao de
graficos de dispersao atraves dos retardos temporais (Zt vs Zt−1, Zt vs Zt−2, Zt vs Zt−3,
. . .). Nesse caso, o aparecimento de alguma estrutura nos graficos indica que ha alguma
relevancia desse retardo temporal para a previsao. Essa tecnica e limitada, pois precisa
da interpretacao humana para verificar a correlacao nos graficos, entretanto e um metodo
bastante simples e facilmente aplicavel.
Muitos outros fatores tambem influenciam o nıvel de detalhes usado: disponibilidade
dos dados, precisao alcancavel, custo de analise etc. Em situacoes nas quais a escolha
apropriada das variaveis nao e clara, podem-se tentar algumas alternativas a fim de
escolher a que apresentar o melhor desempenho, ou seja, a que representar melhor a serie
temporal estudada. Esta analise e tipicamente realizada durante o desenvolvimento do
sistema de previsao por meio de simulacoes de dados historicos.
Uma classe de decisoes importante envolve tres elementos temporais: o perıodo da
previsao, o horizonte da previsao e o intervalo da previsao. O perıodo da previsao e a
unidade basica de tempo na qual as previsoes sao realizadas. Por exemplo, deseja-se
prever a demanda por semana, nesse caso o perıodo e de uma semana. O horizonte da
previsao corresponde ao numero de perıodos cobertos, no futuro, pela previsao. Desta
forma, e possıvel requerer uma previsao para as proximas dez semanas, com uma analise
semanal, assim o horizonte seria dez semanas e o perıodo de uma semana. Finalmente o
intervalo da previsao e a frequencia com a qual novas previsoes sao geradas.
Frequentemente, o intervalo da previsao e igual ao perıodo. Desta forma, as pre-
visoes sao revisadas a cada perıodo usando a demanda de perıodo mais recente e outra
12
informacao corrente como base para as revisoes. Se o horizonte tem o mesmo compri-
mento, por exemplo T perıodos, e a previsao e revisada a cada perıodo, diz-se que se esta
operando com uma base de horizonte movel.
Um outro aspecto para a definicao do problema e a forma requerida da previsao. E
conveniente conceber a variavel de interesse como uma variavel aleatoria com uma distri-
buicao de probabilidades desconhecida. O problema de decisao pode requerer uma esti-
mativa de alguma caracterıstica desta distribuicao de probabilidades, tal como a media,
mediana ou valor mais provavel, ou ainda, uma medida de incerteza, com estimativas do
desvio padrao, percentuais, ou um intervalo contendo uma alta probabilidade de um de-
terminado valor. Tambem e importante considerar a disponibilidade de dados historicos
do problema, a precisao e a representatividade estatıstica de tais dados, sendo estas
essenciais para o sucesso da previsao [3].
2.2.1 Modelos Estatısticos para Analise e Previsao de Series Temporais
A Estatıstica e o ramo da ciencia que aborda o problema de analise e previsao de series
temporais [3, 45, 47, 48], apresentando genericamente: (a) os modelos lineares, que sao
muito bem entendidos e tradicionalmente usados, mas que nem sempre sao aptos para a
resolucao do problema; e (b) os modelos nao-lineares, que tentam suprir as deficiencias
dos modelos lineares, mas que, devido ao alto grau de complexidade, nem sempre sao
aplicaveis na pratica.
Na literatura e possıvel encontrar uma grande quantidade de modelos lineares propos-
tos para a analise e previsao de series temporais: Medias Moveis Simples (MMS) [45,48],
Alisamento Exponencial Simples (AES) [45,48], Alisamento Exponencial Linear de Brow
(AELB) [45,48], Alisamento Exponencial Biparametrico de Holt (AEBH) [45,48], Filtra-
gem Adaptativa (FA) [45, 48], dentre outros [3, 45, 47, 48]. Entretanto, dentre todos os
modelos propostos, uma classe de modelos recebe um destaque especial, os modelos de
Box & Jenkins, que, de forma pratica, sao os mais populares.
Box & Jenkins [3] propuseram uma famılia de modelos algebricos (chamados de mo-
delos ARIMA), a partir dos quais se seleciona um modelo que melhor desempenhe a
previsao de uma dada serie temporal. O modelo ARIMA(p, d, q) e uma combinacao de
outros modelos: o AR(p) (Autoregressive) e o MA(q) (Moving Average), combinados com
uma integracao de ordem d. Os parametros p e q correspondem ao numero de termos
auto-regressivos e ao numero de termos da media movel, respectivamente.
Um modelo ARIMA(p, d, q) e um metodo algebrico que mostra como uma variavel de
uma serie temporal (Zt) e relacionada com seus valores passados (Zt−1, . . ., Zt−p) e os
13
valores passados dos termos de ruıdo (rt−1, . . . , rt−q), diferenciados d vezes. Os termos de
ruıdo correspondem a choques aleatorios passados que influenciam valores futuros.
Box & Jenkins propuseram um procedimento pratico para encontrar um modelo ade-
quado para uma dada situacao, como esquematizado na Figura 2.1.
Figura 2.1: Estagios para a construcao de um modelo iterativo de Box & Jenkins (retiradode [1]).
No Estagio 1 da Figura 2.1, Identificacao, usam-se calculos para se medir a correlacao
entre as observacoes de um conjunto de dados da serie temporal. Estes dispositivos sao:
a funcao de auto-correlacao e a funcao de correlacao parcial. A partir destes escolhem-se
possıveis modelos candidatos.
No Estagio 2 da Figura 2.1, Estimacao, estimam-se os parametros do modelo esco-
lhido no estagio anterior. No Estagio 3 da Figura 2.1, Diagnostico, sao utilizados alguns
procedimentos de checagens para determinar se o modelo e estatisticamente adequado.
Um modelo que falhe nestes testes e rejeitado [45].
Diversos trabalhos na literatura de series temporais nao somente assumem que as
series sao estacionarias, mas que tambem podem ser transformadas em series estacionarias
atraves de alguma transformacao simples, como a diferenciacao [3]. Esses trabalhos
ainda assumem que as series temporais sao processos lineares, de forma que podem ser
representadas por modelos lineares.
Entretanto, na literatura nao e encontrado nenhum trabalho que generalize a suposicao
de linearidade. Na realidade, e de se esperar que, devido a natureza nao-linear do meio que
14
forma o cenario de acontecimentos da serie temporal (mundo real), e bem mais natural
se supor a existencia de estruturas nao-lineares [14, 49, 50].
De forma geral, as series temporais podem ser modeladas como
Zt = h(Zt−1, . . . , Zt−p, rt−1, . . . , rt−q) + rt (2.2)em que rt e um termo de ruıdo, p e q sao ındices inteiros que determinam as janelas de
dependencia temporal nos termos passados da serie e do ruıdo, respectivamente, e h(·)
e uma funcao nao-linear de transferencia que modela o mapeamento entre os valores do
futuro e os valores do passado.
Varios modelos nao-lineares estatısticos tem sido propostos, como os modelos bili-
neares (bilinear models) [15], os modelos auto-regressivos exponenciais (exponential au-
toregressive models) [16], os modelos de limiar auto-regressivo (threshold autoregressive
models) [17], e os modelos de estados dependentes (general state dependent models) [18],
dentre outros. A partir de uma visao geral da literatura, e possıvel concluir que o de-
sempenho de previsao para tais modelos nao-lineares esta abaixo do esperado [14], ja
que o nıvel de complexidade adicionado a solucao do problema, nao justifica o ganho de
desempenho na previsao como poderia ser esperado [14, 22]. De Gooijer e Kumar [19],
em 1992, com o artigo de revisao a respeito dos modelos nao-lineares, nao conseguiram
evidencias claras em favor dos modelos nao-lineares, quando comparados aos modelos
lineares em termos de desempenho de previsao.
Entretanto, e um conceito global aceitar que o ambiente gerador das series temporais
do mundo real e nao-linear, e assim pode-se inferir que os atuais modelos nao-lineares nao
consigam descrever a realidade de forma melhor que as simples aproximacoes lineares,
sugerindo que uma nova abordagem deve ser desenvolvida.
Observa-se, em particular, nas ciencias economicas, que a aplicacao de um grande
numero de modelos nao-lineares tem sido largamente investigado. Por exemplo, a maior
parte dos modelos do ciclo real de negocios e nao-linear [14], como tambem os modelos
de financas [14]. O uso destes modelos nao-lineares na economia e financas e consistente
com o uso dos modelos lineares aplicados na pratica, uma vez que tais modelos podem
ser vistos como uma aproximacao dos fenomenos nao-lineares de interesse. Assim, nao
e surpreendente que modelos nao-lineares nos ultimos anos tenham tido grande atencao
na literatura [22, 23], ate mesmo com a inclusao de paradigmas nao advindos da Es-
tatıstica aplicados ao problema de previsao, como e o caso das redes neurais artificiais,
dos algoritmos geneticos e outras tecnicas da Inteligencia Computacional.
Entretanto, outro fator tambem deve ser considerado quando se estudam series tempo-
15
rais. Geralmente, o fenomeno gerador de uma serie temporal, alem de convencionalmente
ser um processo nao-linear, tambem, em muitos casos, apresenta um alto grau de comple-
xidade. Uma gama de fenomenos que se desenvolvem no tempo e que podem ser encarados
como series temporais, sao geradas por relacionamentos de alta complexidade. Esse rela-
cionamento nao-linear de diversos agentes e uma caracterıstica de sistemas complexos [8],
normalmente estudados pelos fısicos. Esses sistemas estao presentes em diversas areas:
antropologia, quımica, ciencia da computacao, economia, financas, meteorologia, biologia
molecular, psicologia, neurociencia e muitas outras.
2.2.2 Modelos Inteligentes para Analise e Previsao de Series Temporais
A Inteligencia Computacional e vista com uma alternativa para abordar o problema de
previsao de series temporais. Com metodos e procedimentos geralmente nao-lineares,
e que, em termos praticos atuais, sao mais simples quando comparados aos modelos
estatısticos nao-lineares. Esses modelos inteligentes tem como caracterısticas principais
a nao-linearidade e o poder de adaptacao a varios problemas.
Redes Neurais Artificiais (RNAs) sao algoritmos originalmente baseados no fun-
cionamento de sistemas neurais biologicos e, em particular, do cerebro humano [37]. As
RNAs sao sistemas paralelos distribuıdos compostos por unidades de processamento sim-
ples, chamadas de neuronios ou nodos, que calculam funcoes matematicas, normalmente
nao-lineares.
Os neuronios ou nodos sao dispostos em um arranjo espacial composto geralmente
por uma ou mais camadas e interligadas por um grande numero de conexoes. Na maior
parte dos modelos, estas conexoes estao associadas a pesos, os quais armazenam o conhe-
cimento representado no modelo e servem como ponderadores para os sinais de entrada
dos neuronios da rede.
Cada uma das unidades de uma RNA e condicionada a receber um sinal. Este si-
nal, ponderado pelos respectivos pesos das conexoes de entrada da unidade, e processado
por uma funcao matematica, chamada de funcao de ativacao ou funcao de transferencia,
produzindo um novo sinal de saıda que e propagado pela rede. As RNAs possuem a capa-
cidade de aprender atraves de exemplos, realizar interpolacoes dos dados e extrapolacoes
das informacoes aprendidas.
No processo de aprendizado de uma RNA, a principal tarefa e a determinacao da
intensidade das conexoes entre os neuronios, sendo os algoritmos de aprendizado utilizados
para a adaptacao desses parametros. Estes algoritmos tem a finalidade de realizar o ajuste
dos pesos das conexoes para a melhor generalizacao possıvel da informacao contida nos
16
exemplos expostos. Ou seja, atraves de exemplos utilizados no treinamento, as RNAs
tem capacidade de aplicar o conhecimento aprendido a exemplos nao conhecidos num
determinado problema.
Muitos tipos de modelos de RNAs tem sido propostos, dentre os quais, podem-se des-
tacar os mais populares: Redes Multi-Layer Perceptron(MLP) [51]; Redes Recorrentes
[51]; Redes de Kohonen [52, 53]; Redes de Hopfield [54] e Redes ART [55].
Desses tipos de modelos de RNAs, as rede MLPs sao indubitavelmente as mais po-
pulares devido a sua praticidade, flexibilidade e eficiencia, sendo aplicada a uma vasta
gama de problemas [24, 51, 56, 57].
2.2.3 Abordagens Utilizadas pela Econofısica para Analise de Series Temporais
Economico-Financeiras
O termo “Econofısica” foi introduzido por Stanley em meados de 1990, referindo-se ao
grande numero de artigos escrito por fısicos analisando problemas relacionados ao mer-
cado de acoes. Anos depois, o livro intitulado An Introduction to Econophysics: Cor-
relations and Complexity in Finance, escrito por R. N. Mantegna e H. E. Stanley, foi
publicado [8]. Esse novo e promissor campo usa abordagens fısicas para explicar e anali-
sar fenomenos advindos do sistema economico, que e um exemplo de sistema complexo.
Entretanto, antes do aparecimento do termo “Econophysics”, as duas areas ja tinham se
cruzado em trabalhos de Mandelbrot [39, 40] e Bachelier [41], por exemplo.
Em 1900, Bachelier propos uma explicacao para as flutuacoes do mercado, que, na te-
oria neoclassica, sao consideradas como um “ruıdo” causado por “choques” imprevisıveis
que ocorrem devido a fatores que nao dependem do sistema economico. Ele propos uma
explicacao que introduziu a teoria de passeio aleatorio (Random Walk) [43], que mais
tarde foi desenvolvida de forma independente por Einstein para explicar o movimento
browniano [58]. Na epoca, a Teoria de Bachelier foi considerada muito estranha para ser
levada a serio pelos economistas. Em 1960, o matematico Mandelbrot mostrou que as flu-
tuacoes na serie dos precos de algodao seguem uma distribuicao que difere de um processo
gaussiano tıpico, no qual cada evento ocorre de forma aleatoria e independentemente de
todos os outros [39].
A ideia de que a Fısica pode contribuir com a Economia surgiu porque os dois campos
estudam sistemas complexos que contem muitos agentes. Tais sistemas sao compostos
por elementos que interagem entre si e obedecem a regras especıficas. A Fısica Estatıstica
descreve o comportamento de uma materia com massa sob forcas que atuam entre atomos
e moleculas, enquanto, o ramo da Economia ou das Financas estuda as interacoes dos
17
agentes economicos - market traders, ou empresas [59].
Ball, no artigo Econophysics: Culture Crash [59], publicado na revista Nature, em
2006, abordou os aspectos positivos e negativos da atuacao da Econofısica na analise de
fenomenos economico-financeiros. Tal discussao teve origem com a publicacao do artigo
“Worrying trends in econophysics”, de Gallegati et al. [60]. Esse trabalho discutiu o receio
de algumas tendencias nas analises da Econofısica em areas da Economia onde os dados
sao muito escassos e menos confiaveis. Em meio a tal discussao, McCauley publicou
o artigo “Response to Worrying Trends in Econophysics” [61] e Matteo e Aste publi-
caram no periodico The European Physical Journal B o artigo “No Worries”: Trends
in Econophysics, [62] que destaca onze contribuicoes a partir de importantes pesquisas
da area: universalidade em sistemas economicos; flutuacoes e ruıdos em series tempo-
rais financeiras; modelos de riqueza e de distribuicao de renda; fenomenos emergentes
no comportamento agregado; uma abordagem para mecanica estatıstica nao-exaustiva;
transicoes de fase em sistemas socio-economicos; novas abordagens teoricas para interacao
de agentes; Comportamentos coletivos racionais versus irracionais na interacao de mo-
delos baseados em agentes; impacto mecanico e informativo de ordens de negociacao nos
precos; metodos para distinguir sinal e ruıdo e filtragens de correlacao.
De forma geral, um numero crescente de artigos [63] com abordagens da Econofısica
tem utilizado metodos da Estatıstica e da Fısica Estatıstica para analisar as series tempo-
rais de precos de acoes. Tradicionalmente, o objetivo em economia e a avaliacao de riscos
no mercado financeiro atraves da observacao dos precos de um ativo ou ındice financeiro.
Essas analises geralmente tomam como base a serie de retornos, em vez do uso da serie
de precos original. A serie de retornos nada mais e que a serie de medidas de perdas e
ganhos ao longo de um determinado perıodo. Nela pode ser capturado o movimento dos
precos de uma determinada acao ou ındice. Essa variacao de precos entre os instantes
t− λ e t quantifica a variacao de um determinado ativo num intervalo λ. Para os econo-
mistas, a amplitude das series de retornos e conhecida como a volatilidade de uma acao
num determinado perıodo, e esses retornos podem conter correlacoes de longo alcance
persistentes por varios meses [8]. A investigacao dessa serie e valida porque contem in-
formacoes interessantes para investidores e porque possui propriedades estatisticamente
mais atrativas que a serie de precos [64].
Geralmente, as series de retornos tem apresentado algumas caracterısticas comuns, a
partir de estudos empıricos em diversos mercados. A esses padroes se da o nome de fatos
estilizados. Em ciencias sociais, principalmente na Economia, um fato estilizado e uma
apresentacao teorica simplificada de um fenomeno que foi constatado empiricamente. Nas
18
series de retornos, os principais fatos estilizados encontrados sao [65, 66]:
1. Tendencias: representam um movimento ascendente ou descendente nos valores das
observacoes de uma serie temporal. Geralmente, nao sao encontradas nas series de
retornos, sendo uma caracterıstica mais comum nas series de taxas de cambio [67];
2. Sazonalidades: movimento da serie temporal com caracterısticas semelhantes que
ocorrem num determinado tempo. A sazonalidade e mais encontrada em series
intradiarias [68];
3. Eventos extremos: de forma geral, a volatilidade e menor em momentos nos quais
existe uma alta de precos no mercado e maior em momentos nos quais o preco
das acoes esta em baixa [69, 70]. Esse fato contribui para a ocorrencia de eventos
extremos semelhantes a um Black Monday em 1987, quando ha uma sequencia de
altas volatilidades em meio a volatilidades baixas;
4. Heteroscedasticidade: as series apresentam diferentes variancias em torno de uma
media. Nas series de retornos grandes variacoes de preco geralmente sao segui-
das no tempo por grandes variacoes, ocorrendo o mesmo para pequenas variacoes
(agrupamentos de volatilidades) [71];
5. Nao-linearidae: retornos de ativos em geral nao apresentam dependencia linear,
exceto em altas frequencias [66]. Os fenomenos temporais respondem de maneira
diferente a choques grandes (grandes diferencas na volatilidade) ou pequenos (pe-
quenas diferencas na volatilidade) e a choques positivos ou negativos;
6. Caudas pesadas: a serie de retornos empiricamente apresenta uma distribuicao
de cauda pesada (leptocurtica). Ou seja, valores extremos ocorrem com maior
probabilidade do que numa distribuicao Normal [39, 40, 72].
Muitos dos fatos estilizados apresentados sao correlacionados e sao alvo de inten-
sas pesquisas. Diversas analises encontradas na literatura [8, 71, 73–75] sao focadas na
distribuicao das series de retornos das acoes. A ideia e quantificar a volatilidade num
dado intervalo T. A serie de retornos pode ser calculada de forma normalizada pela
Equacao 2.3 [76].
G(t) = lnZ(t+∆t)− lnZ(t) ∼=Z(t+∆t)− Z(t)
Z(t)(2.3)
19
0 200 400 600 800 1000 1200 14000
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
Tempo (dias)
|G(t
)|
Figura 2.2: Serie de resıduos do ındice Dow Jones de 01 de janeiro de 1998 ate 26 deagosto de 2003.
em que ∆t e o intervalo de amostragem. O valor de G(t) descreve a amplitude das
flutuacoes, como pode ser visto na Figura 2.2.
Varias analises sao realizadas com base na serie de retornos e grande parte da comu-
nidade cientıfica da Econofısica tem ajustado tais dados por uma lei de potencia. Uma
lei de potencia, fisicamente, e uma relacao entre dois escalares x, que corresponde a serie
de retornos, e y, que e o resultado do ajuste. A lei de potencia pode ser escrita como na
Equacao 2.4,y = axk. (2.4)
A vantagem de modelar sistemas por meio dessa relacao e que se trata de uma simples
proporcao, que depende apenas de duas constantes, em que a e a constante de proporcio-
nalidade e k e o expoente da lei. Desse modo, um fenomeno caracterizado por uma lei de
potencia depende apenas das constantes. Essa funcao matematica e bastante utilizada
na analise de varios fenomenos [77–79].
Diversos trabalhos analisam as series de retorno atraves de metodos da Fısica Es-
tatıstica [71, 74, 80–83]. As leis de potencia tem sido bastante utilizadas em estudos
nas ciencias economicas, sendo utilizadas para analisar: flutuacoes de ındices, precos de
acoes de companhias individuais, comportamento das bolsas de valores e a volatilidade
dos mercados. Por exemplo, as flutuacoes no ındice S&P 500 sao dezesseis vezes menos
frequentes cada vez que o seu valor e dobrado [84].
20
Leis de potencia tambem foram observadas no ındice S&P 500 por Mantegna e Stan-
ley [83]. Uma lei de potencia semelhante foi encontrada para os precos de acoes de
companhias individuais [82]. Leis de potencia foram observadas nas bolsas de Milao [85],
na bolsa de Sao Paulo [75], em taxas de cambio [86, 87] e ainda foram observadas em
volatilidade dos mercados [76,88]. A aplicacao da lei de potencia ja e bem difundida em
diversas areas na literatura [71, 74, 80–83]
Outros trabalhos [89–91] tambem tem utilizado tal lei para descrever eventos raros em
outros sistemas complexos, como: terremotos, redes sociais, queimadas e deslizamentos
de terra. Em sistemas complexos, as distribuicoes por lei de potencia indicam que eventos
raros ocorrem com probabilidades que nao podem ser desconsideradas, por exemplo, no
caso de um grande tremor de terra ou uma grande queimada. Os eventos extremos, como
terremotos e queimadas, sao transicoes raras que ocorrem repentinamente em comparacao
com as escalas de tempo caracterısticas de todo fenomeno. A compreensao cientıfica
desses fenomenos pode fornecer um melhor entendimento de sistemas complexos.
A questao e como a dinamica de um sistema complexo e afetada quando o sistema
sofre um evento extremo. Normalmente, utiliza-se uma lei de potencia para explicar a
relacao entre um evento extremo e a probabilidade desse evento ocorrer [71]. Quanto
maior for a intensidade de um evento extremo, menor e a probabilidade que esse evento
ocorra.
Entretanto, na literatura outras abordagens foram propostas para tratar as series de
retorno. Em 1900, Bachelier [41] propos o movimento Browniano para modelar o processo
estocastico dos retornos. Com base no teorema do limite central, esta abordagem concluiu
que o retorno sobre uma escala de tempo ∆t segue uma Distribuicao Gaussiana. Outros
trabalhos desenvolvidos por Mandelbrot [39, 40], Fama [72] e Mantegna e Stanley [83]
afirmaram que a distribuicao dos retornos pode ser aproximada por uma distribuicao de
Levy.
Outros estudos tambem analisaram o retorno da series. Eberlein et al. [92] ajustaram
uma Distribuicao Gaussiana Inversa com decaimento assintotico por uma lei de potencia
multiplicada por uma Distribuicao Exponencial, e Longin [93] estudou a distribuicao
dos valores mınimos e maximos, utilizando uma Distribuicao de Frechet. Recentemente,
Queiros et al. [78] propuseram o ajuste dos dados financeiros com uma distribuicao q-
Gaussiana. Podobnik et al. [94,95] analisaram cerca de 8000 acoes da Nasdaq e da Bolsa
de Nova York (registros anuais). Nesses trabalhos, a regiao central da funcao densidade
de probabilidade (fdp) dos retornos agregados sao aproximados por uma Distribuicao de
Laplace (dupla exponencial).
21
Dentre tantas abordagens, ainda nao existe uma explicacao consolidada para descre-
ver a dinamica dos mercados de acoes. Alguns autores tambem utilizam Distribuicoes
Exponenciais para descrever as series de retorno [96–102]. Essa abordagem e utilizada na
literatura para descrever algumas caracterısticas do mercado de acoes. Cont et al. [103]
propuseram o uso da Distribuicao Exponencial truncada para analisar a serie de retor-
nos. Laherrere e Sornette [102] ajustaram as distribuicoes dos retornos das acoes com
uma Exponencial do tipo Stretched-Exponential function, ou tambem chamada exponen-
cial esticada (ou alongada). Takayasu et al. [104] analisaram os dados das taxas de cambio
iene-dolar, utilizando tambem uma Stretched-Exponential function. Eles investigaram o
rapido crescimento das mudancas de precos (hiper-inflacao) [105]. Kim e Yoon [106]
estudaram o comportamento dinamico dos tıtulos futuros da KOFEX (Korean Futures
Exchange market) usando uma exponencial alongada.
Yakovenko utilizou uma Distribuicao Exponencial para estudar a distribuicao de renda
dos agentes computacionais e dos mercados americano e ingles [97, 98, 107]. Outras
analises tambem foram feitas em torno das series de retornos dos mercados desenvolvidos
e em desenvolvimento. Matia et al. [77] utilizaram as leis de potencia para descrever a
fdp de acoes dos Estados Unidos (mercado desenvolvido), enquanto a Distribuicao Ex-
ponencial foi utilizada para analisar o mercado indiano (mercado em desenvolvimento).
Entretanto, Distribuicoes Exponenciais tambem foram encontradas no mercado ameri-
cano [107]. Yakovenko ajustou uma distribuicao exponencial e uma lei de potencia a fdp
dos retornos de acoes, utilizando diversos horizontes de tempo (variando de uma hora
a um mes). Enquanto menores janelas tinham uma distribuicao que segue uma lei de
potencia, a maioria das janelas era bem ajustada por uma distribuicao exponencial.
Entre as varias abordagens utilizadas para modelar a dinamica da volatilidade dos
mercados financeiros (retornos), a funcao densidade de probabilidade (fdp) [77,94,95,103]
e extremamente relevante. A fdp e uma funcao usada para representar a distribuicao de
probabilidade de uma determinada variavel. Em Econofısica, a fdp representa a relacao
entre as altas e baixas volatilidades com a probabilidade de ocorrencia de cada uma. Esta
informacao pode ser utilizada para compreender os fenomenos economicos dos mercados
e fornecer novos insights sobre as flutuacoes economicas, eventos extremos, como falhas e
alta valorizacao no valor de acoes dos mercados, a evolucao temporal do dinheiro etc. [8,
71, 73, 74, 88, 107].
Nesse cenario, a Econofısica e vista como uma alternativa para analise de series tem-
porais financeiras. Metodos e procedimentos anteriormente utilizados para descrever
comportamentos de terremotos, queimadas em florestas e/ou interacao de partıculas de
22
gases podem ser utilizados para descrever tais mercados.
2.3 RESUMO DO CAPITULO
Neste segundo capıtulo, foram definidas algumas caracterısticas de uma serie temporal,
bem como metodos para analise, previsao e alguns fatores relevantes, por exemplo: os
retardos temporais relevantes (ou lags), o horizonte de previsao, a disponibilidade dos
dados e o intervalo de previsao.
Tambem foram abordadas algumas metodologias classicas da Estatıstica para analise
e previsao de series temporais: metodos univariados, funcao de transferencia e metodos
multivariados. O primeiro e mais comumente usado na literatura, tendo como foco ape-
nas as informacoes contidas na serie de interesse. As funcoes de transferencia abordam
series temporais correlacionadas e a terceira metodologia aborda varias series temporais,
correlacionadas ou nao.
Dentre os modelos convencionais de previsao de series temporais, os mais conheci-
dos sao os modelos de Box & Jenkins. Esses metodos sao baseados nos modelos Auto-
Regressivos (AR) e de Medias Moveis (MA), que, combinados com uma integracao de
ordem d, formam os modelos ARIMA.
Posteriormente, foram definidos conceitos importantes de sistemas baseados em Inte-
ligencia Computacional. Tais sistemas sao inspirados em modelos biologicos e, como sua
principal caracterıstica e a nao-linearidade, nos ultimos anos tem sido largamente utili-
zados na modelagem de problemas complexos, tais como a analise e previsao de series
temporais.
Finalmente, alguns metodologias utilizadas pela Econofısica, bem como algumas de-
finicoes, como serie de retornos e suas caracterısticas, foram abordadas. Alguns trabalhos
da literatura tambem foram descritos, bem como as analises realizadas para descrever a
funcao densidade de probabilidade das series de retornos, eventos extremos, distribuicao
de riqueza etc.
23
CAPITULO 3
METODO PROPOSTO PARA ANALISE DE SERIES
TEMPORAIS DE MERCADOS FINANCEIROS
Neste capıtulo, um metodo para analise do mercado de acoes e apresentado. Primeira-
mente, na Secao 3.1, a hipotese que a dinamica do mercado de acoes pode ser modelada
por um modelo de gas ideal e introduzida. Na Secao 3.2, a abordagem proposta e expli-
cada, bem como algumas questoes teoricas que servem de base para o ambiente artificial
desenvolvido, que e apresentado na Secao 3.2.1. Na Secao 3.2.2, um algoritmo para a
analise das series temporais do mercado de acao simulado e de mercados de acoes reais e
proposto.
3.1 INTRODUCAO
Como visto no Capıtulo 2, as abordagens desenvolvidas pela Econofısica tem se mostrado
bastante eficazes para o entendimento de fenomenos provenientes do mercado de acoes.
Na literatura, uma gama de trabalhos foca a analise da volatilidade historica, quer seja na
relacao entre grandes e pequenas variacoes no mercado, ou na analise de eventos extremos.
Assim, varias distribuicoes tem sido utilizadas para modelar diversos acontecimentos que
derivam dos sistemas economicos.
Entretanto, compreender as diversas variaveis do mercado e uma tarefa complexa, ja
que existem interacoes provenientes da relacao entre diferentes elementos de um determi-
nado mercado e fatores que influenciam o mercado externamente, como outros mercados.
Desse modo, a geracao de um modelo que possa explicar alguns fenomenos, ou o com-
portamento dos mercado atraves de simplificacoes em regras e relacoes, e extremamente
desejavel.
A possibilidade do desenvolvimento de um metodo capaz de descrever o compor-
tamento de diferentes tipos de mercados financeiros e bem interessante. Desse modo,
seria possıvel explicar relacoes nao so de mercados de paıses desenvolvidos, como o caso
da Inglaterra, Estados Unidos e Franca, que possuem uma economia mais estavel, mas
tambem de estabelecer relacoes que possam caracterizar os mercados de paıses em desen-
volvimento, como Brasil, Argentina e Chile.
24
Na literatura, alguns trabalhos [96, 108–110] analisaram modelos de distribuicao de
riqueza baseados em mercados artificiais. Para isso, a interacao entre os investidores no
mercado foi inspirado na dinamica de um modelo de gas ideal [2]. Um gas ideal consiste de
um modelo onde um conjunto de partıculas tem movimento randomico. Nesses modelos
os agentes atraves de transacoes trocam “dinheiro” entre si. A vantagem o uso desse
modelo em relacao aos mercados reais e a sua simplicidade e a possibilidade de definir
varios cenarios de diferentes mercados.
A partir dessa hipotese, um mercado de acoes simulado inspirado na dinamica do
modelo do gas ideal e proposto. Nesse mercado, se supoe um dinamica de compra e
venda de acoes simplificada, onde cada agente tem um comportamento aleatorio como
uma partıcula. A partir desse modelo, ambientes artificiais poderao ser simulados e
ambientes reais poderao ser analisados.
3.2 ABORDAGEM PROPOSTA
Omercado de acoes ou bolsa de valores e uma entidade publica utilizada para a negociacao
de acoes (papeis de empresas) ou derivativos a um determinado preco que e acordado
entre compradores e vendedores. As acoes sao listadas e negociadas em diversas bolsas
de valores pelo mundo. Tais organizacoes sao especializadas na listagem de tıtulos e
valores mobiliarios para negociacao entre os interessados.
O mercado acionario e uma das principais fontes para uma empresa arrecadar dinheiro.
Esse artifıcio permite que o capital de uma determinada organizacao seja aberto, ou que
ela aumente o capital atraves da venda de acoes de propriedade da empresa num mercado
publico. Por exemplo, em 2010, a Petrobras (Petroleo Brasileiro S/A), uma das maiores
empresas do mundo no segmento de energia, principalmente na exploracao e producao de
petroleo e seus derivados, lancou novas acoes no mercado, com o objetivo de conseguir
uma maior capitalizacao. Tal processo injetou cerca de R$ 120 bilhoes nas contas da
empresa pela venda de suas acoes, que serao utilizados para financiar uma parte do seu
plano de investimentos, que inclui desde construcao de refinarias e plataformas marıtimas
ate a perfuracao e exploracao das reservas de petroleo e gas da camada de pre-sal da costa
brasileira [111].
De forma geral, cada paıs possui um mercado onde sao negociadas as acoes das empre-
sas nacionais. Entretanto, geralmente grandes bolsas tambem negociam acoes de grandes
empresas estrangeiras. Por exemplo, o maior mercado acionario dos Estados Unidos, por
capitalizacao de mercado, e a Bolsa de Valores de Nova Iorque (NYSE). No Canada, o
maior mercado de acoes e a Bolsa de Valores de Toronto. Na Europa, os principais mer-
25
cados incluem a Amsterdam Stock Exchange, a Bolsa de Londres, Paris Bourse e a Bolsa
de Valores de Frankfurt. Na Africa, os maiores exemplos sao a Nigerian Stock Exchange
e a Johannesburg Stock Exchange da Africa do Sul. No mercado asiatico, a Bolsa de
Cingapura, a Tokyo Stock Exchange, a Bolsa de Valores de Hong Kong, Shanghai Stock
Exchange e a Bombay Stock Exchange da India sao as mais representativas. Na America
Latina, as principais sao a BM&FBovespa do Brasil e da BMV do Mexico.
Basicamente, no mundo existem dois tipos de economias: mercados “quentes” e mer-
cados “frios”. O primeiro tipo possui uma volatilidade maior causada normalmente pela
instabilidade, ou inseguranca da economia de um dado paıs. Geralmente, esses mercados
sao encontrados nos paıses em desenvolvimento. O segundo tipo de economia normal-
mente e encontrada em paıses mais ricos e com economia mais equilibrada, que dao
confianca aos investidores externos, tornando o mercado mais estavel.
A volatilidade [8,112,113] e uma medida estatıstica de desvio dos retornos para uma
dada acao ou ındice de mercado. Esse valor pode ser estimado usando alguma medida
de dispersao, como media de diferencas, variancia ou desvio padrao calculado em torno
das series de retornos de uma acao.
A funcao densidade de probabilidade (fdp) e muito abordada na literatura porque
descreve a relacao entre altas e baixas volatilidades. Tal relacao e justamente o que
caracteriza se um mercado e “quente” ou “frio”, ja que em mercados em desenvolvimento
existe uma maior probabilidade da ocorrencia de eventos extremos, retratado por grandes
altas ou baixas na volatilidade. Essa analise pode ser usada para entender a dinamica
dos mercados e fornecer novas ideias sobre as flutuacoes economicas, eventos extremos,
como falhas e valorizacao de alta no valor dos mercados de acoes, e evolucao temporal
do dinheiro [8, 71, 73, 74, 88, 107]. Estudos anteriores [77, 99–101] mostraram que a fdp
das series de retornos tambem pode ser bem ajustada por uma distribuicao exponencial.
Matia et al. [77] observaram que a fdp do mercado indiano e bem ajustada por uma
distribuicao exponencial, enquanto a fdp da volatilidade dos mercados americanos segue
uma lei de potencia. O trabalho de Matia et al. sugere, assim, que existam duas classes
de mercados governados por diferentes leis.
A proposta deste trabalho e descrever e analisar o comportamento dos diferentes
tipos mercados utilizando um metodo que e desenvolvido baseado na teoria do gas ideal.
Assim, se o mercado de acoes e composto por agentes ou acoes que podem ser vistos
como partıculas, ha duas hipoteses que podem ser usadas para explicar a dinamica dos
mercados. A primeira e a hipotese do RandomWalk (RW) [13,114]. Essa suposicao afirma
que as partıculas nao interagem umas com as outras. Essa hipotese e uma formalizacao
26
matematica que fisicamente passa a ideia de varios passos consecutivos, sendo cada um
numa direcao aleatoria. Essa formalizacao e descrita na Equacao 3.1Zt = Zt−1 + rt, (3.1)
ou
∆Zt = Zt − Zt−1 = rt, (3.2)em que Zt e a observacao atual, Zt−1 e a observacao imediatamente anterior a Zt e rt
e um termo de ruıdo, com uma distribuicao normal com media zero e desvio padrao σ
(rt ≈ N(0, σ)). A segunda hipotese, a hipotese do nao passeio aleatorio, afirma que as
partıculas interagem fracamente entre si, ou seja, o mercado pode ser previsto, ate certo
grau. Assim, qualquer que seja a abordagem, o mercado pode ser visto como um modelo
generalizado de um gas ideal.
A partir da suposicao de que o mercado de acoes e constituıdo por partıculas (agentes),
pode-se considerar duas alternativas: ou essas partıculas nao interagem entre si (hipotese
random walk), ou interagem fracamente (hipotese de nao existir um random walk). Em
ambas, o sistema pode ser encarado como um gas ideal [2]. Todas as partıculas tem
uma velocidade e uma energia que podem ser comparadas com o preco das acoes. Entao,
se uma partıcula pode mudar sua energia (ou velocidade), da mesma forma uma acao
pode ter seu preco alterado. Se essa hipotese e valida, as mudancas nos precos das acoes
devem ter o comportamento analogo da mudanca na energia (ou velocidade) de uma
partıcula. Estando correta essa suposicao, a fdp da serie de retornos deve decair com
a mudanca da magnitude do seu preco (energia). Essa analogia, na descricao classica,
segue a distribuicao de Maxwell-Boltzmann [2]. Partindo desse pressuposto, e possıvel
definir a temperatura ou grau de instabilidade do mercado.
A Distribuicao de Maxwell-Boltzmann [2] descreve a funcao densidade de probabi-
lidade da energia (ou velocidade) da partıcula, que se move livremente no sistema, so-
frendo pequenas colisoes (choques aleatorios). Esta distribuicao e usada para descrever
o reparticao de partıculas sobre varios estados de energia, quando o sistema esta no
equilıbrio termico. Descartando os efeitos quanticos, esse equilıbrio termico e caracteri-
zado pela baixa densidade das partıculas e por uma alta temperatura no sistema. Entao,
a variacao na velocidade da partıcula gera energia termal, resultando no aumento (ou
reducao) da agitacao das partıculas.
Assim, encarando as acoes negociadas em um mercado como partıculas. Logo, a partir
desse raciocınio, a dinamica dos precos das acoes pode ser descrita pela estatıstica de
27
Maxwell-Boltzmann. Desse modo, a volatilidade do mercado pode estar relacionada com
a temperatura de um gas ideal, ou seja, quanto maior a volatilidade, maior a temperatura
e quanto a menor volatilidade do mercado, menor a sua temperatura.
Entao, considerando uma partıcula ou uma acao com energia E, P (E) e a probabi-
lidade de uma partıcula sobreviver ate atingir a energia E, sem sofrer nenhuma colisao.
Quando P (0) = 1, a partıcula ou a acao nao colidira com outra num tempo t → 0.
Observando a Figura 3.1, P (E) decai a medida que a energia E aumenta. Dado que
uma partıcula pode sofrer uma colisao em qualquer tempo, essa probabilidade aumenta
a medida que o tempo passa. Entao, quando P (E) → 0 a energia E → ∞, ou seja, a
probabilidade de colisao e muito alta. A probabiliade de colisao pode ser descrita por
BdE. Esse termo representa a probabilidade de uma partıcula sofrer uma colisao entre
a energia E e E + dE. Portanto, B e a probabilidade por unidade de energia de uma
partıcula sofrer uma colisao, em outras palavras, B e uma “taxa de colisao”. Numa
primeira suposicao, a “taxa de colisao” sera considerada constante.
Assumindo que a taxa B e independente de colisoes passadas e que a partıcula nao
depende da velocidade ou da energia (E), e possıvel calcular a probabilidade de sobrevida
P (E) de uma acao ou partıcula. Portanto, a probabilidade de que uma partıcula sobreviva
ate uma energia E + dE, sem sofrer colisao, deve ser igual a probabilidade que esta
partıcula tem de sobreviver a uma energia E, sem sofrer uma colisao. O segundo termo
da equacao deve ser multiplicado pela probabilidade de nao sofrer uma colisao no intervalo
posterior entre E e E + dE, como segue:
P (E + dE) = P (E)(1− BdE) (3.3)Desse modo,
P (E) +dP (E)
dEdE = P (E)− P (E)BdE (3.4)
dP (E)
dEdE = −P (E)BdE (3.5)
1
P (E)
dP (E)
dE= −B. (3.6)
A taxa B, mesmo que seja uma funcao da velocidade (ou energia), pode ser consi-
derada essencialmente como uma constante independente da energia (ou da velocidade).
Integrando a Equacao 3.6,28
0 500 1.0000
0.2
0.4
0.6
0.8
1
E
P(E
)
dE
Figura 3.1: A probabilidade P (E) de uma partıcula/acao sobreviver ate uma energia E(serie de retorno) sem sofrer uma colisao [2].
lnP (E) = −BE + constante (3.7)ou
P (E) = ae−BE (3.8)em que os coeficientes a e B sao constantes: a e a amplitude inicial (E = 0) e B e a taxa
de decaimento, ou uma “taxa de colisao”. Tomando como base o mercado de acoes, a
variavel E corresponde a serie de retornos, ou a energia do sistema. O parametro B da
distribuicao exponencial esta relacionado inversamente a energia media do sistema.
Com essa suposicao em mente, a energia ou temperatura de um gas ideal pode ser
relacionada a volatilidade do sistema. Assim, altas temperaturas levam a uma maior
volatilidade e baixas temperaturas no sistema economico levam a uma menor volatilidade
no mercado. A volatilidade [77] e uma medida estatıstica da dispersao ou desvio das
series de retorno, calculada para um dado ındice do mercado ou acao. Esse valor pode
ser estimado usando uma medida de desvio, como media das diferencas, variancia ou o
desvio padrao dos retornos. Normalmente, quanto maior a volatilidade, maior e o risco do
investimento em dado mercado. Existem diversas formas para calculo da volatilidade [8,
76, 77, 88], por exemplo: volatilidade historica, volatilidade implıcita ou alguns modelos
mais sofisticados, como o exponentially weighted moving average (EWMA) e o processo
GARCH [3].
29
A partir da analogia entre o mercado de acoes e o gas ideal, e possıvel estabelecer
uma relacao entre a distribuicao de Maxwell-Boltzmann (Equacao 3.9) e a distribuicao
exponencial (Equacao 3.8). A estatıstica de Maxwell-Boltzmann descreve a distribuicao
das partıculas de um gas (ideal) nos diversos nıveis de energia (ou velocidade). A relacao
e dada pela Equacao 3.10.P (E) = ae−E/kbT (3.9)
em que a e uma constante, kb e a constante de Boltzmann, E corresponde a energia da
partıcula (ou a serie de retorno) e T corresponde a temperatura do sistema, que pode ser
encarada como a volatilidade do mercado.
B =1
kbT. (3.10)
Desse modo, essa analogia pode ser valida para descrever a dinamica do mercado de
acoes, ja que na literatura [77, 97, 98, 104–107] alguns trabalhos indicam a distribuicao
exponencial como uma funcao que se ajusta bem aos dados em diversos casos. Assim,
a partir dessa hipotese devera haver um relacionamento entre os coeficientes das distri-
buicoes exponenciais, utilizadas para ajustar a base de dados, e a volatilidade dos dados.
Portanto, quando a volatilidade diminui (a energia ou a temperatura diminui), o coefici-
ente B devera aumentar. Tal relacao, para obedecer a estatıstica de Maxwell-Boltzmann,
deve tender a uma constante, como pode ser demonstrado pela Equacao 3.11,B ∝
1
V olatilidade⇒ B · V olatilidade = C (3.11)
sendo C a constante de proporcionalidade entre o coeficiente B e a volatilidade.
Se a relacao entre o coeficiente B e a volatilidade for encontrada empiricamente,
a teoria de Maxwell-Boltzmann pode ser valida para analisar a funcao densidade de
probabilidade das series de retorno. Desse modo, o sistema do mercado de acoes pode
ser tratado como um sistema de gas ideal [108]. A volatilidade ou, equivalentemente,
o coeficiente B, quantifica o risco financeiro de um dado mercado sob um perıodo de
tempo especıfico. Em outras palavras, essas medidas podem ser usadas para estimar a
instabilidade/flutuacao dos mercados.
A teoria de Maxwell-Boltzmann descreve o relacionamento entre a velocidade das
partıculas de um gas ideal e a temperatura desse sistema. Desse modo, o grau de oscilacao
do mercado (ou volatilidade) pode ser comparado com a energia de uma partıcula, que
e proporcional a temperatura. Na Equacao 3.10, a mesma relacao pode ser vista: o
30
coeficiente B e inversamente proporcional a temperatura do sistema. Essa informacao
pode ser valiosa, ja que pode ser usada para agrupar mercados ou para prever o seu
comportamento.
3.2.1 Um Ambiente baseado em Agentes para Analise do Mercado de Acoes
Um mercado de acoes e uma entidade publica para a negociacao de acoes de uma empresa
e seus derivativos a um preco acordado. O mercado acionario, que pode ser visto como
uma rede de transacoes economicas, e um exemplo de um sistema complexo [8] composto
por varios componentes que se relacionam entre si, de modo que o comportamento global
depende de cada componente do sistema. Simular todas as variaveis do mercado de acoes
e complicado e custoso. Dessa forma, um ambiente para simulacao do mercado de acoes
foi desenvolvido para analisar suas caracterısticas. O ambiente e um modelo simplista
inspirado na dinamica do modelo do gas ideal [2], ja que nesse mercado artificial nao ha
interacoes entre os agentes, entre as acoes do mercado e nem entre agentes e mercado.
Apesar do modelo abstrair varios aspectos e interacoes do mercado, o intuito e analisar
o comportamento coletivo que emerge das iteracoes dos agentes.
As abordagens baseadas em agentes inteligentes para analise financeira tem crescido
como um campo de pesquisa importante para o desenvolvimento e compreensao dos
fenomenos e padroes complexos observados em sistemas economicos. As simulacoes do
mercado financeiro baseadas em agentes computacionais [115–119] tem sido propostas, a
fim de estudar como caracterısticas macro do sistema emergem a partir de interacoes indi-
viduais. Nesta nova interpretacao, o conceito de sistemas complexos pode ser largamente
usado.
O ambiente artificial proposto inspirado no modelo do gas ideal e composto por dois
“mundos” que nao trocam informacao, como pode ser observado na Figura 3.2. O pri-
meiro conjunto e constituıdo apenas por Agentes que nao interagem entre si, nao havendo
qualquer troca de informacao entre eles. No segundo grupo, que e formado pelas Acoes,
nao existe qualquer influencia do mercado nos precos das acoes. Ou seja, o movimento do
preco de cada acao nao e afetado pelo preco das outras acoes que compoem o mercado.
Mesmo, quando papeis de uma determinada acao sao comprados por varios agentes, nao
existe uma valorizacao dessa acao, como tambem nao havera qualquer influencia desse
movimento na flutuacao dos precos do mercado.
No algoritmo proposto, as ordens de compra e venda sao feitas diretamente para o
mercado. A ideia e gerar um ambiente em que as interacoes sejam realizadas apenas entre
cada agente financeiro e o mercado na compra e na venda de acoes. O Algoritmo 3.2.1
31
Figura 3.2: Representacao do mercado de acoes desenvolvido com base na analogia como gas ideal.
descreve o pseudo-codigo do modelo proposto.
Cada agente inicia a simulacao com um nome, um capital inicial, uma acao em posse
e uma acao visada que ele deseja comprar. As caracterısticas dos agentes financeiros
sao geradas ao acaso: o nome e um numero criado sequencialmente, que serve apenas
para identificar o agente, o capital inicial e gerado por uma distribuicao gaussiana (ca-
pital inicial ← 100 + N(0, sigma)) e a acao em posse e a acao desejada sao sorteadas
aleatoriamente.
Cada acao inicia a simulacao com um nome, seu preco inicial e um desvio padrao. O
nome serve apenas para identificar cada acao e e gerado sequencialmente. O preco inicial
e sempre um numero positivo gerado aleatoriamente por uma distribuicao gaussiana, em
que preco inicial ← 10 + N(0, sigma). O desvio padrao e gerado por uma distribuicao
gaussiana (desvio padrao ← N(0, sigma)).
Em cada iteracao, que corresponde a um dia, os agentes financeiros compram e vendem
tıtulos financeiros aleatoriamente com uma dada probabilidade. Duas estrategias foram
usadas: primeiramente foi estabelecida uma taxa constante de compra e de venda e depois
a probabilidade foi gerada atraves de uma distribuicao normal. Apenas uma operacao e
permitida por vez, assim, a cada iteracao, o agente ou compra, ou vende uma acao. A
ideia e que o agente sempre esteja realizando pelo menos uma operacao.
Depois que todas as negociacoes sao realizadas no dia, os precos das acoes sao atua-
lizados com base no desvio padrao da iteracao anterior. A atualizacao dos precos segue
um modelo Random Walk (RW) [13], conforme foi definido na Equacao 3.1.32
Algoritmo 1 Pseudo-codigo para o Mercado de Acoes Proposto
Saıda: Indice financeiro do mercado, Indice do ganho dos agentesnInvestidores {Quantidade de investidores no mercado}nAcoes {Quantidade de acoes negociadas no mercado}iteracoes {Quantidade de maxima de iteracoes}sigma {Desvio padrao do modelo RW utilizado na atualizacao dos precos das acoes}pVenda {Probabilidade de venda dos agentes}pCompra {Probabilidade de compra dos agentes}i,j,k ← 1Repita:
Inicializa o nome da acao j e o seu desvio padrao ← N(0, sigma)Inicializa o preco inicial da acao j ← 10 +N(0, sigma)j← j + 1
Ate: j ≤ nAcoesRepita:
Inicializa o nome do investidor k e o seu capital inicial ← 100 +N(0, sigma)Sorteia a acao da carteira e a acao visada do investidor kk← k + 1
Ate: k ≤ nInvestidoresj,k ← 1 {Cada investidor so realiza uma operacao (compra ou venda) por dia}Enquanto i ≤ iteracoes Faca
Enquanto k ≤ nInvestidores FacaSe Capital do investidor k >= Preco atual da acao visada e pCompra >= U(0, 1) Entao
Agente k compra acao visadaSenao
Agente k nao compra nenhuma acaoFim SeSe Agente k possui acao e pVenda >= U(0, 1) Entao
Agente k vende uma acaoSenao
Agente k nao vende nenhuma acaoFim Sek ← k + 1
Fim EnquantoEnquanto j ≤ nAcoes Faca
Se Preco da acao j + desvio padrao >= 0 EntaoPreco da acao j e atualizado baseado no seu desvio padraoDesvio padrao da acao j e atualizado
SenaoPreco da acao j e atualizado com o modulo do seu desvio padraoDesvio padrao da acao j e atualizado
Fim SeFim Enquanto
Fim EnquantoindiceSeries ← serie do preco medio das acoes {Indice financeiro do mercado}indiceGanhoAgentes ← ganho % de cada agente {Indice de ganho dos agentes}
33
A partir da atualizacao de precos utilizando o desvio padrao do modelo RW, foi
possıvel simular diferentes tipos de ambientes. Mercados mais “frios” provenientes de
paıses desenvolvidos, como Estados Unidos, Inglaterra e Alemanha, possuem uma menor
volatilidade, apresentando geralmente uma menor variacao nos precos de suas acoes.
Por outro lado, mercados mais volateis (“quentes”), de forma geral, tem uma maior
variabilidade nos seus precos.
Em cada simulacao, um ındice e calculado a partir do valor medio diario de todas as
acoes, semelhante ao Indice Dow Jones, ou S&P500. O ındice e criado com base no preco
de todas as acoes que compoem o mercado, gerando apenas uma serie temporal. No final
de cada simulacao, o percentual de ganho/perda e calculado para cada agente com base
no capital inicial e final.
3.2.2 Algoritmo Proposto para Analise dos Indices de Mercados Financeiros
O algoritmo proposto e simples e pode ser utilizado para a analise de uma serie tem-
poral de algum ındice financeiro ou acao negociada na bolsa de valores. A metodologia
desenvolvida serve como base para todas as analises realizadas nesta tese. A base dos
resultados consiste na observacao do comportamento da volatilidade e do coeficiente B
da funcao exponencial. A partir dos experimentos, os resultados serao discutidos e uma
aplicacao para classificacao de paıses sera proposta.
Para cada ındice de mercado, foram realizados os seguintes passos:
1. Calculo da serie de retornos, definida como
G(t) =|lnZ(t+∆t)− lnZ(t)|
s. (3.12)
Como os dados utilizados sao registros diarios, foi estabelecido que ∆t = 1 dia, Z(t)
e o valor do ındice no instante t e s e o desvio padrao de lnZ(t+∆t)− lnZ(t). Essa
formula descreve como as series de retorno foram construıdas a partir dos dados
dos ındices;
2. Para cada ındice, a volatilidade [76,88,120] foi calculada com base na diferenca dos
retornos diarios normalizados pelo desvio padrao dos retornos,
VT(t) =1
s
∑t+n−1
t′=t G(t′)
n, (3.13)
sobre uma janela de tempo T = n∆t, sendo n um inteiro positivo, ∆t o intervalo
34
de tempo e t′ um ındice temporal. Para todos os ındices, e usado ∆t = 1 dia. Se n
e pequeno, as altas frequencias sao mais relevantes no calculo da volatilidade. Se n
e grande, a volatilidade e mais sensıvel aos dados de baixa frequencia;
3. A funcao densidade de probabilidade (fdp) e estimada;
4. Os ajustes realizados nos dados com as leis de potencia e a distribuicao exponencial
foram feitos utilizando quatro algoritmos: Least Squares (LS) [121],Trust Region
(TR) [122], Levenberg-Marquardt (LM) [123] e Maximum Likelihood Estimation
(MLE) [79, 124]. O erro dos ajustes foi calculado baseado no Mean Square Error
(MSE). Para o algoritmo MLE, o negativo da verossimilhanca [3] e usado para
avaliar a qualidade dos ajustes.
A fdp da serie de retornos foi analisada com a funcao linear: o algoritmo LS em
escala log-log e semi-log. Na escala semi-log, o ajuste linear corresponde ao fitting da
funcao exponencial, enquanto em escala log-log o ajuste corresponde ao ajuste das leis de
potencia. Esse ajuste e possıvel porque na escala log-log as leis de potencia se comportam
como uma reta, enquanto na escala semi-log as funcoes exponenciais sao retas. Num
segundo ajuste, os dados da propria fdp da serie de retornos sao usados sem nenhuma
transformacao de escala. Para esse ajuste, foram utilizados tres algoritmos: TR, LM e
MLE. Apos essa estapa, foi feita uma comparacao com o ajuste linear (algoritmo LS).
O algortimo LM e um metodo iterativo que tem como objetivo minimizar uma funcao
custo, que e expressa como a soma dos quadrados de uma funcao nao-linear. Esse algo-
ritmo e adotado em um amplo espectro de disciplinas, como Matematica [123] e Ciencia
da Computacao [30]. O algoritmo LM pode ser encarado como uma combinacao entre o
algoritmo de Gauss-Newton [125] e o metodo de gradiente descendente [126]. Se a solucao
esta longe da real, o algoritmo comporta-se como um metodo de gradiente descendente.
O algoritmo TR busca uma regiao que minimiza o problema em questao. Para isso,
ele usa uma funcao modelo (muitas vezes a funcao quadratica). Quando o algoritmo TR
encontra uma regiao promissora, a regiao e expandida, tentando encontrar novas regioes
promissoras para resolver o problema. Se o ajuste e pobre, a regiao e contraıda, e o
algoritmo busca outras regioes que podem resolver o problema.
A Estimacao por Maxima Verossimilhanca (MLE) foi originalmente desenvolvida por
Fisher em 1920 e e utilizada para o ajuste dos parametros de um modelo estatıstico
em relacao a um conjunto de dados. O metodo seleciona os valores para parametros
que maximizam a verossimilhanca dos dados amostrais em relacao a distribuicao mais
provavel. Os metodos MLE sao versateis e podem ser aplicadas a maioria dos modelos
35
e tipos de dados diferentes. Eles fornecem metodos eficientes para a quantificacao da
incerteza atraves de intervalos de confianca.
O TR e o LM fornecem solucoes numericas para o problema de minimizacao de funcoes.
O LM e MLE sao algoritmos nao-lineares, enquanto que o TR e um metodo de busca
linear.
3.3 RESUMO DO CAPITULO
Neste capıtulo foram introduzidos os conceitos basicos sobre a teoria do gas ideal, descre-
vendo a estatıstica de Maxwell-Boltzmann e suas implicacoes teoricas para a aplicacao
na descricao da dinamica do mercado de acoes. A metodologia proposta tambem foi
mostrada do ponto de vista teorico e pratico. Assim, o resultado esperado para que
essa analogia seja valida e uma possıvel relacao entre a volatilidade e o coeficiente B
da distribuicao usada para ajustar a funcao densidade de probabilidade das series sob
estudo.
Com base no modelo de gas ideal foi proposto um ambiente composto por agentes
inteligentes e series artificiais modeladas por um Random Walk para analisar as carac-
terısticas do mercado e dos agentes. Para isso, os agentes foram implementados simulando
partıculas de um gas. Utilizando o modelo RW, mercados desenvolvidos e em desenvol-
vimento foram simulados.
36
CAPITULO 4
RESULTADOS EXPERIMENTAIS
Neste capıtulo sao analisados e comparados todos os resultados obtidos utilizando o
metodo proposto. Primeiramente, o banco de dados de ındices reais e descrito, carac-
terizando series utilizadas e os perıodos estudados. Na Secao 4.1, todos os parametros
utilizados na simulacao com agentes artificiais sao definidos. Os resultados da simulacao
com o mercado de acoes artificial sao discutidos na Secao 4.1.1. Na Secao 4.2, o metodo
e aplicado a ındices de mercados de acoes reais usando janelas de tempo de um, dois,
cinco, dez e quinze anos. Em cada perıodo estudado sao avaliados os ajustes com a lei de
potencia e a funcao exponencial, bem como as relacoes entre o coeficiente B e a volatili-
dade. Na Secao 4.2.3, uma aplicacao e proposta utilizando o metodo para a classificacao
de paıses em dois grupos, desenvolvidos e em desenvolvimento, com base apenas nos
ındices financeiros de cada nacao.
4.0.1 Base de Dados Utilizada nos Experimentos
A base de dados e constituıda de series geradas artificialmente e de series provenientes de
mercados reais (adquiridos no site http://finance.yahoo.com/). As series artificiais sao
geradas com base no modelo RW (Equacao 3.1), possibilitando que se recriem diferentes
tipos de mercados. As series reais sao provenientes de ındices financeiros de mercados
mundiais. Contudo, mesmo com grande quantidade de dados referentes aos mercados,
uma dificuldade nessa pesquisa foi a aquisicao de dados, ja que existe uma maior dis-
ponibilidade de dados referentes a mercados desenvolvidos, tal como Estados Unidos,
Inglaterra, Franca e Espanha. Em muitos casos, o ındice esta registrado com uma pe-
quena quantidade de dados, inviabilizando seu uso para nossa pesquisa, que considera no
mınimo um ano. Assim, a heterogeneidade dos dados esta relacionada tanto aos diferen-
tes mercados abordados, quanto aos perıodos estudados. Essa variacao possibilita uma
melhor analise do metodo, permitindo que se saibam as limitacoes do metodo proposto.
Um fator interessante que impulsionou o uso de dados de paıses foi o trabalho de
Matia et al. [77], que encontrou um melhor ajuste exponencial apenas no mercado indiano,
diferente do mercado americano, que foi melhor ajustado por uma lei de potencia. Esse
37
trabalho sugere que mercados desenvolvidos sao melhor ajustados por leis de potencia,
enquanto mercados em desenvolvimento sao melhor descritos por exponencial. O presente
trabalho tambem pretende analisar esse fato.
Primeiramente um conjunto de 17 ındices mundiais no perıodo de dois anos (2008−
2010) foi utilizado para testar as leis de potencias e a funcao exponencial. As series
escolhidas foram: Estados Unidos (Dow Jones e S&P 500), Inglaterra (FTSE 100), Japao
(Nikkei 225), Alemanha (Dax 30), Franca (CAC 40), Canada (GSPTSE), Espanha (Ibex
35), Coreia do Sul (Kospi), Italia (MIB), Suecia (OMX), Noruega (Oseax), Singapura
(STI), China (SSEC), Argentina (Merval), Mexico (IPC) e India (BSE Sensex).
Como nem todas as series utilizadas podem ser adquiridas em outros perıodos de
tempo, apos a primeira analise, um novo conjunto foi formado, a fim de se analisar
diferentes perıodos: um ano (2009− 2010), dois anos (2008− 2010), cinco anos (2005−
2010), dez anos (2000 − 2010) e quinze anos (1995 − 2010). Os 15 ındices escolhidos
foram: Estados Unidos (Dow Jones, Nasdaq e S&P500), Inglaterra (FTSE100), Japao
(Nikkei 225), Alemanha (Dax 30), Franca (CAC 40), Espanha (Ibex 35), Singapura (STI),
Mexico (IPC), Hong Kong (Hang Seng), Malasia (KLSE), Brasil (Ibovespa), Austria
(ATX) e Suıca (SMI). Dessa forma, a diferenca entre o primeiro e o segundo conjunto
e a substituicao dos ındices GSPTSE, Kospi, MIB, OMX, Oseax, SSEC, Merval e Bse
Sensex por IPC, Hang Seng, KLSE, Ibovespa, ATX e SMI.
Um terceiro grupo de ındices foi formado com o intuito de englobar em igual proporcao
paıses desenvolvidos e em desenvolvimento: um conjunto com 34 ındices contendo 17
economias de cada classe. As classificacoes sugeridas pela Organizacao das Nacoes Unidas
(ONU) [127] e pelo Fundo Monetario Internacional (FMI) [128] foram usadas.
Assim, os ındices no perıodo de dois anos (2008 − 2010) foram divididos em dois
grupos, sendo um de paıses desenvolvidos: Hang Seng (Hong Kong), OMX C20 (Dina-
marca), MIB (Italia), IBEX 35 (Espanha), GSPTSE (Canada), ISEQ (Irlanda), CAC 40
(Franca), Nikkei 225 (Japao), SMI (Suıca), FTSE 100 (Inglaterra), ATHEX 20 (Grecia),
ASX 200 (Australia), Kospi (Korea), Dow Jones e S&P 500 (Estados Unidos), DAX 30
(Alemanha) e TWII (Taiwan). E outro grupo de ındices provenientes de paıses em desen-
volvimento: IGBC (Colombia), IGPA e IPSA (Chile), EZA (Africa do Sul), e SSEC e CSI
300 (China), PSEI (Filipinas), Bse Sensex (India), JKSE (Indonesia), KWSE (Kuwait),
SET (Tailandia), MXY e IPC (Mexico), Merval (Argentina), IBRX 50 e Bovespa (Brasil)
e MASI (Marrocos).
38
4.1 SIMULACAO DO AMBIENTE ARTIFICIAL BASEADO NO MODELO DO
GAS IDEAL
A partir da simulacao do mercado de acoes com base no modelo do gas ideal, e possıvel
analisar o comportamento do mercado para diferentes variaveis. A variacao de parametros
permite avaliar o comportamento do mercado em diversas situacoes, que, na pratica, e
mais complicado devido a falta de informacao de certas variaveis, como quantidade de
investidores, quantidade de bens dos investidores, liquidez de papeis, etc.
Assim, primeiramente um conjunto de variaveis foi fixada para comparar o ajuste
utilizando a lei de potencia e a funcao exponencial, e a relacao do coeficiente B e a
volatilidade. Para se obter um comportamento medio, cada configuracao foi simulada 30
vezes. Os seguintes parametros foram utilizados:� Numero de investidores (nInvestidores) = 500;� Numero de acoes (nAcoes) = 100;� Iteracoes (corresponde aos dias ) = 2000;� Probabilidade de compra (pCompra) = 0,9 ou N(0, 5; 0, 15);� Probabilidade de venda (pVenda) = 0,9 ou N(0, 5; 0, 15);� σ = 0, 01; 0, 05; 0, 1; 0, 3; 0, 5; 0, 7; 1, 0; 1, 3; 1, 5; 1, 7; 2, 0 e 2, 3.
A variacao do σ foi definida para simular diversos tipos de mercado. As probabilidades
de compra e venda foram estabelecidas de duas formas diferentes, com o intuito de analisar
se essa variacao pode afetar os resultados dos ajustes [110]. E importante salientar que
no mercado artificial desenvolvido existem 100 (cem) diferentes tipos de acao, onde cada
acao tem um numero de papeis suficiente para que cada agente possa adquirir um papel
sem precisar verificar a disponibilidade.
Uma segunda configuracao foi definida com o objetivo de analisar a estacionarie-
dade dos mercados e o comportamento a longo prazo. Assim, a ideia foi variar alguns
parametros, por exemplo a quantidade de investidores e o σ do modelo RW, para veri-
ficar se a dinamica do mercado segue um modelo de gas ideal em outras determinadas
situacoes. Assim, os seguintes parametros foram definidos:� Numero de investidores (nInvestidores) = 25, 50, 100, 250 e 500;� Numero de acoes (nAcoes) = 100;
39
� Iteracoes = 100000;� Probabilidade de compra (pCompra) = 0,9 ou N(0, 5; 0, 15);� Probabilidade de venda (pVenda) = 0,9 ou N(0, 5; 0, 15);� σ = 0, 01; 1, 0 e 2, 3.
Com a combinacao dos parametros probabilidade de compra/venda, numero de agen-
tes e σ do modelo RW trinta configuracoes diferentes foram executadas. Cada experi-
mento foi inicializado aleatoriamente 30 vezes, a fim de verificar o comportamento medio
do mercado. As analises foram feitas com base na media aritmetica das trinta repeticoes
para cada configuracao.
A estacionariedade do mercado artificial foi avaliada analisando a evolucao da vo-
latilidade, devido sua menor complexidade computacional para estimacao, ja que deve
existir uma relacao entre o coeficiente B e a volatilidade. E esperado que a volatilidade
tenda a uma constante com o passar do tempo. Atraves de testes empıricos, foi estabe-
lecido um total de 100000 iteracoes para cada experimento. Um criterio de parada foi
estabelecido, de tal forma que o algoritmo e finalizado se apos 1000 iteracoes nao houver
uma variacao maior que 1% no valor da volatilidade. Como nos experimentos os valores
utilizados correspondem aos precos diarios de fechamento, 1000 iteracoes correspondem
aproximadamente a cinco anos. Apos aproximadamente cinco anos, sem uma variacao
maior que 1%, e plausıvel inferir que o mercado chegou a um ponto de estacionariedade.
4.1.1 Resultados dos Experimentos com o Mercado de Acoes Artificial
Como o mercado de acoes artificial foi desenvolvido inspirado no modelo de um gas
ideal, algumas caracterısticas devem ser analisadas a fim de validar o metodo. Para isso,
todas as analises das simulacoes nesta Tese tomam como base o algoritmo proposto na
Secao 3.2.2.
A bateria de experimentos inicial leva em consideracao a primeira configuracao do
mercado, com 2000 iteracoes. Com base nessas simulacoes, primeiramente, os ajustes
a funcao densidade de probabilidade das series de retorno com a funcao exponencial e
a lei de potencia serao comparados. Os resultados encontrados a partir da analise das
simulacoes com os agentes com probabilidades de compra e venda constantes e variaveis
sao mostrados nas Tabelas 4.1 e 4.2, respectivamente. Os resultados estao dispostos em
ordem decrescente de sigma (σ) do modelo RW. Nas Tabelas 4.1 e 4.2 pode ser visto que
40
a funcao exponencial obteve um melhor ajuste do que a lei de potencia para todas as fdp
das series de retorno.
Tabela 4.1: Erros (MSE) usando as leis de potencia e a abordagem proposta baseada nafuncao exponencial com probabilidade de compra e venda constante
Modelo Volatilidade Trust Region Coef. Coef. deRW das series Lei de Potencia Exponencial Expon. (B) Pearsonσ = 2,30 1,017 0,0006 0,0001 0,820 0,317σ = 2,00 0,973 0,0006 0,0001 0,846 0,312σ = 1,70 0,949 0,0007 4,19E-05 0,850 0,295σ = 1,50 0,933 0,0009 4,07E-05 0,880 0,282σ = 1,30 0,922 0,0010 0,0008 0,950 0,292σ = 1,00 0,913 0,0011 0,0002 0,970 0,289σ = 0,70 0,907 0,0015 0,0002 0,908 0,273σ = 0,50 0,876 0,0024 0,0002 0,957 0,281σ = 0,30 0,835 0,0029 0,0003 1,000 0,225σ = 0,10 0,801 0,0006 0,0001 1,030 0,178σ = 0,05 0,798 0,0019 3,05E-05 1,035 0,151σ = 0,01 0,799 0,0144 0,0024 1,102 0,226
Tabela 4.2: Erros (MSE) usando as leis de potencia e a abordagem proposta baseada nafuncao exponencial com probabilidade de compra e venda variavel
Modelo Volatilidade Trust Region Coef. Coef. deRW das series Lei de Potencia Exponencial Expon. (B) Pearsonσ = 2,30 1,026 0,0007 0,0001 0,791 0,220σ = 2,00 0,983 0,0007 0,0001 0,800 0,238σ = 1,70 0,958 0,0008 4,69E-05 0,841 0,143σ = 1,50 0,948 0,0008 0,0001 0,850 0,222σ = 1,30 0,929 0,0010 3,51E-05 0,880 0,154σ = 1,00 0,922 0,0012 0,0003 0,900 0,148σ = 0,70 0,913 0,0017 0,0001 0,929 0,230σ = 0,50 0,889 0,0019 0,0003 0,940 0,214σ = 0,30 0,845 0,0030 0,0003 0,961 0,252σ = 0,10 0,810 0,0030 0,0003 0,975 0,203σ = 0,05 0,807 0,0027 0,0002 1,000 0,249σ = 0,01 0,789 0,0032 0,0004 1,050 0,268
A Figura 4.1 mostra exemplos dos ajustes feitos com a funcao exponencial e com a
lei de potencia nas escalas semi-log e log-log. Os pontos pretos sao os valores gerados
pela simulacao computacional e a linha cinza representa o ajuste de cada funcao. A
funcao exponencial aderiu melhor a funcao densidade de probabilidade da serie do que a
lei de potencia. Enquanto o ajuste da funcao exponencial e feito em toda a extensao da
fdp, descrevendo o comportamento medio dos dados, a lei de potencia tem uma melhor
aderencia na regiao da cauda da fdp. Assim, se apenas a cauda for considerada, a lei de
potencia alcanca um melhor ajuste.
41
0 0.5 1 1.5 2 2.5 3 3.5 4 4.510
−2
10−1
100
Intervalos de Retorno
fd
p (
Sig
ma =
0.1
)
(a) Funcao Exponencial.
0 0.5 1 1.5 2 2.5 3 3.5 4 4.510
−2
10−1
100
Intervalos de Retorno
fd
p (
Sig
ma =
0.1
)
(b) Lei de Potencia.
10−2
10−1
10010
−2
10−1
100
Intervalos de Retorno
fd
p (
Sig
ma =
0.1
)
(c) Funcao Exponencial.
10−2
10−1
10010
−2
10−1
100
Intervalos de Retorno
fd
p (
Sig
ma =
0.1
)
(d) Lei de Potencia.
Figura 4.1: Ajustes com a funcao exponencial e a lei de potencia usando o algoritmo TrustRegion para a serie temporal gerada com σ = 0, 1. (a-b) Ajuste na escala semi-log. (c-d)Ajuste na escala log-log. A linha preta representa a funcao densidade de probabilidade(fdp) da serie temporal e a linha cinza representa o ajuste encontrado pelo algoritmo.
Dado que o ajuste da funcao exponencial aderiu melhor aos dados que a lei de potencia,
os resultados encontrados nos experimentos corroboram com a analogia proposta entre o
mercado de acoes e o modelo do gas ideal. A relacao entre o coeficiente B e a volatilidade
pode ser vista nas Figuras 4.2a e 4.2b. Como enunciado no Capıtulo 3, o coeficiente B
pode ser comparado a uma medida de temperatura de mercado, inversamente proporci-
onal a volatilidade. Dessa forma, quando a volatilidade do mercado de acoes e alta, o
coeficiente B correspondente a essa mercado sera pequeno e quando a volatilidade de um
determinado mercado for baixa, o coeficiente B desse mercado sera alto.
Como visto no Capıtulo 3, na analogia entre o modelo do gas ideal e o mercado de
acoes a relacao entre o coeficiente B e a volatilidade, denotada pela expressao (produto)
B·V olatilidade deve tender a uma constante. Tal medida de proporcionalidade entre essas
42
2 4 6 8 10 120.75
0.8
0.85
0.9
0.95
1
1.05
1.1
Séries
Am
pli
tud
es
(a) Relacao para os experimentos com proba-bilidade de compra e venda dos agentes cons-tante.
2 4 6 8 10 120.75
0.8
0.85
0.9
0.95
1
1.05
1.1
Séries
Am
pli
tud
es
(b) Relacao para os experimentos com pro-babilidade de compra e venda dos agentesvariavel.
Figura 4.2: Comparacao entre a volatilidade e o coeficiente B. (a) Relacao das duasvariaveis nas simulacoes realizadas com a probabilidade constante de compra e venda dosagentes. (b) Relacao das duas variaveis nas simulacoes realizadas com a probabilidadevariavel de compra e venda dos agentes. No grafico, os pontos pretos sao as volatilidadee as estrelas cinzas sao os coeficientes B das series temporais geradas artificialmente. Osresultados estao em ordem decrescente de volatilidade.
variaveis corresponde a constante de Boltzmann da estatıstica de Maxwell-Boltzmann
(Equacao 3.9). Nos experimentos com a probabilidade de compra/venda constante e
variavel, o valor medio encontrado foi de 0, 84 ± 0, 04 e 0, 81 ± 0, 03, respectivamente.
O produto entre a volatilidade e o coeficiente B para os dois casos pode ser visto nas
Figuras 4.3a e 4.3b.
2 4 6 8 10 120
0,5
1
1,5
Séries
Vo
lati
lid
ad
e*C
oefic
ien
te B
(a) Produto para os experimentos com proba-bilidade de compra e venda dos agentes cons-tante.
2 4 6 8 10 120
0,5
1
1,5
Séries
Vo
lati
lid
ad
e*C
oefic
ien
te B
(b) Produto para os experimentos com pro-babilidade de compra e venda dos agentesvariavel.
Figura 4.3: O produto B · V olatilidade para cada mercado. A linha solida representa ovalor medio para o conjunto de pontos.
43
A partir dos experimentos tambem e possıvel analisar o comportamento dos diferen-
tes tipos de mercado sob o ponto de vista do investidor. Atraves da distribuicao de
ganho/perda de patrimonio (acoes + dinheiro) dos agentes pode-se correlacionar o grau
de instabilidade do mercado com a probabilidade de um investidor ganhar ou perder
uma determinada quantidade de dinheiro. Dessa forma, pode-se estimar o retorno de um
investidor dado o mercado onde ele esta inserido.
Na simulacao, os agentes nao tem qualquer informacao sobre o mercado, ou sobre os
investimentos dos outros agentes. Os agentes correspondem a pessoas que investem sem
fazer qualquer estudo de mercado, ou qualquer tipo de previsao com base em calculos, ou
informacoes da mıdia. Os agentes representam investidores que estao no mercado, mas
nao fazem qualquer estudo ou analise sobre o futuro ou o movimento das acoes.
Para calcular a distribuicao de ganho/perda por agente, um histograma para cada
mercado foi construıdo. O coeficiente de Pearson [129], utilizado para estimar a assimetria
de um histograma foi calculado para cada tipo de mercado e os seus valores estao descritos
em ordem decrescente de volatilidade nas Tabelas 4.1 e 4.2. O coeficiente de Pearson
quantifica a assimetria de uma determinada distribuicao. Tal coeficiente e determinado
pela diferenca entre a media e a moda divido pelo desvio padrao dos dados. O coeficiente
e medido de acordo com a Equacao 4.1,As =
X −Mo
s(4.1)
em que As e o coeficiente de Pearson, X e a media dos dados, Mo e a moda da distribuicao
e s e o desvio padrao da distribuicao. Como os dados analisados correspondem aos valores
absolutos das series de retornos, quanto maior o valor do coeficiente de Pearson, maior a
assimetria dos dados. Assim, quanto maior a assimetria, maior o montante de dinheiro
que os agentes ganham ou perdem num determinado mercado.
Para analisar a correlacao entre a “temperatura” do mercado e o montante de di-
nheiro dos agentes, dois cenarios foram simulados. No primeiro, como ja mencionado
anteriormente, os agentes compram e vendem acoes com uma probabilidade de 0, 9. No
segundo, a probabilidade de compra e venda e variavel seguindo uma distribuicao nor-
mal N(0, 5; 0, 15). Essa probabilidade foi estabelecida com o objetivo que o agente possa
executar alguma acao, ou de compra, ou de venda.
Nas Figuras 4.4a, 4.4b, 4.5a e 4.5b podem ser vistos os histogramas da distribuicao
de ganhos/perdas do menor sigma (σ = 0, 01) e do maior sigma (σ = 2, 3) utilizados na
simulacao. As taxas de lucro ou prejuızo de cada agente (taxaAgente) foram calculadas
seguindo a Equacao 4.2,44
taxaAgente =|patrimoniofinal − patrimonioinicial|
patrimonioinicial(4.2)
em que patrimoniofinal corresponde ao montante de capital do agente ao sair do mercado,
patrimonioincial e o montante de capital do agente ao entrar no mercado. Os histogramas
das Figuras 4.4 e 4.5 apresentam as taxas de ganho/perda normalizadas pelo desvio
padrao dos valores de taxas dos agentes (taxaAgente).
As Figuras 4.4a, 4.4b mostram os histogramas com a probabilidade de compra/venda
constante e as Figuras 4.5a e 4.5b mostram os histogramas com a probabilidade variavel.
Observando os histogramas na Figura 4.4, pode-se notar que no mercado menos volatil,
com desvio padrao menor, os agentes ganham/perdem menos dinheiro do que no caso de
mercado mais volatil que tem uma variacao de precos maior.
0 1 2 3 4 5 60
20
40
60
Distribuição (%) de ganho/perda dos agentes
Fre
qu
ên
cia
(a) Histograma para σ = 0, 01.
0 1 2 3 4 5 60
20
40
60
Distribuição (%) de ganho/perda dos agentes
Fre
qu
ên
cia
(b) Histograma para σ = 2, 3.
Figura 4.4: Histogramas normalizados das distribuicoes (ganho/perda) dos agentes(taxaAgente) com o uso de probabilidade de compra/venda constante. (a) Distribuicaodo dinheiro dos agentes para a serie temporal gerada com σ = 0, 01. (b) Distribuicao dodinheiro dos agentes para a serie temporal gerada com σ = 2, 3.
A assimetria nas Figuras 4.4a e 4.4b mostra que o mercado com menor desvio padrao
(σ = 0, 01) apresenta uma menor assimetria do que o mercado com maior desvio padrao
(σ = 2, 3). Estas medidas mostram que, quando a volatilidade e pequena, o ganho/perda
dos investidores se concentram mais em torno do valor medio dos retornos. Quando a
volatilidade e elevada, ha uma maior dispersao, e por conseguinte, uma maior probabi-
lidade de ganho/perda dos agentes. E importante salientar que nesse caso, os agentes
compram e vendem papeis com uma probabilidade alta (0, 9), deixando que o mercado
influencie severamente nos seus ganhos. Nesse caso, dado esse comportamento, os re-
sultados seguem a teoria de Maxwell-Boltzmann descrita anteriormente. Ou seja, de
45
acordo com a energia (volatilidade) do sistema (mercado), os agentes ganham/perdem
mais dinheiro. Esse fenomeno ocorre quando um investidor mantem uma determinada
posicao, de compra ou venda, independente do movimento do mercado. Geralmente, esse
investidores usam a bolsa de valores como investimento de longo prazo (no caso de anos),
desprezando as variacoes em pequenos perıodos, na esperanca que haja uma valorizacao
na media do preco do investimento.
0 1 2 3 4 5 60
10
20
30
40
50
Distribuição (%) de ganho/perda dos agentes
Fre
qu
ên
cia
(a) Histograma para σ = 0, 01.
0 1 2 3 4 5 60
10
20
30
40
50
Distribuição (%) de ganho/perda dos agentes
Fre
qu
ên
cia
(b) Histograma para σ = 2, 3.
Figura 4.5: Histogramas normalizados das distribuicoes (ganho/perda) dos agentes(taxaAgente) com o uso de probabilidade de compra/venda variavel. (a) Distribuicaodo dinheiro dos agentes para a serie temporal gerada com σ = 0, 01. (b) Distribuicao dodinheiro dos agentes para a serie temporal gerada com σ = 2, 3.
No caso dos mercados com probabilidade de compra/venda variavel (N(0, 5; 0, 15)),
em que os agentes sao menos influenciados pelas flutuacoes do mercado, a dinamica encon-
trada foi diferente. As Figuras 4.5a e 4.5b mostram que nao ha uma diferenca significativa
entre o mercado mais volatil (σ = 0, 01) e o menos volatil (σ = 2, 3). Esse comportamento
se deve ao fato de a probabilidade de compra/venda flutuar em torno de 0, 5, tornando
o impacto da flutuacao do mercado menor nos ganhos/perdas dos agentes. A relacao
entre o coeficiente de assimetria e o coeficiente B sao mostrados (em ordem crescente de
B) na Figura 4.6. Resultados semelhantes aos encontrados nesses experimentos foram
publicados em [130, 131].
Na analise de estacionariedade dos mercados artificiais, foram analisadas 30 com-
binacoes. Na Tabela 4.3 sao mostrados os valores dos parametros utilizados, dividos em
dois conjuntos, probabilidade de compra/venda constante e variavel. Na mesma tabela
podem ser vistos o criterio de parada medio alcancado dos 30 experimentos, a volatilidade
e o coeficiente B medio de todas observacoes. Na Tabela 4.3 tambem pode ser visto que
46
0 2 4 6 8 10 120
0,2
0,4
0,6
0,8
1
1,2
Séries
Am
plitu
de
s
(a) Mercado de acoes com probabilidade de com-pra/venda constante.
0 2 4 6 8 10 120
0.2
0.4
0.6
0.8
1
1.2
Séries
Am
plitu
de
s
(b) Mercado de Acoes com probabilidade de com-pra/venda variavel.
Figura 4.6: Relacao entre o coeficiente de Pearson e o coeficiente B em ordem cres-cente do coeficiente B. No grafico, os pontos representam os coeficientes B e as estrelascorrespondem aos coeficientes de Pearson das series temporais artificiais. (a) Relacaopara investidores com compra/venda constante. (b) Relacao para investidores com com-pra/venda variavel.
o MSE obtido dos ajustes com a funcao exponencial foram superiores em desempenho a
lei de potencia na maioria dos casos.
Nas Figuras 4.7a, 4.7b e 4.7c sao mostrados exemplos de evolucao da volatilidade para
diferentes casos. Para o caculo da volatilidade foi estabelecida uma janela cumulativa
que estima a nova volatilidade a cada 50 iteracoes. Entao, a primeira volatilidade e
calculada apos 50 iteracoes, a segunda apos 100, a terceira depois de 150 passos e assim
sucessivamente ate o criterio de parada ser alcancado. Na Figura 4.7 pode ser visto
que apos uma determinada quantidade de iteracoes, o processo se torna estacionario, de
acordo com o criterio de parada estabelecido, pois apos 1000 iteracoes nao houve uma
variacao na volatilidade maior que 1%.
A partir da analise da Tabela 4.3, observa-se que os resultados obtidos com proba-
bilidade de compra/venda constante se assemelham com os resultados obtidos com a
probabilidade de compra/venda variavel. Apesar da mudanca do numero de agentes,
os mercados (de acordo com o desvio padrao do modelo RW ) alcancaram o criterio de
parada com a mesma quantidade de iteracoes e praticamente a mesma volatilidade fi-
nal. Dessa forma, pode-se inferir que, no modelo artificial proposto, onde os agentes nao
trocam informacao com o ambiente, nao ha qualquer influencia da dinamica dos agentes
nos precos das acoes, independente do modo (constante/variavel) de compra/venda uti-
lizado. Tambem e possıvel afirmar que independente da janela temporal considerada nos
47
Tabela 4.3: Estatısticas dos experimentos com 100000 iteracoes.
Prob. de Numero Desv. Padrao Iteracao Volat. MSE Coef.comp./venda Agentes do modelo RW L.P. Exp. B
0,01 20000 0,798 1,32E-06 1,85E-07 0,90025 1,00 50000 0,561 1,36E-04 1,03E-04 1,200
2,30 50000 0,386 8,04E-05 1,19E-04 0,8780,01 20000 0,796 2,34E-03 2,14E-04 1,000
50 1,00 50000 0,559 2,22E-03 1,66E-04 1,0502,30 50000 0,387 7,87E-05 6,68E-05 0,8020,01 20000 0,798 2,43E-03 2,01E-04 1,080
Constante 100 1,00 50000 0,565 1,40E-04 1,05E-04 1,2002,30 50000 0,399 8,09E-05 6,90E-05 0,6250,01 20000 0,799 2,74E-03 3,52E-04 0,970
250 1,00 50000 0,571 1,40E-04 1,08E-04 1,2052,30 5000 0,395 8,31E-05 8,06E-05 0,7350,01 20000 0,799 2,35E-03 2,21E-04 1,010
500 1,00 50000 0,551 1,34E-04 1,30E-04 1,3002,30 50000 0,375 7,63E-05 1,06E-04 0,8720,01 20000 0,799 4,17E-04 2,18E-04 0,950
25 1,00 50000 0,630 1,74E-04 1,36E-04 1,1002,30 50000 0,540 1,79E-04 1,08E-04 1,2000,01 20000 0,797 2,83E-03 1,72E-04 1,030
50 1,00 50000 0,616 1,69E-04 1,14E-04 1,4252,30 50000 0,570 1,53E-04 7,81E-05 1,1000,01 20000 0,796 2,12E-03 1,30E-04 1,100
Variavel 100 1,00 50000 0,583 6,70E-04 1,99E-04 1,6192,30 50000 0,553 1,79E-04 8,11E-05 1,0000,01 20000 0,799 2,43E-03 1,51E-04 1,080
250 1,00 50000 0,643 1,89E-04 9,61E-05 1,3162,30 50000 0,551 1,92E-04 9,29E-05 1,2000,01 20000 0,796 2,22E-03 1,96E-04 1,000
500 1,00 50000 0,615 1,71E-04 1,20E-04 1,4492,30 50000 0,542 1,63E-04 1,00E-04 1,134
experimentos, a funcao exponencial aderiu melhor aos dados que as lei de potencia.
4.2 RESULTADOS EXPERIMENTAIS COM DADOS REAIS
Quando as series reais foram abordadas, um problema crucial foi a aquisicao de dados,
por isso conforme o foco dos experimentos, as analises sao realizadas em diferentes series.
Nessa secao, os experimentos estao divididos em duas partes:
1. Aplicacao da abordagem proposta na Secao 3.2.2 do Capıtulo 3 em ındices finan-
ceiros reais com diferentes janelas de tempo;
2. Aplicacao da abordagem para agrupamento de paıses baseado em seus ındices fi-
nanceiros. Dessa forma, a abordagem proposta na Secao 3.2.2 do Capıtulo 3 serve
como base para a classificacao dos grupos de paıses.
A seguir os resultados sao mostrados em tres diferentes secoes. Na primeira, uma
exaustiva analise foi realizada usando ındices financeiros no perıodo de dois anos. Na
48
0 50 100 150 200 250 300 350 4000
2
4
6
8
10
12
Janelas temporais
Vo
lati
lid
ade
0.65
0.7
0.75
0.8
0.85
0.9
0.95
(a) Evolucao da volatilidade para um mercado(σ = 0, 01) com 25 agentes.
0 100 200 300 400 500 600 700 800 900 10000
2
4
6
8
10
12
Janelas temporais
Vo
lati
lid
ad
e
(b) Evolucao da volatilidade para um mercado(σ = 0, 1) com 250 agentes.
0 100 200 300 400 500 600 700 800 900 10000
2
4
6
8
10
12
Janelas temporais
Vo
lati
lid
ad
e
(c) Evolucao da volatilidade para um mercado(σ = 2, 3) com 500 agentes.
Figura 4.7: Evolucao temporal da volatilidade utilizando uma janela cumulativa de 50registros para os mercados com: (a) 25 agentes e σ = 0, 01, (b) 250 agentes e σ = 0, 1 e(c) 500 agentes e σ = 2, 3
secao subsequente, um conjunto de janelas de tempo e considerado para um outro grupo
de ındices. E finalmente, uma metodologia utilizando a abordagem proposta e utilizada
na tarefa de classificacao de paıses na ultima secao.
4.2.1 Analise no Perıodo de Dois Anos
O passo inicial foi comparar as duas abordagens classicas encontradas na literatura para
modelar series de retornos provenientes de series reais. Foram realizados experimentos
utilizando a lei de potencia (Equacao 2.4) e a funcao exponencial (Equacao 3.8). Para a
comparacao, 17 ındices economicos mundiais com registros diarios foram analisados numa
pequena janela de observacoes, de Janeiro de 2008 a Janeiro de 2010.
49
Tabela 4.4: Erros de ajuste (MSE) em escala semi-log e log-log.
Indices Volatilidades Least Squares Trust Region Levenberg-Marquardt Coeficiente B(Paıses) dos ındices Log-log Semi-log Log-log Semi-log Log-log Semi-log B (LS) B (TR) B (LM)SSEC 1,1041 0,3182 0,0064 0,3182 0,0064 0,3182 0,0064 0,8875 0,8875 0,8875OMX 1,0767 0,2517 0,0069 0,2517 0,0069 0,2517 0,0069 0,9316 0,9316 0,9316OSEAX 1,0653 0,2909 0,0303 0,2909 0,0303 0,2909 0,0303 0,7874 0,7874 0,7874BseSensex 1,0650 0,4244 0,0042 0,4244 0,0042 0,4244 0,0042 0,9448 0,9448 0,9448MIB 1,0055 0,2284 0,0392 0,2284 0,0392 0,2284 0,0392 0,8078 0,8078 0,8078IBEX 35 1,0054 0,2436 0,0116 0,2436 0,0116 0,2436 0,0116 0,9559 0,9559 0,9559STI 1,0021 0,2462 0,0093 0,2462 0,0093 0,2462 0,0093 0,9003 0,9003 0,9003GSPTSE 0,9812 0,2422 0,0279 0,2422 0,0279 0,2422 0,0279 0,8274 0,8274 0,8274IPC 0,9772 0,2500 0,0123 0,2500 0,0123 0,2500 0,0123 0,8786 0,8786 0,8786CAC 40 0,9677 0,1934 0,0106 0,1934 0,0106 0,1934 0,0106 0,9841 0,9841 0,9841Nikkei 225 0,9663 0,2521 0,0250 0,2521 0,0250 0,2521 0,0250 0,8844 0,8844 0,8844FTSE 100 0,9599 0,2253 0,0432 0,2253 0,0432 0,2253 0,0432 0,9300 0,9300 0,9300Merval 0,9597 0,2653 0,0182 0,2653 0,0182 0,2653 0,0182 0,8771 0,8771 0,8771Kospi 0,9367 0,2257 0,0292 0,2257 0,0292 0,2257 0,0292 0,8613 0,8613 0,8613Djia 0,9283 0,2240 0,0427 0,2240 0,0427 0,2240 0,0427 0,9500 0,9500 0,9500S&P 500 0,9181 0,2270 0,0174 0,2270 0,0174 0,2270 0,0174 0,8547 0,8547 0,8547Dax 30 0,9130 0,2244 0,0305 0,2244 0,0305 0,2244 0,0305 0,8629 0,8629 0,8629
50
Resultados semelhantes aos que sao expostos aqui foram publicados no periodico Phy-
sica A no artigo intitulado Market Volatility Modelling for Short Time Window [132] e
apresentados no Econofis’10 [133], que foi o encontro nacional de Econofısica.
Os resultados encontrados na primeira fase dos experimentos, utilizando os tres algo-
ritmos para ajuste (LS, TR e LM), para todas as series, sao descritos na Tabela 4.4. Os
resultados estao em ordem descendente de volatilidade. Analisando os valores, os ajustes
realizados na escala semi-log obtiveram melhor resultado. Os resultados na escala semi-
log representam o ajuste da funcao exponencial. Na escala log-log, o ajuste representa a
lei de potencia.
0 0.5 1 1.5 2 2.5 3 3.5 4
−3
−2
−1
0
Intervalos de Retorno
Ibe
x 3
5 (
fdp
)
(a) Ajuste Linear (Funcao Exponencial).
−4 −3 −2 −1 0 1
−3
−2
−1
0
Intervalos de Retorno
Ibe
x 3
5 (
fdp
)
(b) Ajuste Linear (Lei de Potencia).
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
−4
−3
−2
−1
0
Intervalos de Retorno
BS
E S
en
se
x (
fdp
)
(c) Ajuste Linear (Funcao Exponencial).
−4 −3 −2 −1 0 1
−4
−3
−2
−1
0
Intervalos de Retorno
BS
E S
en
se
x (
fdp
)
(d) Ajuste Linear (Lei de Potencia).
Figura 4.8: Ajuste linear nas escalas log-log e semi-log, usando o algoritmo LS. (a-b)Indice Ibex 35 (Espanha). (c-d) Indice BSE Sensex (India). Os pontos escuros sao a fdpdos ındices e a linha cinza e o ajuste linear
Na Figura 4.8 podem ser vistos dois exemplos de ajustes nas escalas semi-log e log-log.
Os pontos escuros representam a fdp dos dados e a linha cinza corresponde ao ajuste. Na
escala semi-log, ha uma melhor aderencia aos dados porque a curva que corresponde a
funcao exponencial se ajusta a todas regioes da fdp, perdendo apenas o final da cauda. Na
escala log-log, a aderencia linear e pobre porque o ajuste foi realizado em todo intervalo
51
de dados e nao so na cauda. Quando o fitting e realizado apenas na cauda, os resultados
encontrados na literatura [71, 73, 74, 88] mostram que o ajuste linear que corresponde a
lei de potencia e uma boa escolha.
0 0.5 1 1.5 2 2.5 3 3.5 4
10−1
100
Intervalos de Retorno
Ibe
x 3
5 (
fdp
)
(a) Funcao Exponencial.
0 0.5 1 1.5 2 2.5 3 3.5 4
10−1
100
Intervalos de Retorno
Ibe
x 3
5 (
fdp
)
(b) Lei de Potencia.
0 0.5 1 1.5 2 2.5 3 3.5 4 4.510
−2
10−1
100
Intervalos de Retorno
BS
E S
en
sex
(fd
p)
(c) Funcao Exponencial.
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
10−1
100
Intervalos de Retorno
BS
E S
en
sex
(fd
p)
(d) Lei de Potencia.
Figura 4.9: Ajustes com lei de potencia e funcao exponencial, usando o algoritmo TrustRegion na escala semi-log. (a-b) Indice Ibex 35 (Espanha). (c-d) Indice BSE Sensex(India). A linha preta e a fdp dos ındices e a linha cinza e o ajuste.
Na segunda bateria de simulacoes, a distribuicao exponencial e as leis de potencia
foram usadas diretamente aos dados. Nessa parte foram utilizados tres algoritmos (TR,
LM e MLE), como mostrado na Tabela 4.5. Os resultados estao em ordem decrescente
de volatilidade. Na Tabela 4.5 pode ser visto que a distribuicao exponencial obteve um
melhor ajuste aos dados do que a lei de potencia. Nesse caso, a funcao exponencial aderiu
a todas as regioes da fdp dos retornos dos ındices, perdendo um pouco do ajuste no final
da cauda. Esse comportamento acontece devido a caracterıstica da funcao exponencial
de se ajustar ao comportamento medio da curva sob estudo, perdendo um pouco o ajuste
nos extremos. Para o algoritmo TR, a diferenca entre as abordagens foi em torno de uma
ordem de grandeza. Com o algoritmo LM, a funcao exponencial aderiu melhor aos dados
em todos os ındices analizados. Os resultados obtidos com o algoritmo MLE mostrou que
todos os ındices tambem sao melhor ajustados pela funcao exponencial.
52
Tabela 4.5: Erros de ajuste (MSE e verossimilhanca) usando leis de potencia e distribuicoes exponenciais.
Indices Volatilidades Trust Region MLE Levenberg-Marquardt Coeficiente B(Paıses) dos ındices Lei de Potencia Exponencial Lei de Potencia Exponencial Lei de Potencia Exponencial B (TR) B (LM) B (MLE)SSEC 1,1041 0,00026 0,00006 -224,19 -555,5 0,00089 0,00006 0,9070 0,9037 0,9146OMX 1,0767 0,01503 0,00068 -215,17 -545,2 0,01860 0,00112 0,9892 0,9614 0,9334OSEAX 1,0653 0,00037 0,00031 -200,65 -541,4 0,00060 0,00031 0,9848 0,9848 0,9403Bse Sensex 1,065 0,00114 0,00011 -203,97 -513,7 0,00169 0,00011 0,9448 0,9448 0,9928MIB 1,0055 0,00121 0,00039 -175,07 -513,4 0,00067 0,00039 1,0240 1,0240 0,9934IBEX 35 1,0054 0,00103 0,00013 -183,36 -515,9 0,00102 0,00013 1,0270 1,0270 0,9962STI 1,0021 0,00147 0,00011 -241,79 -510,7 0,00147 0,00011 0,9966 0,9966 1,0064GSPTSE 0,9812 0,00003 0,00001 -187,12 -501,0 0,00007 0,00001 1,0340 1,0340 1,0255IPC 0,9772 0,00047 0,00034 -235,28 -498,4 0,00101 0,00034 1,0540 1,0540 1,0308CAC 40 0,9677 0,00160 0,00018 -173,07 -498,1 0,00123 0,00018 1,0690 1,0690 1,0314Nikkei 0,9663 0,00024 0,00013 -217,01 -489,7 0,00072 0,00013 1,0580 1,0580 1,0406FTSE 0,9599 0,00071 0,00022 -215,51 -492,0 0,00071 0,00022 1,0660 1,0660 1,0437Merval 0,9597 0,00058 0,00017 -312,87 -485,2 0,00107 0,00017 1,0370 1,0370 1,0499Kospi 0,9367 0,00084 0,00014 -170,61 -477,3 0,00065 0,00014 1,0820 1,0820 1,0740Djia 0,9283 0,00061 0,00012 -215,83 -474,1 0,00061 0,00012 1,0570 1,0570 1,0807S&P 500 0,9181 0,00083 0,00018 -174,47 -468,4 0,00064 0,00018 1,0720 1,0720 1,0929Dax 0,9130 0,00123 0,00031 -147,77 -460,7 0,00067 0,00031 1,1280 1,1280 1,1016
53
Nas Figuras 4.9, 4.10, 4.11 and 4.12 sao mostrados exemplos dos ajustes gerados
com a funcao exponencial e a lei de potencia, onde os pontos escuros sao os dados ex-
perimentais e a linha cinza e o ajuste. A funcao exponencial adere melhor a funcao
densidade de probabilidade dos ındices, porque o ajuste e realizado em toda a extensao
da fdp. Entretanto, se apenas a cauda dos dados e considerada, o ajuste utilizando as
leis de potencia descreve bem essa regiao da fdp como afirmado pelo trabalho de Matia et
al. [77], etc [71, 73, 74, 88].
10−2
10−1
100
10−1
100
Intervalos de Retorno
Ibe
x 3
5 (
fdp
)
(a) Funcao Exponencial.
10−2
10−1
100
10−1
100
Intervalos de Retorno
Ibe
x 3
5 (
fdp
)
(b) Lei de Potencia.
10−2
10−1
100
10−2
10−1
100
Intervalos de Retorno
BS
E S
en
se
x (
fdp
)
(c) Funcao Exponencial.
10−2
10−1
100
10−2
10−1
100
Intervalos de Retorno
BS
E S
en
se
x (
fdp
)
(d) Lei de Potencia.
Figura 4.10: Ajustes com lei de potencia e funcao exponencial, usando o algoritmo TrustRegion na escala log-log. (a-b) Indice Ibex 35 (Espanha). (c-d) Indice BSE Sensex(India). A linha preta e a fdp dos ındices e a linha cinza e o ajuste.
Nos resultados encontrados, a funcao exponencial descreve melhor a funcao densidade
de probabilidade dos ındices financeiros do que a lei de potencia. Contudo, o resultado
mais interessante e o relacionamento entre o coeficiente B da funcao exponencial e a
volatilidade dos ındices financeiros. Como visto na Secao 4.1.1 que mostrou os resultados
do modelo artificial proposto, o coeficiente B pode corresponder a uma medida de tem-
peratura do mercado. Dessa forma, existe uma relacao inversamente proporcional entre
a volatilidade do mercado e o coeficiente B. Esta relacao foi encontrada neste traba-
54
0 0.5 1 1.5 2 2.5 3 3.5 4
10−1
100
Intervalos de Retorno
Ibe
x 3
5 (
fdp
)
(a) Funcao Exponencial.
0 0.5 1 1.5 2 2.5 3 3.5 4
10−1
100
Intervalos de Retorno
Ibe
x 3
5 (
fdp
)
(b) Lei de Potencia.
0 0.5 1 1.5 2 2.5 3 3.5 4 4.510
−2
10−1
100
Intervalos de Retorno
BS
E S
en
se
x (
fdp
)
(c) Funcao Exponencial.
0 0.5 1 1.5 2 2.5 3 3.5 4 4.510
−2
10−1
100
Intervalos de Retorno
BS
E S
en
se
x (
fdp
)
(d) Lei de Potencia.
Figura 4.11: Ajustes com lei de potencia e funcao exponencial, usando a Estimacao porMaxima Verossimilhanca na escala semi-log. (a-b) Indice Ibex 35 (Espanha). (c-d) IndiceBSE Sensex (India). A linha preta e a fdp dos ındices e a linha cinza e o ajuste.
lho e corrobora a analogia desenvolvida no Capıtulo 3 e nos resultados da Secao 4.1.1.
Os resultados podem ser observados nas Tabelas 4.4 e 4.5 e a relacao e mostrada na
Figura 4.13.
Os dados que podem ser vistos na Figura 4.14 confirmam a relacao encontrada na
Equacao 3.11 descrita no Capıtulo 3. Nesta figura, observa-se que B ·V olatilidade tende
a ser uma constante, assim como encontrado nas series artificiais. Essa medida de propor-
cionalidade entre o coeficiente B e a volatilidade corresponde a constante de Boltzmann
da estatıstica de Maxwell-Boltzmann (Equacao 3.9). Nos experimentos, o valor medio
encontrado foi de 0, 88 ± 0, 1 para o algoritmo LS, 1, 02 ± 0, 04 para o algoritmo TR,
1, 02± 0, 04 para o algoritmo LM e 1, 01± 0, 01 para o algoritmo MLE.
Os resultados mostram que a teoria de Maxwell-Boltzmann pode ser valida para
descrever a fdp da serie de retornos de ındices reais, assim como no modelo artificial.
Assim, o sistema de mercado poderia ser tratado como um sistema de gas ideal [108].
Os experimentos realizados corroboram a relacao entre o coeficiente B e a volatilidade
55
10−2
10−1
100
10−1
100
Intervalos de Retorno
Ibe
x 3
5 (
fdp
)
(a) Funcao Exponencial.
10−2
10−1
100
10−1
100
Intervalos de Retorno
Ibe
x 3
5 (
fdp
)
(b) Lei de Potencia.
10−2
10−1
100
10−2
10−1
100
Intervalos de Retorno
BS
E S
en
se
x (
fdp
)
(c) Funcao Exponencial.
10−2
10−1
10010
−2
10−1
100
Intervalos de Retorno
BS
E S
en
se
x (
fdp
)
(d) Lei de Potencia.
Figura 4.12: Ajustes com lei de potencia e funcao exponencial, usando a Estimacao porMaxima Verossimilhanca na escala log-log. (a-b) Indice Ibex 35 (Espanha). (c-d) IndiceBSE Sensex (India). A linha preta e a fdp dos ındices e a linha cinza e o ajuste.
mostrada no Capıtulo 3. Assim, o risco financeiro de um determinado mercado ao longo
de um perıodo de tempo especificado pode ser quantificado pela volatilidade ou pelo
coeficiente B. Em outras palavras, eles medem a instabilidade/flutuacao dos mercados.
4.2.2 Analise em Diversas Janelas de Tempo
O primeiro questionamento proveniente dos experimentos realizados com a janela de dois
anos de ındices reais foi se o comportamento ocorria devido a pequena janela de tempo
utilizada, ja que geralmente as analises encontradas na literatura abordam janelas de
tempo maiores. Uma hipotese seria o fato de a abordagem proposta ter sido aplicada
a dados referentes a dois anos, desprezando informacoes de longo prazo. Assim, novos
experimentos foram realizados a fim de conhecer as limitacoes da metodologia proposta.
Para isso, novas simulacoes foram feitas utilizando series de 15 ındices mundiais em cinco
janelas diferentes de tempo, contendo um, dois, cinco, dez e quinze anos.
56
2 4 6 8 10 12 14 160.8
1
1.2
1.4
1.6
1.8
2
Índices
Am
pli
tud
es
(a) Least Squares.
2 4 6 8 10 12 14 160.8
1
1.2
1.4
1.6
1.8
2
Índices
Am
pli
tud
es
(b) Trust Region.
2 4 6 8 10 12 14 160.8
1
1.2
1.4
1.6
1.8
2
Índices
Am
pli
tud
es
(c) Levenberg-Marquardt.
2 4 6 8 10 12 14 160.8
1
1.2
1.4
1.6
1.8
2
Índices
Am
pli
tud
es
(d) Maximum Likelihood Estimation.
Figura 4.13: Relacao entre a volatilidade e o coeficiente B: (a)Least Squares, (b) TrustRegion, (c) Levenberg-Marquardt e (d) Maximum Likelihood Estimation. Nos graficos, ospontos sao as volatilidades dos ındices financeiros e as estrelas sao os coeficientes B dosındices.
O procedimento foi o mesmo utilizado nos experimentos anteriores, contudo, o al-
goritmo usado para ajustar a curva aos pontos da fdp foi o Trust Region, que obteve
melhores resultados nos ajustes realizados anteriormente.
Nas Tabelas 4.6, 4.7, 4.8, 4.9 e 4.10 pode ser visto que a funcao exponencial se ajusta
melhor a fdp das series de retorno na grande maioria dos ındices em todas janelas de
tempo abordadas. Nessas tabelas os ındices estao na ordem decrescente de volatilidade.
A Figura 4.15 mostra que existe uma relacao entre o coeficiente B e a volatilidade nao so
para o janelas menores (um e dois anos), mas tambem para janelas maiores (cinco, dez e
quinze anos).
Para todas as janelas analisadas foi encontrado um valor medio constante, quando o
produto foi feito entre o coeficente B e a volatilidade. Os valores medios encontrados, que
podem ser vistos na Figura 4.16, foram de 1, 16±0, 1 para um ano, 1, 01±0, 03 para dois
anos, 1, 01± 0, 03 para cinco anos, 1, 02± 0, 03 para dez anos e 1, 02± 0, 03 para quinze
57
2 4 6 8 10 12 14 160
0,5
1
1,5
2
Índices
Vo
lati
lid
ad
e*C
oe
ficie
nte
B
(a) Least Squares.
2 4 6 8 10 12 14 160
0.5
1
1.5
2
Índices
Vo
lati
lid
ad
e*C
oe
ficie
nte
B
(b) Trust Region.
2 4 6 8 10 12 14 160
0.5
1
1.5
2
Índices
Vo
lati
lid
ad
e*C
oe
ficie
nte
B
(c) Levenberg-Marquardt.
2 4 6 8 10 12 14 160
0.5
1
1.5
2
Índices
Vo
lati
lid
ad
e*C
oe
ficie
nte
B
(d) Maximum Likelihood Estimation.
Figura 4.14: Relacionamento entre a volatilidade e o coeficiente B calculado por ((a)LeastSquares, (b) Trust Region, (c) Levenberg-Marquardt e (d) Maximum Likelihood Estima-tion). Nos graficos, os pontos sao o resultado do produto B ·V olatilidade e a linha solidae o valor medio desses valores.
anos. Pelos resultados, percebe-se que houve uma maior variacao do produto (coeficiente
B e volatilidade) no conjunto de dados compostos por observacoes de um ano.
Desse modo, a analogia pode ser usada nao so para pequenas janelas, ja que mesmo
para grandes janelas a funcao exponencial pode ser melhor ajustada a fdp do que as leis
de potencia. A relacao entre o coeficiente B e a volatilidade e valida para todas as janelas
abordadas.
4.2.3 Aplicacao da Metodologia Proposta para Classificacao de Paıses Desenvol-
vidos e em Desenvolvimento
Diversas propostas para classificacao ou agrupamento de paıses [134] sao publicadas anu-
almente por instituicoes, tais como Banco Mundial e Organizacao das Nacoes Unidas.
Essas publicacoes tem o objetivo de medir o desempenho ou grau de desenvolvimento dos
paıses, a partir de indicadores economicos, demograficos, de saude, culturais e educaci-
58
Tabela 4.6: Erro de ajuste (MSE) no perıodo de um ano.
Perıodo de um ano
Indices MSE Exponencial(Paıses) Volatilidade Lei de Potencia Exponencial Coeficiente BATX 1,275 0,00125 0,00011 0,910
Hang Seng 1,251 0,00029 0,00017 1,026Ibex 35 1,218 0,00023 0,00014 1,022
Nikkei 225 1,155 0,00026 0,00012 1,059CAC 40 1,141 0,00021 0,00021 1,055DAX 30 1,140 0,00024 0,00031 1,102FTSE 100 1,105 0,00025 0,00022 1,067
Ibov 1,095 0,00025 0,00024 1,080SMI 1,089 0,00020 0,00027 1,052STI 1,084 0,00127 0,00011 1,050IPC 1,080 0,00047 0,00034 1,100DJIA 1,031 0,00018 0,00012 1,102Nasdaq 1,028 0,00113 0,00002 0,990S&P500 1,022 0,00021 0,00018 1,105KLSE 0,558 0,00016 0,00009 1,541
Tabela 4.7: Erro de ajuste (MSE) no perıodo de dois anos.
Perıodo de dois anos
Indices MSE Exponencial(Paıses) Volatilidade Lei de Potencia Exponencial Coeficiente BATX 1,096 0,00123 0,00011 0,964
Hang Seng 1,012 0,00029 0,00017 1,026Ibex 35 1,005 0,00091 0,00011 1,027STI 1,002 0,00140 0,00011 0,997IPC 0,977 0,00047 0,00034 1,054
CAC 40 0,968 0,00124 0,00014 1,069Nasdaq 0,967 0,00101 0,00002 0,973
Nikkei 225 0,966 0,00025 0,00013 1,058SMI 0,962 0,00020 0,00027 1,052
FTSE 100 0,960 0,00075 0,00023 1,066DJIA 0,928 0,00064 0,00013 1,057
Ibovespa 0,926 0,00025 0,00024 1,080S&P500 0,918 0,00087 0,00019 1,072DAX 30 0,913 0,00128 0,00032 1,128KLSE 0,726 0,00016 0,00009 1,421
onais dos paıses. Em geral, a tarefa de agrupar ou classificar paıses considera diversos
aspectos, dentre os quais podem ser destacados os de cunho economico [127,128,135] ou
social [136]. As propostas encontradas na literatura [2, 3, 4, 5] levam em consideracao
varios indicadores, tornando onerosa, complexa e imprecisa a tarefa de classificacao. Ge-
ralmente, as propostas focam criterios economicos, como a renda per capita, produto in-
terno bruto (PIB), nıvel de industrializacao, situacao economica e outros fatores [128,135].
No entanto, outras medidas tambem foram propostas [136], dentre elas, a mais famosa
e o Indice de Desenvolvimento Humano (IDH), que combina medidas economicas com
outros indicadores, como ındices de expectativa de vida e educacao (taxa de escolaridade
e alfabetizacao).
Ainda que existam controversias e heterogeneidade nesse cenario, a classificacao de
59
Tabela 4.8: Erro de ajuste (MSE) no perıodo de cinco anos.
Perıodo de cinco anos
Indices MSE Exponencial(Paıses) Volatilidade Lei de Potencia Exponencial Coeficiente B
IPC 1,004 0,00094 0,00026 1,039Ibovespa 0,995 0,00018 0,00016 1,036ATX 0,927 0,00019 0,00015 1,103STI 0,904 0,00017 0,00040 1,099
Nikkei 225 0,891 0,00020 0,00028 1,122SMI 0,890 0,00022 0,00010 1,147
Nasdaq 0,886 0,00017 0,00020 1,147Dax 0,881 0,00024 0,00009 1,144CAC 0,878 0,00022 0,00020 1,162
Ibex 35 0,876 0,00016 0,00015 1,160FTSE 0,859 0,00021 0,00025 1,198
Hang Seng 0,856 0,00017 0,00011 1,082DJIA 0,807 0,00018 0,00017 1,234
S&P 500 0,786 0,00017 0,00055 1,279KLSE 0,757 0,00077 0,00022 1,356
Tabela 4.9: Erro de ajuste (MSE) no perıodo de dez anos.
Perıodo de dez anos
Indices MSE Exponencial(Paıses) Volatilidade Lei de Potencia Exponencial Coeficiente BIbovespa 1,104 0,00031 0,00003 1,018
IPC 1,014 0,00021 0,00013 1,011Nikkei 225 1,009 0,00023 0,00011 0,999Ibex 35 1,000 0,00063 0,00005 1,005DAX 30 0,986 0,00019 0,00008 1,006CAC 40 0,980 0,00020 0,00009 1,036Nasdaq 0,974 0,00021 0,00005 1,007STI 0,971 0,00023 0,00009 1,041SMI 0,948 0,00020 0,00013 1,075
FTSE 100 0,944 0,00022 0,00012 1,074Hang Seng 0,924 0,00022 0,00003 1,053
DJIA 0,920 0,00021 0,00010 1,092S&P500 0,907 0,00018 0,00012 1,105ATX 0,877 0,00018 0,00032 1,181KLSE 0,866 0,00018 0,00011 1,186
paıses e importante, tendo em vista sua relevancia para a adocao de polıticas publicas
e de metas a serem alcancadas no que diz respeito a qualidade de vida da populacao.
Devido a globalizacao e internacionalizacao dos mercados, as classificacoes mais tradici-
onais [127, 128, 135], de forma geral, agrupam os paıses em dois grupos, desenvolvidos e
em desenvolvimento.
Desse modo, a classificacao dos paıses e uma tarefa complexa, uma vez que depende de
diversas variaveis. Este trabalho propoe uma metodologia para o agrupamento de paıses
baseada na analogia com a teoria de gas ideal, levando em consideracao a analise da funcao
densidade de probabilidade (fdp) da serie de retornos de ındices financeiros. A principal
contribuicao da abordagem proposta e o agrupamento de paıses usando apenas duas
caracterısticas (o coeficiente B e a volatilidade), as quais descrevem o comportamento dos
60
respectivos mercados em conformidade com a teoria de gas ideal. A classificacao e baseada
na distancia mınima para o centroide de cada possıvel classe. O centroide da classe dos
paıses desenvolvidos e o da classe dos paıses em desenvolvimento sao obtidos com o
algoritmo K-means [44, 137]. A seguir serao descritas alguns criterios de classificacao de
organizacoes tradicionais.
A metodologia proposta sera usada para agrupar paıses a partir da analise da funcao
densidade de probabilidade (fdp) da serie de retornos de 34 ındices financeiros mundiais,
mencionados na Secao 4.0.1. A ideia e construir clusters de paıses usando apenas o
coeficiente B e a volatilidade, que sao caracterısticas de sensibilidade do mercado, que
descrevem o comportamento do mercado de cada paıses. Um dos pontos interessantes de
se utilizar essa abordagem e que ela nao depende de nenhum algoritmo de agrupamento
especıfico, podendo ser testado qualquer metodo para essa tarefa. A seguir serao descritos
alguns criterios de classificacao de organizacoes tradicionais.
4.2.4 Classificacao de Paıses de Acordo com Organizacoes Internacionais
Entre varias classificacoes desenvolvidas pelas diversas instituicoes, existem algumas di-
vergencias. Por exemplo, o Fundo Monetario Internacional (FMI) identifica 34 paıses
como economias avancadas, enquanto o Banco Mundial (BM) identifica 66 paıses de alta
renda. Os criterios para definir essas listas sao muitas vezes subjetivos e controversos.
Classificacao de Acordo com o Fundo Monetario Internacional (FMI)
Tabela 4.10: Erro de ajuste (MSE) no perıodo de quinze anos.
Perıodo de quinze anos
Indices MSE Exponencial(Paıses) Volatilidade Lei de Potencia Exponencial Coeficiente BNikkei 1,030 0,00018 0,00024 0,981CAC 40 1,009 0,00021 0,00009 1,020Ibex 35 1,005 0,00020 0,00006 1,016DAX 30 0,993 0,00020 0,00008 1,003IPC 0,988 0,00035 0,00011 1,036
Nasdaq 0,974 0,00021 0,00006 1,024SMI 0,971 0,00021 0,00005 1,049
FTSE 100 0,963 0,00021 0,00014 1,056Ibovespa 0,963 0,00020 0,00012 1,075DJIA 0,937 0,00014 0,00036 1,077STI 0,933 0,00020 0,00006 1,087
S&P500 0,919 0,00026 0,00009 1,098Hang Seng 0,903 0,00020 0,00010 1,089
ATX 0,899 0,00018 0,00010 1,151KLSE 0,706 0,00021 0,00012 1,480
61
2 4 6 8 10 12 14
0.6
0.7
0.8
0.9
1
1.1
1.2
1.3
1.4
Índices
Am
pli
tud
es
(a) Um ano.
2 4 6 8 10 12 14
0.8
0.9
1
1.1
1.2
1.3
1.4
Índices
Am
pli
tud
es
(b) Dois anos.
2 4 6 8 10 12 14
0.8
0.9
1
1.1
1.2
1.3
1.4
Índices
Am
pli
tud
es
(c) Cinco anos.
2 4 6 8 10 12 14
0.9
1
1.1
1.2
Índices
Am
pli
tud
es
(d) Dez anos.
2 4 6 8 10 12 14
0.8
0.9
1
1.1
1.2
1.3
1.4
Índices
Am
pli
tud
es
(e) Quinze anos.
Figura 4.15: Relacionamento entre a volatilidade e o coeficiente B calculado para asjanelas de tempo de: (a) 1 ano, (b) 2 anos, (c) 5 anos, (d) 10 anos e (e) 15 anos.Nos graficos, os pontos sao as volatilidades dos ındices financeiros e as estrelas sao oscoeficientes B dos ındices.
O FMI publica um relatorio chamado World Economic Outlook [128] duas vezes por
ano. A pesquisa e realizada pelo corpo tecnico do FMI e apresenta a evolucao da eco-
nomia global, mostrando uma visao geral e uma analise detalhada da economia global.
Basicamente, as questoes discutidas cobrem campos que afetam os paıses industrializados
e paıses em desenvolvimento. A classificacao publicada divide o mundo em dois grandes
62
2 4 6 8 10 12 140
0,5
1
1,5
2
Índices
Vo
lati
lid
ad
e*C
oe
ficie
nte
B
(a) Um ano.
2 4 6 8 10 12 140
0.5
1
1.5
2
Índices
Vo
lati
lid
ad
e*C
oe
ficie
nte
B
(b) Dois anos.
2 4 6 8 10 12 140
0.5
1
1.5
2
Índices
Vo
lati
lid
ad
e*C
oe
ficie
nte
B
(c) Cinco anos.
2 4 6 8 10 12 140
0.5
1
1.5
2
Índices
Vo
lati
lid
ad
e*C
oe
ficie
nte
B
(d) Dez anos.
2 4 6 8 10 12 140
0.5
1
1.5
2
Índices
Vo
lati
lid
ad
e*C
oe
ficie
nte
B
(e) Quinze anos.
Figura 4.16: Relacionamento entre a volatilidade e o coeficiente B calculado para as jane-las de tempo de: (a) 1 ano, (b) 2 anos, (c) 5 anos, (d) 10 anos e (e) 15 anos. Nos graficos,os pontos sao as volatilidades dos ındices financeiros e as estrelas sao os coeficientes Bdos ındices. Nos graficos, os pontos sao o resultado do produto B ·V olatilidade e a linhasolida e o valor medio desses valores.
grupos: as economias avancadas e os paıses em desenvolvimento (este grupo inclui as
economias emergentes e paıses pobres).
O agrupamento de paıses e baseado em diversas caracterısticas economicas, tais como
taxas de cambio, taxas de juros, impostos, crescimento e PIB. Outros dados relacionados
com o comercio exterior e dados fiscais tambem sao listadas, bem como informacoes sobre
63
taxa de desemprego e taxa de emprego. Assim, os grupos definidos pelo FMI nao levam
em conta fatores sociais, como educacao e expectativa de vida, por exemplo.
Classificacao de Acordo com o Banco Mundial (BM)
Geralmente, o Banco Mundial [135] usa o rendimento nacional bruto (RNB) per capita,
que e tambem referido como o produto nacional bruto (PNB), como principal criterio para
classificar as economias. Com base nesses dados, toda economia e classificada como de
baixa renda, de renda media (subdividida em media baixa e media alta), ou de alta renda.
A classificacao do Banco Mundial tambem pode ser dividida em economias em de-
senvolvimento e desenvolvidas. Assim, as economias de baixa renda e media renda sao
referidas como economias em desenvolvimento. Essa nomenclatura e interessante por-
que outras organizacoes internacionais tambem a usam, como ONU e FMI, facilitando
a comparacao entre as organizacoes. No entanto, o problema dessa classificacao e que
nem todas as economias neste grupo tem o mesmo nıvel de desenvolvimento, ja que a
classificacao por renda nem sempre reflete, necessariamente, o status de desenvolvimento
de um paıs.
Classificacao de acordo com a Organizacao das Nacoes Unidas (ONU)
A Organizacao das Nacoes Unidas utiliza duas classificacoes: uma classificacao base-
ada nos dados do FMI e do Banco Mundial e outra utilizando dados sociais calculados
a partir de ındices de riqueza, educacao e qualidade de vida, em geral. A classificacao
economica e muito semelhante a do FMI, enquanto a classificacao social estimada pela
ONU e determinada pelo Indice de Desenvolvimento Humano [136].
Indice de Desenvolvimento Humano (IDH)
Tradicionalmente, as classificacoes desenvolvidas por agencias internacionais dao um
grande peso aos aspectos economicos. O Indice de Desenvolvimento Humano das Nacoes
Unidas e uma medida estatıstica que tenta estimar o nıvel de desenvolvimento humano
de um paıs. Essa metrica considera tres dimensoes: riqueza, educacao e esperanca de
vida da populacao. Esse ındice e uma medida comparativa, e tem como objetivo estimar
o bem-estar da populacao.
A ONU indica que as estimativas do IDH tem o foco nas polıticas centradas nas
pessoas, em vez do PIB per capita, por exemplo. O PIB mede o desempenho do paıs
em valor de mercado de todos os bens e servicos finais produzidos num paıs durante
um determinado perıodo. Embora haja alguma correlacao entre o IDH e uma economia
prospera, nao necessariamente os paıses mais ricos tem o maior IDH. No entanto, em geral,
os paıses classificados como desenvolvidos tem um Indice de Desenvolvimento Humano
64
elevado.
4.2.5 Algoritmo Proposto para a Classificacao de Paıses
As metodologias apresentadas para classificacao dos paıses utilizam dados diferentes para
agrupar um paıs. Assim, independente do metodo utilizado, todos eles sao baseados em
varias caracterısticas para agrupar paıses em blocos. Assim, o reconhecimento de padroes
torna-se difıcil, devido a quantidade de dados e a complexidade das caracterısticas. Mui-
tas dessas caracterısticas sao ındices dependentes de outros calculos, onde se podem
conter erros, imprecisoes ou que necessite da depedencia de especialistas humanos. Seria
interessante ter um metodo ou uma metodologia para agrupamento de paıses, que nao
precisasse de varias caracterısticas ou do julgamento humano.
A ideia e definir a temperatura para um determinado mercado, semelhante a tempe-
ratura de um gas. Para isso, a analogia com a Estatıstica Maxwell-Boltzmann e utilizada.
As acoes das empresas que sao negociadas pelos investidores podem ser comparadas com
partıculas de um gas ideal na distribuicao de Maxwell-Boltzmann. Assim, a temperatura
de um gas ideal pode estar relacionada com a volatilidade do mercado. Assim, a maior
temperatura leva a uma maior volatilidade e menor temperatura do sistema economico
leva a menor volatilidade do mercado. Essa analogia pode ser utilizada para agrupar
paıses com base apenas na volatilidade e no coeficiente B dos ındices mundiais.
O primeiro passo e o mesmo descrito na Secao 3.2.2 no Capıtulo 3, gerando os dois
atributos que descrevem o comportamento dos respectivos mercados em conformidade
com a teoria de gas ideal. Na segunda etapa, a partir da analogia com o gas, um algoritmo
e utilizado para agrupar os dados (coeficiente B e volatilidade). Mais precisamente,
os dois atributos compoem os vetores de caracterısticas: a volatilidade e o coeficiente
B. Usando um conjunto de treinamento composto por um vetor bidimensional, um
algoritmo de agrupamento e aplicado, a fim de encontrar dois centroides - como mostrado
na Figura 4.20, um representante para os paıses desenvolvidos e outro para os paıses
em desenvolvimento: c1 e o vetor centroide ou representante para a classe de paıses
desenvolvidos e c2 e o centroide para a classe de paıses em desenvolvimento. Vale ressaltar
que qualquer algoritmo de agrupamento pode ser aplicado para a obtencao de c1 e c2.
Contudo nesse trabalho, o algoritmo K-means foi utilizado. Apos esse procedimento, a
classificacao e uma tarefa facil e de baixo custo computacional - e feita simplesmente com
base na distancia mınima, ou seja, buscando o centroide mais proximo. Seja x um paıs
para ser classificado, d(x, ci) e a distancia entre x e ci. Se d(x, c1) < d(x, c2), entao x e
classificado como um paıs desenvolvido. Caso contrario, x e classificado como um paıs
65
em desenvolvimento.
A validacao cruzada utilizando o metodo leave-one-out foi usada nos experimentos. O
algoritmo K-means foi usado para agrupar os dados em dois grupos (K = 2). A medida
de distancia implementada para agrupar os dados foi a distancia euclidiana quadratica.
Os recursos usados para agrupar os paıses foram apenas o coeficiente B e a volatilidade,
que sao medidas de flutuacao do mercado. O desempenho da classificacao realizada foi
comparado com classificacoes tradicionais das organizacoes internacionais [127,128,135].
No entanto, estas classificacoes sao usadas somente como uma base, uma vez que entre
elas ha divergencias, tornando a comparacao uma tarefa inconclusiva. A classificacao
tambem e comparada com o IDH. Os resultados sao descritos na proxima secao.
4.2.6 Resultados para Classificacao de Paıses
Para testar a abordagem proposta, 34 ındices do mercado mundial foram analisados
no perıodo de dois anos (Janeiro de 2008 a Janeiro de 2010). Os ındices sao listados
no Capıtulo 3 na Secao 4.0.1. Dos ındices utilizados, 17 sao provenientes de mercados
desenvolvidos e 17 sao series de mercados em desenvolvimento. A metodologia utilizada
foi a mesma usada nos experimentos anteriores e o ajuste realizado nas series de retorno foi
feito utilizando a funcao exponencial e a lei de potencia. Na Tabela 4.11 sao mostrados os
erros dos ajustes para os dois conjuntos de paıses, a classificacao com base na ONU, Banco
Mundial, FMI e IDH, volatilidade e o coeficiente B. Mesmo com mercados provenientes
de paıses desenvolvidos e em desenvolvimento, a funcao exponencial se ajusta melhor que
a lei de potencia na maioria dos casos.
A relacao entre B e a volatilidade tambem corroboram a analogia descrita no Capıtulo 3
e pode ser vista na Tabela 4.11 e na Figura 4.17. Semelhante aos outros resultados,
enquanto a volatilidade decresce, o coeficente B da exponencial aumenta de valor. A
informacao mostrada na Figura 4.18 mais uma vez confirma a relacao encontrada na
Equacao 3.11. Assim, na figura observa-se que a expressao B · V olatilidade tende a uma
constante. Nos experimentos o valor medio encontrado foi de 1, 01± 0, 06.
O risco financeiro de um determinado mercado num determinado perıodo pode ser
quantificado pela volatilidade ou pelo coeficiente de B. Em outras palavras, esses atri-
butos sao medidas de instabilidade/flutuacao dos mercados. Desse modo, essas medidas
da temperatura do mercado podem ser usadas para entender o comportamento da eco-
nomia, ou de um grupo de mercados ou paıses. No entanto, um problema crıtico e a
forma de reconhecer as caracterıstas ou os dados relevantes, que podem ser usados para
agrupar paıses. Do ponto de vista financeiro, as medidas de flutuacao de mercado sao
66
Tabela 4.11: Dados dos ındices dos paıses.
Indices Volatilidades ONU - FMI Banco Mundial IDH Lei de Potencia Exponencial Coef.(Paıses) dos ındices Classificacao Classificacao 2010 MSE MSE BIGBC 1,1410 Desenvolvimento 0,689 0,00021 0,00018 0,8945IPSA 1,1290 Desenvolvimento 0,783 0,00021 0,00010 0,8994EZA 1,1270 Desenvolvimento 0,597 0,00034 0,00023 0,9221IGPA 1,1240 Desenvolvimento 0,783 0,00029 0,00023 0,9050CSI 300 1,1170 Desenvolvimento 0,663 0,00032 0,00013 0,8876SSEC 1,1041 Desenvolvimento 0,663 0,00026 0,00006 0,9070PSEI 1,0880 Desenvolvimento 0,519 0,00039 0,00029 0,9958Bse Sensex 1,0650 Paıses Desenvolvimento 0,519 0,00114 0,00011 0,9448JKSE 1,0600 em Desenvolvimento 0,600 0,00031 0,00029 0,9608KWSE 1,0561 Desenvolvimento Desenvolvido 0,771 0,00522 0,00004 0,9336SET 1,0380 Desenvolvimento 0,654 0,00081 0,00013 0,9886MXY 1,0230 Desenvolvimento 0,750 0,00048 0,00033 1,0093IPC 0,9772 Desenvolvimento 0,750 0,00047 0,00034 1,0540Merval 0,9597 Desenvolvimento 0,775 0,00058 0,00017 1,0370IBRX 50 0,9545 Desenvolvimento 0,699 0,00030 0,00024 1,0550MASI 0,9417 Desenvolvimento 0,567 0,00013 0,00005 1,0780Ibovespa 0,9258 Desenvolvimento 0,699 0,00029 0,00004 1,0800Hang Seng 1,0122 Desenvolvido 0,862 0,00029 0,00017 1,0260OMX C20 1,0110 Desenvolvido 0,866 0,00030 0,00021 1,0324MIB 1,0055 Desenvolvido 0,854 0,00121 0,00039 1,0240Ibex 35 1,0054 Desenvolvido 0,863 0,00103 0,00013 1,0270GSPTSE 0,9812 Desenvolvido 0,888 0,00003 0,00001 1,0340ISEQ 0,9698 Desenvolvido 0,895 0,00308 0,00006 1,0585CAC 40 0,9677 Desenvolvido 0,872 0,00160 0,00018 1,0690Nikkei 225 0,9663 Paıses Desenvolvido 0.884 0,00024 0,00013 1,0580SMI 0,9617 Desenvolvidos Desenvolvido 0,874 0,00020 0,00027 1,0520FTSE 100 0,9599 Desenvolvido 0,849 0,00071 0,00022 1,0660ATHEX 20 0,9592 Desenvolvido 0,855 0,00277 0,00004 1,1122ASX 200 0,9559 Desenvolvido 0,937 0,00052 0,00009 1,0838Kospi 0,9367 Desenvolvido 0,877 0,00084 0,00014 1,0820Djia 0,9283 Desenvolvido 0,902 0,00061 0,00012 1,0570S&P500 0,9181 Desenvolvido 0,902 0,00083 0,00018 1,0720Dax 30 0,9130 Desenvolvido 0,885 0,00123 0,00031 1,1280TWII 0,8935 Desenvolvido 0,868 0,00564 0,00005 1,0641
5 10 15 20 25 30
0.90
0.95
1.00
1.05
1.10
1.15
Índices
Am
pli
tud
es
Figura 4.17: Relacao entre a volatilidade e o coeficiente B no dados correspondentes adois anos. Os pontos cinzas representam a volatilidade dos ındices e os quadrados pretosrepresentam o coeficiente B.
interessantes e podem ser usadas para essa tarefa. Assim, na Figura 4.19 observa-se que
67
5 10 15 20 25 300.5
1.0
1.5
Índices
Vo
lati
lid
ade
x C
oef
icie
nte
B
Figura 4.18: Constante de proporcionalidade entre a volatilidade e o coeficiente B. Ospontos sao o produto B · V olatilidade = C e a reta e o valor medio do produto dasgrandezas.
existem grupos de mercados desenvolvidos e em desenvolvimento. Atraves desses dados,
um algoritmo para analise de agrupamentos pode ser utilizado para agrupar os mercados
mundiais.
0.9 0.95 1 1.05 1.1
0.9
0.95
1
1.05
1.1
Volatilidade
Co
efic
ien
te B
Mercados DesenvolvidosMercados em Desenvolvimento
Figura 4.19: Grafico combinando as medidas de flutuacao. O eixo x corresponde avolatilidade e o eixo y ao coeficiente B. As estrelas representam os mercados desenvolvidose os pontos representam os mercados em desenvolvimento.
Nos resultados encontrados, todos os mercados desenvolvidos foram classificados cor-
retamente. No entanto, segundo um criterio de avaliacao externo, cinco ındices provenien-
tes de paıses em desenvolvimento foram classificados incorretamente: Argentina (Merval),
Mexico (IPC), Marrocos (MASI) e Brasil (IBRX 50 e Ibovespa) foram agrupados como
paıses desenvolvidos. A taxa de acerto foi de 85, 3% comparando com as classificacoes
68
0.9 0.95 1 1.05 1.1
0.9
0.95
1
1.05
1.1
Volatilidade
Co
efic
ien
te B
Mercados DesenvolvidosMercados em DesenvolvimentoCentróides
c1
c2
Figura 4.20: Etapa de classificacao, utilizando os centroides encontrados pelo o algoritmoK-means. As estrelas representam as economias classificadas como mercados desenvolvi-dos e pontos representam as economias classificadas como mercados em desenvolvimento.As cruzes sao os centroides para cada grupo.
do FMI e das Nacoes Unidas. Quando o resultado do agrupamento foi comparado com
a classificacao do Banco Mundial, a taxa caiu para 82, 3%. Os centroides sao vistos na
Figura 4.20, nas coordenadas (1, 0640; 0, 9642) esta localizado o centroide do grupo dos
paıses em desenvolvimento e nas coordenadas (0, 9464; 1.0710) esta localizado o centroide
do grupo dos paıses desenvolvidos. Na Tabela 4.11, pode-se observar que o Kuwait tem
diferentes classificacoes, ja que para a ONU e o FMI ele e um paıs em desenvolvimento,
e para o Banco Mundial, e classificado como paıs desenvolvido. Entao, desconsiderando
o Kuwait, a taxa de acerto comparando com todas as classificacoes e 84, 8%. Assim,
comparando os resultados com a classificacao da ONU e do FMI, a taxa de acerto e
de aproximadamente 0, 5% menor quando o Kuwait e considerado, desconsiderando esse
paıs a taxa e 2, 5% superior quando compara-se o resultado com a classificacao do Banco
Mundial.
Observando a Figura 4.19 pode-se perceber que podem existir mais que dois grupos,
contudo como a base de comparacao utiliza duas classificacoes, nao foram feitos experi-
mentos com outros valores de K. Mas e possıvel que dentro dessas duas classificacoes
existam sub−classes, onde se possa restringir melhor as caracterısticas financeiras, ou
sociais do paıs.
A construcao dos grupos foi realizada baseada apenas em duas estimativas: a volati-
lidade e o coeficiente B. Quando e considerada apenas uma caracterıstica como entrada
para o K-means, por exemplo a volatilidade, a taxa de acerto diminui para 73, 5%. No
entanto, se apenas o coeficiente B for considerado, a taxa de acerto continua sendo de
69
85, 3%, o mesmo valor quando se consideram as duas caracterısticas. Dessa forma, o
coeficiente B reflete o comportamento do mercado melhor do que a volatilidade, corrobo-
rando com a hipotese da temperatura do gas ideal. Este fenomeno pode ocorrer porque
o coeficiente B pode ser menos afetado por eventos extremos nas series de retorno. Por-
tanto, nos experimentos, o coeficiente B representou melhor a temperatura dos mercados,
ou o seu grau de agitacao.
A partir dos resultados da classificacao realizada, quatro economias no perıodo ana-
lisado foram classificadas como desenvolvidas, mesmo com as crises em outros mercados.
Este resultado corrobora a estabilidade financeira desses paıses. Entre os paıses aborda-
dos neste trabalho, o Mexico foi um dos mais afetados pela crise de 2008 devido a sua
estreita relacao com os EUA. Geralmente, os mercados dos paıses desenvolvidos sao mais
estaveis e apresentam menor volatilidade nas series de retornos, sendo seu comporta-
mento mais padronizado. Por outro lado, a caracterıstica dos paıses em desenvolvimento
e ter um mercado mais volatil. No entanto, alguns paıses nos ultimos anos tem alcancado
bons resultados na sua economia, tornando o seu mercado mais estavel. Assim, e possıvel
que alguns desses mercados tenha alcancado um ambiente economico atrativo para novos
investimentos [138], como Mexico, Argentina, Brasil e Marrocos.
A tarefa de classificar os mercados mundiais e complexa, subjetiva e, geralmente,
e feita observando muitas caracterısticas. Os resultados encontrados pela metodologia
proposta utilizando a analogia dos mercados com o gas ideal, utilizando apenas duas
estimativas de flutuacao do mercado (volatilidade e coeficiente B), sao satisfatorios, uma
vez que o procedimento e simples, tendo uma taxa de acerto em torno de 84%. Os resul-
tados dessa metodologia foram apresentados no conferencia Perspectives and Challenges
in Statistical Physics and Complex Systems for the Next Decade: A Conference in Honor
of Eugene Stanley and Liacir Lucena [139] e publicados na Physica A sob o tıtulo An
ideal gas approach to classify countries using financial indices [140].
4.3 RESUMO DO CAPITULO
Neste capıtulo foram discutidos os resultados obtidos com o metodo proposto. Primei-
ramente, um mercado de acoes artificial composto por agentes foi proposto inspirado no
modelo do gas ideal. Os experimentos foram realizados com diferentes parametros e os
resultados obtidos para todas configuracoes mostraram que a analogia entre o gas ideal
e o mercado de acoes e valida.
As analises com mercados de acoes reais foram realizadas utilizando o metodo proposto
na Secao 3.2.2 do Capıtulo 3. Primeiramente, 17 ındices mundiais no perıodo de dois anos
70
(2008 − 2010) foram analisados. Nesses experimentos foram realizados ajustes lineares,
com a funcao exponencial e com a lei de potencia utilizando quatro algoritmos: Least
Squares, Trust Region, Levenberg-Marquardt e Maximum Likelihood Estimation. Alem
do ajuste com a funcao exponencial aderir melhor aos dados do que a lei de potencia,
todas as hipoteses levantadas no Capıtulo 3 tambem foram confirmadas para os dados
reais. A teoria do gas ideal, que e guiada pela Estatıstica de Maxwell-Boltzmann, pode
ser utilizada para modelar a dinamica dos mercados de acoes.
Apos a primeira bateria de experimentos com dados reais, novas simulacoes foram
realizadas com uma nova base dados. Foram utilizados 15 ındices mundiais nos perıodos
de: um ano (2009 − 2010), dois anos (2008 − 2010), cinco anos (2005 − 2010), dez anos
(2000−2010) e quinze anos (1995−2010). Para todas as janelas de tempo, a analogia com
o gas ideal e valida para descrever o comportamento dos mercados, tanto desenvolvidos
como em desenvolvimento.
A ultima etapa foi utilizar a abordagem como base para uma metodologia usada para
classificar paıses. Os resultados foram comparados com classificacoes bem estabelecidas
de orgaos internacionais: Fundo Monetario Internacional, Organizacao das Nacoes Unidas
e Banco Mundial. A classificacao e realizada utilizando apenas duas caracterısticas de
instabilidade dos ındices financeiros (coeficiente B e volatilidade), tomando como base os
centroides das classes gerados pelo algoritmo K-means.
Desse modo, a metodologia proposta e simples, rapida, obtendo uma acuracia satis-
fatoria, quando comparada com classificacoes tradicionais. E importante salientar que
poderia ter sido usado qualquer algoritmo de agrupamento de dados, ja que a base da
metodologia fornece as caracterısticas utilizadas para agrupar paıses.
71
CAPITULO 5
CONCLUSOES
Neste capıtulo as consideracoes finais do trabalho sao apresentadas. Primeiramente, uma
breve resumo e descrito abordando o mercado artificial desenvolvido, o metodo proposto
e os resultados alcancados. Na Secao 5.2, as principais contribuicoes, praticas e teoricas,
da tese sao mostradas. As limitacoes do metodo proposto sao comentadas na Secao 5.3.
Concluindo, na Secao 5.4, alguns possıveis trabalhos futuros sao listados.
5.1 RESUMO DO TRABALHO
A analise de series temporais geralmente e tratada pela Estatıstica. Diversos mode-
los [3, 15, 16, 45] propostos na literatura assumem que as series temporais sob estudo sao
estacionarias, ou que tais series possam ser transformadas em estacionarias por algum
metodo. Assim, os modelos tradicionais sao constituıdos por processos e modelagens li-
neares. Entretanto, devido a natureza nao-linear dos sistemas que geram os fenomenos
temporais, e natural se supor que esses sistemas possuam estruturas ou relacoes nao-
lineares [14]. Outros paradigmas como os da Inteligencia Computacional tambem foram
utilizados na analise de series temporais [31–36] com sucesso, contudo, geralmente, sao
metodos voltados apenas para analise e/ou previsao, nao servindo como metodo para
explicar, avaliar, ou contextualizar o sistema gerador da serie temporal.
A Econofısica, que e uma ramificacao da Fısica, usa ferramentas da Fısica e da Es-
tatıstica para analisar e explicar problemas em Economia e Finacas. Desse modo, este
trabalho propos uma abordagem para analise de mercados financeiros baseado nas analises
e ferramentas da Econofısica. Tal metodologia aborda series temporais financeiras, utili-
zando a funcao de densidade de probabilidade das series de retorno [8, 71, 73–76].
A partir da hipotese de que a dinamica do mercado de acoes pode ser modelada por um
modelo de gas ideal, um mercado artificial inspirado nesse modelo foi desenvolvido a fim de
analisar o comportamento do mercado. A partir de um modelo em que agentes compram
e vendem acoes, que seguem um modelo Random Walk [13, 114], foi constatado que a
dinamica da funcao de densidade de probabilidade das series de retornos dos mercados
artificiais possui o mesmo comportamento que um modelo de gas ideal. Primeiramente,
72
o ajuste com a lei de potencia e com a funcao exponencial foram comparados. Foi
constatado que a distribuicao exponencial foi melhor ajustada aos dados do que as leis de
potencia, ja que a segunda distribuicao descreve bem somente a cauda da fdp das series
de retorno.
Observando a volatilidade historica e o coeficiente B (taxa de decaimento da funcao
exponencial), foi constado que existe uma relacao nao-linear entre as duas variaveis.
Quanto maior e o grau de agitacao da serie, mais volatil e o mercado e menor e o coeficiente
B. Quanto menor e o grau de agitacao ou a temperatura do mercado, menos volatil e o
mercado e maior e o coeficiente B. O produto entre o coeficiente B e a volatilidade tende
a uma constante e essa dinamica segue a Distribuicao de Maxwell-Boltzmann. Nessa
analogia, as acoes negociadas em um mercado podem ser vistas como partıculas. Entao,
por esse raciocınio, a dinamica dos precos das acoes podem ser descritas pelas estatısticas
de Maxwell-Boltzmann. Assim, a volatilidade do mercado pode estar relacionada com
a temperatura de um gas ideal. Dessa forma, quanto maior a volatilidade, maior a
temperatura. Por outro lado, quanto menor a volatilidade do mercado, menor a sua
temperatura.
Desenvolver cenarios artificiais e interessante para analisar o desempenho dos agentes
nos diversos mercados (mais e menos volateis). Dessa forma, e possıvel desenvolver es-
trategias para investimento de acordo com o nıvel do mercado. Entretanto, nos trabalhos
desenvolvidos, os agentes foram programados para ter o comportamento semelhante ao
de uma partıcula de um gas ideal.
Apos a analise com series artificiais, um primeiro estudo foi realizado utilizando ındices
de mercados de acoes reais no perıodo de dois anos. Nos experimentos com series reais,
tambem foi constatado que os dados das fdp sao melhor ajustados pela distribuicao ex-
ponencial. Os ajustes primeiramente foram realizados utilizando o algoritmo Mınimos
Quadrados (Least Squares) em graficos semi-log e log-log, depois foram utilizados tres al-
goritmos (Levenberg-Marquardt, Trust Region eMaximum Likelihood Estimation), tendo
o algoritmo Trust Region obtido o melhor resultado. Para todos ajustes, a exponencial
aderiu melhor aos dados e os resultados desses experimentos foram publicados em [132].
Para avaliar o metodo proposto, um novo conjunto de ındices financeiros foi usado
em diferentes perıodos (janelas de tempo). Uma parte dos dados sao ındices financeiros
provenientes de paıses desenvolvidos e a outra de paıses em desenvolvimento, de tal forma
a estabelecer uma base experimental comparativa. As series selecionadas foram analisadas
em diferentes janelas de tempo: um ano (2009 − 2010), dois anos (2008 − 2010), cinco
anos (2005− 2010), dez anos (2000− 2010) e quinze anos (1995− 2010).
73
Como a volatilidade e o coeficiente B sao medidas de flutuacao ou instabilidade do
mercado, uma metodologia para classificacao de paıses foi desenvolvida e proposta. Um
conjunto de 34 ındices de paıses desenvolvidos e em desenvolvimento foi dividido em
dois conjuntos, observando apenas o coeficiente B e a volatilidade. Os resultados foram
comparados com as classificacoes providas pelo Banco Mundial, Fundo Monetario Inter-
nacional e Nacoes Unidas. A taxa de acerto obtida pelo metodo foi em torno de 85%
com relacao as classificacoes tradicionais. Contudo, como a tarefa de classificar paıses
e, em geral, subjetiva, ja que depende do foco da classificacao (social ou economico, por
exemplo) e das diferentes variaveis, os resultados obtidos neste trabalho sao satisfatorios
dado a baixa complexidade da abordagem e a possibilidade de usar qualquer algoritmo de
analise de agrupamentos para realizar a classificacao. Os resultados dessa analise foram
publicados no periodico Physica A [140].
Desse modo, a abordagem desenvolvida e uma proposta promissora para analise dos
mercados de acoes, ja que a analogia pode ser utilizada para compreender o comporta-
mento dos diferentes tipos e mercados e prover insights de outras possıveis aplicacoes,
como previsao, analise de eventos extremos e estudo da distribuicao de ganhos/perdas
dos agentes. Tanto para pesquisas cientıficas como para aplicacoes praticas, a analogia
pode ser usada, ja que necessita de um baixo poder computacional.
5.2 PRINCIPAIS CONTRIBUICOES DA TESE
Os resultados obtidos pelo metodo proposto tornam valida a proposicao de que a dinamica
dos mercados de acoes pode ser modelada por um gas ideal classico que segue a Distri-
buicao de Maxwell-Boltmzann. Essa abordagem, que tem como base uma distribuicao
exponencial pode ser usada tanto em series de resıduos provenientes de paıses desenvol-
vidos (mercados menos volateis) como em desenvolvimento (mercados mais volateis). A
metodologia tambem e valida nao so para pequenas janelas de tempo [132], mas tambem
para grandes janelas de tempo.
Outra contribuicao relevante foi o desenvolvimento de um mercado financeiro artificial
baseado na dinamica do gas ideal. A partir desse modelo foi possıvel estudar e relacionar
o comportamento dos investidores com o tipo de merado (“quente” ou “frio”), dada sua
estrategia de compra e venda. Para isso o modelo Random Walk [13, 114] foi utilizado
para gerar os precos das acoes. Nela pode-se avaliar o desempenho de agentes artificiais
em diferentes tipos de mercados e ainda ratificar as observacoes realizadas nos mercados
reais. A partir de diferentes cenarios foi possıvel gerar experimento modificando algumas
variaveis, como: temperatura de mercado (desvio padrao do modelo RW ), quantidade
74
de agentes, numero de iteracoes e probabilidade de compra e venda. Em todos os expe-
rimentos, o mercado pode ser modelado pelo metodo proposto.
E finalmente, foi verificado que o metodo pode ser combinado com algum algoritmo
para analise de agrupamentos [44, 137] para classificar paıses. A partir do metodo pro-
posto sao geradas duas medidas de flutuacao ou instabilidade da serie de retorno, a
volatilidade e o coeficiente B. Essas duas variaveis sao caracaterısticas que podem ser
usadas para se classificar um paıs, dado que neste trabalho so ındices de paıses sao abor-
dados. A vantagem desse metodo e que qualquer algoritmo de analise de agrupamentos
pode ser utilizado para classificar os paıses. Nesse trabalho, foi utilizado o algoritmo
K-means [137], contudo novos trabalhos podem ser produzidos analisando os resultados
de outros algoritmos.
5.3 PRINCIPAIS LIMITACOES DO TRABALHO
O metodo desenvolvido e baseado na analogia entre a dinamica de um gas ideal e o
comportamento do mercado de acoes. A partir dos resultados, tal comparacao e valida
para analise do comportamento dos mercados de acoes. Como demonstrado no Capıtulo 3
partimos da suposicao que a taxa de decaimento (coeficiente B) da funcao densidade de
probabilidade das series de retorno e constante. Analisando os dados, observou-se que a
taxa da fdp se aproxima a uma constante, mas possui na cauda uma variacao decrescente
acentuada.
A variacao da taxa de decaimento na cauda da fdp pode explicar a pequena perda
de ajuste da funcao exponencial no final dos dados, ja que a funcao exponencial descreve
o comportamento medio da curva. Assim, mesmo obtendo resultados satisfatorios, a
limitacao desse trabalho e tal aproximacao. A partir de alguns experimentos preliminares
e alguns resultados encontrados na literatura [8,102] ha indıcios que essa estatıstica esteja
relacionada com a exponencial alongada.
Desse modo, novas analises e pesquisas devem ser feitas, a fim de buscar uma distri-
buicao com taxa variavel. Dessa forma, espera-se que nao so o ajuste dessa funcao aos
dados da fdp seja melhor que a funcao exponencial, mas tambem que tenha a variacao
da taxa mais semelhante a encontrada nos dados analisados.
5.4 TRABALHOS FUTUROS
Dada a suposicao de taxa constante na fdp dos dados, o primeiro trabalho futuro a
ser desenvolvido naturalmente e a pesquisa de uma nova distribuicao. A distribuicao
75
provavelmente tera uma melhor aderencia aos dados. Assim, a distribuicao devera ser
testada e comparada com o mesmo banco de dados usado nesse trabalho.
Contudo, outros trabalhos tambem podem ser desenvolvidos. Como verificado nessa
tese, o coeficiente B pode ser considerado uma medida de temperatura, assim, pode-se
avaliar a evolucao temporal dessa variavel e (i) verificar o quao essa medida pode ser
significativa para quantificar os acontecimentos referentes ao mercado, ou (ii) analisar a
possibilidade do uso do coeficiente B como informacao para realizar previsoes sobre o
mercado.
A mesmo metodo utilizado nesse trabalho tambem pode ser aplicado a acoes de uma
determinada bolsa, avaliando assim a temperatura de cada papel. No caso da classificacao
de paıses, outros algoritmos podem ser verificados, outros perıodos podem ser estudados
e outras comparacoes podem ser feitas, como, por exemplo, o risco paıs.
Quanto ao desenvolvimento de novas modelagens para simulacao de mercados, o al-
goritmo PSO (Particle Swarm Optimization) [141,142] pode ser implementado com esse
intuito. Como o PSO se trata de um algoritmo que simula um conjunto de indivıduos
que trocam informacao entre si, um mercado pode ser criado utilizando essa ideia.
Quanto aos mercados artificiais, novos modelos podem ser desenvolvidos para ava-
liacao da distribuicao de perdas/ganhos dos agentes. A partir do modelo inicialmente
criado, e possıvel testar outros cenarios que possam ser interessantes para estudar o mer-
cado.
5.5 TRABALHOS PUBLICADOS
Os trabalhos listados a seguir sao resultados da pesquisa realizada no Doutorado:� Volatility Analysis from exponential adjustment [133] apresentado no ECONO-
FIS’10;� Market volatility modeling for short time window [132] publicado na Physica A;� Stock Market Simulation for Volatility Analysis Inspired on Ideal Gas: an Intelligent
Agent Approach [130] publicado no X Congresso Brasileiro de Redes Neurais;� A simulation environment for volatility analysis of developed and in development
markets [131] publicado no International Joint Conference on Neural Networks 2011;� An Approach Based on Ideal Gas to Cluster World Economies [139] apresentado no
congresso Perspectives and Challenges in Statistical Physics and Complex Systems
for the Next Decade: A Conference in Honor of Eugene Stanley and Liacir Lucena.
76
� An ideal gas approach to classify countries using financial indices [140] publicado
na Physica A.
77
REFERENCIAS BIBLIOGRAFICAS
[1] T. A. E. Ferreira. Uma Nova Metodologia Hıbrida Inteligente para a Previsao de
Series Temporais. PhD thesis, Centro de Informatica - Universidade Federal de Per-
nambuco, Av. Prof. Luiz Freire, s/n, Cidade Univercitaria - Recife - Pernambuco,
2006.
[2] F. Reif. Fundamentals of Statistics and Termal Physics. Waveland Press, United
States, 2008.
[3] G. E. P. Box, G. M. Jenkins, and G. C. Reinsel. Time Series Analysis: Forecasting
and Control. Wiley, New Jersey, fourth edition, 2008.
[4] J. Kwapien and S. Drozdz. Physical Approach to Complex Systems. Physics Re-
ports, 515:115–226, 2012.
[5] W. B. Arthur. Complexity and the economy. Science, 284(5411):107–109, 1999.
[6] Y. Bar-Yam. Dynamics of Complex Systems. Studies in Nonlinearity. Addison-
Wesley, 1997.
[7] V. M. Yakovenko. Statistical Mechanics Approach to Econophysics. In Robert A.
Meyers, editor, Encyclopedia of Complexity and Systems Science, pages 2800–2826.
Springer, 2009.
[8] R. N. Mantegna and H. E. Stanley. An Introduction to Econophysics: Correlations
and Complexity in Finance. Cambridge University Press USA, New York, first
edition, 2000.
[9] A. Gadomski, J. Kertesz, H.E. Stanley, and N. Vandewalle. Applications of Statis-
tical Physics. North Holland, Amsterdam, first edition, 2000.
[10] P. J. Brockwell and R. A. Davis. Introduction to Time Series and Forecasting.
Springer, 2nd edition, 2002.
[11] C. Chatfield. Time Series Forecasting. Chapman & Hall/CRC, London, 2001.
78
[12] H. Kantz and T. Schreiber. Nonlinear Time Series Analysis. Cambridge University
Press, New York, NY, USA, second edition, 2003.
[13] T. C. Mills. The Econometric Modelling of Financial Time Series. Cambridge
University Press, Cambridge, 2003.
[14] M. P. Clements, P. H. Franses, and N. R. Swanson. Forecasting economic and
financial time-series with non-linear models. International Journal of Forecasting,
20:169–183, 2004.
[15] T. Subba Rao and M. M. Gabr. Introduction to Bispectral Analysis and Bilinear
Time Series Models, volume 24 of Lecture Notes in Statistics. Springer, Berlin,
1984.
[16] M. B. Priestley. Non-Linear and Non-Stacionary Time Series Analysis. Academic
Press, 1988.
[17] T. Ozaki. Nonlinear Time Series Models and Dynamical Systems, volume 5 of Hand
Books of Statistics. Noth-Holland, Amsterdam, 1985.
[18] D. E. Rumelhart and J. L. McCleland. Parallel Distributed Processing, Explorations
in the Microstructure of Cognition, volume 1 & 2. MIT Press, 1987.
[19] J. G. De Gooijer and K. Kumar. Some recent developments in non-linear time series
modelling, testing, and forecasting. International Journal of Forecasting, 8:135–156,
1992.
[20] R. F. Engle. Autoregressive conditional heteroskedasticity with estimates of the
variance of UK inflation. Econometrica, 50:987–1008, 1982.
[21] T. Bollerslev. Generalized autoregressive conditional heteroskedasticity. Journal of
Econometrics, 31:307–328, 1986.
[22] S. F. Crone, F. Collopy, C.-M. Kuan, A. Lendasse, H. Song, and R. J. Hyndman.
Special Section 1: Forecasting with Artificial Neural Networks and Computational
Intelligence. International Journal of Forecasting. Elsevier, 2011.
[23] M.P. Clements. Special Issue: Forecasting Economic and Financial Time Series
Using Nonlinear Methods. International Journal of Forecasting. North-Holland,
2004.
79
[24] G. Zhang, B. E. Patuwo, and M. Y. Hu. Forecasting with artificial neural networks:
The state of the art. International Journal of Forecasting, 14:35–62, 1998.
[25] C. T. Chan, C. H. Chuek, D. P. Mital, and T. T. Huat. Time series modelling
and forecasting using genetic algorithms. In L. C. Jain, editor, First Internatio-
nal Conference on Knowledge-Based Intelligent Electronic Systems, pages 260–268,
Adelaide, 1997.
[26] A. Neubauer. Genetic algorithms for adaptive non-linear predictors. In IEEE
International Conference on Eletronics, Circuits and Systems, volume 1, pages 209–
212, 1998.
[27] R. J. Povinelli and Xin Feng. A new temporal pattern identification method for
characterization and prediction of complex time series events. IEEE Transactions
on Knowledge and Data Engineering, 15(2):339–352, March/April 2003.
[28] J. M. Mendel. Fuzzy logic systems for engineering: A tutorial. Proceedings of the
IEEE, 83(3):345–377, 1995.
[29] Suran Goonatilake and Sukhdev Khebbal. Intelligence Hybrid Systems. John Wiley
& Son, 1995.
[30] T. A. E. Ferreira, G. C. Vasconcelos, and P. J. L. Adeodato. A New Intelligent
System Methodology for Time Series Forecasting with Artificial Neural Networks.
Neural Processing Letters, 28(2):113–129, 2008.
[31] D.P. Solomatine and M.B. Siek. Modular learning models in forecasting natural
phenomena. Neural Networks, 19(2):215–224, march 2006.
[32] J. J. Valds and G. Bonham-Carter. Time dependent neural network models for
detecting changes of state in complex processes: Applications in earth sciences and
astronomy. Neural Networks, 19(2):196–207, march 2006.
[33] A. Preminger and R. Franck. Forecasting exchange rates: A robust regression
approach. International Journal of Forecasting, 23(1):71–84, January-March 2007.
[34] G.P. Zhang and D.M. Kline. Quarterly time-series forecasting with neural networks.
IEEE Transactions on Neural Networks, 18(6):1800–1814, 2007.
80
[35] B. R. Chang and H.-F. Tsai. Composite of adaptive support vector regression
and nonlinear conditional heteroscedasticity tuned by quantum minimization for
forecast. Applied Intelligence, 27:277–289, January 2007.
[36] J.-T. Tsai, J.-H. Chou, and T.-K. Liu. Tuning the structure and parameters of a
neural network by using hybrid Taguchi-genetic algorithm. IEEE Transactions on
Neural Networks, 17(1):69–80, 2006.
[37] M. Perus. Multi-level synergetic computation in brain. Nonlinear Phenomena in
Complex Systems, 4(2):157–193, 2001.
[38] H. E. Stanley, V. Afanasyev, L. A. N. Amaral, S. V. Buldyrev, A. L. Goldberger,
S. Havlin, H. Leschhorn, P. Maass, R. N. Mantegna, C. K. Peng, P. A. Prince,
M. A. Salinger, M. H. R. Stanley, and G. M. Viswanathan. Anomalous fluctuations
in the dynamics of complex systems: from dna and physiology to econophysics.
Physica A: Statistical and Theoretical Physics, 224(1-2):302–321, February 1996.
[39] B. Mandelbrot. The variation of certain speculative prices. The Journal of Business,
36(4):394–419, 1963.
[40] B. Mandelbrot. New methods in statistical economics. Journal of Political Eco-
nomy, 61:421–440, 1963.
[41] L. Bachelier. Theorie de la speculation. In Annales Scientifiques de l’Ecole Normale
Superieure, volume 3, pages 21–86, 1900.
[42] V. Pareto. The new theories of economics. The Journal of Political Economy,
5(4):485–502, 1897.
[43] B. G. Malkiel. A Random Walk Down Wall Street, Completely Revised and Updated
Edition. W. W. Norton & Company, April 2003.
[44] B. S. Everitt, S. Landau, and M. Leese. Cluster Analysis. Wiley, fourth edition,
2009.
[45] P. A. Morettin e C. M. Toloi. Modelos para Previsao em Series Temporais, volume
1 e 2. IMPA - Instituto de Matematica Pura e Aplicada, Sao Paulo, 1981.
[46] D. B. Percival and A. T. Walden. Spectral Analysis for Physical Applications –
Multitaper and Conventional Univariate Techniques. Cambridge University Press,
New York, 1998.
81
[47] P. A. Morettin. Analise Harmonica de Processos Estocasticos. IMPA - Instituto de
Matematica Pura e Aplicada, Rio De Janeiro, 1979.
[48] P. A. Morettin e C. M. Toloi. Series Temporais. Colecao Metodos Quantitativos.
Atual Editora, Sao Paulo, 1987.
[49] J. G. De Gooijer and R. J. Hyndman. 25 years of time series forecasting. Interna-
tional Journal of Forecasting, 22(3):443 – 473, 2006.
[50] S. B. Taieb, G. Bontempi, A. F. Atiya, and A. Sorjamaa. A review and compa-
rison of strategies for multi-step ahead time series forecasting based on the NN5
forecasting competition. Expert Systems with Applications, 39(8):7067 – 7083, 2012.
[51] S. Haykin. Redes Neurais - Princıpios e Pratica. Bookman, Porto Alegre - Brasil,
second edition, 2002.
[52] T. Kohonen. Self-Organized Formation of Topologically Correct Feature Maps.
Biological Cybernetics, 43:5–69, 1982.
[53] T. Kohonen. Self-Organization and Associative Memory. Springer-Verlog, Berlin,
1984.
[54] J. J. Hopfield. Neural networks and physical systems with emergent coletive com-
putational abilities. In Proceedings of the National Academy of the Sciences of the
USA, volume 79, pages 2554–2558, 1982.
[55] G. A. Carpenter and S. Grossberg. The art of adaptive pattern recognition by a
self-organizing neural network. Computer, 21(3):77–88, March 1988.
[56] T. M. Mitchell. Machine Learning. WCB McGraw-Hill, Boston, 1997.
[57] P. A. Braga, A. P. L. F. Carvalho, and T. B. Ludemir. Redes Neurais Artificiais:
Teoria e Aplicacoes. LTC, Rio de Janeiro, 2000.
[58] A. Einstein. Investigations on the Theory of Brownian Movement. Dover Publica-
tions, New York, 1956.
[59] P. Ball. Econophysics: Culture Crash. Nature, 441:686–688, 2006.
[60] M. Gallegati, S. Keen, T. Lux, and P. Ormerod. Worrying trends in econophysics.
Physica A: Statistical Mechanics and its Applications, 370:1–6, 2006.
82
[61] J. L. McCauley. Response to worrying trends in econophysics. Physica A: Statistical
Mechanics and its Applications, 2(371):601–609, 2006.
[62] T. D. Matteo and T. Aste. “No Worries”: Trends in Econophysics. The European
Physical Journal B, 55(2):121–122, 2007.
[63] B. M. Roehner. Fifteen years of econophysics: worries, hopes and prospects. Tech-
nical report, arXiv.org, 2010.
[64] J. Y. Campbell, A. W. Lo, and A. C. MacKinlay. The Econometrics of Financial
Markets. Princeton University Press, Princeton, 1997.
[65] S. J. Taylor. Introduction to asset price dynamics, volatility, and prediction. In
Asset Price Dynamics, Volatility, and Prediction, Introductory Chapters. Princeton
University Press, 2007.
[66] R. Cont. Empirical properties of asset returns: Stylized facts and statistical issues.
Quantitative Finance, 1:223 – 236, 2001.
[67] P. A. Morettin. Econometria Financeira. Edgard Blucher, Sao Paulo, 2008.
[68] L. Coroneo and D. Veredas. Intradaily seasonality of returns distribution. a quan-
tile regression approach and intradaily var estimation. CORE Discussion Papers
2006/077, Universite Catholique de Louvain, Center for Operations Research and
Econometrics (CORE), 2006.
[69] F. Lillo and R. N. Mantegna. Power-law relaxation in a complex system: Omori
law after a financial market crash. Physical Review E, 68, 2003.
[70] F. Black. Studies of stock price volatility changes. Proceedings from the American
Statistical Association, Business and Economic Statistics, pages 177–181, 1976.
[71] K. Yamasaki, L. Muchnik, S. Havlin, A. Bunde, and H. E. Stanley. Scaling and
memory in volatility return intervals in financial markets. Proceedings of the Na-
tional Academy of Sciences of the United States of America, 102(26):9424 – 9428,
June 2005.
[72] E. F. Fama. The behavior of stock-market prices. Journal of Business, 38:34–105,
1965.
83
[73] F. Wang, K. Yamasaki, S. Havlin, and H. E. Stanley. Return Intervals Approach to
Financial Fluctuations. Lecture Notes of the Institute for Computer Sciences, Social
Informatics and Telecommunications Engineering. Springer Berlin Heidelberg, 2009.
[74] V. Plerou, P. Gopikrishnan, B. Rosenow, L. A. N. Amaral, and H. E. Stanley.
Econophysics: Financial time series from a statistical physics point of view. Physica
A: Statistical Mechanics and its Applications, 279:443–456, 2000.
[75] I. Gleria, R. Matsushita, and S. Silva. Scaling power laws in the Sao Paulo Stock
Exchange. Economics Bulletin, 7(3):1–12, 2002.
[76] Y. Liu, P. Gopikrishnan, P. Cizeau, M. Meyer, C. Peng, and E. H. Stanley. Statisti-
cal properties of the volatility of price fluctuations. Physical Review E, 60(2):1390–
1400, 1999.
[77] K. Matia, M. Pal, H. Salunkay, and H. E. Stanley. Scale-dependent price fluctua-
tions for the indian stock market. Europhysics Letters, 66(6):909–914, 2004.
[78] S. M. Duarte Queiros, C. Anteneodo, and C. Tsallis. Power-law distributions in
economics: A nonextensive statistical approach. Proceedings of SPIE, 5848:151,
2005.
[79] M.L. Goldstein, S.A. Morris, and G.G. Yen. Problems with fitting to the power-law
distribution. The European Physical Journal B, 41:255–258, 2004.
[80] X. Gabaix, P. Gopikrishnan, V. Plerou, and E. Stanley. A unified econophysics
explanation for the power-law exponents of stock market activity. Physica A: Sta-
tistical Mechanics and its Applications, 382(1):81–88, August 2007.
[81] F. Selcuk. Financial earthquakes, aftershocks and scaling in emerging stock markets.
Physica A: Statistical and Theoretical Physics, 333:306–316, 2004.
[82] P. Gopikrishnan, V. Plerou, L. A. Amaral, M. Meyer, and H. E. Stanley. Scaling
of the distribution of fluctuations of financial market indices. Physical Review E,
60(5):5305–5316, 1999.
[83] R. N. Mantegna and E. H. Stanley. Scaling behaviour in the dynamics of an eco-
nomic index. Nature, 376(6535):46–49, 1995.
84
[84] P. Gopikrishnan, M. Meyer, L. A. N. Amaral, and H. E. Stanley. Inverse cubic
law for the distribution of stock price variations. European Physical Journal B,
3:139–140, 1998.
[85] R. N. Mantegna. Levy Walks and enhanced diffusion in Milan Stock Exchange.
Physica A: Statistical Mechanics and its Applications, 179(2):232–242, 1991.
[86] S. Silva. Autocorrelation as a source of truncated Levy flights in foreign exchange
rates. Finance 0405018, EconWPA, May 2004.
[87] U. A. Muller, M. M. Dacorogna, R. B. Olsen, O. V. Pictet, M. Schwarz, and
C. Morgenegg. Statistical study of foreign exchange rates, empirical evidence of
a price change scaling law, and intraday analysis. Journal of Banking & Finance,
14(6):1189–1208, December 1990.
[88] T. G. Andersen, T. Bollerslev, F. X. Diebold, and H. Ebens. The Distribution of
Stock Return Volatility. Journal of Financial Economics, 61:43–76, 2001.
[89] S. Lennartz, V. N. Livina, A. Bunde, and S. Havlin. Long-term memory in earth-
quakes and the distribution of interoccurrence times. EPL (Europhysics Letters),
81(6):69001, 2008.
[90] A. Clauset, C. R. Shalizi, and M. E. J. Newman. Power-law distributions in empi-
rical data. SIAM Review, 51(4):661–703, 2009.
[91] M. O. Santos, T. Stosic, and B. D. Stosic. Long-term correlations in hourly wind
speed records in pernambuco, brazil. Physica A: Statistical Mechanics and its
Applications, 391(4):1546 – 1552, 2012.
[92] E. Eberlein, U. Keller, and K. Prause. New insights into smile, mispricing and value
at risk: the hyperbolic model. Journal of Business, 71:371–405, 1998.
[93] F. M. Longin. The asymptotic distribution of extreme stock market returns. Journal
of Business, 96:383–408, 1996.
[94] B. Podobnik, D. Horvatic, A. Petersen, and H. E. Stanley. Quantitative relations
between risk, return and firm size. Europhysics Letters, 85:50003, 2009.
[95] B. Podobnik, D. Horvatic, A. Petersen, M. Njavro, and H. E. Stanley. Common
scaling behavior in finance and macroeconomics. European Physical Journal B,
76:487–490, 2010.
85
[96] A. Dragulescu and V. M. Yakovenko. Statistical mechanics of money. The European
Physical Journal B, 17(4):723 – 729, 2000.
[97] A. Dragulescu and V. M. Yakovenko. Evidence for the exponential distribution of
income in the USA. The European Physical Journal B, 20(4):585–589, 2001.
[98] A. Dragulescu and V. M. Yakovenko. Exponential and power-law probability dis-
tributions of wealth and income in the United Kingdom and the United States.
Physica A: Statistical Mechanics and its Applications, 299:213–221, 2001.
[99] J. L. McCauley and G. H. Gunaratne. An empirical model of volatility of returns
and option pricing. Physica A: Statistical Mechanics and its Applications, 329:178–
198, 2003.
[100] A. C. Silva, R. E. Prange, and V. M. Yakovenko. Exponential distribution of
financial returns at mesoscopic time lags: a new stylized fact. Physica A: Statistical
Mechanics and its Applications, 344:227–235, 2004.
[101] A. C. Silva and V. M. Yakovenko. Stochastic volatility of financial markets as the
fluctuating rate of trading: An empirical study. Physica A: Statistical Mechanics
and its Applications, 382:278–285, 2007.
[102] J. Laherrre and D. Sornette. Stretched exponential distributions in nature and
economy: Fat tails with characteristic scales. European Physical Journal B, 2:525–
539, 1999.
[103] R. Cont, M. Potters, and J. Bouchaud. Scaling in Stock Market Data: Stable Laws
and Beyond. 1997.
[104] H. Takayasu, M. Takayasu, M. P. Okazaki, K. Marumo, and T. Shimizu. Fractal
Properties in Economics. World Scientific, 2000.
[105] T. Mizuno, M. Takayasu, and H. Takayasu. The mechanism of double exponential
growth in hyper-inflation. Physica A: Statistical Mechanics and its Applications,
308:411–420, 2002.
[106] K. Kim and S.-M. Yoon. Dynamical behavior of continuous tick data in futures
exchange market. Fractals, 11:131–136, 2003.
86
[107] A. C. Silva and V. M. Yakovenko. Temporal evolution of the “thermal” and “su-
perthermal” income classes in the usa during 1983 to 2001. Europhysics Letters,
69(2):304, 2005.
[108] A. Chatterjee and B. K. Chakrabarti. Ideal-gas-like market models with savings:
Quenched and annealed cases. Physica A: Statistical Mechanics and its Applicati-
ons, 382(1):36 – 41, 2007.
[109] A. Chatterjee, B. K. Chakrabarti, and S. S. Manna. Pareto law in a kinetic model
of market with random saving propensity. Physica A: Statistical Mechanics and its
Applications, 335(1-2):155 – 163, 2004.
[110] M. Patriarca, A. Chakraborti, E. Heinsalu, and G. Germano. Relaxation in statis-
tical many-agent economy models. The European Physical Journal B. Condensed
Matter and Complex Systems, 57(2):219–224, 2007.
[111] Agencia Senado. Petrobras termina nesta semana venda de acoes para conseguir o
dinheiro da exploracao do pre-sal, setembro 2010.
[112] M. Asai, M. McAleer, and M. Medeiros. Modelling and forecasting noisy realized
volatility. Computational Statistics & Data Analysis, 56:217–230, 2012.
[113] S. Bordignon, M. Caporin, and F. Lisi. Generalised long-memory GARCH models
for intra-daily volatility. Computational Statistics & Data Analysis, 51(12):5900 –
5912, 2007.
[114] R. Sitte and J. Sitte. Neural networks approach to the random walk dilemma of
financial time series. Applied Intelligence, 16(3):163–171, May 2002.
[115] J. Angle. The surplus theory of social stratification and the size distribution of
personal wealth. Social Forces, 65:293–326, 1986.
[116] L. Tesfatsion and K. L. Judd. Handbook of Computational Economics: Agent-Based
Computational Economics, volume 2. North-Holland Publishing Co., Amsterdam,
The Netherlands, 2006.
[117] B. LeBaron. Empirical regularities from interacting long and short memory inves-
tors in an agent based stock market. IEEE Transactions on Evolutionary Compu-
tation, 5(5):442–455, 2001.
87
[118] B. LeBaron. Agent-based computational finance: Suggested readings and early
research. Journal of Economic Dynamics and Control, 24(5-7):679–702, June 2000.
[119] B. Cui, H. Wang, K. Ye, and J. Yan. Intelligent agent-assisted adaptive order
simulation system in the artificial stock market. Expert Systems with Applications,
39(10):8890 – 8898, 2012.
[120] L.A.N. Amaral, P. Cizeau, P. Gopikrishnan, Y. Liu, M. Meyer, C.-K. Peng, and
H.E. Stanley. Econophysics: can statistical physics contribute to the science of
economics? Computer Physics Communications, 121-122:145 – 152, 1999.
[121] J. Wolberg. Data Analysis Using the Method of Least Squares: Extracting the Most
Information from Experiments. Springer Publishing, Cambridge, 2005.
[122] J. Dong, J. Shi, S. Wang, Y. Xue, and S. Liu. A trust-region algorithm for equality-
constrained optimization via a reduced dimension approach. J. Comput. Appl.
Math., 152(1-2):99–118, 2003.
[123] J. J. Mor. The Levenberg-Marquardt Algorithm: Implementation and Theory. In
G. A. Watson, editor, Numerical Analysis, volume 630 of Lecture Notes in Mathe-
matics, pages 105–116, Berlin, 1977. Springer-Verlag.
[124] C. Kleiber and S. Kotz. Statistical Size Distributions in Economics and Actuarial
Sciences (Wiley Series in Probability and Statistics). Wiley-Interscience, 1 edition,
2003.
[125] R. Fletcher. Practical methods of optimization. John Wiley & Sons, New York,
second edition, 1987.
[126] J. A. Snyman. Practical Mathematical Optimization: An Introduction to Basic
Optimization Theory and Classical and New Gradient-Based Algorithms. Springer
Publishing, Cambridge, 2005.
[127] United Nations. Composition of macro geographical (continental) regions, geo-
graphical sub-regions, and selected economic and other groupings. Technical report,
july 2011.
[128] International Monetary Funds. Country composition of world economic outlook
groups. Technical report, april 2010.
88
[129] T. H. Kim and H. White. On more robust estimation of skewness and kurtosis.
Finance Research Letters, 1:56–73, 2004.
[130] P. S.G. de Mattos Neto, A. L. J. Rodrigues, T. A. E. Ferreira, and G. D.C. Ca-
valcanti. Stock market simulation for volatility analysis inspired on ideal gas: an
intelligent agent approach. In X Congresso Brasileiro de Redes Neurais, 2011.
[131] P. S.G. de Mattos Neto, T. A. E. Ferreira, and G. D.C. Cavalcanti. A simulation
environment for volatility analysis of developed and in development markets. In
IEEE International Joint Conference on Neural Networks, pages 2450 – 2456, 2011.
[132] P. S. G. de Mattos Neto, D. Silva, T. Ferreira, and G. Cavalcanti. Market vola-
tility modelling for short time window. Physica A: Statistical Mechanics and its
Applications, 390(20):3444–3453, 2011.
[133] P. S. G. de Mattos Neto, T. A. E. Ferreira, and G. D. C. Cavalcanti. Volati-
lity analysis from exponential adjustment. In Encontro de Econofısica (ECONO-
FIS’10), 2010.
[134] M. Gligor and M. Ausloos. Convergence and cluster structures in EU area according
to fluctuations in macroeconomic indices. Journal of Economic Integration, 23:297
– 330, 2008.
[135] World Bank. How we classify countries. Technical report, april 2011.
[136] United Nations. International human development indicators. Technical report,
2010.
[137] E. Forgy. Cluster analysis of multivariate data: efficiency versus interpretability of
classifications. Biometrics, 21:768–780, 1965.
[138] M. K. Hassan, B. Sanchez, and J.-S. Yu. Financial development and economic
growth: New evidence from panel data. The Quarterly Review of Economics and
Finance, 51(1):88 – 104, 2011.
[139] P. S. G. de Mattos Neto, F. Madeiro, T. A. E. Ferreira, and G. D. C. Cavalcanti.
An approach based on ideal gas to cluster world economies. In Perspectives and
Challenges in Statistical Physics and Complex Systems for the Next Decade: A
Conference in Honor of Eugene Stanley and Liacir Lucena, 2011.
89
[140] P. S. G. de Mattos Neto, G. D.C. Cavalcanti, F. Madeiro, and T. A.E. Ferreira. An
ideal gas approach to classify countries using financial indices. Physica A: Statistical
Mechanics and its Applications, 392(1):177–183, 2013.
[141] J. Kennedy and R. C. Eberhart. Particle swarm optimization. In Proceedings of the
IEEE International Conference on Neural Networks IV, pages 1942–1948, 1995.
[142] P. S. G. de Mattos Neto, G. G. Petry, R. A. Andrade, T. A. E. Ferreira, and G. C.
Vasconcelos. Hybrid swarm system for time series forecasting. In Anais do VI
Encontro Nacional de Inteligncia Artificial - VI ENIA, Rio de Janeiro - RJ, 2007.
Sociedade Brasileira de Redes Neurais.
90