identificaÇÃo de fatores influentes no desempenho de...
TRANSCRIPT
REGIANE CRISTINA YAMANARI
IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE UM GRUPO DE AÇÕES DO MERCADO
FINANCEIRO
Trabalho de Formatura apresentado à
Escola Politécnica da Universidade de
São Paulo para obtenção do diploma
de Engenheiro de Produção
São Paulo
2010
REGIANE CRISTINA YAMANARI
IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE UM GRUPO DE AÇÕES DO MERCADO
FINANCEIRO
Trabalho de Formatura apresentado à
Escola Politécnica da Universidade de
São Paulo para obtenção do diploma
de Engenheiro de Produção
Professora: Linda Lee Ho
São Paulo
2010
FICHA CATALOGRÁFICA
Yamanari, Regiane Cristina
Identificação de fatores influentes no desempenho de um grupo de ações do mercado financeiro / R.C. Yamanari. -- São Paulo, 2010.
80 p.
Trabalho de Formatura - Escola Politécnica da Universidade de São Paulo. Departamento de Engenharia de Produção.
1.Ações 2.Mercado financeiro 3.Análise de regressão 4.Mode-
los de previsão I.Universidade de São Paulo. Escola Politécnica. Departamento de Engenharia de Produção II.t.
A minha família, meu namorado,
meus amigos e colegas de faculdade,
pelo incentivo e compreensão ao longo desta jornada.
AGRADECIMENTO
A minha família, por sempre me apoiar e incentivar em todos os momentos.
A professora Dra. Linda Lee Ho, pela paciência, pela atenção, pelos conselhos
valiosos e orientação durante a realização deste trabalho.
Ao meu namorado, Hugo, pelo apoio, pela companhia e pela paciência.
Aos amigos e colegas de faculdade, pelo suporte e incentivo mútuo ao longo de todos
estes anos.
Aos amigos e colegas de trabalho, pela possibilidade de realização do estágio, pela
confiança, pela orientação e pelos conhecimentos transmitidos.
RESUMO
Prever perfeitamente o comportamento do mercado de ações através de modelos
matemáticos é uma tarefa muito complicada devido ao número de fatores que o influenciam, à
aleatoriedade do comportamento destes fatores e à complexidade para identificá-los. Deste
modo, os analistas de ações tentam criar ferramentas mais simples que possam ajudá-los a
entender melhor esta dinâmica que é o comportamento das ações.
Neste trabalho, é proposto um modelo de previsão para um grupo de ações do mercado
financeiro para identificar a influência que a política monetária juntamente com as
características de cada uma das empresas dentro do grupo escolhido pode ter no desempenho
das ações. Para isto, tomou-se como base teórica os Modelos Lineares Generalizados e
realizou-se uma regressão Gamma para os dados analisados.
Palavras-chave: Ações, Mercado Financeiro, Análise de Regressão, Modelos de
Previsão.
ABSTRACT
Predicting the behavior of stocks using mathematical models is a difficult task given
the number of factors that can influence it, the randomness of the behavior of these factors
and the complexity to identify all of them. Therefore, equity analysts seek to create simpler
tools in order to help a better understanding of the stock dynamic.
In this paper, a prediction model is proposed for a group of stocks to identify how the
changes in monetary policy and the characteristics of each company within the group chosen
can influence the stock performance. The model was based on the Generalized Linear Models
and a Gamma regression was used for the data analysis.
Keywords: Stocks, Financial markets, Regression analysis, Prediction models.
LISTA DE FIGURAS
Figura 2.1.1 – Evolução da taxa de juros ao longo do tempo .................................................. 20
Figura 2.1.2 - Realocação dos setores em três grupos segundo o A.I.D. ................................. 27
Figura 2.1.3 - Distribuição dos retornos para ações de empresas do setor Varejo para os três
diferentes períodos do ciclo da taxa de juros (SELIC) ............................................................ 29
Figura 2.1.4 - Distribuição dos retornos para ações de empresas do setor Bancos e Instituições
Financeiras para os três diferentes períodos do ciclo da taxa de juros (SELIC) ...................... 29
Figura 3.2.1 - Distribuição de frequência dos retornos trimestrais .......................................... 39
Figura 4.1.1 – Variáveis estimadas versus variáveis observadas ............................................. 50
Figura 4.2.1 – Resíduos padronizados (I) ................................................................................ 57
LISTA DE TABELAS
Tabela 2.1.1 - Classificação da série da taxa de juros (SELIC) ............................................... 20
Tabela 2.1.2- Lista das classificações utilizadas por categoria ................................................ 23
Tabela 2.1.3 - Setores ordenados por média dos retornos das ações ........................................ 24
Tabela 2.1.4 - Resultado da Análise de Variância entre os grupos formados por G1 e por G2 a
G9 ............................................................................................................................................. 24
Tabela 2.1.5 – Valor de F para todas as partições possíveis (1ª iteração) ................................ 25
Tabela 2.1.6 - Valor de F para todas as partições possíveis (2ª iteração – Grupo 1) ............... 25
Tabela 2.1.7 - Valor de F para todas as partições possíveis (2ª iteração – Grupo 2) ............... 26
Tabela 2.1.8 - Valor de F para todas as partições possíveis (3ª iteração – Grupo 3 e 4) .......... 26
Tabela 3.1.1 –Lista de funções link canônicas ......................................................................... 38
Tabela 4.1.1 - Definição das variáveis do modelo ................................................................... 46
Tabela 4.1.2 – Valores dos parâmetros βi do modelo de previsão reduzido ............................ 48
Tabela 4.1.3 – Parâmetros estimados para períodos do ciclo monetário .................................. 50
Tabela 4.1.4 - Parâmetros estimados para os tamanhos das empresas ..................................... 51
Tabela 4.1.5 - Parâmetros estimados para os anos das observações ........................................ 52
Tabela 4.1.6 - Parâmetros estimados para os setores econômicos ........................................... 52
Tabela 4.1.7 - Parâmetros estimados para super-setores .......................................................... 53
Tabela 4.1.8 - Parâmetros estimados para os meses das observações ...................................... 54
Tabela 4.1.9 - Parâmetros estimados para as interações entre os setores econômicos e os
períodos do ciclo monetário ..................................................................................................... 54
Tabela 4.3.1 – Parâmetros considerados para o cálculo de previsão retorno trimestral (I) ...... 58
Tabela 4.3.2 – Parâmetros considerados para o cálculo de previsão retorno trimestral (II) .... 59
LISTA DE EQUAÇÕES
Equação 2.2.1 - Razão de preços por trimestre ........................................................................ 30
Equação 3.1.1- Definição de um modelo linear probabilístico ................................................ 33
Equação 3.1.2 – Valor esperado de Y ...................................................................................... 34
Equação 3.1.3 – Modelo linear com interação entre variáveis para o caso de duas variáveis . 34
Equação 3.1.4 – Definição de modelo linear generalizado ...................................................... 34
Equação 3.1.5 –Expressão geral da função densidade de probabilidade para membros da
família exponencial .................................................................................................................. 35
Equação 3.1.6 – Função densidade de probabilidade para uma variável normal aleatória ...... 35
Equação 3.1.7 –Definição da função densidade de probabilidade da distribuição da família
Gamma ..................................................................................................................................... 35
Equação 3.1.8- Definição da função Gamma .......................................................................... 36
Equação 3.1.9 – Definição da função link ............................................................................... 37
Equação 3.1.10 – Variável resposta para o modelo de regressão ............................................ 37
Equação 3.1.11 – Função link canônica ................................................................................... 37
Equação 3.2.1 – Forma exponencial do modelo de previsão de primeira ordem .................... 39
Equação 3.2.2 – Forma exponencial do modelo de previsão de segunda ordem ordem ......... 40
Equação 3.2.3 – Estatística do teste de hipótese ...................................................................... 41
Equação 3.2.1.1 - Definição de deviance ................................................................................. 42
Equação 3.2.2.1 – Definição de resíduo padronizado .............................................................. 43
Equação 4.1.1 – Modelo de previsão completo ....................................................................... 47
Equação 4.1.2 – Modelo de previsão reduzido ........................................................................ 47
SUMÁRIO
1. INTRODUÇÃO ................................................................................................................ 13
1.1 Descrição da empresa .................................................................................................... 13
1.2 Área de realização do estágio ........................................................................................ 14
1.3 Motivação para a realização do trabalho ....................................................................... 15
1.4 Objetivo do trabalho ...................................................................................................... 16
2. ANÁLISE PRELIMINAR ................................................................................................ 19
2.1 Escolha e classificação das ações .................................................................................. 19
2.2 Definição do retorno das ações ...................................................................................... 30
3. REVISÃO BIBLIOGRÁFICA .......................................................................................... 33
3.1 Modelos lineares generalizados ..................................................................................... 33
3.2 Definição do modelo de previsão .................................................................................. 38
3.2.1 Deviance e Akaike Information Criterion (AIC) ....................................................... 41
3.2.2 Resíduos padronizados .............................................................................................. 43
4. APLICAÇÃO .................................................................................................................... 45
4.1 Modelos lineares generalizados ..................................................................................... 45
4.2 Verificação da qualidade do modelo de previsão .......................................................... 55
4.3 Previsão para os próximos 3 meses ............................................................................... 57
5. CONCLUSÕES ................................................................................................................. 61
6. REFERÊNCIAS BIBLIOGRÁFICAS .............................................................................. 63
ANEXOS .................................................................................................................................. 65
Anexo A - Empresas escolhidas para a realização do trabalho ................................................ 65
Anexo B - Resultados da aplicação do método A.I.D. para agrupar setores semelhantes ....... 67
Anexo C - Síntese dos resultados obtidos no software R ......................................................... 72
Anexo D - Procedimento efetuado no software R para definir o modelo de previsão ............. 76
Anexo E - Representação gráfica dos resíduos padronizados .................................................. 79
13
1. INTRODUÇÃO
Este estudo foi desenvolvido juntamente com a empresa onde o autor deste trabalho
realiza atualmente seu estágio. Ele será apresentado em quatro partes. Primeiramente, serão
apresentados o contexto em que o trabalho foi desenvolvido e a motivação para a sua
realização. Em um segundo momento, far-se-á uma análise preliminar dos dados coletados,
classificando-os e definindo a estrutura inicial do problema a ser resolvido neste trabalho.
Em seguida, será exposta a base teórica para o desenvolvimento deste estudo, para
então aplicá-la aos dados analisados e construir o modelo de regressão. Ademais, serão feitos
os ajustes e análises para a verificação se o modelo definido está bem ajustado, ou seja, se as
estimativas calculadas pelo modelo são coerentes com os dados reais observados. Enfim, os
resultados obtidos serão interpretados e uma previsão, utilizando o modelo definido, será
realizada para o curto/médio prazo.
1.1 Descrição da empresa
Este estudo foi realizado no banco e prestador de serviços financeiros Morgan Stanley
cuja sede mundial se situa em Nova Iorque, nos Estados Unidos. No Brasil, as operações do
Morgan Stanley tiveram início em 1997, em São Paulo. Desde então, o grupo ampliou suas
operações no Brasil e atualmente conta com a colaboração de quase 200 funcionários. O
banco oferece diversos tipos de produtos através das seguintes divisões existentes no
escritório de São Paulo:
• Investment Banking: É a área do banco que possui um maior contato com clientes
corporativos. Nesta divisão são oferecidos serviços de reestruturação financeira,
operações de fusões e aquisições de empresas, coordenação de emissão de ações
no mercado financeiro, entre outros produtos.
• Equity Division: Trata-se da área que trabalha diretamente com o mercado de
ações. O departamento é subdividido em Equity Research, que trabalha com a
pesquisa e análise fundamentalista dos papéis listados na Bolsa de Valores, e em
Equity Trading, que lida com a negociação dos papéis listados no mercado.
• Fixed Income Division: Assim como existe a área especializada na análise e
negociação de ações, também existe no banco um setor especializado em renda
14
fixa. Entende-se por renda fixa papéis atrelados a taxa de juros fixada pelo Banco
Central, debêntures de empresas, entre outros.
• Brokerage House: Trata-se da corretora do Banco Morgan Stanley. A função da
corretora é efetuar as ordens de compra e/ou venda de seus clientes e oferecer
suporte e assessoria a estes. Além disso, a corretora pode também vender produtos
estruturados, oferecendo melhores retornos aos seus clientes. Através destas
operações de compra/venda, a corretora ganha uma pequena porcentagem dos
valores negociados.
• Administration: Existe todo um sistema de apoio às atividades principais do banco,
como o departamento de Recursos Humanos, de Tecnologia da Informação e o
Jurídico, todos de extrema importância para o funcionamento do banco.
1.2 .Área de realização do estágio
O estágio está sendo realizado na área de Equity Strategy (Estratégia para o mercado
de ações), que funcionalmente se encontra ligado ao departamento de Equity Research
(Pesquisa de mercado de ações). Na área de pesquisa, os analistas da área são divididos por
setor. Os principais setores são: 1) Varejo, 2) Bancos e Instituições Financeiras, 3) Energia e
Petróleo, 4) Transporte, Logística e Concessões, 5) Construtoras e Incorporadoras, 6)
Siderurgia, 7) Mineração, 8) Saúde, 9) Utilidade pública – empresas de geração e distribuição
de energia elétrica, e 10) Telecomunicações.
Para cada um dos setores há um analista-chefe que coordena os estudos e análises das
ações de empresas específicas de tal setor. Estes estudos são publicados em formato de
relatórios e distribuídos aos clientes da corretora do Banco Morgan Stanley. Os clientes da
corretora são principalmente os fundos de investimento e grandes investidores estrangeiros,
que utilizam os estudos desenvolvidos pelos analistas do banco para formar as suas opiniões
sobre o mercado financeiro e poder então definir melhores opções de investimento.
A partir dos estudos setoriais e das projeções macroeconômicas identificadas pelos
economistas do banco são feitas as principais análises da área de Equity Strategy. O
estrategista analisa globalmente os efeitos macroeconômicos no mercado de ações que não se
limita a um único setor específico. A comparação entre diferentes setores e papéis de
empresas preferidos de cada analista permite ao estrategista extrair informações importantes
para identificar oportunidades no mercado.
15
Como dito anteriormente, o principal produto da área de pesquisa e de estratégia são
os relatórios. Estes possuem periodicidades diferentes, ou seja, existem relatórios que são
publicados semanalmente, outros mensalmente e até mesmo trimestralmente. No relatório
semanal, analisam-se as principais mudanças de projeções e estimativas macro e
microeconômicas durante a semana anterior. O principal relatório é publicado mensalmente e
possui um tema diferente a cada mês dependendo dos fatos recentemente ocorridos ou que
poderão surgir. Além disso, existe outro onde se publica uma seleção de dez ações que,
segundo o estrategista-chefe, poderão apresentar retornos maiores que a média das ações
listadas durante o mês corrente, ou seja, trata-se de uma seleção de ações com objetivo de
retorno a curto prazo.
Foi neste contexto de estágio que se inspirou o tema central do presente trabalho de
formatura, a ser detalhado na seção 1.3.
1.3 .Motivação para a realização do trabalho
O papel da área de estratégia de um banco é tentar prever como os mercados se
comportarão principalmente no médio e longo prazos. Usualmente, como terminologia dessa
área, entende-se como curto prazo o período de até 1 mês; médio entre 1 e 3 meses e longo
para um prazo superior a 3 meses. Para tanto, um dos passos fundamentais é a análise dos
acontecimentos econômicos passados, a partir dos quais pode-se identificar padrões e
fenômenos reincidentes dentro de determinadas condições macroeconômicas. O
conhecimento desses eventos que se repetem e da forma como impactam os diferentes setores
econômicos é para o estrategista um instrumento poderoso que lhe dá pistas de como os
papéis das empresas se comportarão no futuro.
Um exemplo clássico de evento reincidente são os períodos de ciclo monetário de
redução, conservação e elevação da taxa de juros. A fim de melhor ilustrar esse ciclo, podem-
se tomar por base os fatos observados a partir do segundo semestre de 2008. Com o pedido de
concordata da Lehman Brothers, a crise financeira atingiu o seu ápice e, como consequência,
as economias globais entraram em recessão. Neste período, o mercado entrou em um regime
turbulento, observando-se uma alta volatilidade e tornando-se quase imprevisível. Criou-se
assim um contexto econômico altamente desafiador para o trabalho do analista de estratégia.
Neste contexto econômico, os países “desenvolvidos” presenciaram um verdadeiro
colapso em seus sistemas financeiros que atingiu a economia dos países emergentes alguns
16
meses depois, como o Brasil, embora em menor intensidade. Assim, para diminuir a falta de
liquidez nos mercados financeiros e seus efeitos recessivos na economia real, o Banco Central
do Brasil iniciou o corte da taxa básica de juros (SELIC) que, no início de janeiro de 2009,
encontrava-se no patamar de 13,75% a.a. (ao ano) e terminou o mês de julho de 2009 à 8,75%
a.a. Esta tendência também foi observada em outros países da América Latina, como Chile e
México. Sabe-se que uma taxa de juros mais baixa tem como consequência incentivar o
crédito às empresas, estimular a economia, além de causar um impacto positivo no aumento
de investimentos de longo prazo no país (Mankiw, 2005).
Após tomarem medidas para estimular o crescimento da economia e terminarem o
ciclo de redução da taxa básica de juros, tanto as economias mundiais quanto a brasileira
começaram a apresentar sinais de recuperação. Ao longo do ano de 2009, os dados relativos a
esta recuperação da economia global foram se tornando cada vez mais positivos. Desta forma,
os estímulos e medidas tomados pelos governos no ápice da crise puderam ser retirados (por
exemplo, a redução do imposto para a aquisição de certos bens de consumo), embora os juros
se mantivessem no mesmo patamar atenuado.
Enfim, no caso específico do Brasil, a retomada do crescimento do consumo interno,
da produção industrial e das exportações voltou a pressionar o perigo de alta inflação. Assim,
para controlá-la, espera-se que o Banco Central inicie um ciclo de elevação da taxa básica de
juros que terá continuidade, de acordo com as expectativas do mercado, ao longo de 2010 e
2011.
É neste contexto econômico, dentro da área de estratégia, que emergiu a necessidade
de observar e se possível conseguir prever o comportamento das ações nos diferentes períodos
do ciclo monetário assim como determinar outros fatores que possam influenciar o grupo de
ações que será analisado neste trabalho.
1.4 .Objetivo do trabalho
O objetivo do presente trabalho é identificar, a partir de dados históricos obtidos, a
influência que os ciclos monetários e as características de cada uma das empresas podem ter
no comportamento do preço das ações, analisado através do seu retorno. Tais ações não serão
estudadas individualmente, mas reunidas em grupos que possuam comportamentos
semelhantes de acordo com o cenário monetário definido. Desta forma, pode-se estabelecer
uma melhor estratégia de investimento no mercado de ações.
17
Além disso, definiu-se que será abordado somente as ações do tipo domésticas (ou
seja, empresas que não são produtoras nem exportadoras de commodities), que são ações de
empresas que possuem seu mercado principal no Brasil e por isso suas atividades estão
diretamente relacionadas com o nível da taxa básica de juros. Ao contrário de empresas do
tipo commodities que, por seus principais mercados estarem localizados no exterior
(normalmente na Europa, China e EUA), dependem principalmente do cenário internacional e
que, portanto, não sofrem forte influência da política monetária brasileira.
Este trabalho está organizado da seguinte forma:
• Análise preliminar dos dados: neste capítulo, serão definidas as empresas cujas
ações serão analisadas, o tipo de retorno das ações e os períodos do ciclo
monetário que serão posteriormente utilizados para desenvolver o trabalho.
• Revisão bibliográfica: nesta parte, serão apresentadas as teorias utilizadas como
base do estudo realizado; neste caso, será abordado o tema de modelos lineares
generalizados, principal assunto deste trabalho, e as considerações feitas para se
chegar ao modelo de previsão.
• Definição do modelo: Para definir o modelo de previsão, será aplicado o
procedimento apresentado na revisão bibliográfica. Assim, será feita uma
regressão Gamma aplicada aos dados analisados neste trabalho que se
classificaram como heterocedásticos. Além disso, serão detalhadas as etapas do
processo para definir o melhor modelo para o conjunto de dados deste trabalho.
Em seguida, será apresentada a equação de previsão e será feita uma análise e
interpretação dos parâmetros estimados. Finalmente, far-se-á uma aplicação do
modelo de previsão definido para estimar alguns valores de retornos para os
grupos de ações definidos.
• Conclusões: serão feitas as considerações finais sobre o trabalho, os resultados
obtidos e a utilidade de se criar um modelo de previsão como o desenvolvido neste
trabalho.
18
19
2. ANÁLISE PRELIMINAR
Neste capítulo, serão escolhidas as empresas cujas ações serão analisadas além de
classificá-las em três categorias estabelecidas para este estudo: setor econômico, super-setor e
tamanho da empresa. Também serão desenvolvidas neste capítulo a definição do retorno
trimestral das ações e a classificação dos períodos do ciclo monetário que serão
posteriormente utilizados para desenvolver o modelo de previsão, o principal objetivo deste
trabalho.
2.1 .Escolha e classificação das ações
Para o estudo proposto neste trabalho, escolheram-se 72 ações de empresas listadas na
BOVESPA, identificadas com o perfil do tipo doméstico. Trata-se de uma escolha por
conveniência que foi estabelecida em conjunto com o estrategista-chefe de ações para a
América Latina do Banco Morgan Stanley.
Primeiramente, obteve-se a série histórica de preços para cada um dos 72 papéis
escolhidos além da série histórica da taxa de juros (SELIC), esta última definida pelo Banco
Central através do Comitê de Política Monetária (Copom). A fonte de dados escolhida foi o
terminal da Bloomberg, devido à facilidade de se exportar dados para uma planilha em MS
Excel. A Bloomberg é atualmente um dos provedores de informação mais largamente
utilizados no mercado financeiro.
Coletaram-se as séries históricas de dados desde janeiro de 2002 até novembro de
2009 em uma frequência semanal, ou seja, utilizando apenas os preços de fechamento de
mercado do final da semana. Excluiu-se a possibilidade de coletar os dados em uma
frequência diária em razão da quantidade de dados a serem coletados. Além disso, acredita-se
que a frequência semanal seja suficiente para obter a informação que se procura analisar neste
trabalho de formatura.
Para este estudo, analisou-se a curva da taxa de juros observada no período de 2002 a
2009 e definiram-se três diferentes momentos da evolução da taxa de juros:
i) Corte: Período no qual se observa redução da taxa básica de juros;
ii) Estável: Período de sucessivos meses com taxa de juros constante;
iii) Subida: Período no qual se observa aumento da taxa básica de juros.
20
Assim, com a série histórica de taxa de juros desde 2002 e a definição dos três
diferentes momentos (corte/estável/subida), classificaram-se os diferentes períodos da série
como mostra a Tabela 2.1.1:
Tabela 2.1.1 - Classificação da série da taxa de juros (SELIC)
Período Classificação Janeiro-2002 a Outubro-2002 Corte
Outubro-2002 a Março-2003 Subida
Março-2003 a Julho-2003 Estável
Julho-2003 a Dezembro-2003 Corte
Dezembro-2003 a Setembro-2004 Estável
Setembro-2004 a Maio-2005 Subida
Maio-2005 a Setembro-2005 Estável
Setembro-2005 a Setembro-2007 Corte
Setembro-2007 a Abril-2008 Estável
Abril-2008 a Novembro-2008 Subida
Novembro-2008 a Janeiro-2009 Estável
Janeiro-2009 a Setembro-2009 Corte
Setembro-2009 a Junho-2010 Estável
A representação da Tabela 2.1.1 pode ser feita como mostra a Figura 2.1.1, onde se
observa a evolução da taxa básica de juros ao longo do tempo:
Figura 2.1.1 – Evolução da taxa de juros ao longo do tempo
5%
10%
15%
20%
25%
30%
jan-02 jan-03 jan-04 jan-05 jan-06 jan-07 jan-08 jan-09
CorteCorte
Corte
Corte
Subida
Subida
Subida
Estável
Estável
Estável
Estável
EstávelEstável
Tempo
Taxa de juros
21
Uma vez definida a classificação dos diferentes períodos do ciclo monetário como
estão representados na Tabela 2.1.1 e na Figura 2.1.1, analisar-se-á os retornos das ações em
cada uma destas três situações. Além disso, ressalta-se que será esta classificação a referência
que será considerada para a definição do modelo de previsão que será construído ao longo
deste trabalho.
As ações escolhidas foram classificadas de acordo com três critérios distintos segundo
setor econômico, super-setor e tamanho da empresa. O intuito desta diferenciação com
critérios distintos é isolar características atribuíveis a grupos de empresas para enfim melhor
observar como o impacto dos ciclos monetários no preço dos papéis pode variar segundo o
perfil das empresas.
Os setores econômicos estão divididos em nove neste trabalho: 1) Alimentos, bebidas
e tabaco, 2) Bancos e instituições financeiras, 3) Construção civil e engenharia, 4) Educação,
5) Infraestrutura, logística e concessões, 6) Saúde, 7) Telecomunicações, 8) Utilidade pública
e 9) Varejo.
De acordo com os critérios estabelecidos, a classificação das empresas segundo setores
econômicos apresentou as seguintes frequências para cada um dos setores:
• 5 empresas de alimentos, bebidas e tabaco;
• 12 empresas de bancos e instituições financeiras;
• 24 empresas de construção civil e engenharia;
• 3 empresas de educação;
• 9 empresas de infraestrutura, logística e concessões;
• 4 empresas de saúde;
• 4 empresas de telecomunicações;
• 7 empresas de utilidade pública;
• 4 empresas de varejo;
Já os super-setores são classificações mais abrangentes do que os setores econômicos,
e podem ser definidos como sendo 1) de crescimento ou 2) defensivo. Empresas de
crescimento geram elevados fluxos de caixa e lucro líquido e apresentam taxas de crescimento
acima do nível da economia como um todo (da mesma forma que apresentam redução maior
em seus lucros em caso de desaceleração econômica). Geralmente, tendem a ter rentáveis
oportunidades de reinvestimento de seu lucro. Por isso, este tipo de empresa na maior parte
22
das vezes paga poucos dividendos aos acionistas, optando por reinvestir o lucro da empresa
em outros projetos. Por outro lado, empresas defensivas são companhias que apresentam
lucros relativamente estáveis, independente do nível de crescimento da economia, ou seja,
seus lucros apresentam pequena sensibilidade a altos ou baixos níveis de crescimento
econômico. De acordo com este critério de super-setor, 45 empresas foram classificadas como
sendo empresas de crescimento enquanto as 27 restantes foram classificadas como empresas
defensivas.
O terceiro critério utilizado foi a classificação das empresas por tamanho feita segundo
a liquidez da ação da empresa na BOVESPA durante os três meses mais recentes. O indicador
de liquidez utilizado foi o volume diário médio de negociação. Por isso, foi necessário obter a
série histórica do volume diário de negociação dos papéis das 72 empresas escolhidas
utilizando o terminal da Bloomberg e as ordenar de forma decrescente segundo a sua liquidez.
Foram definidas três tamanhos de empresa : 1) Grandes, 2) Médias e 3) Pequenas empresas,
onde um terço das ações foram classificadas como de grandes empresas, outros um terço
como de médias empresas e o um terço restante como ações de pequenas empresas. As
empresas classificadas como grandes foram aquelas que apresentaram os 24 maiores volumes
médios diários de negociação entre as ações escolhidas (tais empresas tiveram o volume
médio diário de negociação superior a 14,5 bilhões de reais). As empresas classificadas como
médias apresentaram o volume médio de negociação diário entre 14,5 e 2,2 bilhões de reais. E
por fim, as pequenas empresas tiveram um volume médio de negociação diário inferior a 2,2
bilhões de reais. Por conta desse ajuste trimestral e da variação de liquidez das ações que pode
ocorrer, esta é a única classificação em que os grupos podem sofrer alterações na sua
composição ao longo do tempo.
As classes de cada uma das três variáveis categóricas estão descritas na Tabela 2.1.2.
A lista completa das 72 empresa escolhidas e as suas respectivas classificações podem ser
encontradas no Anexo A.
23
Tabela 2.1.2- Lista das classificações utilizadas por categoria
Super-setores Setores Tamanho
Ações de crescimento Alimentos, Bebidas e Tabaco Grandes empresas
Ações defensivas Bancos e Instituições Financeiras Médias empresas
Construção civil e Engenharia Pequenas empresas
Educação
Infraestrutura, Logística e Concessões
Saúde
Telecomunicações
Utilidade pública
Varejo
Em função do pequeno número de empresas em algumas das 9 categorias de setores
econômicos (como por exemplo educação, saúde, telecomunicações, varejo e alimentos,
bebidas e tabaco que apresentaram entre três a cinco empresas em cada setor), houve a
necessidade de reagrupar tais setores econômicos em grupos homogêneos segundo algum
critério. A técnica escolhida para aplicar o agrupamento foi a Automatic Interaction Detection
(A.I.D). Ela foi proposta por Morgan e Sonquist (Kass, 1974). Ademais, esta técnica é um
procedimento de agrupamento de dados utilizando partições binárias.
O princípio do A.I.D é dividir os dados analisados em dois subgrupos que modo que
sejam o mais diferentes possíveis de acordo com a variável de interesse definida e que
internamente, cada subgrupo seja o mais homogêneo possível. Em seguida, cada um dos
subgrupos é analisado independentemente do outro e dividido em mais dois subgrupos;
obtendo-se então ao final da segunda iteração 4 subgrupos. Este procedimento é continuado
até atender a algum critério pré-estabelecido. Assim, a fim de reduzir o número de categoria
de setor, empregou-se a técnica A.I.D. ao grupo de setores econômicos.
Calculou-se a média dos retornos trimestrais para cada um dos nove setores.
Tomando-se a média dos retornos como parâmetro, classificaram-se os grupos em ordem
decrescente de média, sendo G1 o setor econômico com maior média e G9 o setor com menor
média (vide Tabela 2.1.3).
24
Tabela 2.1.3 - Setores ordenados por média dos retornos das ações
Setor Nome Média
G1 Varejo 3,2%
G2 Construção civil e Engenharia 3,1%
G3 Infraestrutura, Logística e Concessões 3,0%
G4 Bancos e Instituições Financeiras 0,1%
G5 Alimentos, Bebidas e Tabaco -0,2%
G6 Saúde -1,2%
G7 Utilidade pública -1,5%
G8 Telecomunicações -2,2%
G9 Educação -2,4%
Com os setores ordenados, procurou-se a partição que fornecesse dois grupos o mais
distintos possíveis. Por exemplo, uma partição possível é separar um grupo A contendo o
setor G1 e um grupo B contendo os setores de G2 à G9. Para isto uma análise de variância foi
utilizada e cujo resultado está na Tabela 2.1.4.
Tabela 2.1.4 - Resultado da Análise de Variância entre os grupos formados por G1 e por G2 a G9
Realizou-se o mesmo teste para todas as partições possíveis, conforme a descrição dos
grupos A e B definidos na Tabela 2.1.5. Nesta tabela, as estatísticas F para cada partição
foram também incluídas.
Análise de variancia: um fator
DetalhesGrupos Tamanho amostra Soma Média Variancia
Colonne 1 393 12,7547033 0,03245472 0,00827542Colonne 2 2651 0,73144867 0,00027591 0,01781305
Análise de VarianciaCausas da Variação SQ GL QM F P F crítico (5%)Tratamentos 0,354402978 1 0,35440298 21,3701683 3,9438E-06 3,844517334Resíduos 50,44854331 3042 0,01658401
Total 50,80294629 3043
25
Tabela 2.1.5 – Valor de F para todas as partições possíveis (1ª iteração)
# Componentes do Grupo A Componentes do Grupo B Estatística F
1 G1 G2, G3, G4, G5, G6, G7, G8, G9 21,4
2 G1, G2 G3, G4, G5, G6, G7, G8, G9 47,5
3 G1, G2, G3 G4, G5, G6, G7, G8, G9 75,9
4 G1, G2, G3, G4 G5, G6, G7, G8, G9 63,3
5 G1, G2, G3, G4, G5 G6, G7, G8, G9 55,2
6 G1, G2, G3, G4, G5, G6 G7, G8, G9 44,2
7 G1, G2, G3, G4, G5, G6, G7 G8, G9 26,6
8 G1, G2, G3, G4, G5, G6, G7, G8 G9 6,3
Como pode ser observado na Tabela 2.1.5, o maior F obtido foi 75,9 que corresponde
aos grupos formados por: G1 a G3 (Grupo A) e G4 a G9 (Grupo B) e portanto, podem ser
considerados como os dois grupos o mais distintos possíveis entre os grupos analisados.
Assim, a primeira divisão resultou nos grupos:
a. Grupo 1: G1, G2 e G3;
b. Grupo 2: G4, G5, G6, G7, G8 e G9.
Efetuou-se em seguida testes entre os setores do Grupo 1 e entre os setores do Grupo 2
da mesma forma realizada anteriormente. O teste é interrompido quando os F’s obtidos não
forem mais significativos (i.e. abaixo do F crítico – que neste caso foi realizado com α igual à
5% e cujo valor é de 3,84).
Para o grupo formado por G1, G2 e G3, o resultado das análises de variância estão na
Tabela 2.1.6. Observa-se que nenhum dos F’s obtidos é maior que o F crítico. Por esta razão,
não se pode separar o Grupo 1, formado pelos setores G1, G2 e G3, em mais subgrupos.
Tabela 2.1.6 - Valor de F para todas as partições possíveis (2ª iteração – Grupo 1)
# Componentes do Grupo A1 Componentes do Grupo B1 Estatística F
1 G1 G2, G3 0,04
2 G1, G2 G3 0,002
Da mesma forma, para o Grupo 2 formado por G4, G5, G6, G7, G8 e G9 foram
efetuadas análises de variâncias, cujos valores de F estão expostos na Tabela 2.1.7.
26
Tabela 2.1.7 - Valor de F para todas as partições possíveis (2ª iteração – Grupo 2)
# Componentes do Grupo A2 Componentes do Grupo B2 Estatística F
1 G4 G5, G6, G7, G8, G9 6,9
2 G4, G5 G6, G7, G8, G9 14,2
3 G4, G5, G6 G7, G8, G9 12,9
4 G4, G5, G6, G7 G8, G9 9,6
5 G4, G5, G6, G7, G8 G9 2,5
De acordo com os resultados da Tabela 2.1.7, o Grupo 2 dividiu-se em dois grupos de
setores:
• Grupo 3: G4 e G5;
• Grupo 4: G6, G7, G8 e G9.
O mesmo algoritmo foi reaplicado aos grupos 3 e 4. Observa-se na Tabela 2.1.8 as
partições possíveis e a estatística F de cada uma delas. Assim, pode-se verificar que não
houve mais partições pois os valores de F são menores que o valor de F crítico.
Tabela 2.1.8 - Valor de F para todas as partições possíveis (3ª iteração – Grupo 3 e 4)
# Componentes do Grupo A3 Componentes do Grupo B3 Estatística F
1 G4 G5 0,47
2 G6 G7, G8, G9 0,79
3 G6, G7 G8, G9 1,40
4 G6, G7, G8 G9 0,46
Na Figura 2.1.2, resume-se o agrupamento de setores realizado utilizando o método
A.I.D. As ações classificadas primeiramente em 9 setores foram realocadas em 3 grupos da
seguintes forma:
• Grupo SI: i) Varejo (G1), ii) Construção civil e engenharia (G2) e iii)
Infraestrutura, logística e concessões (G3);
• Grupo SII: i) Bancos e instituições financeiras (G4) e ii) Alimentos, bebidas e
tabaco (G5);
• Grupo SIII: i) Saúde (G6), ii) Utilidade pública (G7), iii) Telecomunicações
(G8) e iv) Educação (G9).
27
Figura 2.1.2 - Realocação dos setores em três grupos segundo o A.I.D.
Desta forma, como ilustra a Figura 2.1.2, o resultado da aplicação do método A.I.D
mostra que se pode considerar os setores de varejo, de construção civil e engenharia e de
infraestrutura como um único grupo de retorno trimestral médio igual a 3,1%. Da mesma
forma, observa-se que o outro grupo será composto pelos setores bancos e instituições
financeiras e alimentos, bebidas e tabaco. Enfim, o terceiro grupo de setores é formado por
empresas da área da saúde, utilidade pública, telecomunicações e educação.
Em um primeiro momento, este agrupamento pode parecer estranho por incluir, por
exemplo, infraestrutura e varejo no mesmo grupo, setores que aparentemente são
completamente diferentes. Porém, observando a sensibilidade à variação da taxa de juros,
ambos são impactados negativamente quando ocorre o seu aumento da seguinte forma:
quando a taxa de juros aumenta, os bancos cobram mais caro os empréstimos feitos aos
varejistas e também ao consumidor. O consumidor, por pagar mais juros aos bancos, pega
menos crédito e consequentemente gasta menos. Os varejistas também pagam mais caro para
obter empréstimos, por isso, caso queiram financiar as compras de seus clientes (as famosas
parcelas mensais e carnês), terão que repassar este custo dos juros a seus clientes e não
poderão oferecer condições tão boas de pagamentos aos consumidores. Como consequência,
haverá menos consumo e, portanto, menos receita para a empresa varejista.
Construção civil e engenhariaInfraestrutura, logística econcessões
Bancos e instituiçõesfinanceiras Utilidade públicaAlimentos, bebidas Telecomunicaçõese tabaco Educação
Y = 0,4%
F = 14,2
Saúde
Varejo
F = 75,9
Y1 = 3,1% Y2 = -1,1%
Y3 = -0,1% Y4 = -1,1%
28
No caso das empresas ligadas a infraestrutura e logística, os investimentos nesta área
requerem elevado aporte de capital e um longo prazo para recuperar o capital investido. Como
uma parte deste capital necessário para o investimento é proveniente da contração de dívida,
quanto maior os juros, maior o custo de capital de dívida da empresa/projeto. Assim, em um
ambiente de alta taxa de juros, empresas ligadas a este setor tendem a diminuir os seus
investimentos, e portanto, apresentam menor crescimento. Conclui-se, enfim, que empresas de
ambos setores de varejo e de infraestrutura seguem uma mesma tendência de crescimento
afetados pela variação da taxa de juros.
Outros dois setores agrupados no mesmo grupo são bancos e instituições financeiras e
alimentos, bebidas e tabaco (com média de retorno de -0,1%). Ambos podem não ser
impactados de forma negativa pelo aumento da taxa de juros já que no caso dos bancos, a sua
receita está ligada ao recebimento de juros dos empréstimos concedidos e que esta aumenta
com a elevação da taxa de juros. No caso das empresas de alimentos, bebidas e tabaco, pode-
se associar o mesmo pensamento, pois o consumidor não financia suas compras de itens de
supermercado e não deixa de consumir produtos básicos por causa do nível da taxa de juros.
O outro grupo é composto pelos setores de saúde, educação, utilidade pública e
telecomunicações, que embora não pareça intuitivamente um grupo homogêneo, apresentaram
médias de retornos semelhantes. Além disso, nota-se que as atividades destes setores são
menos sensíveis a variação do crescimento da economia do país.
Para complementar a análise feita anteriormente dos setores e principalmente para
observar o comportamento dos retornos das ações em cada um dos períodos do ciclo
monetário, traçaram-se gráficos das distribuições dos retornos trimestrais para cada um dos
setores.
A Figura 2.1.3 ilustra a distribuição dos retornos trimestrais de ações de empresas do
setor de varejo divididos nos três diferentes períodos do ciclo monetário. A partir deste
gráfico, pode-se verificar que em períodos de corte de taxa de juros as ações deste setor
apresentaram retornos positivos em uma frequência maior que em períodos de subida da taxa
de juros. Isto pode ser explicado pela alta relação que o desempenho das empresas do setor de
varejo possuem com a facilidade de obtenção de crédito, como abordado anteriormente.
Por outro lado, observa-se na Figura 2.1.4 uma distribuição diferente da apresentada
na Figura 2.1.3. Em períodos de alta de juros as ações de empresas do setor bancário
29
apresentaram retornos positivos em uma frequência maior que em períodos de corte de taxa
de juros. Isso pode ser explicado pelo fato de parte da receita destas instituições ser
diretamente ligada a taxa juros, ou seja, quanto maior os juros no mercado, maior serão os
juros cobrados por estas instituições aos clientes e conseqüentemente maiores serão as
receitas geradas.
Figura 2.1.3 - Distribuição dos retornos para ações de empresas do setor Varejo para os três diferentes períodos do ciclo da taxa de juros (SELIC)
Figura 2.1.4 - Distribuição dos retornos para ações de empresas do setor Bancos e Instituições Financeiras para os três diferentes períodos do ciclo da taxa de juros (SELIC)
0%
10%
20%
30%
40%
50%
-24% -18% -12% -6% 0% 6% 12% 18% 24%
Corte Estável Subida
0%
10%
20%
30%
40%
-6% -4% -2% 0% 2% 4% 6%
Corte Estável Subida
30
Outra constatação que se pode notar a partir dos gráficos é que as distribuições dos
retornos não são simétricas. Algumas possuem assimetria com tendência positiva e outros
negativa. Assim, acredita-se que uma das idéias iniciais de definir o modelo utilizando
modelos lineares, ou seja, assumindo que os retornos possuem distribuição normal, possa não
ser eficiente para se encontrar um modelo adequado para este trabalho.
Por constatar este problema que pode ocorrer ao assumir os dados segundo uma
distribuição normal, pensou-se em uma maneira de calcular os retornos trimestrais sem que
estes apresentem formas negativas. Tal fato poderia restringir as possibilidades de abordar o
problema utilizando outras distribuições já que uma grande parte das distribuições não
assumem valores negativos. Desta forma, foi definido o cálculo do retorno que será utilizado
na modelagem deste trabalho.
2.2 . Definição do retorno das ações
Como discutido anteriormente, há uma restrição quanto ao valor que os retornos das
ações podem assumir: estes não devem ser negativos. Assim, neste trabalho, ao invés de se
calcular o retorno como porcentagem de redução ou aumento do preço da ação (o que teria
como consequência a obtenção de valores negativos), o retorno de uma ação será considerado
como a razão do preço em uma data (t+13) pelo preço na data referência (t), onde t é
expressado em semanas. Assume-se que um ano possui 52 semanas e como três meses
correspondem a um quarto de um ano, o número de semanas em três meses será considerado
como 13. Assim, considerando-se os retornos trimestrais (ou 13 semanas), a razão R na
semana t, é definida como mostra a Equação 2.2.1.
ttt PPR /13+=
Equação 2.2.1 - Razão de preços por trimestre
Assim, caso Rt seja maior que 1, evidencia-se uma valorização do preço do papel no
trimestre e, portanto, o acionista obteve lucro. Caso contrário, se Rt for menor que 1, há uma
desvalorização do ativo em questão, o que corresponde a um prejuízo para o acionista.
Ao calcular o retorno da ações desta forma, garante-se a obtenção de somente valores
positivos de entrada no modelo do problema. Este fato garante flexibilidade para trabalhar
com uma grande variedade de distribuições para testar o modelo (ex. Distribuição binomial,
Poisson, Gamma, exponencial, etc.) e não restringe o teste do modelo a aplicação da
31
distribuição normal que nem sempre é a mais adequada, podendo comprometer a qualidade
dos resultados.
Por isso, calcular-se-á o retorno pela razão entre preços, de forma a obter liberdade
para testar o modelo com diferentes distribuições, caso seja necessário.
32
33
3. REVISÃO BIBLIOGRÁFICA
Neste capítulo serão abordados os temas que servirão de base para o desenvolvimento
do modelo de previsão para as ações escolhidas no capítulo 2.
Em um primeiro momento, serão abordados os modelos lineares generalizados, a sua
estrutura e as distribuições da família exponencial, em especial a distribuição Gamma, e será
apresentado o conceito de função link e a sua ligação com a definição do modelo de previsão.
Em seguida, serão detalhados os passos para a definição do modelo de previsão e
quais as equações consideradas neste processo. Enfim, serão apresentados alguns indicadores
que serão utilizados para testar a significância dos parâmetros estimados e a qualidade do
modelo de previsão definido.
3.1 Modelos lineares generalizados
Segundo Myers, Montgomery e Vining (2002), um modelo é uma forma abstrata de
representar a realidade e de fazer uma aproximação mais simples de um fenômeno complexo.
Modelos podem ser classificados como determinísticos ou probabilísticos. Em um modelo
determinístico, as variáveis respostas são geralmente definidas por conjunto de equações. São
exemplos de modelos determinísticos equações relacionadas à ciência, como a lei dos gases
ideais ou a primeira lei da termodinâmica. Por outro lado, em um modelo probabilístico, as
respostas apresentam variações devido ao fato de existirem variáveis aleatórias ou então
conter variáveis impactadas de certa forma por elementos aleatórios.
Um modelo linear probabilístico pode ser definido como mostra a Equação 3.1.1:
εββββ +++++= ppo xxxY ...2211
Equação 3.1.1- Definição de um modelo linear probabilístico
Onde Y é a variável resposta e x1, x2, x3,.., xp, é um conjunto de covariáveis, β0, β1,
β2,..., βp, são um conjunto de parâmetros desconhecidos e ε é uma variável aleatória
relacionada ao erro. Para escrever o modelo que estima o valor esperado de Y, considera-se o
valor esperado para erro ε geralmente como nulo. Assim, o valor esperado de Y no modelo de
regressão linear é definido como:
34
( ) ppo xxxYE ββββ ++++= ...2211
Equação 3.1.2 – Valor esperado de Y
Além disso, se existe interação entre as covariáveis do modelo, no caso de duas
variáveis, pode-se escrever a equação da seguinte forma:
εββββ ++++= 21122211 xxxxY o
Equação 3.1.3 – Modelo linear com interação entre variáveis para o caso de duas variáveis
O modelo linear apresentado na Equação 3.1.2 é chamado de modelo linear de
primeira ordem ou também de modelo com os efeitos principais (“main-effects model”) e o
modelo da Equação 3.1.3 de modelos de interação de segunda ordem.
Quando se trabalha com modelos de regressão lineares (e também não lineares),
assume-se que a variável resposta Y segue uma distribuição normal. Porém, existem casos
onde esta condição não é satisfeita e que a premissa de normalidade da amostra é irreal. Desta
forma, foi desenvolvida a teoria dos modelos lineares generalizados (GLM).
Se yi é uma variável resposta, para i = 1,2,...,n, então o GLM é definido como:
( ) ( )[ ]== ii yEgg µ xi‘β
Equação 3.1.4 – Definição de modelo linear generalizado
Onde o vetor xi é o vetor de covariáveis para a i-ésima observação e β é o vetor de
parâmetros ou coeficientes de regressão. Todo modelo linear generalizado possui três
componentes:
• uma distribuição da variável resposta;
• um estimador linear (“predictor linear”) onde as covariáveis de regressão xi
são consideradas;
• uma função link g que conecta o estimador linear à média natural da variável
resposta.
Os modelos lineares generalizados foram desenvolvidos para se permitir estruturar
modelos de regressão para dados que seguem uma distribuição mais abrangente, a chamada
família exponencial. A família exponencial inclui as distribuições normal, binomial, Poisson,
exponencial, Gamma e outras.
35
Um conceito importante sobre os modelos lineares generalizados são as distribuições
da família exponencial. Os membros de uma família exponencial têm todos funções densidade
de probabilidade para uma variável resposta y que pode ser expressada como mostra a
Equação 3.1.5.
( ) ( )( ) ( )
+−= φφ
θθφθ ,exp;; yca
byyf
Equação 3.1.5 –Expressão geral da função densidade de probabilidade para membros da família exponencial
Onde, na Equação 3.1.5, a(.), b(.) e c(.) são funções específicas. O parâmetro θ é o
parâmetro natural e o φ é chamado de parâmetro de dispersão. Para alguns membros da
família exponencial, como a binomial e a Poisson, o valor de φ é 1.
A distribuição normal, por exemplo, faz parte da família exponencial. Assim, a função
densidade de probabilidade para uma variável normal aleatória y com parâmetros µ e σ é
definida como mostra a Equação 3.1.6:
( ) [ ]σπσ
µσµ⋅
⋅
−−=
2
1
2exp;;
2
2yyf
Equação 3.1.6 – Função densidade de probabilidade para uma variável normal aleatória
Outro membro da família exponencial é a distribuição Gamma, que por possui dois
parâmetros r e λ, assume formas assimétricas e por isso possui uma maior flexibilidade para
modelar.
A função densidade de probabilidade da distribuição Gamma pode ser definida para
uma variável y contínua, onde r>0 e λ>0, é dada como:
1/1
)(
1)( −−
Γ= ry
r
yer
yf λ
λ
Equação 3.1.7 –Definição da função densidade de probabilidade da distribuição da família Gamma
Onde )(rΓ é a função gamma definida, para r>0, como mostra a Equação 3.1.8:
36
∫∞
−−=Γ0
1)( dxexr xr
Equação 3.1.8- Definição da função Gamma
E a média e a variância das função Gamma são definidas como: ( ) λrGammaE = e
( ) 2λrGammaVar = .
Ao colocar a função de densidade na forma de uma distribuição da família
exponencial como mostra a Equação 3.1.5, chega-se às seguintes equações:
rλθ 1−=
λµ r=
( ) 1−= ra φ
( ) ( )θθ −−= lnb
( ) ( ) ( ) yrrrrc ln1lnln −+Γ−=φ
O parâmetro r é escalar e quando assume o valor 1 a distribuição Gamma se reduz a
uma distribuição exponencial. Assume-se que o valor de r é constante em uma regressão de
um conjunto de dados, o que implica que a média varia de acordo com o parâmetro λ. Em
geral, o parâmetro r pode ser estimado através de métodos de máxima verossimilhança.
Considerando-se a função densidade de probabilidade para a família exponencial
como apresentada na Equação 3.1.5, a estrutura formalizada dos modelos lineares
generalizados é definida da seguinte forma:
i. Existem y1, y2,..., yn observações independentes com médias µ1, µ2,..., µn
respectivamente;
ii. A observação yi segue uma das distribuições da família exponencial;
iii. Existe um conjunto de covariáveis de regressão x1, x2,..., xk;
iv. O modelo de previsão é construído baseando-se no estimador linear (“linear
predictor”), definido como =η x’β ∑=
+=k
iii x
10 ββ ;
37
v. O modelo é definido através do uso da função link, como mostra a Equação
3.1.9:
( )ii g µη = , i = 1,2,...,n
Equação 3.1.9 – Definição da função link
O termo link (em inglês significa elo, vínculo) é utilizado devido ao fato desta
função ser a ligação entre a média e o estimador linear. Assim, a variável resposta esperada
para o modelo de regressão é definida como:
( ) ( ) 11 −− == ggyE ii η ( xi’β)
Equação 3.1.10 – Variável resposta para o modelo de regressão
Em uma regressão linear múltipla o modelo == ii ηµ xi’β, onde i = 1,2,...,n,
sugere um caso especial, onde ( ) iig µµ = , e assim a função link utilizada neste caso é a
função link identidade.
Maiores detalhes sobre a estrutura dos modelos lineares generalizados podem ser
encontrados no McCullagh e Nelder (1987). Existem várias possíveis escolhas da função link.
Se for escolhida uma função link com propriedade mostrada na Equação 3.1.11, ηi é chamada
de função link canônica.
ii θη =
Equação 3.1.11 – Função link canônica
Na Tabela 3.1.1 mostram-se as funções link canônicas para as distribuições mais
recorrentes e empregadas nos modelos lineares generalizados.
38
Tabela 3.1.1 –Lista de funções link canônicas
Distribuição Função link canônica
Normal ii µη = (link identidade)
Binomial
−=
i
ii P
P
1lnη (link logística)
Poisson ( )ii µη ln= (log link ou link logarítmica)
Exponencial i
i µη 1= (link recíproco)
Gamma i
i µη 1= (link recíproco)
Além da função link canônica, existem outras funções link que podem ser usadas em
modelos lineares generalizados. Algumas destas funções são:
a. Função link probit: ( )[ ]ii yE1−Φ=η , onde Φ representa a função de
distribuição acumulada da normal.
b. Função link log-log complementar: ( )[ ]ii µη −= 1lnln
c. Função link power family: ( )
=≠
=0,ln
0,
λµλµη
λ
se
se
i
ii
A escolha da função link mais adequada para o problema analisado é muito importante
pois usá-la de forma incorreta pode resultar em problemas significativos no modelo de
regressão ajustado.
3.2 Definição do modelo de previsão
Nesta trabalho considerou-se a utilização da distribuição Gamma entre todas as outras
distribuições da família exponencial. Isto foi feito pois ao representar graficamente os
retornos, observou-se que a curva de distribuição das frequências possui uma forma
assimétrica e que portanto a distribuição Gamma se encaixaria melhor devido aos seus dois
parâmetros λ e r.
39
Figura 3.2.1 - Distribuição de frequência dos retornos trimestrais
Para um parâmetro canônico =θ x’β, tem-se a seguinte equação para a média:
=−1µ x’β
A função link canônica no caso da distribuição exponencial e Gamma é a função link
recíproca (como mostra a Tabela 3.1.1). Observa-se que ao usar a função link canônica, a
média pode assumir valores negativos, o que não deve ocorrer em uma distribuição Gamma.
Ao contrário da função link recíproca, com a função log link, embora ela não seja uma função
link canônica, não se obtém valores negativos para as estimativas. Assim, para uma
distribuição Gamma a função log link foi escolhida e deste modo:
=)ln(µ x’β
e==µ
θ 1 xi’β
Desta forma, o modelo de previsão de primeira ordem terá forma exponencial (função
log link) e apresentará a forma como mostra a Equação 3.2.1:
)...exp()( 2211 nno xxxyE ββββµ ++++==
Equação 3.2.1 – Forma exponencial do modelo de previsão de primeira ordem
0%
10%
20%
30%
-55% -44% -33% -22% -11% 0% 11% 22% 33% 44% 55% 66%
40
Onde, as covariáveis xi do modelo deste trabalho são as variáveis categóricas descritas
anteriormente no capítulo 2.
Existem várias formas de representar variáveis categóricas num modelo de regressão.
Para exemplificar, considere o ciclo monetário que assume três categorias: corte, estável e
subida. Neste trabalho o ciclo monetário estará representado por duas variáveis x1 e x2. Assim,
para se estimar um ponto para uma empresa j em um instante t:
• Se este instante t está dentro de um período de taxa de juros estável, então o
valor de x1 será 1 e o valor de x2 será zero. Desta forma, o parâmetro estimado
β1 associado ao x1 será considerado no cálculo do retorno da ação da empresa j
no instante t (x1=1, x2=0);
• Da mesma forma, se t se encontra em um período de aumento de taxa de juros,
o coeficiente β2 associado ao x2 será considerado no cálculo do valor de Y(t)
pois x1 terá valor igual a zero e x2 terá valor igual a 1 (x1=0, x2=1);
• E enfim, se t se encontra em um período de corte de taxa de juros, ambos x1 e
x2 serão nulos, pois o valor estimado para a situação de um período de corte de
juros já está incluído no valor de β0 (x1=0, x2=0);.
Inicialmente será considerado o modelo de previsão de primeira ordem sem considerar
as interações entre as covariáveis. Porém, acredita-se que tais interações existam e por isso,
elas serão incluídas na Equação 3.2.1 posteriormente. Na procura do melhor modelo para o
problema proposto, analisaram-se tais interações e as que foram consideradas não-
significativas foram excluídas do modelo. Assim, a equação do modelo pode ser escrita como
mostra na Equação 3.2.2:
)......exp()( 1)1(311321122211 ppppnno xxxxxxxxxyE −−++++++++== βββββββµ
Equação 3.2.2 – Forma exponencial do modelo de previsão de segunda ordem ordem
Uma vez estabelecido um modelo, é necessário testá-lo para saber o quão ajustado e
adequado está em relação aos valores reais observados. Para isto, testes de hipóteses serão
feitos para verificar se os parâmetros estimados do modelo são significativos. Este
procedimento é uma das etapas mais importantes para a definição do modelo mais adequado.
41
A realização de testes de hipóteses para cada coeficiente de regressão (βi)
individualmente é útil na determinação do valor de cada variável de regressão do modelo e na
verificação dos níveis de significância de cada um dos parâmetros estimados. Assim, através
destes testes, pode-se analisar se o modelo fica melhor ajustado com a inclusão de certas
variáveis ou se a exclusão de outras variáveis que estavam inicialmente sendo consideradas
melhoram o modelo ajustado.
As hipóteses para testar a significância de um dos coeficientes de regressão (βi) é
definido por:
0:
0:
1
0
≠=
i
i
H
H
ββ
Se H0 não é rejeitado, então pode-se excluir xi do modelo. Defini-se a estatística do
teste para esta hipótese, como mostra a Equação 3.2.3:
)(0ie
i
bs
bt =
Equação 3.2.3 – Estatística do teste de hipótese
Onde bi é o coeficiente de regressão que estima o valor do parâmetro βi e se(bi) é uma
estimativa do erro padrão de bi. A hipótese nula H0 é rejeitada se 1,2/0 −−≥ kntt α , no caso deste
trabalho 1,96, o que corresponde a um nível de significância α de 5%. Vale lembrar que este
teste se trata de um teste marginal, pois o coeficente de regressão bi depende dos outros
coeficientes de regressão xj (i ≠ j) que também estão no modelo.
Durante o processo de definição do modelo, além de analisar individualmente as
estimativas dos parâmetros (bi), a fim de verificar a qualidade do teste, pode-se também
observar o comportamento da deviance que será definida na Seção 3.2.1.
3.2.1 Deviance e Akaike Information Criterion (AIC)
O cálculo da deviance quando se procura definir um modelo é uma das opções que
existem para testar a qualidade do modelo analisado. Existem alguns testes e formas de
analisar a deviance, que usa o critério da razão da verossimilhança. A deviance permite
avaliar se dois modelos são equivalentes ou não.
42
Será denominado o modelo completo, um modelo com m parâmetros independentes da
regressão de tal forma que, feita a estimativa dos parâmetros do modelo, restem zero graus de
liberdade disponíveis; o modelo reduzido será aquele com número de parâmetros igual a p
(onde p < m); e o modelo nulo é um modelo com ausência de covariáveis.
A deviance do modelo de regressão é definida como mostra a Equação 3.2.1.1:
( )( )
−=
PD
ςβςβ ln2)(
Equação 3.2.1.1 - Definição de deviance
Onde ς (β) é o valor da função de verossimilhança do modelo ajustado (com número
de parâmetros menor que m) com β substituído pelas estimativas de máxima verossimilhança
(MLE) e ς (P) é o valor da função de verossimilhança para o modelo completo no qual m
parâmetros são estimados.
Pode-se demonstrar que D(β) segue uma distribuição 2pm−χ com (m-p) graus de
liberdade, onde m é o número de parâmetros estimados no modelo completo e p é o número
de parâmetros estimados no caso do modelo ajustado.
Um valor pequeno da deviance D(β) implica que o modelo ajustado não é
significamente pior do que o modelo completo. Neste caso, utilizando o princípio da
parsimônia, que diz que quando duas soluções para o mesmo problema são quase idênticas
deve-se optar pela opção mais simples, a solução do modelo ajustado será a escolhida pois é
mais simples e fornece a mesma qualidade para o modelo de previsão do que o modelo
completo. Assim, conclui-se que quanto menor o valor da deviance, melhor é o modelo
ajustado.
Outra regra simples para analisar a qualidade do modelo é utilizar a razão
deviance/(m-p); quando esta razão é muito elevada, pode ser um sinal de falta de ajuste do
modelo.
Segundo Hair et al (1998), outra medida de ajuste que pode ser utilizada na
comparação de modelos é o Akaike Information Criterion (AIC), que é calculado como:
⋅+= 22χAIC número de parâmetros estimados
43
Um valor de AIC próximo a zero indica um melhor ajuste do modelo segundo o
princípio da parsimônia. Um valor pequeno do AIC ocorre quando valores pequenos do χ2 são
obtidos com menor número de coeficientes estimados. Isto mostra não apenas um bom ajuste
do modelo em relação as covariáveis estimadas versus observadas, mas também a escolha de
um modelo mais simples.
3.2.2 Resíduos padronizados
Além da análise da deviance do modelo, pode-se calcular os resíduos do modelo
ajustado. Os resíduos são as diferenças entre os valores reais da amostra e os valores obtidos
através do modelo. Muitos analistas preferem trabalhar com resíduos padronizados ao invés
de trabalhar com os resíduos absolutos (mínimos quadrados), pois, geralmente, os resíduos
padronizados oferecem mais informação agregadas do que os resíduos absolutos.
O resíduo padronizado é definido como mostra a equação 3.2.2.1, onde i = 1,2,...,n e
EMS=σ̂ . Lembre-se que MSE é o erro quadrático médio, ou seja, mede a média dos
quadradros dos erros entre o valor estimado e o valor real.
σ̂i
i
ed =
Equação 3.2.2.1 – Definição de resíduo padronizado
Os resíduos padronizados têm média zero e variância aproximadamente unitária;
consequentemente, eles são úteis para procurar pontos discrepantes na amostra. Segundo
Myers, Montgomery e Vining (2002), para um modelo de previsão aderente, os valores destes
resíduos devem estar entre -3 e 3; pontos fora deste intervalo devem ser analisados
cuidadosamente e deve-se tentar entender os motivos destes pontos estarem apresentando
estas discrepâncias.
Assim, quando os parâmetros do modelo estiverem testados e definidos e os resíduos e
deviance convergirem para um modelo adequado, o modelo de previsão estará então pronto.
No capítulo 4 apresentar-se-á uma aplicação da teoria exposta neste capítulo aos dados
específicos deste trabalho.
44
45
4. APLICAÇÃO
Neste capítulo será aplicado o procedimento abordado no capítulo 3. Será proposta
uma regressão Gamma aplicada aos dados analisados neste trabalho que se classificaram
como heterocedásticos.
Em um primeiro momento, serão explicadas as premissas assumidas e as
considerações feitas para modelar o problema. Além disso, serão detalhadas as etapas do
processo para definir o melhor modelo para o conjunto de dados deste trabalho. Em seguida,
será apresentada a equação de previsão e será feita uma análise e interpretação dos parâmetros
estimados.
Neste processo, serão analisados os valores da deviance e os níveis descritivos do teste
de hipótese 0:0 =iH β para cada um dos parâmetros estimados. Também serão analisados os
resíduos padronizados do modelo final.
Finalmente, far-se-á uma aplicação do modelo de previsão definido para estimar
alguns valores de retornos para os grupos de ações definidos.
Como observação, vale ressaltar que a modelagem do problema foi realizada no
programa R, uma linguagem e ambiente desenvolvido para modelagens e análises estatísticas.
Escolheu-se este programa para o desenvolvimento deste trabalho pelo fato de ser gratuito e
por oferecer uma vasta variedade de funções estatísticas (modelos lineares e não lineares, os
clássicos testes estatísticos, análises temporais, entre outros). Detalhes do passo-a-passo da
programação do modelo de regressão no R estão nos Anexos C e D.
4.1 Modelos lineares generalizados
Como abordado no capítulo 3 deste trabalho, os dados de retorno das ações possuem
uma distribuição assimétrica. Desta forma, o uso da distribuição normal fica comprometido,
pois resultará em modelos que não correspondem com o que se espera como estimativas para
o retorno das ações. Por isso, escolheu-se utilizar a distribuição Gamma, que por possuir dois
parâmetros r e λ na sua composição, pode assumir diversas formas e, portanto, apresentar uma
distribuição assimétrica.
Pelo mesmo motivo, optou-se por uma abordagem baseada em modelos lineares
generalizados ao invés de modelos lineares; enquanto os últimos assumem apenas distribuição
46
normal, os modelos lineares generalizados podem assumir outros tipos de distribuição da
família exponencial, tal como a distribuição Gamma.
Na Tabela 4.1.1 estão apresentadas as covariáveis xi com suas respectivas definições:
Tabela 4.1.1 - Definição das variáveis do modelo
Critério de classificação Covariável e definição
11 =x se ciclo = taxa de juros estável
Ciclo monetário 12 =x se ciclo = subida de taxa de juros
021 == xx se ciclo = corte de taxa de juros
13 =x se setor for SII
Setor econômico 14 =x se setor for SIII
043 == xx se setor for SI
Super-setor 15 =x se super-setor = crescimento
05 =x se super-setor = defensivo
16 =x se tamanho = empresas médias
Tamanho 17 =x se tamanho = empresas pequenas
076 == xx se tamanho = empresas grandes
18 =x se for 2ª semana do mês
19 =x se for 3ª semana do mês
Semana do mês 110 =x se for 4ª semana do mês
111 =x se for 5ª semana do mês
0111098 ==== xxxx se for 1ª semana do mês
112 =x se ano for 2003
113 =x se ano for 2004
114 =x se ano for 2005
Ano 115 =x se ano for 2006
116 =x se ano for 2007
117 =x se ano for 2008
118 =x se ano for 2009
018171615141312 ======= xxxxxxx se ano for 2002
119 =x se mês for Outubro
120 =x se mês for Novembro
Mês do ano 121 =x se mês for Dezembro
122 =x se mês for Fevereiro
123 =x se mês for Março
124 =x se mês for Abril
125 =x se mês for Maio
47
126 =x se mês for Junho
Mês do ano 127 =x se mês for Julho
128 =x se mês for Agosto
129 =x se mês for Setembro
0... 2928212019 ====== xxxxx se mês for Janeiro
Neste trabalho, será considerado como modelo completo aquele que contém os efeitos
principais e as interações de segunda ordem. Este modelo é expresso como mostra a Equação
4.1.1:
+++= ∑∑∑
= >=
28
1
2929
1
expi
iij
jiiji
iioi exxxY βββ
Equação 4.1.1 – Modelo de previsão completo
Foram efetuados testes de hipótese: 0:0 =iH β onde i = 1,2,..,29 e 0:0 =ijH β onde i
= 1,2,..,28, j = 2,3,...,29 e i ≠ j, relativo aos parâmetros do modelo exposto na Equação 4.1.1.
Constatou-se que algumas interações não foram significativas, sendo o modelo da Equação
4.1.1 reduzido no modelo da Equação 4.1.2:
+++++= ∑∑∑∑∑∑∑∑
== == == ==
4
355
11
8
29
12
2
1
29
19
2
1
7
3
29
1
expi
iii j
jiiji j
jiiji j
jiiji
iioi xxxxxxxxxY ββββββ
Equação 4.1.2 – Modelo de previsão reduzido
Note que na Equação 4.1.2:
• ∑=
29
1iii xβ : refere-se aos efeitos principais;
• ∑∑= =
2
1
7
3i jjiij xxβ : refere-se às interações entre i) os ciclos e setores econômicos,
ii) os ciclos e super-setor e iii) os ciclos e tamanhos das empresas;
• ∑∑= =
2
1
29
19i jjiij xxβ : refere-se às interações entre os ciclos e os meses;
• ∑∑= =
11
8
29
12i jjiij xxβ : refere-se às interações entre i) as semanas e anos e ii) as
semanas e meses;
48
• ∑=
4
355
iii xxβ : refere-se às interações entre setores econômicos e super-setor.
A tabela com as estimativas dos parâmetros do modelo (Equação 4.1.2) é
relativamente extensa e não será reproduzida neste capítulo. No entanto, ela está no Anexo C.
Para melhor entendimento e interpretação dos resultados obtidos, serão consideradas
apenas as estimativas dos parâmetros de efeitos principais, apresentadas na Tabela 4.1.2.
Tabela 4.1.2 – Valores dos parâmetros βi do modelo de previsão reduzido
Critério de classificação
Covariável e definição Parâmetro
β0 -0.099485
Ciclo monetário
11 =x se ciclo = taxa de juros estável β1 -0.221265
12 =x se ciclo = subida de taxa de juros β2 -0.073917
Setor econômico
13 =x se setor for SII β3 -0.029927
14 =x se setor for SIII β4 -0.053791
Super-setor 15 =x se super-setor = crescimento β5 0.087393
Tamanho 16 =x se tamanho = empresas médias β6 0.016476
17 =x se tamanho = empresas pequenas β7 0.043408
18 =x se for 2ª semana do mês β8 -0.012198
Semana do mês
19 =x se for 3ª semana do mês β9 0.059443
110 =x se for 4ª semana do mês β10 0.024507
111 =x se for 5ª semana do mês β11 -0.131152
112 =x se ano for 2003 β12 0.327370
113 =x se ano for 2004 β13 0.247110
114 =x se ano for 2005 β14 0.386759
Ano 115 =x se ano for 2006 β15 0.179707
116 =x se ano for 2007 β16 0.233808
117 =x se ano for 2008 β17 0.294731
118 =x se ano for 2009 β18 0.496813
119 =x se mês for Outubro β19 0.023120
120 =x se mês for Novembro β20 -0.024696
Mês do ano 121 =x se mês for Dezembro β21 -0.028273
122 =x se mês for Fevereiro β22 0.017708
123 =x se mês for Março β23 0.077288
124 =x se mês for Abril β24 -0.024722
125 =x se mês for Maio β25 -0.069889
126 =x se mês for Junho β26 -0.125272
49
127 =x se mês for Julho β27 -0.009147
128 =x se mês for Agosto β28 -0.052485
129 =x se mês for Setembro β29 -0.011160
Para melhor entendimento da Equação 4.1.2, pode-se usar o seguinte exemplo. Se,
para uma estimativa, xi é nulo para todo i = 1,2,...,29, então o valor do retorno trimestral é
exp(-0,0994) igual a 0,9053. Este valor significa um retorno trimestral de -9,47% na situação
de corte de taxa de juros, no ano de 2002, no mês de janeiro, na primeira semana do mês, para
uma ação de uma empresa pertencente ao grupo de setores SI, ao super-setor defensivo e de
uma empresa de tamanho grande.
Se for modificado, em relação ao exemplo anterior, apenas o setor econômico e o
super-setor de SI para SIII e de Defensivo para Crescimento, ou seja, x4 =1 e x5 = 1, então a
estimativa de retorno médio segundo a Equação 4.1.2 será dada por:
( )545;455440exp xxxx ββββ +++
= exp[-0,0994+(-0,0538)+0,0874+(-0,0584)]
= exp[-0,1242]
= 0.8832
Este valor obtido equivale a um retorno trimestral médio de -11,68% na situação de
corte de taxa de juros, no ano de 2002, no mês de janeiro, na primeira semana do mês, para
uma ação de uma empresa pertencente ao grupo de setores SIII, ao super-setor de crescimento
e de uma empresa de tamanho grande.
Conclui-se que nas condições especificadas anteriormente (durante corte de taxa de
juros, na primeira semana do mês de janeiro, para empresas grandes), empresas do setor
econômico do grupo SI e que são defensivas têm um retorno esperado maior que as empresas
do setor econômico do grupo SIII e que são de crescimento.
Desta forma, podem-se obter todos os valores esperados para os retornos das ações a
partir da Equação 4.1.2 para então compará-los aos valores reais observados. Os pontos
estimados contra os pontos reais observados podem ser visualizados na Figura 4.1.1.
50
Figura 4.1.1 – Variáveis estimadas versus variáveis observadas
A seguir será feita uma interpretação das estimativas dos parâmetros βi. O modelo
reduzido (Equação 4.1.2) é composto por 136 parâmetros e para não tornar a análise muito
repetitiva escolheram-se alguns parâmetros considerados interessantes e que pudessem
contribuirr para um melhor entendimento do modelo de previsão.
Tabela 4.1.3 – Parâmetros estimados para períodos do ciclo monetário
Covariável e definição Parâmetro Estimativa do parâmetro
Pr (>|t|)
11 =x se ciclo = taxa de juros estável β1 -0.221265 < 2e-16 12 =x se ciclo = subida de taxa de juros β2 -0.073917 0.006491
Em relação aos períodos do ciclo monetário observa-se que os parâmetros para
períodos de subida de taxa de juros (x2) e de taxa de juros estável (x1) são, conforme a Tabela
4.1.3, negativos (-0,0739 e -0,2213 respectivamente), ou seja, em comparação ao período de
corte de taxa de juros o retorno da ação é reduzido de exp(-0,0739) = 0,9287 e exp(-0,2213).=
0,8015, o que significa que o desempenho das ações nestes períodos pode ser pior. Além
disso, os valores de p (conforme Tabela 4.1.3) são bem pequenos, isso mostra que estes
parâmetros são significativos.
É normal que em um ambiente de alta taxa de juros os investidores prefiram aumentar
a sua exposição em ativos atrelados à taxa de juros, como, por exemplo, os títulos de dívida
emitidos pelo governo, pois estes oferecem um alto retorno com relativamente baixo risco.
0
0,4
0,8
1,2
1,6
2
0,0 0,5 1,0 1,5 2,0 2,5Valor observado
Valor estimado
51
Quando a taxa de juros inicia um período de redução, os ativos atrelados a taxa de juros
oferecem menor retorno, e como os investidores têm uma meta de retorno e precisam garanti-
la, recorrem ao mercado de ações que oferece um maior retorno, porém com maior risco. Este
é um dos fatores que podem explicar os dois parâmetros negativos.
Além disso, como mencionado no início deste trabalho, uma taxa de juros baixa tem
como consequência incentivar o crédito às empresas, estimular a economia, além de causar
um impacto positivo no aumento de investimentos de longo prazo no país. Da mesma forma
que uma elevada taxa de juros faz com que os investimentos diretos diminuam e
consequentemente reduzam o crescimento da economia. Assim, em um ambiente de elevação
da taxa de juros as empresas tendem a investir menos e por isso a crescer menos. Oferecendo
menos crescimento e retorno ao acionista, os investidores analisam outros tipos de
investimento que o mercado de ações.
A estimativa do parâmetro referente ao período de taxa de juros estável é menor que o
parâmetro referente ao período de alta de taxa de juros. Uma explicação para este fato é que
todo período de taxa de juros estável está na iminência de aumento ou redução da taxa de
juros, principalmente no Brasil, onde são raros os momentos em que a taxa de juros
permanece constante sem pressão para reduzi-la ou aumentá-la. E como se sabe bem, o que os
investidores menos gostam no mercado de ações é a indefinição, o que pode explicar a
magnitude do valor do parâmetro obtido.
Tabela 4.1.4 - Parâmetros estimados para os tamanhos das empresas
Covariável e definição Parâmetro Estimativa do parâmetro
Pr (>|t|)
16 =x se tamanho = empresas médias β6 0.016476 0.021537 17 =x se tamanho = empresas pequenas β7 0.043408 5.82e-08
Em relação ao tamanho da empresa, as estimativas dos parâmetros para as pequenas e
médias empresas são positivos, conforme a Tabela 4.1.4: exp(0,0434) = 1,0444 e exp(0,0165)
= 1,0166 respectivamente; todos significativos. Assim, é esperado que ambos contribuam
positivamente para um retorno maior que o observado para as grandes empresas. Sabe-se que
empresas grandes oferecem menor risco de não honrarem as suas contas e de falirem; e como
quase tudo no mercado financeiro pode ser explicado pelo equilíbrio de risco-retorno, neste
caso não deixa de ser diferente. Empresas maiores, por possuírem menores riscos de não
52
cumprirem suas metas, são ativos menos arriscados e por isso oferecem em média menor
retorno que empresas médias e pequenas.
Tabela 4.1.5 - Parâmetros estimados para os anos das observações
Covariável e definição Parâmetro Estimativa do parâmetro
Pr (>|t|)
112 =x se ano for 2003 β12 0.327370 < 2e-16 113 =x se ano for 2004 β13 0.247110 < 2e-16 114 =x se ano for 2005 β14 0.386759 < 2e-16 115 =x se ano for 2006 β15 0.179707 < 2e-16 116 =x se ano for 2007 β16 0.233808 < 2e-16 117 =x se ano for 2008 β17 0.294731 < 2e-16 118 =x se ano for 2009 β18 0.496813 < 2e-16
Ao analisar as contribuições dos anos ao retorno, observa-se que as estimativas dos
parâmetros são positivas, conforme a Tabela 4.1.5. O ano tomado como referência é 2002,
ano em que ocorreram as eleições presidenciais em que o atual presidente Luis Inácio Lula da
Silva foi eleito. É de se esperar que os valores dos parâmetros dos outros anos sejam todos
positivos em relação a 2002. Ano de eleição é sempre um ano de indecisão em que o
investidor olha com cautela para o país. Em 2002, quando Lula começou a liderar as
pesquisas de intenção de voto, o investidor receoso do que poderia ocorrer com Lula
assumindo a presidência, retirou seus investimentos financeiros no país e consequentemente
os mercados despencaram.
A menor estimativa do parâmetro para os anos é o de 2006, também ano de eleição.
Embora em 2006 a reeleição de Lula já fosse o cenário mais provável, e mesmo os
investidores já conhecendo o perfil e o jeito de governar de Lula, eles continuaram cautelosos.
Como mencionado anteriormente, períodos de indecisão são sempre complicados para os
investidores.
Tabela 4.1.6 - Parâmetros estimados para os setores econômicos
Covariável e definição Parâmetro Estimativa do parâmetro
Pr (>|t|)
13 =x se setor for SII β3 -0.029927 0.007819 14 =x se setor for SIII β4 -0.053791 1.39e-07
53
Em relação aos setores econômicos, as estimativas dos parâmetros para as empresas
dos setores do grupo SII e do grupo SIII são negativos, conforme a Tabela 4.1.6: -0,0299 e -
0,0538 respectivamente, ou seja, em comparação aos setores do grupo SI o retorno da ação é
reduzido de exp(-0,0299) = 0,9705 e exp(-0,0538) = 0,9476. Lembrando-se, como definido no
capítulo 2, que o grupo SI inclui os setores de varejo, construção civil e infraestrutura,
logística e concessões, o grupo SII inclui os setores de bancos e instituições financeiras e de
alimentos, bebidas e tabaco e o grupo SIII inclui os setores de educação, saúde, utilidade
pública e telecomunicações.
Setores como o de utilidade pública e de telecomunicações apresentam menor
sensibilidade à variação da taxa de crescimento da economia do país. Como nos últimos 8
anos o Brasil apresentou um crescimento anual médio do PIB de 3,4%, é de se esperar que os
setores com maior sensibilidade à variação da taxa de crescimento do PIB tenham apresentado
maior crescimento de seus lucros neste período, como é o caso das empresas do setor de
varejo e de construção civil (que estão no grupo SI). Assim, comparado a setores menos
expostos a este crescimento, como é o caso de setores como o de utilidade pública, educação e
bebidas, alimentos e tabaco, os setores incluídos no grupo SI apresentaram maior crescimento
e, consequentemente, maior retorno de suas ações. Portanto, os dois coeficientes negativos
também são coerentes.
Tabela 4.1.7 - Parâmetros estimados para super-setores
Covariável e definição Parâmetro Estimativa do parâmetro
Pr (>|t|)
15 =x se super-setor = crescimento β5 0.087393 < 2e-16
Em relação ao parâmetro relacionado ao super-setor, pode-se interpretar do mesmo
modo como se procedeu para os parâmetros estimados dos setores econômicos. O PIB do
Brasil crescendo em média 3,4% ao ano, as empresas do tipo crescimento apresentarão maior
crescimento e, portanto, maiores retornos do que as empresas do tipo defensivas, como se
pode confirmar pela estimativa do parâmetro do super-setor de crescimento, conforme a
Tabela 4.1.7.
54
Tabela 4.1.8 - Parâmetros estimados para os meses das observações
Covariável e definição Parâmetro Estimativa do parâmetro
Pr (>|t|)
119 =x se mês for Outubro β19 0.023120 0.385605 120 =x se mês for Novembro β20 -0.024696 0.366069 121 =x se mês for Dezembro β21 -0.028273 0.297328 122 =x se mês for Fevereiro β22 0.017708 0.469441 123 =x se mês for Março β23 0.077288 0.001530 124 =x se mês for Abril β24 -0.024722 0.311363 125 =x se mês for Maio β25 -0.069889 0.003659 126 =x se mês for Junho β26 -0.125272 2.19e-07 127 =x se mês for Julho β27 -0.009147 0.702456 128 =x se mês for Agosto β28 -0.052485 0.026800 129 =x se mês for Setembro β29 -0.011160 0.663901
Conforme a Tabela 4.1.8, as estimativas dos parâmetros referentes aos meses são
positivos apenas para Fevereiro, Março e Outubro, ou seja, apenas estes 3 meses apresentam
em média retornos maiores que o mês de Janeiro. Isto implica que o primeiro trimestre do ano
apresenta um retorno médio maior que os outros períodos do ano. Além disso, embora alguns
dos parâmetros não tenham apresentado valores significativos, eles apresentaram uma
importante interação com a variável relacionada aos períodos do ciclo monetário (conforme a
Equação 4.1.2).
Tabela 4.1.9 - Parâmetros estimados para as interações entre os setores econômicos e os períodos do ciclo monetário
Covariável e definição Parâmetro Estimativa do parâmetro
Pr (>|t|)
11 =x se ciclo = taxa de juros estável &
13 =x se setor for SII β1;3 0.064206 9.64e-08
12 =x se ciclo = subida de taxa de juros &
13 =x se setor for SII β2;3 0.158902 < 2e-16
11 =x se ciclo = taxa de juros estável &
14 =x se setor for SIII β1;4 0.039554 0.002746
12 =x se ciclo = subida de taxa de juros &
14 =x se setor for SIII β2;4 0.189300 < 2e-16
55
Outros aspectos relativos aos parâmetros referem-se às interações entre setor
econômico e períodos do ciclo monetário (vide Tabela 4.1.9). As estimativas dos parâmetros
referentes ao período de subida da taxa de juros nos setores SII e SIII são elevados: 0,1589 e
0,1893 respectivamente, assim, em comparação aos setores do grupo SI no período de subida
de taxa de juros, estes dois grupos contribuem de forma a aumentar o retorno da ação de
exp(0,1589) = 1,1722 e exp(0,1893) = 1,2084 respectivamente. Lembrando-se que, conforme
definido no Capítulo 2, o grupo de setores SI inclui os setores de varejo, construção civil e
infraestrutura, logística e concessões.
Algumas breves análises das estimativas dos parâmetros que se acredita serem
pertinentes para este estudo foram feitas nesta seção. Outras informações, não abordadas nesta
seção, são possíveis de se obter analisando detalhadamente os resultados do Anexo C.
4.2 Verificação da qualidade do modelo de previsão
A fim de verificar a qualidade do modelo previsão definido, alguns indicadores foram
considerados:
• O nível de significância de cada um dos parâmetros estimados bi;
• O valor da deviance residual (se ela diminui em relação ao valor da deviance
nula);
• O valor do AIC.
No modelo final, a grande parte dos valores do nível de significância dos parâmetros βi
são inferiores ao nível de significância, como se pode observar no Anexo C.
Nota-se que, com exceção de categorias de Semana e de Mês, todos outros parâmetros
individuais possuem um nível de significância abaixo dos 5% e que, portanto os valores são
significantes para o modelo definido. Embora os valores dos níveis de significância (p) sejam
elevados para as covariáveis Mês e Semana, eles não foram excluídos do modelo de previsão,
pois possuem interações com os períodos do ciclo monetário que não podem ser descartados e
simplesmente ignorados. Além disso, retirá-los do modelo de previsão faz com que o valor da
deviance residual aumente significativamente. Estes valores relacionados à interação entre as
covariáveis podem ser vistos no Anexo C.
56
Como já mencionado anteriormente, a diferença entre a deviance nula e a deviance
residual foi observada a cada vez que se compilava os dados no software R. A diferença entre
dois valores deve ser a maior possível. Os valores obtidos para o modelo de previsão final
foram:
• Deviance do modelo nulo: 1990,06 – com 14934 graus de liberdade;
• Deviance do modelo final: 1191,94 – com 135 graus de liberdade; produzindo
• Deviance residual: 798,12 - com 14799 graus de liberdade
Outro indicador seria um coeficiente semelhante ao R2, denominado coeficiente de
determinação, dos modelos lineares, dado por [(1990,06 – 798,12)/1990,06] = 0,6.
O AIC é outra ferramenta utilizada para escolher o melhor modelo entre outros vários
modelos. Não é possível dizer se um modelo é bom ou não apenas analisando o seu AIC. O
que se pode afirmar observando o AIC é que ele é pior ou melhor em relação a um outro
modelo: o melhor modelo é aquele que possui menor valor do AIC.
O AIC observado para o modelo de previsão final foi de 20,59.
Segundo Myers, Montgomery e Vining (2002), para se obter um modelo de previsão
aderente, os valores dos resíduos padronizados devem estar entre -3 e 3; além disso, afirmam
que pontos fora deste intervalo devem ser analisados cuidadosamente e deve-se tentar
entender os motivos destes pontos estarem apresentando estas discrepâncias.
Na Figura 4.2.1 estão representados apenas um terço dos resíduos padronizados, os
outros dois gráficos dos resíduos estão no Anexo E.
57
Figura 4.2.1 – Resíduos padronizados (I)
Foram observados 14950 retornos trimestrais ao todo e apenas 3,6% deles não ficaram
dentro do intervalo de -2 a 2. Se o intervalo é estendido para -3 a 3, o valor passa para menos
de 1%.
Desta forma, também através da análise dos resíduos padronizados, o modelo de
previsão definido se mostra consistente.
4.3 Previsão para os próximos 3 meses
A partir do modelo de previsão definido, serão projetados retornos para alguns
cenários. Escolheu-se o retorno para os próximos três meses já que este modelo de previsão
pode ser definido como um modelo de curto/médio prazo. Desta forma, será considerado para
esta estimativa o ano de 2009 (ano mais recente analisado), o mês será junho, a semana será a
terceira do mês e o período do ciclo monetário será o período de subida, já que nas duas
últimas reuniões do COPOM (reuniões no fim de Abril de 2010 e no início de junho de 2010)
a taxa básica de juros aumentou em 0,5% e 0,75% respectivamente e ela ainda encontra-se
em tendência de subida até o final do ano de 2010 segundo as expectativas do mercado.
Em um primeiro momento, será calculado o retorno trimestral previsto para as
empresas pertencentes simultaneamente as seguintes categorias: i) Setor: SIII, ii) Super-setor:
defensivo e iii) Tamanho: grandes empresas.
-4
-3
-2
-1
0
1
2
3
4
5
0 1000 2000 3000 4000 5000Observações
Resíduo padronizado
58
Tabela 4.3.1 – Parâmetros considerados para o cálculo de previsão retorno trimestral (I)
Covariável e definição Parâmetro Estimativa do parâmetro
β0 -0,09949 12 =x se ciclo = subida de taxa de juros β2 -0,07392
14 =x se setor for SIII β4 -0,05379
19 =x se for 3ª semana do mês β9 0,05944
118 =x se ano for 2009 β18 0,49681
126 =x se mês for Junho β26 -0,12527
12 =x se ciclo = subida de taxa de juros &
14 =x se setor for SIII β2;4 0,18930
12 =x se ciclo = subida de taxa de juros &
126 =x se mês for Junho β2;26 -0,36600
19 =x se for 3ª semana do mês &
126 =x se mês for Junho β9;26 -0,02398
19 =x se for 3ª semana do mês &
118 =x se ano for 2009 β9;18 0,05539
A partir do modelo de previsão determinado anteriormente (Equação 4.1.2), chegou-se
a uma estimativa cujo valor é exp(0,058505) = 1,06025 que representa um retorno trimestral
médio positivo de 6,025% (com intervalo entre -9% e +24%).
Este valor do retorno é coerente com aquilo que foi analisado anteriormente: em
períodos de subida de taxa de juros, os retornos são mais baixos do que em períodos de corte
de juros e poderiam até ser negativos, como já discutido anteriormente. No entanto, como
neste caso trata-se de empresas defensivas, o efeito negativo da alta de juros é atenuado pelo
fato de empresas defensivas apresentarem melhores desempenhos em períodos de alta de taxa
de juros que empresas de crescimento. Além disso, os setores que compõem o grupo SIII são
setores menos expostos à variação do crescimento da economia, e isto contribuiu para que o
retorno trimestral fosse positivo.
Analisando um outro caso onde as categorias são : i) Setor: SI, ii) Super-setor:
crescimento e iii) Tamanho: pequenas empresas, e os outros parâmetros são os mesmos do
exemplo anterior, as variáveis são definidas como mostra a Tabela 4.3.2:
59
Tabela 4.3.2 – Parâmetros considerados para o cálculo de previsão retorno trimestral (II)
Covariável e definição Parâmetro Estimativa do parâmetro
β0 -0,0995 12 =x se ciclo = subida de taxa de juros β2 -0,0739
15 =x se super-setor = crescimento β5 0,0874
17 =x se tamanho = empresas pequenas β7 0,0434
19 =x se for 3ª semana do mês β9 0,0594
118 =x se ano for 2009 β18 0,4968
126 =x se mês for Junho β26 -0,1253
12 =x se ciclo = subida de taxa de juros &
15 =x se super-setor = crescimento
β2;5 -0,0948
12 =x se ciclo = subida de taxa de juros &
126 =x se mês for Junho
β2;26 -0,3660
12 =x se ciclo = subida de taxa de juros &
17 =x se tamanho = empresas pequenas
β2;7 -0,2036
19 =x se for 3ª semana do mês &
126 =x se mês for Junho
β9;26 -0,0240
19 =x se for 3ª semana do mês &
118 =x se ano for 2009
β9;18
0,0554
Neste segundo exemplo, chega-se ao valor de exp(-0,244571) = 0,7830 que representa
um retorno trimestral médio negativo de 21,7% (intervalo entre -33% a -8%).
Comparado ao exemplo anterior, este mostrou um retorno médio bem pior. Como
neste caso estão sendo consideradas empresas do Setor SI (Varejo, construção civil e
infraestrutura) e de crescimento, pode-se dizer que o resultado obtido é coerente, já que o
período considerado para esta previsão é o de subida de taxa de juros. Como discutido
anteriormente, empresas do setor SI e de crescimento são mais sensíveis às variações do
crescimento da economia do país e às mudanças da taxa de juros.
Pode-se concluir através deste exemplo que, em condições semelhantes, a escolha do
tipo de ação a ser investida é muito importante e que em cada circunstância, existe um tipo de
ação que apresentará um retorno maior. Neste caso, espera-se que nos próximos três meses, as
ações de empresas pertencentes ao grupo SIII (Utilidade pública, saúde, educação e
telecomunicações), que sejam do tipo defensivas e grandes, apresentem retornos
significativamente maiores que aquelas pertencentes ao grupo SI (varejo, construção civil e
infraestrutura) e que sejam do tipo de crescimento e pequenas (+5% contra -22%).
60
61
5. CONCLUSÕES
No intuito de se criar ferramentas mais simples que possam ajudar os analistas do
mercado financeiro a entender melhor a dinâmica dos papéis das empresas, buscou-se estudar
neste trabalho de formatura a influência que os diferentes períodos do ciclo monetário podem
ter no desempenho das ações.
Ao invés de estudar o comportamento dos papéis individualmente, as ações foram
analisadas em conjunto de forma a identificar tendências comuns entre elas. Assim, criou-se
um modelo de previsão para um grupo de 72 ações a fim de determinar o valor médio do
retorno das ações de acordo com algumas características definidas: setores econômicos,
super-setor e tamanho da empresa.
Um dos fatores incluído do modelo de previsão, os períodos do ciclo monetário,
mostrou-se pertinente para o modelo de previsão e apresentou interações significativas com as
características definidas. Pôde-se obter tal resultado, pois o modelo de previsão construído
além de considerar os efeitos principais também considerou as interações de segunda ordem.
Os parâmetros estimados para o modelo de previsão referente aos períodos do ciclo
monetário mostraram-se significativos e condizentes com o que se esperava intuitivamente.
No modelo, o parâmetro referente ao período de aumento da taxa de juros diminui o retorno
médio esperado em relação ao período de redução da taxa de juros, o que era o esperado pois,
num ambiente de aumento da taxa de juros os investidores devem preferir aumentar a sua
exposição em ativos atrelados aos juros e não ao mercado de ações. Por outro lado, quando a
taxa de juros inicia um período de redução, os ativos atrelados a ela oferecem menor retorno,
e assim, os investidores recorrem ao mercado de ações que pode oferecer um retorno maior.
Um fato interessante observado e, em um primeiro momento, não intuitivo, foi a
influência dos meses no valor do retorno médio esperado. Verificou-se que o primeiro
trimestre do ano apresenta retorno médio esperado maior que os outros períodos do ano.
Tentando procurar uma explicação para tal fato, chegou-se a conclusão de que como no início
do ano a maior parte dos fundos de investimento definem suas metas para o ano, buscando no
mercado novas oportunidades de investimento e refazendo posições desfeitas no final do ano
anterior, o mercado de ações apresenta retornos maiores que no resto do ano. As posições
desfeitas se devem ao que é chamado no mercado de “realização de lucro”, ou seja, ao possuir
um ativo que se valorizou ao longo do ano, no final deste, para reconhecer o ganho ao
62
desempenho anual, vende-se o ativo; este movimento em massa faz com que o mercado
apresente uma tendência de queda.
Enfim, através do modelo de previsão definido, foram calculadas duas previsões para
os próximos três meses. Para cada previsão foi considerado um grupo de ações diferente. O
resultado obtido foi coerente e mostrou como que em condições semelhantes os retornos
obtidos podem ser muito diferentes de acordo com as características da ação escolhida e o
quão importante é o processo de escolha do tipo de ação a ser investida de acordo com a
situação considerada.
Os resultados obtidos neste estudo foram portanto coerentes e satisfatórios. Desse
modo, espera-se que o método utilizado para definir o modelo de previsão deste trabalho não
se restrinja apenas aos fatores aqui apresentados e possa servir de base para estudos de
influência de outros fatores no desempenho das ações das empresas.
63
6. REFERÊNCIAS BIBLIOGRÁFICAS
MANKIW, N. Gregory. Princípios de Macroeconomia. 3ª ed. São Paulo : Pioneira Thomson Learning, 2005.
PINHO, D. Benevides, VASCONCELLOS M.A.S et al. Manual de Economia. 5ª.ed. São Paulo: Editora Saraiva, 2007.
DRAPER, N.R.; SMITH, H. Applied Regression Analysis. 3ª ed. New York: Wiley, 1998.
BANCO CENTRAL DO BRASIL. Disponível em<www.bcb.gov.br/?copom> – Consulta em 14.02.2010.
MCCULLOCH, C.E.; SEARLE, S.R.; NEUHAUS J.M. Generalized, linear, and mixed models. 2a ed. Hoboken, N.J.: Wiley, 2008.
MCCULLAGH, P.; NELDER, J.A.. Generalized linear models. 2a ed. London, New York: Chapman & Hall, 1989.
MYERS, R.H.; MONTGOMERY, D.C.; VINING, G.G. Generalized linear models – with application in engineering and the sciences. New York: Wiley, 2002.
KASS, G.V. Significance testing in automatic interaction detection (A.I.D.). University of the Witwatersrand, 1974. Disponível em <http://mephisto.unige.ch/pub/publications/early_trees/kass_AIDtesting_Applied_stat75.pdf>.
SONQUIST, J.A; BAKER, E.I.; MORGAN, J.N. Searching for structure. Ann Arbor, Survey Research Center, 1973.
DEMIDENKO, E. Mixed models: theory and applications. Hoboken, N.J., Wiley - Interscience, 2004.
VONESH, E.F.; CHINCHILLI, V.M. Linear and nonlinear models for the analysis of repeated measurements. New York: M.Dekker, 1997.
ZEGER, S.L.; LIANG, K.Y.; DIGGLE, P. Analysis of longitudinal data. Oxford: Clarendon Press, 1994.
SINGER, J.M.; PAULINO, C.D. Análise de dados categorizados. 1ª ed. São Paulo: Edgard Blücher, 2006.
HAIR, J.H et al. Multivariate data analysis. 5ª ed. Upper Saddle River, N.J.: Prentice-Hall, 1998.
64
65
ANEXOS
Anexo A - Empresas escolhidas para a realização do trabalho
Empresa Super-setor Setor Tamanho
JBS Defensivo Alimentos, Bebidas e Tabaco Médio
TIM Part. Crescimento Telecomunicações Médio
Tractebel Defensivo Utilidade pública Médio
Dasa Defensivo Saúde Médio
Localiza Crescimento Infraestrutura, Logística e Concessões Médio
Marfrig Defensivo Alimentos, Bebidas e Tabaco Médio
Brasil Malls Crescimento Construção civil e Engenharia Médio
Construtora Tenda Crescimento Construção civil e Engenharia Médio
Banrisul Crescimento Bancos e Instituições Financeiras Médio
Abyara Crescimento Construção civil e Engenharia Médio
Agra Crescimento Construção civil e Engenharia Médio
Brookfield Crescimento Construção civil e Engenharia Médio
Sul America Crescimento Bancos e Instituições Financeiras Médio
Log-in Logistica Defensivo Infraestrutura, Logística e Concessões Pequeno
Obrascon Duarte Defensivo Infraestrutura, Logística e Concessões Pequeno
Amil Defensivo Saúde Médio
JHSF Participações Crescimento Construção civil e Engenharia Médio
Klabin Segall SA Crescimento Construção civil e Engenharia Médio
Banco Industrial e Comercial Crescimento Bancos e Instituições Financeiras Pequeno
American Banknote SA Crescimento Bancos e Instituições Financeiras Pequeno
Multiplan Crescimento Construção civil e Engenharia Médio
Estácio Participações Sa Defensivo Educação Pequeno
Odontoprev Defensivo Saúde Pequeno
Panamericano Crescimento Bancos e Instituições Financeiras Médio
Tegma Defensivo Infraestrutura, Logística e Concessões Pequeno
EZ TEC Empreendimentos Crescimento Construção civil e Engenharia Pequeno
Anhanguera Educacional Participações SADefensivo Educação Pequeno
Lopes Consultoria de Imoveis Crescimento Construção civil e Engenharia Pequeno
Medial Defensivo Saúde Médio
Camargo Correa Crescimento Construção civil e Engenharia Pequeno
Iguatemi Crescimento Construção civil e Engenharia Médio
Kroton Educacional SA Defensivo Educação Pequeno
Rodobens Crescimento Construção civil e Engenharia Pequeno
Even Crescimento Construção civil e Engenharia Médio
Banco ABC Brasil Crescimento Bancos e Instituições Financeiras Pequeno
Banco Daycoval Crescimento Bancos e Instituições Financeiras Pequeno
Santos BRP Defensivo Infraestrutura, Logística e Concessões Pequeno
Cyrela Commercial properties Crescimento Construção civil e Engenharia Pequeno
São Carlos Crescimento Construção civil e Engenharia Pequeno
Tecnisa Crescimento Construção civil e Engenharia Pequeno
General Shopping Brasil SA Crescimento Construção civil e Engenharia Pequeno
Banco Sofisa Crescimento Bancos e Instituições Financeiras Pequeno
João Fortes Engenharia Crescimento Construção civil e Engenharia Pequeno
Triunfo Defensivo Infraestrutura, Logística e Concessões Pequeno
Banco Indusval Crescimento Bancos e Instituições Financeiras Pequeno
66
Empresa Super-setor Setor Tamanho
Itau Unibanco Crescimento Bancos e Instituições Financeiras Grande
Bradesco Crescimento Bancos e Instituições Financeiras Grande
Ambev Defensivo Alimentos, Bebidas e Tabaco Grande
Cemig Defensivo Utilidade pública Grande
Tele Norte Leste Defensivo Telecomunicações Grande
Vivo Crescimento Telecomunicações Grande
Perdigao Defensivo Alimentos, Bebidas e Tabaco Grande
Banco do Brasil Crescimento Bancos e Instituições Financeiras Grande
Gafisa Crescimento Construção civil e Engenharia Grande
Cyrela Crescimento Construção civil e Engenharia Grande
ALL Crescimento Infraestrutura, Logística e Concessões Grande
CBD Defensivo Varejo Grande
Copel Defensivo Utilidade pública Grande
CPFL Defensivo Utilidade pública Grande
Renner Crescimento Varejo Grande
Cesp Defensivo Utilidade pública Grande
MRV Crescimento Construção civil e Engenharia Grande
PDG Realty Crescimento Construção civil e Engenharia Grande
Americanas Crescimento Varejo Grande
Eletropaulo Defensivo Utilidade pública Médio
LLX Crescimento Infraestrutura, Logística e Concessões Grande
Eletrobras Defensivo Utilidade pública Médio
B2W Crescimento Varejo Grande
CCR Defensivo Infraestrutura, Logística e Concessões Grande
Souza Cruz Defensivo Alimentos, Bebidas e Tabaco Médio
GVT Crescimento Telecomunicações Grande
Rossi Crescimento Construção civil e Engenharia Grande
67
Anexo B - Resultados da aplicação do método A.I.D. para agrupar setores semelhantes
Primeira iteração: G1 a G9.
G1 / G2-G9ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 393 12,75470334 0,032454716 0,008275424Coluna 2 2651 0,731448669 0,000275914 0,017813048
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,354402978 1 0,354402978 21,37016828 3,94383E-06 3,844517334Intragrupo 50,44854331 3042 0,016584005
Total 50,80294629 3043
G1-G2/G3-G9ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 786 24,82605432 0,031585311 0,030680029Coluna 2 2258 -11,33990231 -0,0050221 0,011492151
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,781339657 1 0,781339657 47,51617144 6,60542E-12 3,844517334Intragrupo 50,02160663 3042 0,016443658
Total 50,80294629 3043
G1-G3/G4-G9ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 1109 34,44529264 0,031059777 0,028092101Coluna 2 1935 -20,95914064 -0,010831597 0,009534521
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 1,237134965 1 1,237134965 75,92662082 4,74964E-18 3,844517334Intragrupo 49,56581133 3042 0,016293824
Total 50,80294629 3043
G1-G4/G5-G9ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 1502 34,71724237 0,02311401 0,021105415Coluna 2 1542 -21,23109036 -0,013768541 0,011738281
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 1,0350267 1 1,0350267 63,26467429 2,52544E-15 3,844517334Intragrupo 49,76791959 3042 0,016360263
Total 50,80294629 3043
68
G1-G5/G6-G9ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 1895 33,85403195 0,017864925 0,018126656Coluna 2 1149 -20,36787994 -0,017726614 0,013558325
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,906104167 1 0,906104167 55,24134913 1,37803E-13 3,844517334Intragrupo 49,89684212 3042 0,016402644
Total 50,80294629 3043
G1-G6/G7-G9ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 2137 30,99594365 0,014504419 0,017437067Coluna 2 907 -17,50979164 -0,019305173 0,014160611
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,727858598 1 0,727858598 44,21651475 3,47175E-11 3,844517334Intragrupo 50,07508769 3042 0,016461239
Total 50,80294629 3043
G1-G7/G8-G9ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 2530 24,92367999 0,009851257 0,016033411Coluna 2 514 -11,43752798 -0,022252 0,019130918
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,440288336 1 0,440288336 26,59425001 2,67064E-07 3,844517334Intragrupo 50,36265795 3042 0,016555772
Total 50,80294629 3043
G1-G8/G9ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 2923 16,44979264 0,005627709 0,016592541Coluna 2 121 -2,963640628 -0,024492898 0,018451062
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,105413677 1 0,105413677 6,325128436 0,011955048 3,844517334Intragrupo 50,69753261 3042 0,016665856
Total 50,80294629 3043
69
Segunda iteração: G1 a G3
Segunda iteração: G4 a G9
G1/G2-G3ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 393 12,75470334 0,032454716 0,008275424Coluna 2 716 21,6905893 0,030294119 0,038994261
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,001184463 1 0,001184463 0,042127106 0,837415409 3,84987258Intragrupo 31,12486324 1107 0,028116408
Total 31,1260477 1108
G1-G2/G3ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 716 22,37394166 0,031248522 0,014387012Coluna 2 393 12,07135098 0,030715906 0,053161383
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 7,19785E-05 1 7,19785E-05 0,002559925 0,959656817 3,84987258Intragrupo 31,12597572 1107 0,028117413
Total 31,1260477 1108
G4/G5-G9ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 393 0,271949724 0,000691984 0,00072853Coluna 2 1542 -21,23109036 -0,013768541 0,011738281
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,065488355 1 0,065488355 6,8894685 0,008738814 3,84627382Intragrupo 18,37427527 1933 0,009505574
Total 18,43976362 1934
G4-G5/G6-G9ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 786 -0,591260697 -0,00075224 0,003490866Coluna 2 1149 -20,36787994 -0,017726614 0,013558325
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,134477354 1 0,134477354 14,20052774 0,00016925 3,84627382Intragrupo 18,30528627 1933 0,009469884
Total 18,43976362 1934
70
Terceira iteração: G4 a G5
G4-G6/G7-G9ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 1028 -3,449348993 -0,003355398 0,005343396Coluna 2 907 -17,50979164 -0,019305173 0,014160611
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,12258252 1 0,12258252 12,93605224 0,000330408 3,84627382Intragrupo 18,3171811 1933 0,009476038
Total 18,43976362 1934
G4-G7/G8-G9ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 1421 -9,521612651 -0,006700642 0,006010081Coluna 2 514 -11,43752798 -0,022252 0,019130918
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,091287823 1 0,091287823 9,617112807 0,00195556 3,84627382Intragrupo 18,3484758 1933 0,009492228
Total 18,43976362 1934
G4-G8/G9ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 1814 -17,99550001 -0,009920342 0,00893632Coluna 2 121 -2,963640628 -0,024492898 0,018451062
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,024088688 1 0,024088688 2,528467413 0,111972289 3,84627382Intragrupo 18,41567494 1933 0,009526992
Total 18,43976362 1934
G4/G5ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 393 0,271949724 0,000691984 0,00072853Coluna 2 393 -0,863210421 -0,002196464 0,006257924
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,001639426 1 0,001639426 0,469315471 0,49350474 3,853346999Intragrupo 2,738690245 784 0,003493227
Total 2,740329671 785
71
Terceira iteração: G6 a G9
G6/G7-G9ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 242 -2,858088296 -0,011810282 0,011305861Coluna 2 907 -17,50979164 -0,019305173 0,014160611
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,010730827 1 0,010730827 0,791312866 0,373889967 3,849578695Intragrupo 15,55422577 1147 0,01356079
Total 15,5649566 1148
G6-G7/G8-G9ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 635 -8,930351953 -0,014063546 0,009040613Coluna 2 514 -11,43752798 -0,022252 0,019130918
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,019046738 1 0,019046738 1,405296199 0,236084357 3,849578695Intragrupo 15,54590986 1147 0,01355354
Total 15,5649566 1148
G6-G8/G9ANOVA: um fator
Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 1028 -17,40423931 -0,016930194 0,012993805Coluna 2 121 -2,963640628 -0,024492898 0,018451062
ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,006191739 1 0,006191739 0,456458131 0,499420124 3,849578695Intragrupo 15,55876486 1147 0,013564747
Total 15,5649566 1148
72
Anexo C - Síntese dos resultados obtidos no software R
Call: glm(formula = Y ~ Ciclo + Setorr + Ssetor + Tam + Ciclo * Setorr +
Ciclo * Ssetor + Ciclo * Tam + Ssetor * Setorr + Semana + Ano + Mes + Ciclo * Mes +
Mes * Semana + Semana * Ano, family = Gamma(link = log), data = dados)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.44361 -0.14991 -0.02497 0.10534 2.01213
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -0.099485 0.025812 -3.854 0.000117 *** CicloEstavel -0.221265 0.021126 -10.474 < 2e-16 *** CicloSubida -0.073917 0.027153 -2.722 0.006491 ** SetorrSII -0.029927 0.011250 -2.660 0.007819 ** SetorrSIII -0.053791 0.010208 -5.270 1.39e-07 *** SsetorGR 0.087393 0.009156 9.545 < 2e-16 *** TamMC 0.016476 0.007168 2.299 0.021537 * TamSC 0.043408 0.007998 5.427 5.82e-08 *** SemanaS2 -0.012198 0.030811 -0.396 0.692187 SemanaS3 0.059443 0.030812 1.929 0.053718 . SemanaS4 0.024507 0.031033 0.790 0.429704 SemanaS5 -0.131152 0.051157 -2.564 0.010365 * AnoA2003 0.327370 0.024144 13.559 < 2e-16 *** AnoA2004 0.247110 0.024013 10.291 < 2e-16 *** AnoA2005 0.386759 0.023374 16.547 < 2e-16 *** AnoA2006 0.179707 0.021273 8.448 < 2e-16 *** AnoA2007 0.233808 0.019604 11.927 < 2e-16 *** AnoA2008 0.294731 0.020654 14.270 < 2e-16 *** AnoA2009 0.496813 0.020138 24.671 < 2e-16 *** MesM10 0.023120 0.026647 0.868 0.385605 MesM11 -0.024696 0.027322 -0.904 0.366069 MesM12 -0.028273 0.027128 -1.042 0.297328 MesM2 0.017708 0.024479 0.723 0.469441 MesM3 0.077288 0.024385 3.170 0.001530 ** MesM4 -0.024722 0.024419 -1.012 0.311363 MesM5 -0.069889 0.024044 -2.907 0.003659 ** MesM6 -0.125272 0.024160 -5.185 2.19e-07 *** MesM7 -0.009147 0.023944 -0.382 0.702456 MesM8 -0.052485 0.023699 -2.215 0.026800 * MesM9 -0.011160 0.025681 -0.435 0.663901 CicloEstavel:SetorrSII 0.064206 0.012032 5.336 9.64e-08 *** CicloSubida:SetorrSII 0.158902 0.013533 11.742 < 2e-16 *** CicloEstavel:SetorrSIII 0.039554 0.013205 2.995 0.002746 ** CicloSubida:SetorrSIII 0.189300 0.014901 12.704 < 2e-16 ***
73
Coefficients: Estimate Std. Error t value Pr(>|t|) CicloEstavel:SsetorGR -0.070230 0.011022 -6.372 1.92e-10 *** CicloSubida:SsetorGR -0.094764 0.012432 -7.623 2.63e-14 *** CicloEstavel:TamMC -0.037762 0.011409 -3.310 0.000935 *** CicloSubida:TamMC -0.157112 0.012831 -12.244 < 2e-16 *** CicloEstavel:TamSC -0.102465 0.012502 -8.196 2.69e-16 *** CicloSubida:TamSC -0.203604 0.014034 -14.508 < 2e-16 *** SetorrSII:SsetorGR -0.058936 0.011747 -5.017 5.30e-07 *** SetorrSIII:SsetorGR -0.058395 0.011910 -4.903 9.53e-07 *** CicloEstavel:MesM10 -0.110152 0.028102 -3.920 8.91e-05 *** CicloSubida:MesM10 -0.134267 0.031596 -4.249 2.16e-05 *** CicloEstavel:MesM11 0.047460 0.025025 1.897 0.057909 . CicloSubida:MesM11 0.069501 0.035312 1.968 0.049068 * CicloEstavel:MesM12 0.098692 0.024957 3.954 7.71e-05 *** CicloSubida:MesM12 0.095159 0.034697 2.743 0.006103 ** CicloEstavel:MesM2 0.103190 0.023630 4.367 1.27e-05 *** CicloSubida:MesM2 0.073972 0.031071 2.381 0.017291 * CicloEstavel:MesM3 0.109791 0.022947 4.785 1.73e-06 *** CicloSubida:MesM3 -0.091417 0.036169 -2.527 0.011499 * CicloEstavel:MesM4 0.121539 0.024580 4.945 7.71e-07 *** CicloSubida:MesM4 0.019274 0.030086 0.641 0.521776 CicloEstavel:MesM5 0.264946 0.026202 10.112 < 2e-16 *** CicloSubida:MesM5 -0.097924 0.028675 -3.415 0.000640 *** CicloEstavel:MesM6 0.347973 0.025755 13.511 < 2e-16 *** CicloSubida:MesM6 -0.366004 0.030398 -12.040 < 2e-16 *** CicloEstavel:MesM7 0.328478 0.024981 13.149 < 2e-16 *** CicloSubida:MesM7 -0.895471 0.030240 -29.612 < 2e-16 *** CicloEstavel:MesM8 0.309630 0.027413 11.295 < 2e-16 *** CicloSubida:MesM8 -1.018005 0.030244 -33.660 < 2e-16 *** CicloEstavel:MesM9 0.151757 0.026481 5.731 1.02e-08 *** CicloSubida:MesM9 -0.784578 0.032052 -24.478 < 2e-16 *** SemanaS2:MesM10 0.155262 0.030422 5.104 3.37e-07 *** SemanaS3:MesM10 0.027878 0.030467 0.915 0.360190 SemanaS4:MesM10 0.069418 0.030698 2.261 0.023755 * SemanaS5:MesM10 0.021447 0.045755 0.469 0.639263 SemanaS2:MesM11 0.037969 0.030321 1.252 0.210505 SemanaS3:MesM11 0.024393 0.030303 0.805 0.420845 SemanaS4:MesM11 0.025630 0.030545 0.839 0.401426 SemanaS5:MesM11 0.143312 0.054584 2.626 0.008660 ** SemanaS2:MesM12 0.003404 0.030208 0.113 0.910291 SemanaS3:MesM12 -0.047703 0.030218 -1.579 0.114443 SemanaS4:MesM12 -0.014031 0.030490 -0.460 0.645394 SemanaS5:MesM12 0.028528 0.050829 0.561 0.574629 SemanaS2:MesM2 0.001406 0.029234 0.048 0.961646 SemanaS3:MesM2 -0.047367 0.029196 -1.622 0.104747 SemanaS4:MesM2 -0.026247 0.029531 -0.889 0.374134 SemanaS5:MesM2 0.046520 0.053519 0.869 0.384734 SemanaS2:MesM3 -0.002636 0.029160 -0.090 0.927963 SemanaS3:MesM3 -0.093057 0.029135 -3.194 0.001406 **
74
SemanaS4:MesM3 -0.074220 0.029457 -2.520 0.011760 * SemanaS5:MesM3 -0.039176 0.052445 -0.747 0.455076 SemanaS2:MesM4 -0.004514 0.029007 -0.156 0.876344 SemanaS3:MesM4 -0.074772 0.029512 -2.534 0.011299 * SemanaS4:MesM4 -0.065992 0.029807 -2.214 0.026844 * SemanaS5:MesM4 0.080563 0.056537 1.425 0.154192 SemanaS2:MesM5 0.008660 0.028904 0.300 0.764465 SemanaS3:MesM5 -0.126501 0.028938 -4.371 1.24e-05 *** SemanaS4:MesM5 -0.081116 0.029257 -2.773 0.005570 ** SemanaS5:MesM5 -0.062062 0.039065 -1.589 0.112158 SemanaS2:MesM6 0.038792 0.028881 1.343 0.179235 SemanaS3:MesM6 -0.023976 0.028868 -0.831 0.406249 SemanaS4:MesM6 -0.021920 0.029180 -0.751 0.452554 SemanaS5:MesM6 0.100949 0.054122 1.865 0.062172 . SemanaS2:MesM7 -0.057758 0.028730 -2.010 0.044411 * SemanaS3:MesM7 -0.122572 0.028676 -4.274 1.93e-05 *** SemanaS4:MesM7 -0.116260 0.028971 -4.013 6.02e-05 *** SemanaS5:MesM7 -0.102732 0.040380 -2.544 0.010965 * SemanaS2:MesM8 0.039591 0.028475 1.390 0.164437 SemanaS3:MesM8 0.045354 0.029614 1.531 0.125671 SemanaS4:MesM8 -0.007721 0.029890 -0.258 0.796157 SemanaS5:MesM8 0.089740 0.044925 1.998 0.045787 * SemanaS2:MesM9 0.060320 0.030965 1.948 0.051431 . SemanaS3:MesM9 0.002418 0.030975 0.078 0.937770 SemanaS4:MesM9 0.148746 0.030945 4.807 1.55e-06 *** SemanaS5:MesM9 0.128142 0.056993 2.248 0.024567 * SemanaS2:AnoA2003 -0.009162 0.032609 -0.281 0.778744 SemanaS3:AnoA2003 -0.031199 0.032631 -0.956 0.339033 SemanaS4:AnoA2003 0.001948 0.032707 0.060 0.952501 SemanaS5:AnoA2003 0.140934 0.050400 2.796 0.005176 ** SemanaS2:AnoA2004 -0.028200 0.032347 -0.872 0.383325 SemanaS3:AnoA2004 -0.028176 0.032354 -0.871 0.383845 SemanaS4:AnoA2004 0.060684 0.032392 1.873 0.061030 . SemanaS5:AnoA2004 0.129771 0.052045 2.493 0.012662 * SemanaS2:AnoA2005 -0.014284 0.030865 -0.463 0.643512 SemanaS3:AnoA2005 -0.030251 0.030940 -0.978 0.328215 SemanaS4:AnoA2005 -0.026087 0.030990 -0.842 0.399922 SemanaS5:AnoA2005 0.027836 0.053848 0.517 0.605214 SemanaS2:AnoA2006 -0.012036 0.029673 -0.406 0.685018 SemanaS3:AnoA2006 -0.028495 0.029692 -0.960 0.337224 SemanaS4:AnoA2006 -0.013691 0.029655 -0.462 0.644319 SemanaS5:AnoA2006 0.069488 0.048244 1.440 0.149789 SemanaS2:AnoA2007 -0.017069 0.027124 -0.629 0.529173 SemanaS3:AnoA2007 -0.041404 0.027133 -1.526 0.127036 SemanaS4:AnoA2007 -0.034196 0.027112 -1.261 0.207218 SemanaS5:AnoA2007 0.079660 0.039739 2.005 0.045024 * Coefficients: Estimate Std. Error t value Pr(>|t|) SemanaS2:AnoA2008 0.009954 0.026229 0.380 0.704304 SemanaS3:AnoA2008 0.005106 0.026333 0.194 0.846268
75
SemanaS4:AnoA2008 -0.016794 0.026333 -0.638 0.523642 SemanaS5:AnoA2008 0.099514 0.042985 2.315 0.020622 * SemanaS2:AnoA2009 0.002890 0.027891 0.104 0.917474 SemanaS3:AnoA2009 0.055394 0.028276 1.959 0.050129 . SemanaS4:AnoA2009 0.044773 0.028375 1.578 0.114612 SemanaS5:AnoA2009 0.070349 0.047219 1.490 0.136284
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Gamma family taken to be 0.0613073)
Null deviance: 1990.06 on 14934 degrees of freedom
Residual deviance: 798.12 on 14799 degrees of freedom
AIC: 20.594
76
Anexo D - Procedimento efetuado no software R para definir o modelo de previsão
Definidos os dados de entrada no programa, definiu-se em seguida a função a ser
utilizada para modelar os dados. No aplicativo R, escolheu-se a função GLM (“generalized
linear model”), que segundo o R, é definida com os seguintes parâmetros:
fitted.model <- glm ( formula, family = family.generator, data = data.frame )
Na função glm, o termo formula indica a equação que se deseja modelar, incluindo
neste termo, as covariáveis e as interações entre elas; o termo family indica a família de
distribuição que no caso deste trabalho será a família de distribuições gamma; e, o termo data,
indica os dados que pretende-se analisar com a função, no caso deste trabalho, os dados de
entrada descritos anteriormente. Ao definir a família de distribuição Gamma na função glm,
pode-se especificar também a função link, que neste caso, é a função log link.
Nesta etapa de definição do modelo focou-se na programação do problema no pacote
estatístico R. O modelo de função do R é o glm como apresentado anteriormente.
No argumento formula da função glm é inserida a equação com a variável resposta e
as covariáveis que são consideradas no modelo. Inicialmente inseriu-se o modelo completo,
com todas as covariáveis e com todas interações de segunda ordem entre estas covariáveis.
A função glm ficou escrita da seguinte forma:
Analise.fitted <- glm ( Y ~ Ciclo + Setorr + Ssetor + Tam + Semana + Ano + Mes +
Ciclo*Setorr + Ciclo*Ssetor + Ciclo*Tam + Ciclo*Mes + Ciclo*Semana + Ciclo*Ano +
Setorr*Ssetor + Setorr*Tam + Setorr*Semana + Setorr*Mes + Setorr*Ano + Ssetor*Tam +
Ssetor*Semana + Ssetor*Mes + Ssetor*Ano + Tam*Semana + Tam*Mes + Tam*Ano +
Semana*Mes + Semana*Ano + Mes*Ano, family = Gamma (link = log), data = dados)
Onde as covariáveis que compõem a equação principal são detalhadas da seguinte
forma:
• Y: é a variável resposta que se deseja prever, ou seja, é o retorno dos preços
das ações analisadas;
77
• Ciclo: é covariável que é definida pela classificação dos ciclos monetários. Os
períodos do ciclo monetário foram divididos em três (corte, subida e estável);
• Setorr: é a covariável relacionada ao setor da empresa. Utilizou-se a
classificação de SI, SII e SIII. No grupo SI encontram-se os setores de varejo,
construção civil e infraestrutura, logística e concessões. No grupo SII, estão
agrupados o setor bancos e instituições financeiras e empresas do setor de
alimentos, bebidas e tabaco. Enfim, no grupo SIII, encontram-se os setores de
empresas relacionadas à saúde, utilidade pública, telecomunicações e
educação;
• Ssetor: é a covariável dos super-setores. Os super-setores podem ser definidos
como sendo de crescimento ou defensivos;
• Tam: é a covariável do tamanho das empresas. Uma empresa pode ser
classificada como pequena, média ou grande segundo o critério utilizado neste
trabalho;
• Ano: é a covariável que identifica o ano em que a observação foi realizada.
Nesta análise, foram medidos os retornos de 2002 a 2009, por isso, esta
covariável pode assumir os valores A2002, A2003, A2004, A2005, A2006,
A2007, A2008 e A2009;
• Mês: é a covariável que identifica o mês em que a observação foi realizada.
Assim, esta covariável pode assumir os valores M1, M2, M3, M4, M5, M6,
M7, M8, M9, M10, M11, M12;
• Semana: é a covariável que identifica em qual semana do mês a observação foi
realizada. Assim, esta covariável pode assumir os valores S1, S2, S3, S4 e S5.
De forma simplificada, as etapas realizadas para determinar a equação do modelo de
previsão foram as seguintes:
a) Compila-se no software R a função glm com as covariáveis e interações na sua
forma mais completa;
b) Identifica-se os paramêtros bi’s que são menos significativos (através do nível
de significância α do teste de hipótese, ou p-value);
78
c) Exclui-se a interação de covariáveis com menor nível de significância e
compila-se novamente no R a função glm sem a interação excluída;
d) Se a deviance residual do teste diminuir ou se manter constante e se os valores
dos parâmetros bi continuarem tão significativos como antes da exclusão da
interação analisada, pode-se excluir definitivamente esta interação da equação
de previsão;
e) Caso a deviance residual aumente, isto significa que o modelo está pior sem a
interação excluída, por isso, ela deve ser incorporada novamente à equação de
previsão.
Este procedimento foi realizado diversas vezes até que a exclusão de qualquer uma das
interações restantes causasse o aumento da deviance residual. Assim, chegou-se a seguinte
equação para a função glm:
Analise.fitted <- glm (Y ~ Ciclo + Setorr + Ssetor + Tam + Semana + Ano + Mes +
Ciclo*Setorr + Ciclo*Ssetor + Ciclo*Tam + Ssetor*Setorr + Ciclo*Mes + Mes*Semana +
Semana*Ano, family = Gamma (link = log), data = dados)
79
Anexo E - Representação gráfica dos resíduos padronizados
Figura E.1 - Resíduos padronizados (I)
Figura E.2 - Resíduos padronizados (II)
-4
-3
-2
-1
0
1
2
3
4
5
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
-8
-6
-4
-2
0
2
4
6
8
10
5000 5500 6000 6500 7000 7500 8000 8500 9000 9500 10000
80
Figura E.3 – Resíduos padronizados (III)
-8
-6
-4
-2
0
2
4
6
10000 10500 11000 11500 12000 12500 13000 13500 14000 14500 15000