faculdade de ciÊncias da universidade de lisboa …

86
1 FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA INSTITUTO SUPERIOR DAS CIÊNCIAS DO TRABALHO E DA EMPRESA Departamento de Matemática da FCUL Departamento de Finanças do ISCTE MODELOS ECONOMÉTRICOS DE CLASSIFICAÇÃO DE RATING Davide José Henriques da Silva MESTRADO EM MATEMÁTICA FINANCEIRA 2011

Upload: others

Post on 16-Oct-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

1

FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA

INSTITUTO SUPERIOR DAS CIÊNCIAS DO TRABALHO E DA EMPRESA

Departamento de Matemática da FCUL Departamento de Finanças do ISCTE

MODELOS ECONOMÉTRICOS DE CLASSIFICAÇÃO DE RATING

Davide José Henriques da Silva

MESTRADO EM MATEMÁTICA FINANCEIRA

2011

Page 2: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

2

Esta página foi intencionalmente deixada em branco

Page 3: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

3

FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA INSTITUTO SUPERIOR DAS CIÊNCIAS DO TRABALHO E DA EMPRESA

Departamento de Matemática da FCUL Departamento de Finanças do ISCTE

MODELOS ECONOMÉTRICOS DE CLASSIFICAÇÃO DE RATING

Davide José Henriques da Silva

MESTRADO EM MATEMÁTICA FINANCEIRA

Orientadora: Profª. Doutora Diana Mendes

2011

Page 4: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

4

RESUMO

Com a evolução constante dos mercados financeiros, o permanente aumento em

número e complexidade dos produtos e perante o desejo efémero de se obterem os melhores

resultados com a menor exposição possível ao risco, torna-se fundamental conhecer o

mercado de forma a capturar, da forma mais rigorosa possível, os riscos incorridos.

Neste contexto, é fundamental conhecer os intervenientes nos mercados financeiros, e

hierarquizá-los de forma objectiva, de forma a assumir confiança baseada em risco,

aumentando exposição perante intervenientes “bem vistos” e diminuindo-a perante aqueles de

estabilidade “duvidosa”.

Nesse aspecto, as agências de rating desenvolvem um papel fundamental. Empresas

como Moody’s, Standard & Poor’s e Fitch, ao classificarem os principais intervenientes de

mercado, estabelecem uma proxy de risco – o rating - que permite que os agentes de mercado

(investidores, banca ou entidades de supervisão) possam sustentar as suas intervenções.

No entanto, existe uma lacuna no trabalho desenvolvido pelas agências de

classificação que constitui um entrave à realização da maioria das análises: a fórmula de

classificação utilizada por essas agências não é divulgada e, adicionalmente, apenas as

empresas de maior dimensão são classificadas.

Assim, perante a inexistência de uma fórmula que permita classificar qualquer

entidade do mercado, propõe-se estimar um modelo que, com base numa amostra, e mediante

uma série de indicadores e critérios estatísticos rigorosos, consiga captar os principais efeitos

que determinam a atribuição de rating de Instituições Financeiras.

Palavras-chave: Instituição Financeira, Rating, Regressão logística.

Page 5: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

5

ABSTRACT

With the constant evolution of financial markets, the permanent increase in products’

number and complexity, and considering investor’s rush to achieve the best results with the

least possible risk exposure, it has become fundamental to understand the market, in order to

capture incurred risks in the best possible and accurate way.

In this context, it is fundamental to have consistent knowledge about financial market

intervenient, and to rank them objectively, in order to capture risk based confidence,

increasing exposures to “well behaved” intervenient and reducing it before those with

“dubious stability”.

Rating agencies, such as Moody’s, Standard & Poor’s and Fitch, develop a

fundamental role by classifying market participants according to a risk proxy – the rating –

which allows stakeholders (investors, banks, regulatory entities) to support their interventions.

However, there is a loophole in the work developed by those agencies, which

constitutes a barrier to the performance of most credit analysis: the classification formula used

by those agencies is not publically available and, additionally, only major companies are

classified.

Thus, considering the inexistence of a formula allowing the classification of any

market entity, this thesis proposes the estimation of a model that, based on a sample, and

using several indicators and statistical criteria, allows capturing the main effects explaining

rating classification of financial institutions.

Key-words: Financial Institution, Rating, Logistic Regression

Page 6: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

6

AGRADECIMENTOS

O meu agradecimento sincero às seguintes pessoas e entidades:

À Ernst & Young, que apoiou parcialmente a realização do meu Mestrado em

Matemática Financeira, e em particular ao Pedro Lourenço, meu mestre e companheiro de

trabalho, que me incentivou a realizar o Mestrado e cujo auxílio foi fundamental na realização

desta Tese.

Ao corpo docente do Mestrado em Matemática Financeira, pelo contributo

extraordinário que prestam ao serviço da educação e na formação de profissionais, e em

particular à Professora Diana pelo apoio incansável na orientação desta Tese.

À Madalena Ribeiro e Lúcia Ventura, colegas de trabalho que guardo em amizade, e

que muito contribuíram para o sucesso da parte curricular do Mestrado.

À minha Família (Pai, Mãe, Avó, Diana, Rita), de forma muito especial, pelo apoio

que me deram sempre, e sem o qual nada disto seria possível.

Page 7: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

7

SUMÁRIO

1. PROJETO DE PESQUISA .............................................................................................. 9

1.1. Enquadramento ................................................................................................................ 9

2. ENQUADRAMENTO TEÓRICO ................................................................................ 11

2.1. Teoria ............................................................................................................................... 11

2.2. Regressão Logística ........................................................................................................ 11

2.2.1. Interpretação do Modelo de Regressão Logística .................................................. 15

2.3. Método da Máxima Verosimilhança ............................................................................. 16

2.4. Critérios de Selecção do Modelo ................................................................................... 17

2.4.1. Critério de Informação de Akaike ........................................................................... 17

2.4.2. Critério de Schwarz ................................................................................................ 18

2.5. Testes de Significância ................................................................................................... 18

2.5.1. Teste de Wald ......................................................................................................... 18

2.5.2. Rácio de verosimilhança ......................................................................................... 19

2.5.3. Teste de Score ......................................................................................................... 20

3. MÉTODO ........................................................................................................................ 21

3.1. Definição da Amostra ..................................................................................................... 21

3.1.1. Recolha de informação ........................................................................................... 21

3.1.2. Construção de Indicadores ..................................................................................... 24

3.1.3. Pressupostos de construção do Modelo .................................................................. 30

3.2. Estimação do Modelo ..................................................................................................... 31

3.3.2. Plataforma Tecnológica .......................................................................................... 31

3.3.3. Aplicação do Modelo ............................................................................................. 32

4. RESULTADOS ............................................................................................................... 37

4.1. Resultados da aplicação do Modelo ............................................................................... 37

4.2. Definição de Critérios de Classificação (thresholds) ..................................................... 44

Page 8: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

8

4.3. Medidas de Qualidade de Predição ................................................................................ 48

5. CONCLUSÃO E RECOMENDAÇÕES ...................................................................... 53

5.1. Conclusão ......................................................................................................................... 53

5.2. Recomendações ................................................................................................................ 54

6. REFERÊNCIAS BIBLIOGRÁFICAS ......................................................................... 56

7. APÊNDICE ..................................................................................................................... 59

7.1. Aplicação do modelo sobre o rating da Fitch e Moody’s ............................................. 59

7.1.1. Aplicação sobre a Moody’s .................................................................................... 59

7.1.2. Aplicação sobre a Fitch .......................................................................................... 61

7.2. Código de programação do método Stepwise ................................................................ 63

7.3. Ficheiro Excel “Construção da amostra.xls” ................................................................ 86

Page 9: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

9

1. PROJETO DE PESQUISA

1.1. Enquadramento

Com a evolução constante dos mercados financeiros, e perante o permanente aumento

do número e complexidade de produtos, e o desejo efémero de se obterem as melhores

condições e os melhores resultados com a menor exposição possível ao risco, torna-se cada

vez mais importante conhecer o mercado de forma a antecipar situações futuras de ruptura,

identificando e avaliando da forma mais rigorosa possível os riscos incorridos pelos agentes

no mercado.

Neste contexto, é fundamental conhecer os intervenientes nos mercados financeiros, e

hierarquizá-los de forma objectiva, para estabelecer correctamente o binómio

risco/rentabilidade, e assegurar a existência de confiança nas transacções comerciais. A

existência de critérios claros e uniformes de classificação dos agentes financeiros permite aos

parceiros económicos realizar negócios de forma consciente, aumentando a sua exposição

perante intervenientes “de confiança” e diminuindo-a perante aqueles de estabilidade

“duvidosa”.

Nesse aspecto, as agências de rating desenvolvem um papel fundamental. Empresas

como a Moody’s, Fitch ou a Standard & Poor’s, ao classificarem os principais intervenientes

de mercado relativamente à sua qualidade creditícia estabelecem uma proxy de risco que

permite que investidores, banca ou entidades de supervisão possam estabelecer pontos de

partida mais sustentados para realizar as suas intervenções.

A Standard & Poor’s (S&P) emite periodicamente classificações de rating para as

principais entidades presentes nos mercados dos vários sectores de actividade. Essa

classificação usualmente tem em consideração 21 níveis teóricos (AAA, AA+, AA, AA-, A+,

A, A-, BBB+, BBB, BBB-, BB+, BB, BB-, B+, B, B-, CCC+, CCC, CCC-, SD, D), que

constituem uma escala de classificação descendente no que respeita à qualidade ou

performance da entidade classificada. A classificação de uma entidade visa associar-lhe um

desses níveis tendo por base critérios objectivos e subjectivos como por exemplo: localização

geográfica, sector de actividade, rácios financeiros, etc.

Page 10: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

10

A classificação atribuída pela S&P é vista como uma medida da qualidade e

fiabilidade da entidade no mercado, na medida em que empresas com ratings elevados

tendem a ser vistas como entidades mais fiáveis, melhor cumpridoras das suas obrigações,

com maior potencial de desenvolvimento. Por conseguinte, têm mais facilidade de acesso ao

crédito, conseguem melhores condições negociais e são mais apetecíveis aos olhos dos

investidores.

Além de serem medidas bastante úteis para efeitos de classificação de intervenientes,

os ratings são também medidas fundamentais para analisar o risco de crédito na banca, na

execução de análises de preços de transferência ou na tarifação de obrigações e outros

produtos financeiros.

No entanto, existe uma lacuna no trabalho desenvolvido pelas agências de

classificação que constitui um entrave à realização da maioria das análises: as fórmulas de

classificação utilizadas pelas agências de rating não são conhecidas. Além disso, apenas as

principais entidades mundiais estão classificadas, o que dificulta qualquer caracterização

particular de um nicho de mercado como o Português. Até 2000 apenas 4 empresas

portuguesas recebiam periodicamente classificação de rating da S&P (PT, Cimpor, EDP e

Brisa). Em 2010 o número de empresas portuguesas com classificação periódica de rating da

S&P é de apenas 10 (BRISA, BPI, Cimpor, CGD, CP, EDP, Gas Natural, PT, REFER, REN).

É nesta envolvente contextual que se insere a presente proposta de análise. Perante a

inexistência de uma fórmula que permita classificar qualquer entidade do mercado, propõe-se

estimar um modelo que, com base numa amostra, consiga captar os principais efeitos que

explicam e influenciam a atribuição de um rating mais ou menos elevado.

No entanto, uma vez que as especificidades de cada sector de actividade requerem

indicadores distintos para uma análise qualitativa, focalizar-se-á a estimação num

determinado sector de mercado: o sector bancário.

Tendo por base informação histórica de várias entidades bancárias (classificação de

rating e informação financeira e não financeira para determinados anos) propõe-se construir

um conjunto de indicadores para avaliar a qualidade de crédito de uma instituição financeira,

e identificar critérios estatísticos rigorosos para obter um modelo de classificação para

Instituições Financeiras (IF).

Page 11: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

11

2. ENQUADRAMENTO TEÓRICO

2.1. Teoria

A modelização da função de atribuição de ratings a Instituições Financeiras que se

propõe realizar, é efectuada mediante a utilização do modelo de regressão logística ordenada,

com estimação dos parâmetros através do método de máxima verosimilhança.

Para confirmar a qualidade global do ajustamento do modelo, comparando os ratings

estimados pelo Modelo com os ratings observados na amostra, serão utilizados critérios de

selecção, nomeadamente o critério de Akaike e o critério de Schwarz.

Adicionalmente serão utilizados testes de significância para analisar a relevância

individual das variáveis e a contribuição destas para o Modelo seleccionado. Esta análise será

realizada com recurso ao teste de Wald, rácio de verosimilhança e teste de Score.

Nas secções seguintes detalha-se a teoria subjacente aos métodos e testes acima

descritos.

2.2. Regressão Logística

A regressão logística é comummente utilizada para modelizar os resultados de uma

variável dependente de variáveis categóricas [2, pág. 1], uma vez que estas variáveis apenas

tomam um número limitado de valores num intervalo discreto especificado, tornando ineficaz

a utilização de um modelo de regressão linear que, apesar de mais simples na interpretação e

na realização dos cálculos, assume no entanto valores possíveis e contínuos em toda a recta

real.

Outros modelos poderiam ser utilizados, sendo frequentemente descritos na literatura.

Em [3, pág. 214], Abdullah compara 3 modelos de estimação de rating – MDA (Multiple

Discriminant Analysis), Hazard e Logit (regressão logística) – apresentando os resultados da

identificação de situações de imparidade por cada um deles. Nesse estudo, em que se pretende

comparar os resultados do ajustamento dos 3 modelos sobre companhias a operar na Malásia,

o modelo Hazard é apresentado como sendo o que melhor ajusta o rating sob o argumento de

Page 12: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

12

que este modelo utiliza valores temporais para determinar a imparidade, e não um valor médio

como seria o caso da regressão logística. Ou seja, depreende-se que, nos modelos comparados

no estudo, o modelo logit não considera todos os valores temporais.

Não sendo este o caso do modelo que se apresenta nesta tese, que pretende utilizar

todas as observações de todos os anos para cada IF, o modelo logit é apresentado com um

funcionamento semelhante ao modelo Hazard, ignorando no entanto o valor temporal de uma

IF e o facto de já ter transitado por outros estados creditícios (nomeadamente situações de

tensão financeira). Adicionalmente, o modelo logit que se pretende apresentar neste

documento não contempla somente 2 (duas) respostas (default ou não) como indicado no

estudo, mas sim medidas de probabilidade, cujas respostas são os ratings. Como tal, pode

referir-se que o modelo logit assume apenas um período (intemporal) mas que na prática

mitiga o efeito temporal de defaults anteriores, porque procura sempre ajustar à situação de

crédito mais provável em cada momento, dados os valores apresentados pelas variáveis

explicativas.

Em [3, pág. 214-215] Abdullah mostra que não é claro as situações em que uns

modelos são melhores do que outros e inclusive, os modelos MDA e logit são apresentados

como melhores na previsão de resultados fora da amostra de construção, o que é exactamente

a situação que se pretende (previsão na atribuição de rating). Na prática todos os modelos

apresentam ajustamentos aproximados, mas considerando a importância da previsão de

resultados, o modelo logit permite obter maior confiança nos resultados.

A conclusão do estudo de Abdullah sugere os modelos MDA e logit como melhores

no caso da Malásia para a amostra de previsão, e o modelo Hazard no caso de economias

ocidentais. Regra geral, não é no entanto claro nem incontestável qual seria o melhor modelo

para IF's em Portugal, sendo no entanto de constatar que os resultados globais são próximos

em todos os modelos e que, na previsão (amostra de teste), MDA e logit aparentam ser mais

ajustados.

A utilização de um modelo de regressão linear é colocada de parte pela dificuldade em

garantir uma interpretação clara e consistente dos resultados. Em [1, pág. 689] mostra-se que

a utilização de um modelo de regressão linear implica que as probabilidades podem situar-se

abaixo de 0 ou acima de 1 para valores suficientemente pequenos ou grandes da variável

Page 13: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

13

independente, quando deveriam na realidade situar-se entre 0 e 1. Esta situação é evitada no

caso do modelo logit, por se limitarem as probabilidades ao intervalo entre 0 e 1.

Outro tipo de modelo que poderia ser considerado consiste na análise discriminante.

Em [2], Mälhman centra o estudo na estimação dos parâmetros da função de scoring que

permite classificar IF's em 2 grupos (investment grade e não investment grade, também

conhecido por speculative). Assume-se no estudo que as variáveis óptimas a utilizar são

conhecidas e podem ser quantitativas e qualitativas. O problema reduz-se então a encontrar os

estimadores não enviesados. São utilizados dois modelos: logit e análise discriminante. Ao

contrário da análise discriminante em que se prova que os estimadores são enviesados mesmo

em amostras de grande dimensão, o estudo descreve como o modelo logit produz estimadores

centrados, e como as variáveis qualitativas e dummy são aceitáveis.

Dos vários estudos resulta uma ideia consistente: a regressão logística tem aceitação

generalizada como um modelo sólido, comummente utilizado na análise de rating, devido às

suas propriedades (estimadores centrados, possibilidade de utilização de variáveis

categóricas), à facilidade da sua utilização e à qualidade dos resultados obtidos no

ajustamento e na previsão.

Desta forma, a regressão logística, pertencente à classe dos modelos lineares

generalizados, apresenta-se como uma técnica apropriada para a determinação da qualidade

creditícia duma instituição financeira, cujo rating se encontra dependente de variáveis

discretas e até categóricas.

Considere-se então a aplicação da regressão logística na determinação do rating de

uma IF. Para o efeito, assume-se que a variável dependente Y – o rating da IF - assume

valores em k classes de rating e que:

k…X, i=β=αi|X)g(P(Y 'i ,,1) +≤ (2.1)

onde iα representa o i-ésimo dos k parâmetros de intercepção e β representa o

vector de parâmetros associados aos regressores X .

Ou seja, assume-se que a probabilidade da variável Y pertencer a uma determinada

classe de rating é uma função de determinadas variáveis explicativas. A probabilidade de

Page 14: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

14

presença, nessas variáveis, das características que explicam o comportamento de Y é dada

por X e pode ser convertida em hipóteses (odds), isto é,

ticascaracterísdasausênciadeadeprobabilidticascaracterísdaspresençadaadeprobabilid

ppodds =−

=1

(2.2)

No entanto, em vez de se minimizarem os erros quadrados da estimativa de

ajustamento, pretende-se maximizar a verosimilhança dos valores observados e estimados.

Para o efeito utiliza-se

− pp

1log (2.3)

ou seja,

Xβα'i

'i

'ie

ppXβα

ppXβ=αi|X)g(P(Y +=

−⇔+=

⇔+≤11

log)

Xβα 'iepp +−=⇔ )1(

+

=⇔=+⇔+

+++

Xβα

XβαXβαXβα

'i

'i'

i'

i

e

epeep1

)1(

e, por conseguinte,

Xβα

Xβα

'i

'i

e

ei|XP(Y+

+

+==

1) (2.4)

Multiplicando no numerador e denominador por Xβα 'ie −− , tem-se finalmente

Xβα 'ie

i|XP(Y−−+

==1

1) (2.5)

Esta equação expressa a probabilidade de sucesso directamente [1, pág. 691]. Ou seja,

tendo por base as variáveis independentes X para uma determinada IF com rating Y , a

equação permite calcular a probabilidade do rating ser igual a i , ou seja, )i|XP(Y = .

Page 15: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

15

Assumindo a independência, e considerando uma amostra de dimensão n, a função de

verosimilhança a utilizar é:

( )∏ ======

n

iiinn yYPyYyYyP(Y

12211 ),...,, (2.6)

com ∏===

m

j

Iijii

ijpyP(Y1

) (2.7)

e onde

≠=

=i

iij yjse

yjseI

,0,1

e m representa o número de classes de rating.

Os parâmetros α e β a estimar são aqueles que maximizam a função de

verosimilhança:

∏ ∏== =

n

i

m

j

Iij

ijpl1 1

*β (2.8)

onde n representa o número de Instituições Financeiras e m representa o número de

classes de rating.

Para efeitos de estimação, aplicando o método de máxima verosimilhança, é

necessário um número significativo de regressores ( X ) que expliquem da melhor forma

possível a variável a modelizar, neste caso, o rating da IF.

2.2.1. Interpretação do Modelo de Regressão Logística

A utilização de (2.5) permite determinar directamente a probabilidade do resultado,

mas permite também a determinação do efeito de uma determinada variável independente

sobre a variável dependente. A exponencial de um parâmetro β , ceteris paribus, permite

obter o efeito multiplicativo do regressor sobre as hipóteses. Quanto mais β se afasta de zero,

maior o efeito do regressor X sobre a variável dependente, tendo no limite

101

11

1⇔

+⇔

+⇔∞→

∞−eβ

Page 16: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

16

01

11

1⇔

∞+⇔

+⇔−∞→

∞eβ

O efeito de cada regressor sobre a variável dependente deve ser analisado em conjunto

utilizando o sinal do parâmetro β e os valores que toma essa variável X .

- Se 0. >Xβ , então existe uma relação positiva, dada por βe , entre a probabilidade

do resultado iY = e o valor da variável independente. Por outras palavras, a probabilidade do

resultado se verificar é maior para valores maiores de β .

- Se 0. <Xβ , então existe uma relação negativa, dada por β−e , entre a probabilidade

do resultado iY = e o valor da variável independente. Por outras palavras, a probabilidade do

resultado se verificar é menor para valores maiores de β .

2.3. Método da Máxima Verosimilhança

O método da máxima verosimilhança (Maximum Likelihood Estimation ou MLE) é

um método estatístico comummente utilizado para ajustar modelos estatísticos a um conjunto

de informação, fornecendo estimativas para os parâmetros desses modelos.

Para regressões logísticas, o método de minimização da soma dos quadrados dos

resíduos, utilizado no caso da regressão linear, não tem capacidade de produzir estimadores

não enviesados com variância mínima. Como tal, utiliza-se em sua substituição o método da

máxima verosimilhança para determinar os parâmetros que melhor ajustam a informação [2,

pág.1].

Para utilização do MLE, é necessário especificar em primeiro lugar a função densidade

de probabilidade das observações. A função de distribuição ( ).0f que explica o

comportamento dos dados é desconhecida, sabendo-se no entanto que pertence a uma

determinada família de distribuições ( ){ }Θ∈θθ ,|.f denominada por modelo paramétrico, de

tal forma que ( ) ( )00 |.. θff = . O valor de 0θ é desconhecido e refere-se ao “verdadeiro valor”

do parâmetro.

Pretende-se, assim, descobrir um estimador θ̂ o mais próximo possível de 0θ .

Page 17: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

17

Para amostras de dados independentes e identicamente distribuídos (iid) a função de

densidade conjunta é dada por:

( ) ( ) ( ) ( )θθθθ |...|.||,...,, 2121 nn xfxfxfxxxf = (2.9)

No contexto do modelo de predição que se pretende estimar, utilizando uma função de

ligação logística, a aplicação do método da máxima verosimilhança envolve a determinação

dos parâmetros α e β desconhecidos, apresentados na equação (2.1).

A decomposição da função através de (2.7) permite obter a função de verosimilhança

apresentada na equação (2.8).

O problema de determinação dos parâmetros mais próximos do “verdadeiro valor” dos

coeficientes para os regressores dos quais depende o rating reduz-se à maximização do valor

da função dada na equação (2.8) utilizando procedimentos numéricos iterativos de pesquisa.

Na secção seguinte apresentam-se os critérios estatísticos utilizados para validar a

adequação do ajustamento realizado com recurso ao método da máxima verosimilhança.

2.4. Critérios de Selecção do Modelo

2.4.1. Critério de Informação de Akaike

O critério de informação de Akaike (Akaike Information Criterion ou AIC) é uma

medida da qualidade do ajustamento da estimativa de um modelo estatístico.

O critério de Akaike não constitui um teste de hipóteses mas sim uma ferramenta de

selecção entre modelos alternativos. Ou seja, vários modelos podem ser ordenados de acordo

com o valor do critério de Akaike calculado para cada um deles. O modelo com menor valor

do critério de Akaike é considerado o “melhor” modelo.

O valor do critério de informação de Akaike é calculado pela seguinte fórmula:

kLAIC 22 +−= (2.10)

Page 18: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

18

onde *βlL ln= representa o logaritmo da função de verosimilhança *βl no ponto

de maximização, conforme equação (2.8) e k representa o número de parâmetros do modelo

estatístico.

2.4.2. Critério de Schwarz

O critério de informação de Schwarz é uma medida da qualidade do ajustamento de

modelos paramétricos com diferente número de parâmetros.

Este critério penaliza modelos com maior número de parâmetros, sendo uma forma de

analisar a sobreposição de variáveis que, quando incluídas no modelo, melhoram a sua

verosimilhança mas apenas de forma marginal (sendo já cobertas por outras variáveis no

modelo).

O valor do critério de informação de Schwarz é calculado pela seguinte fórmula:

( )nkLSC ln2 ×+−= (2.11)

onde *βlL ln= representa o logaritmo da função de verosimilhança *βl no ponto

de maximização conforme equação (2.7), k representa o número de parâmetros do modelo

estatístico e n representa o número de observações.

2.5. Testes de Significância

2.5.1. Teste de Wald

O teste de Wald é um teste paramétrico que pode ser utilizado para analisar a

significância individual de variáveis incluídas num modelo de estimação. Tem como

potencialidade a sua utilização sobre modelos que incluem, não só variáveis contínuas, como

também dicotómicas (variáveis cujos resultados pertencem a conjuntos separados, como por

exemplo uma variável dummy com apenas dois resultados possíveis).

A estatística de Wald é calculada pela seguinte fórmula:

Page 19: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

19

θθθ

ˆvar

ˆ 2

0−=W (2.12)

onde θ̂ : representa a estimativa do coeficiente da variável explicativa e 0θ representa

o valor que se pretende testar para o coeficiente da variável explicativa.

Pretendendo-se testar a relevância da variável para o modelo estimado, toma-se como

hipótese nula a não significância da variável, ou seja 00 =θ . A rejeição da hipótese nula

implica a relevância da variável para explicar a classificação de rating.

2.5.2. Rácio de verosimilhança

O rácio de verosimilhança é utilizado para comparar o ajustamento de dois modelos

alternativos, em que um dos modelos acresce variáveis sobre o outro.

Por conseguinte, o modelo com maior número de variáveis ajusta sempre pelo menos

tão bem quanto o modelo com menor número de variáveis. Interessa portanto, determinar, de

preferência, se o ajustamento é significativamente superior.

O teste do rácio de verosimilhança é calculado pela seguinte fórmula:

−=

1

0ln2LL

D (2.13)

onde *βlL ln= representa o logaritmo da função de verosimilhança l no ponto de

maximização, ou seja *βl conforme equação (2.8), 1L representa o ponto de maximização

sem restrição nos k parâmetros utilizados, 0L representa o ponto de maximização com

restrição nos k parâmetros utilizados e k representa o número de parâmetros do modelo

estatístico.

Pretendendo-se testar a relevância da variável restringida em 0L para o modelo

estimado, toma-se como hipótese nula a não significância da variável, ou seja valor nulo do

seu coeficiente ( 00 =θ ). A rejeição da hipótese nula implica a relevância da variável para

explicar a classificação de rating.

Page 20: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

20

2.5.3. Teste de Score

O teste de Score é um teste de hipóteses simples em que se pretende analisar se

00 =θ . No trabalho em análise, pretende-se testar a hipótese nula de não significância da

variável, o que equivale a 00 =θ .

O teste de Score é calculado pela seguinte fórmula:

2

2

2

θ

θ

∂∂

−=L

L

S (2.14)

onde *βlL ln= representa o logaritmo da função de verosimilhança l no ponto de

maximização, ou seja *βl conforme equação (2.8).

A rejeição da hipótese nula implica a relevância da variável para explicar a

classificação de rating.

Definidos os critérios de avaliação do ajustamento do modelo, e antes de se proceder à

aplicação do modelo, é ainda necessário definir a amostra de informação a utilizar, bem como

as variáveis a contemplar. No capítulo seguinte, apresenta-se a informação recolhida e

utilizada como base do modelo ajustado, detalha-se a construção dos indicadores (variáveis a

testar como explicativas) e definem-se os pressupostos do modelo.

Page 21: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

21

3. MÉTODO

3.1. Definição da Amostra

Para a estimação do rating de cada Instituição Financeira, aplicando o método da

máxima verosimilhança, é necessário um número significativo de regressores, que capturem

da melhor forma o comportamento dessa variável.

Para esse efeito contemplou-se a criação de diversas variáveis que se considera

aportarem valor na mensuração da qualidade creditícia de uma qualquer Instituição

Financeira. Apresenta-se de seguida o detalhe da informação recolhida e os indicadores

construídos com base nessa informação e utilizados no modelo de predição do rating das IF’s.

3.1.1. Recolha de informação

Para a construção do modelo, considerou-se informação histórica financeira sobre

Instituições Financeiras, publicada na Bloomberg [14], para o período compreendido entre

1997 e 2001.

Esta base de dados internacional publica anualmente informação sobre as principais

entidades financeiras mundiais. No caso de terem sido publicados ratings de S&P nos anos de

publicação ou anteriores, a Bloomberg incorpora igualmente essa informação junto da

informação financeira e não financeira que recolhe e pública.

No total recolheram-se 2571 registos referentes a Instituições Financeiras com rating

associado. No entanto, a distribuição dessas IF pelas 21 classes de rating não é uniforme.

Assim, de forma a preservar quantidades significativas de amostra em todas as classes,

agrupam-se os níveis iniciais em 17 classes, como se apresenta na figura seguinte.

Page 22: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

22

Figura 1: Definição das classes de rating

Rating Nº Registos Rating num Rating agregadoAAA 56 17 AAAAA+ 35 16 AA+AA 128 15 AAAA- 310 14 AA-A+ 320 13 A+A 361 12 AA- 361 11 A-

BBB+ 287 10 BBB+BBB 218 9 BBBBBB- 142 8 BBB-BB+ 73 7 BB+BB 106 6 BBBB- 59 5 BB-B+ 35 4 B+B 44 3 BB- 13 2 B-

CCC+CCCCCC-

SDD

2,571

CCC23 1

Por simplicidade e sem perda de generalidade, associa-se aos níveis uma escala

numérica decrescente. Ou seja a AAA associa-se o valor 17, a AA+ o valor 16 e assim

sucessivamente.

Além da informação proporcionada pela Bloomberg, procurou-se também obter

informação na S&P sobre os ratings de País atribuídos por esta instituição ao longo do

período da amostra. Os ratings de País são atribuídos anualmente e visam medir não só o

nível de desenvolvimento do País, mas também o grau de confiança no mesmo para efeitos de

investimento.

A informação recolhida apresenta-se em seguida, de acordo com a sua proveniência:

§ Detalhes específicos dos Bancos

• Identificação do Banco

Page 23: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

23

• Ano de avaliação (de atribuição da classificação de rating)

• País de origem

• Região de origem

• Especialização (tipo de negócio)

• Rating S&P

• Rating Fitch

• Rating Moody’s

§ Rubricas financeiras dos Bancos (demonstrações financeiras)

• Activos líquidos

• Total dos activos

• Lucro antes de impostos

• Total do Capital Próprio

• Depósitos de clientes

• Total do Passivo

• Provisão para perdas com empréstimos (perdas por imparidade)

• Disponibilidades (Depósitos bancários e Caixa)

§ Informação económica dos Bancos

• Custo da dívida

• Return on Capital

§ Informação regional

• Rating de País

• Produto Interno Bruto do País (PIB)

• Investimento anual (em percentagem do PIB) do País

• Taxa de inflação anual do País

• Taxa de desemprego do País

• Dívida pública (em percentagem do PIB)

Page 24: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

24

3.1.2. Construção de Indicadores

Para efeitos de estimação, aplicando o método da máxima verosimilhança, é

necessário um número significativo de regressores (variáveis explicativas da posição da

variável explicada ou dependente) que expliquem da melhor forma a variável a modelizar,

neste caso o rating de IF’s.

Para esse efeito, contemplou-se a criação de várias variáveis que se considera

aportarem valor na mensuração da qualidade de uma qualquer instituição financeira.

Apresentam-se de seguida os detalhes de cada uma das variáveis consideradas.

Variável 1 – Região Geográfica

Variável categórica que pretende associar cada registo a uma de quatro regiões

geográficas (veja Figura 2). A agregação de países para constituição de regiões geográficas

seguiu critérios meramente lógicos. Um detalhe mais aprofundado da definição da agregação

poderá ser encontrado no ficheiro de Excel “Construção da amostra.xls” (em Anexo 7.3.).

Figura 2: Variável regiões geográficas

Regiões (Variável) CódigoEuropa 1

USA/Canada 2Paises desenvolvidos de Leste 3

Resto 4

Variável 2 – Especialização

Pretende associar cada registo a uma de sete especializações. A agregação das

especializações desagregadas propostas pela Bloomberg seguiu critérios meramente lógicos

relativamente ao tipo de negócio.

Page 25: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

25

Figura 3: Especialização Bloomberg

Especialização (Indústria) CódigoCapital Markets 1

Commercial Banks 2Consumer Finance 3

Diversified Financial Services 4Insurance 5

Real Estate Investment Trusts 6Real Estate Management & Devel 7

Thrifts & Mortgage Finance 8

Para proceder à classificação das categorias de especialização informadas pelo

Bloomberg em 7 categorias, utilizou-se a seguinte tabela de conversão:

Figura 4: Variável Especialização

Especialização (Indústria) Código PropostaCapital Markets 1 1

Commercial Banks 2 2Consumer Finance 3 3

Diversified Financial Services 4 4Insurance 5 5

Real Estate Investment Trusts 6 6Real Estate Management & Devel 7 6

Thrifts & Mortgage Finance 8 7

Um detalhe mais aprofundado da definição da agregação encontra-se no ficheiro de

Excel “Construção da amostra.xls”.

Variável 3 – Rácio de Liquidez

Mede a capacidade do Banco em gerar liquidez e, por conseguinte, a sua capacidade

de liquidar compromissos de curto prazo.

A fórmula de cálculo deste rácio é: ATALRL =

onde RL representa o Rácio de Liquidez, AL representa o Activo Liquido e AT

representa o Activo Total.

Page 26: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

26

Variável 4 – Rácio de Rentabilidade

Mede a capacidade do Banco em gerar recursos para financiar a sua actividade.

A fórmula de cálculo deste rácio é: CPRAIRR =

onde RR representa o Rácio de Rentabilidade, RAI representa o Resultado Antes de

Impostos e CP representa o Capital Próprio.

Variável 5 – Rácio de Qualidade dos Passivos

Mede a qualidade dos passivos do Banco na medida em que, quanto maior o nível de

depósitos de clientes, pior a qualidade dos passivos da instituição.

A fórmula de cálculo deste rácio é: PDCRQP =

onde RQP representa o Rácio de Qualidade de Passivos, DC representa o valor total

de Depósitos de Clientes e P representa o Total do Passivo da IF.

Variável 6 – Rácio de Qualidade dos Activos

Mede a qualidade dos activos do Banco na medida em que, quanto maior o nível de

provisões do ano, pior a qualidade dos activos da instituição.

A fórmula de cálculo deste rácio é: CCLPRQA Pr=

onde RQA representa o Rácio de Qualidade de Activos, Pr representa o valor de

Provisões constituídas pela IF e CCLP representa o valor total de Crédito Concedido Líquido

de Provisões.

Variável 7 – Variável de Posicionamento de Depósitos

Reflecte a posição da IF no que respeita a Depósitos de Clientes, comparando-a com a

mediana do seu sector/região no ano anterior.

A fórmula de cálculo deste rácio é: DCDistDCDCDCRP −=_

Page 27: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

27

onde DCRP _ representa o Rácio de Posicionamento da IF relativamente a Depósitos

de Clientes, DC representa o valor total de Depósitos de Clientes, DC representa a mediana

de Depósitos de Clientes do País onde se encontra sedeada a IF e DCDist representa a

distribuição interquantílica de Depósitos de Clientes do país onde se encontra sedeada a IF.

Variável 8 – Variável de Posicionamento de Activos

Reflecte a posição da IF no que respeita ao Total do Activo, comparando-a com o

máximo do seu sector/região no ano anterior.

A fórmula de cálculo deste rácio é: ( )( )( )i

iA

AAARP maxmax_ −=

onde ARP _ representa o Rácio de Posicionamento dos Activos da IF relativamente

ao mercado, A representa o Total do Activo da IF e ( ) NiAi ∈∀,max representa o valor

máximo do Activo observado para as N IF’s de um determinado sector/região, num

determinado ano.

Variável 9 – Custo da Dívida

Mede a capacidade do Banco em contrair dívida para financiar a sua actividade, e

consiste na taxa de juro que uma empresa paga pela sua dívida, como sejam empréstimos ou

obrigações.

Variável 10 – Rácio de Capital/Passivo

Mede a estrutura financeira de uma IF, ou solvência da sua situação financeira. Este

rácio permite aferir o peso relativo do Passivo contraído por uma IF para exercer a sua

actividade, comparativamente com a sua estrutura de capital.

A fórmula de cálculo deste rácio é: PCPCPR =_

onde CP representa o Capital Próprio e P representa o Passivo.

Page 28: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

28

Variável 11 – Rácio de Disponibilidades/Passivo

Este rácio permite aferir o peso relativo dos activos de elevada liquidez da IF, como

sejam Depósitos à Ordem e valores em Caixa, comparativamente com as suas

responsabilidades. É, por conseguinte, uma medida da liquidez da IF, que permite avaliar a

sua capacidade em cumprir obrigações financeiras de curto prazo

A fórmula de cálculo deste rácio é: PDDPR =_

onde D representa as Disponibilidades e P representa o Passivo.

Variável 12 – Rácio Return on Equity (ROE)

Mede a taxa de retorno do capital de uma IF. Permite aferir sobre a capacidade da IF

em gerar lucros sobre cada unidade de capital (cada acção) e mostra a eficiência da IF na

utilização de fundos de investimento para gerar crescimento dos dividendos.

A fórmula de cálculo deste rácio é: CPRLROE =

onde RL representa o Resultado Líquido de Impostos e CP representa o Capital

Próprio (representado por acções da IF).

Variável 13 – Rating de País

A cada registo associa-se o rating atribuído pela S&P ao País da sua sede (21

classificações possíveis). No entanto uma vez que para efeitos de modelização esta variável

daria lugar a demasiadas variáveis dummy, optou-se por utilizar, não a variável original, mas

sim uma agregação em apenas duas classes.

Trata-se de uma agregação do rating de País em dois níveis: Investment (0) se o rating

do País é superior a BB+ e Speculative (1) caso contrário.

Page 29: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

29

Figura 5: Variável Qualidade de rating de País

Rating Rating num INV/ESP INV/ESP numAAA 17 INV 0AA+ 16 INV 0AA 15 INV 0AA- 14 INV 0A+ 13 INV 0A 12 INV 0A- 11 INV 0

BBB+ 10 INV 0BBB 9 INV 0BBB- 8 INV 0BB+ 7 ESP 1BB 6 ESP 1BB- 5 ESP 1B+ 4 ESP 1B 3 ESP 1B- 2 ESP 1

CCC+ 1 ESP 1CCC 1 ESP 1CCC- 1 ESP 1

SD 1 ESP 1D 1 ESP 1

Variável 14 – Rácio de Investimento do País

Mede o investimento de um país em função do seu PIB. Ao comparar o que um país

investe e o que produz, este rácio funciona como um indicador de desenvolvimento do País e

da sua sustentabilidade.

Variável 15 – Taxa de Inflação do País

Mede a subida relativa e generalizada dos preços de bens de consumo numa economia,

ao avaliar um conjunto de bens (cabaz de bens) de referência, e a evolução dos seus preços no

horizonte temporal de um ano (taxa média anual). É a taxa percentual de alteração no nível de

preços ao longo do tempo [19, pág. 340].

Page 30: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

30

Variável 16 – Taxa de Desemprego do País

Mede a alteração percentual relativa do emprego numa determinada região. O

desemprego ocorre quando uma pessoa permanece sem emprego e procurou activamente por

trabalho nas últimas quatro semanas [20, pág. 4]. A taxa de desemprego é uma medida da

prevalência de desemprego e é calculada como uma percentagem dividindo o número de

desempregados pelo número total actual de indivíduos em idade activa (empregados e

desempregados).

Variável 17 – Rácio de Endividamento do País

Mede o endividamento de um país em função do seu PIB. Ao comparar o que um país

deve e o que produz, este rácio funciona como um indicador de saúde financeira do País e da

sua sustentabilidade.

3.1.3. Pressupostos de construção do Modelo

1 - Ao construir as variáveis apresentadas para todos os registos da base de dados,

verificou-se a existência de alguns missing-values (valores não disponíveis). Para efeitos de

estimação, é necessária a sua substituição por valores.

Assim, sobre as variáveis construídas, substituiu-se cada valor em falta pela mediana

dessa variável no conjunto de todos os registos, para a classe de rating correspondente numa

escala de 17 níveis. Ou seja, utilizando a mesma agregação dos ratings em 17 níveis,

calcularam-se as medianas das variáveis por cada um dos níveis originais, substituindo-se os

valores em falta pela respectiva mediana.

2 - De forma a poder validar se o modelo está demasiado ajustado à amostra, mas

pouco ajustado à realidade, separou-se ainda a amostra total em duas (amostra de estimação e

amostra de teste).

A primeira amostra é utilizada para estimar os parâmetros, enquanto a segunda é

utilizada para realizar a classificação do rating das IF’s, após a estimação dos parâmetros.

Após esta separação, a amostra base a utilizar na construção do modelo ficou

composta por 1817 registos, consistindo a informação de teste em 754 registos.

Page 31: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

31

3.2. Estimação do Modelo

Nesta secção detalham-se os procedimentos realizados com vista à obtenção dos

parâmetros que melhor capturam o comportamento da qualidade creditícia das IF’s com base

nas variáveis consideradas como explicativas.

Inicia-se a secção com a apresentação da plataforma tecnológica utilizada, e a

descrição das funcionalidades utilizadas na determinação do Modelo.

Em seguida, descreve-se a aplicação do Modelo, nomeadamente a utilização dos

métodos de ajustamento na determinação das variáveis relevantes e respectiva relação com o

rating.

Posteriormente, definem-se os critérios de criação de um algoritmo, que permite

transformar a probabilidade de pertença a um rating numa fórmula fechada de classificação.

Por último, apresentam-se medidas da qualidade da classificação efectuada,

comparando as classificações de rating efectivas (que compõem a amostra de teste) com as

classificações obtidas por aplicação do Modelo.

3.3.2. Plataforma Tecnológica

Para a estimação, utilizou-se o software SAS, aplicando o método StepWise de

selecção de variáveis.

O método StepWise inicializa o Modelo sem qualquer variável e iterativamente, em

cada passo, introduz no Modelo a variável que maximiza a Verosimilhança retirando as

variáveis não significativas (através do teste de Wald).

Em cada passo é analisada a estatística AIC (Akaike Information Criterium) de forma

a decidir se o Modelo deve ou não ser considerado (também no software SAS o objectivo é

minimizar esta estatística), de forma a aferir quando se deve parar o algoritmo e qual o

Modelo a considerar.

Page 32: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

32

3.3.3. Aplicação do Modelo

Na selecção das variáveis do Modelo é seguida uma metodologia step-by-step onde se

começa com o Modelo só com constante e, a cada passo, adiciona-se uma nova variável.

Este procedimento permite seleccionar um conjunto de variáveis tendo por base um

outro conjunto mais lato de forma a construir, de forma inteligente, um modelo

estatisticamente robusto [5]. Para tal, define-se uma série de critérios de selecção de variáveis

que potenciam a obtenção de um modelo o mais satisfatório possível tendo por base a

maximização da função de verosimilhança.

Em cada passo selecciona-se a variável que maximiza a função de verosimilhança.

Após a selecção do Modelo é feito em cada passo uma filtragem à existência de variáveis não

significativas estatisticamente (teste de Wald).

O processo de selecção ocorre de forma iterativa de acordo com uma sequência de

passos interligados entre si. O objectivo é iniciar o processo de selecção no passo 0 sem

qualquer variável seleccionada e finalizá-lo no passo k, seleccionando em cada passo

intermédio a “melhor” das variáveis disponíveis. No final pretende-se obter um conjunto

formado pelas melhores variáveis explicativas do incumprimento (variável dependente).

A decisão de prosseguir em cada passo é tomada tendo por base o Critério de Akaike:

se o valor do coeficiente de Akaike é menor no passo p do que o era no passo p-1, deve

efectuar-se o passo, senão o processo termina e o Modelo obtido no passo p-1 é o modelo

final.

Além deste critério de paragem, sempre que não existam mais modelos válidos (de

acordo com os princípios enunciados no início desta descrição) o processo termina

igualmente.

Este procedimento procura guardar o histórico que suplanta todas as decisões tomadas.

Apresenta-se abaixo, de forma resumida, o algoritmo utilizado na selecção do Modelo

e na estimação dos parâmetros de ajustamento.

Considerem-se as seguintes variáveis:

Page 33: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

33

x : representa o número de variáveis explicativas no Modelo e

kx : representa o número de variáveis incluídas no Modelo no passo k do algoritmo.

Os passos do método stepwise apresentam-se como segue:

§ Passo 0

No início do processo, ajusta-se o modelo de regressão logística apenas com a

constante, calculando-se o valor da estatística de máxima verosimilhança 0l e o

valor do critério de informação 0AIC .

§ Passo 1

Posteriormente, procede-se à estimação de x modelos univariados (para cada

uma das variáveis potencialmente explicativas) e ao cálculo do valor da

estatística de máxima verosimilhança 1il e o valor do critério de informação

1iAIC , onde { }xi ,...,1∈ representa o índice da variável explicativa.

Condiciona-se a escolha do melhor modelo ao grupo de modelos univariados

que apresentam as seguintes condições:

• Coeficiente estatisticamente significativo para a variável explicativa.

Para o efeito, utiliza-se o teste de Wald de significância individual das

variáveis explicativas.

• Coeficiente com tendência (positiva ou negativa) coerente com a teoria

económica. Por exemplo, para uma variável de tendência crescente, ou

positivamente relacionado com o rating, é expectável um coeficiente

positivo.

Comparando o valor do critério AIC de cada um dos modelos univariados

viáveis, selecciona-se o que apresenta maior valor de verosimilhança.

Para finalizar o passo, armazena-se a variável 1x e o valor 1AIC do critério AIC

do modelo univariado seleccionado.

Page 34: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

34

§ Passo k

O passo k tem por base a construção de 1−− kxx modelos multivariados. Os

modelos analisados no passo k incluem 1−kx variáveis seleccionadas nos 1−k

passos anteriores e uma nova variável, seleccionada de entre as que se

encontram fora do modelo.

Para cada um dos novos modelos analisados estima-se o valor da estatística de

máxima verosimilhança kil e o valor do critério de informação k

iAIC , com

{ }1,...,1 −∈ kxi .

Condiciona-se a escolha do melhor modelo ao grupo de modelos univariados

que apresentam as seguintes condições:

• As variáveis explicativas são não correlacionadas entre si: sempre que

uma das variáveis não presentes no modelo calculado no passo 1−k está

correlacionada com qualquer uma das que constituem esse modelo

(correspondendo a correlação a um coeficiente de correlação superior ou

igual a 0.6, em valor absoluto), essa variável é excluída da análise e o

modelo respectivo é considerado inviável. Esta condição assegura que no

modelo final não coexistirão variáveis correlacionadas. Caso todas as

variáveis ‘externas’ ao modelo no passo 1−k se encontrem

correlacionadas com variáveis presentes nesse modelo o processo de

stepwise termina, utilizando-se o modelo calculado no passo anterior.

• As variáveis explicativas são todas individualmente consideradas como

estatisticamente significativas: ao incluir outra variável no modelo, e

embora o modelo no seu global seja significativo, podem existir

variáveis no modelo que tenham decrescido o nível da sua significância

individual. Portanto, interessa determinar a significância individual de

cada uma das variáveis incluídas no modelo e retirar do modelo variáveis

que não sejam significativas, caso existam. Para determinar a

significância individual de cada uma das variáveis utiliza-se o teste de

Page 35: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

35

Wald. A hipótese nula do teste de Wald é de não significância da

variável, pelo que a rejeição desta hipótese implica a relevância da

variável para explicar o nível de rating. São excluídas do modelo todas

as variáveis que apresentem um p-value superior a 5% (o que

corresponde à não rejeição da hipótese nula).

• O comportamento das variáveis explicativas é congruente com a teoria

económica: Para cada modelo, verifica-se o sinal do coeficiente da

variável no modelo.

• Caso o sinal do coeficiente se encontre de acordo com a teoria

económica definida, o modelo é considerado válido (relativamente a esta

condição). Por exemplo, uma variável para a qual se tenha definido uma

tendência teórica crescente deve ter um coeficiente associado positivo.

• Caso o sinal do coeficiente contrarie a teoria económica definida, esse

modelo é considerado inválido.

• Se neste passo todos os modelos considerados resultarem inválidos, o

processo stepwise de selecção de variáveis termina.

Comparando o valor do critério AIC de cada um dos modelos multivariados

viáveis, selecciona-se o que apresenta maior valor de verosimilhança.

Para finalizar o passo, armazena-se a variável kx e o valor kAIC do critério

AIC do modelo multivariado seleccionado.

O modelo seleccionado no passo k é considerado apenas se a estimação do

mesmo não implicar um aumento (ou manutenção) do valor do critério de

informação AIC. Ou seja, o passo k é válido apenas na condição de:

1−< kk AICAIC

• Caso a condição não se verifique, o processo de stepwise termina,

utilizando como modelo final o modelo estimado no passo anterior 1−k .

Page 36: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

36

• Se o critério for satisfeito, procede-se para o passo seguinte (ou seja, faz-

se 1+= kk ) e repete-se o mesmo procedimento.

FIM do algoritmo

No final da aplicação do algoritmo obtém-se um modelo que cumpre os seguintes

requisitos:

§ As variáveis são seleccionadas segundo um critério iterativo racional e prático,

assegurando que todas as variáveis utilizadas são explicativas. Ou seja, para

todas as variáveis, rejeita-se a hipótese nula do teste de Wald (de não

significância da variável explicativa).

§ As variáveis seleccionadas não são redundantes para o modelo, garantindo-se

que a sua contribuição acresce valor às estimativas realizadas com base no

modelo.

§ As variáveis seleccionadas não são correlacionadas duas a duas. Caso sejam

correlacionadas, as variáveis não podem ser consideradas em conjunto.

§ As variáveis seleccionadas são coerentes com a teoria económica que as define.

Page 37: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

37

4. RESULTADOS

4.1. Resultados da aplicação do Modelo

Na execução do Modelo, efectuaram-se 14 passos, que resultaram na inclusão de 13

variáveis no Modelo

Figura 6: Output dos 14 passos do Modelo implementado

Passo Variaveis_Modelo AIC _2LogVero

varIN nãoSignif

Tend Validas

1 8554.4 8520.4 VAR13 Sim2 VAR13 8084.7 8048.7 VAR5 Sim3 VAR13 VAR5 7958.1 7920.1 VAR9 Sim4 VAR13 VAR5 VAR9 7828.3 7778.3 VAR2 Sim5 VAR13 VAR5 VAR9 VAR2 7735.0 7683.0 VAR17 Sim6 VAR13 VAR5 VAR9 VAR2 VAR17 7668.6 7614.6 VAR11 Sim

7VAR13 VAR5 VAR9 VAR2 VAR17

VAR117616.1 7560.1 VAR16 Sim

8VAR13 VAR5 VAR9 VAR2 VAR17

VAR11 VAR167584.4 7526.4 VAR6 Sim

9VAR13 VAR5 VAR9 VAR2 VAR17

VAR11 VAR16 VAR67562.0 7498.0 VAR1 Sim

10VAR13 VAR5 VAR9 VAR2 VAR17

VAR11 VAR16 VAR6 VAR17507.2 7441.2 VAR8 Sim

11VAR13 VAR5 VAR9 VAR2 VAR17 VAR11 VAR16 VAR6 VAR1 VAR8

7504.7 7436.7 VAR3 Sim

12VAR13 VAR5 VAR9 VAR2 VAR17 VAR11 VAR16 VAR6 VAR1 VAR8

VAR37504.5 7434.5 VAR12 Sim

13VAR13 VAR5 VAR9 VAR2 VAR17 VAR11 VAR16 VAR6 VAR1 VAR8

VAR3 VAR127504.2 7432.2 VAR15 Sim

14VAR13 VAR5 VAR9 VAR2 VAR17 VAR11 VAR16 VAR6 VAR1 VAR8

VAR3 VAR12 VAR157505.3 7431.3 VAR10 Sim

Page 38: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

38

Observa-se que, em cada um dos passos, o valor do critério de Akaike (AIC) diminui,

pelo que os modelos considerados são sucessivamente mais adequados. Pode também

observar-se que, das variáveis iniciais consideradas, apenas as variáveis 4-Rácio de

Rentabilidade, 7-Posicionamento de Depósitos, 10-Rácio Capital/Passivo e 14-Investimento

do País foram excluídas.

As tabelas que se seguem são criadas pelo programa implementado em SAS, ao

calcular o Modelo que melhor satisfaz as condições definidas.

§ O critério de convergência do algoritmo de optimização da função de

verosimilhança é satisfeito, como pode ser observado na Figura 7:

Figura 7: Convergência do algoritmo Model Convergence

StatusConvergence criterion

(GCONV=1E-8) satisfied.

§ As estatísticas de ajustamento obtidas (veja Figura 8), comparando o Modelo

final com o Modelo sem qualquer variável (só com constante):

Figura 8: Estatísticas de ajustamento

Criterion InterceptOnly Intercept And Covariates

AIC 9,038.1 7,504

SC 9,126.2 7,702

-2 Log L 9,006.1 7,432

§ Relativamente à significância global dos parâmetros (hipótese nula de todos

serem zero), o modelo resulta significativo (ou seja, rejeita-se a hipótese nula de

que os parâmetros são conjuntamente não significativos, para qualquer nível de

significância):

Page 39: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

39

Figura 9: Significância global dos parâmetros

Test ChiSq DF ProbChiSq

Likelihood Ratio 1,573.9 20.0 0

Score 953.4 20.0 0

Wald 1,252.7 20.0 0

§ No que respeita à significância individual das variáveis explicativas, observa-se

(Figura 10) que as variáveis 4, 7, 10 e 14 são excluídas do Modelo.

Figura 10: Significância individual das variáveis explicativas

Variável DF WaldChiSq ProbChiSq NotaVAR13 1 101.7 6.444E-24 <0.001VAR5 1 163.0 2.555E-37 <0.001VAR9 1 166.5 4.347E-38 <0.001VAR2 6 113.2 4.451E-22 <0.001VAR17 1 79.7 4.252E-19 <0.001VAR11 1 47.7 4.888E-12 <0.001VAR16 1 37.3 9.994E-10 <0.001VAR6 1 54.1 1.917E-13 <0.001VAR1 3 63.1 1.288E-13 <0.001VAR8 1 53.9 2.151E-13 <0.001VAR3 1 4.6 3.121E-02VAR12 1 1.9 1.732E-01VAR15 1 2.3 1.275E-01

Os resultados indicam que as variáveis 3, 12 e 15 aportam pouco valor ao

Modelo, sendo consideradas não significativas ao nível de significância de 5%.

No entanto, opta-se pela sua manutenção no Modelo uma vez que contribuem

para melhorar os resultados do critério de Akaike.

Page 40: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

40

§ Os parâmetros estimados são apresentados na tabela seguinte:

Figura 11: Valor dos parâmetros estimados

Variable ClassVal0 DF Estimate StdErr WaldChiSq

ProbChiSqIntercept 1 1 -10.747 0.541 393.98 1.12489E-87Intercept 10 1 -3.434 0.414 68.903 1.03416E-16Intercept 11 1 -2.522 0.411 37.588 8.73602E-10Intercept 12 1 -1.583 0.409 14.976 0.000108876Intercept 13 1 -0.598 0.407 2.1582 0.14181122Intercept 14 1 0.786 0.408 3.7041 0.054278252Intercept 15 1 1.971 0.418 22.247 2.39732E-06Intercept 16 1 2.470 0.427 33.429 7.3926E-09Intercept 2 1 -10.117 0.511 392.36 2.53712E-87Intercept 3 1 -8.785 0.470 349.05 6.80966E-78Intercept 4 1 -8.319 0.460 326.73 4.96466E-73Intercept 5 1 -7.506 0.445 284.15 9.35545E-64Intercept 6 1 -6.374 0.429 220.26 7.91794E-50Intercept 7 1 -5.842 0.425 189.39 4.3092E-43Intercept 8 1 -5.067 0.419 145.93 1.34631E-33Intercept 9 1 -4.292 0.416 106.35 6.18442E-25VAR1 1 1 -1.149 0.175 42.938 5.65001E-11VAR1 2 1 -1.340 0.180 55.424 9.71436E-14VAR1 3 1 -0.586 0.166 12.396 0.00043033VAR2 1 1 -2.967 0.369 64.535 9.48242E-16VAR2 2 1 -2.421 0.326 55.183 1.09837E-13VAR2 3 1 -2.090 0.516 16.379 5.1853E-05VAR2 4 1 -3.180 0.400 63.278 1.79468E-15VAR2 5 1 -2.828 0.349 65.754 5.10794E-16VAR2 6 1 -5.734 0.678 71.498 2.77606E-17VAR3 1 1.837 0.853 4.6415 0.031207436VAR5 1 3.475 0.272 162.96 2.55532E-37VAR6 1 17.988 2.446 54.088 1.9166E-13VAR8 1 1.384 0.189 53.862 2.15106E-13VAR9 1 36.206 2.806 166.48 4.34724E-38VAR11 1 6.835 0.989 47.731 4.88789E-12VAR12 1 0.045 0.033 1.8554 0.173151767VAR13 1 2.118 0.210 101.7 6.44438E-24VAR15 1 -1.470 0.965 2.3227 0.127494726VAR16 1 6.790 1.111 37.326 9.99354E-10VAR17 1 1.451 0.162 79.748 4.25245E-19

Tendo em consideração a forma funcional da regressão logística, apresentada em (2.5)

Xβα 'ie

i|XP(Y−−+

==1

1)

Page 41: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

41

podem aplicar-se os coeficientes estimados sobre a informação recolhida das

instituições financeiras, de forma a determinar a probabilidade do rating Y de determinada

Instituição ser igual a i.

São estimados 16 parâmetros Intercept (menos um do que as categorias da variável

dependente que se pretende modelizar). Cada um dos coeficientes kα permite calcular a

probabilidade de qualquer entidade ser classificada na categoria k. Uma vez que se assume

que a entidade terá de ser classificada numa das 17 categorias, a soma das probabilidades terá

de ser 1, sendo essa a razão de apenas se necessitar de 16 coeficientes. Ou seja,

)1(...)15()16(1)17( pppp −−−−= .

Para interpretar a informação resultante das estimativas considere-se, por exemplo, a

pior classificação de rating (valor igual a 1), mantendo assim fixa a análise da constante

(intercept) com 1=k , focando-se então a interpretação dos coeficientes na influência de cada

uma das variáveis sobre esse nível de rating.

Verifica-se que as entidades Europeias, Americanas e de Países desenvolvidos do

Leste Europeu (categorias 1, 2 e 3 da Variável 1) têm menor tendência a ser classificadas em

níveis baixos do que entidades de outros continentes (categoria 4). Ou seja, as entidades

Europeias (em geral) e Americanas apresentam coeficiente mais baixo, pelo que a sua

probabilidade de classificação em rating 1 é mais reduzida do que a de entidades de outros

continentes.

De forma análoga, verifica-se que a especialização de entidades do tipo Thrifts &

Mortgage Finance (categoria 7 da Variável 2) é “penalizada” pelo Modelo (coeficientes das

restantes especializações são negativos).

Relativamente aos rácios financeiros, o Modelo penaliza entidades com demasiada

liquidez no produto bancário (coeficiente da Variável 3 é positivo) e penaliza severamente as

entidades com pior qualidade dos passivos (coeficiente da Variável 5 é positivo) e com pior

qualidade dos activos, ou seja com maior volume de provisões (coeficiente da Variável 6 é

positivo).

Observa-se também que IF’s com valores de activos elevados (coeficiente da Variável

8 positivo) são penalizadas. Note-se que este coeficiente poderá parecer contra-intuitivo por

penalizar entidades que apresentam valores de activos elevados, comparativamente com

Page 42: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

42

outras entidades. No entanto, deve ter-se em consideração que o volume de activos per si, não

é condição de estabilidade e nem sinónimo de solidez. O Modelo, no ajustamento efectuado,

indicia uma interpretação desta variável como um risco acrescido para a capacidade da

entidade em cumprir as suas responsabilidades.

O Modelo penaliza também severamente IF’s que apresentem custo de dívida elevado

(Variável 9 com coeficiente positivo e elevado) por considerar que uma IF que apresente um

prémio de risco elevado ao procurar financiamento indicia problemas no pagamento da sua

dívida.

Relativamente à Variável 11, observa-se um coeficiente positivo indiciando uma

penalização da IF que apresente um volume significativo de activos líquidos

comparativamente com o Passivo. Apesar de parecer contra-intuitivo, este coeficiente poderá

espelhar a existência de responsabilidades (passivos) de longo prazo cujas durações não se

encontram cobertas pelos activos de curto prazo associados (por exemplo, por insuficiência de

rendimentos gerados pelos activos de curto prazo).

No que respeita à Variável 12, verifica-se que a mesma não é estatisticamente

significativa (individualmente) e que o coeficiente ajustado é reduzido, pelo que se considera

que o mesmo permite retirar conclusões precisas sobre a sua relação com o rating das IF’s.

Verifica-se que IF’s de países com rating Speculative (valor 1 da Variável 13),

apresentam coeficiente positivo. Ou seja as IF’s com rating inferior ou igual a BB+ são

penalizadas pelo modelo com a maior probabilidade de rating mais baixo do que as IF’s do

tipo Investment grade.

Relativamente à taxa de inflação (Variável 15) verifica-se que o Modelo apresenta um

coeficiente negativo. Isto poderá ser justificado na medida em que IF’s localizadas em países

com elevado progresso e crescimento económico apresentem inflação relativamente elevada

enquanto que países em recessão económica poderão revelar uma estagnação generalizada da

procura de bens e serviços.

O Modelo penaliza também severamente IF’s que apresentem taxa de desemprego

elevado (Variável 16 com coeficiente positivo e elevado) por considerar que uma IF que

apresente uma taxa de desemprego elevada indicia problemas na qualidade do crédito dos

Page 43: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

43

consumidores (o que em última análise se repercute na qualidade de crédito das IF’s, em

particular as IF’s mais expostas ao consumo e ao crédito).

Também a Variável 17 (Rácio de Endividamento do País) penaliza as IF’s localizadas

em países com elevado nível de endividamento, reflectindo uma relação algo intuitiva entre a

sustentabilidade financeira do País e a das entidades que nele exercem actividade.

Considerem-se os parâmetros estimados pelo Modelo, e a sua aplicação a um registo a

título exemplificativo do processo de classificação, utilizando a regressão logística referida na

equação (2.5).

Figura 12: Processo de classificação

Cálculo Probabilidade

Campo Valor Interpretação Prob(Y=1) 0.02%

Index 77 Número de registo Prob(Y=2) 0.01%

Score 14 Rating "alvo": AA- Prob(Y=3) 0.09%

VAR1 3 Região: Países de Leste Prob(Y=4) 0.07%

VAR2 2 Especialização: Commercial Prob(Y=5) 0.23%

VAR3 6.71% Rácio de Liquidez Prob(Y=6) 0.86%

VAR5 52.54% Rácio Qualidade de Passivos Prob(Y=7) 0.88%

VAR6 0.13% Rácio Qualidade de Activos Prob(Y=8) 2.40%

VAR8 11.69% Posicionamento de Activos Prob(Y=9) 4.83%

VAR9 4.01% Custo da Dívida Prob(Y=10) 10.26%

VAR11 0.72% Rácio Disponibilidades/Passivo Prob(Y=11) 18.19%

VAR12 3.43% Return on Equity Prob(Y=12) 23.06%VAR13 0.00% Rating País: Investment Prob(Y=13) 19.75%VAR15 2.34% Taxa de Inflação Prob(Y=14) 13.68%VAR16 5.39% Taxa de Desemprego Prob(Y=15) 3.87%VAR17 -1.33% Rácio de Endividamento Prob(Y=16) 0.70%

Prob(Y=17) 1.10%Total = 100.00%

No exemplo acima, o registo observado tem um rating de 14 e o Modelo apresenta a

maior probabilidade de pertença para o nível 12. Realizando o procedimento de forma

análoga para todos os registos, nem sempre se verifica um ajustamento exacto. Torna-se,

Page 44: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

44

desta maneira fundamental obter uma forma de medir os erros do Modelo construído,

procurando analisar o ajustamento do Modelo às observações.

Adicionalmente, note-se que o Modelo disponibiliza como resultado apenas as

probabilidades de pertença a um determinado rating. No entanto, torna-se relevante obter

classificações numa escala de 17 intervalos, de forma análoga à escala em que se encontram

as observações.

Para responder aos pontos anteriores, desenvolve-se nas secções seguintes um

procedimento que permite obter directamente uma estimativa da classificação de rating

utilizando intervalos de probabilidade, e comparam-se as estimativas realizadas com as

observações reais de classificação de rating de cada IF.

4.2. Definição de Critérios de Classificação (thresholds)

Para possibilitar uma classificação mais directa da qualidade creditícia das IF’s,

constrói-se um procedimento de ordenação dos ratings em intervalos de probabilidade.

Uma vez que os resultados do modelo consistem em coeficientes que permitem aplicar

a regressão logística para calcular probabilidades de pertença a uma determinada classificação

de rating, pretende-se agora apresentar um sistema para optimização do Modelo, que define o

rating de cada IF de forma mais directa por associar directamente uma das 17 categorias de

rating consideradas.

Com este método, obtém-se não só uma classificação de rating para qualquer IF, mas

também uma forma de comparar os valores estimados com os valores observados, o que

permite obter uma proxy do nível de ajustamento e qualidade preditiva do modelo.

Para o efeito utilizam-se as classificações sobre os registos da amostra de construção,

após aplicação do Modelo. Ou seja, considerando novamente a equação (2.5), foca-se o

cálculo na probabilidade de pertença ao pior estado, o estado “Outros” ou 1, tal que

( ) ( )Xβα '

eP|XYP

−−+===

11

111

Page 45: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

45

Tendo em consideração todos os registos presentes na amostra de construção de

dimensão cN e a sua distribuição pelas 17 classes de rating (veja Figura 1), para cada um dos

registos da amostra de construção calcula-se a sua probabilidade P(1) de pertença ao estado 1.

Pode-se interpretar o cálculo da seguinte forma: quanto mais próxima a probabilidade P(1)

estiver de 1, maior será a probabilidade de o registo pertencer à classe 1. De forma análoga,

quanto mais afastada estiver a probabilidade P(1) do valor 1, menos provável será que o

registo tenha um rating desfavorável/baixo.

Figura 13: Processo de classificação

Nível Nº Registos Acumulado17 42 4216 21 6315 95 15814 227 38513 228 61312 251 86411 254 1,11810 210 1,3289 145 1,4738 101 1,5747 50 1,6246 74 1,6985 39 1,7374 19 1,7563 37 1,7932 10 1,8031 14 1,817

Tendo por base esta ideia de distância probabilística face ao estado 1, torna-se possível

criar intervalos de classificação (ou thresholds) da qualidade creditícia de cada IF com base

na probabilidade de pertença ao estado 1. Atendendo a que existe uma ordenação entre as 17

categorias, e que existem categorias que estão mais próximas da categoria “Outros” e outras

mais afastadas, é possível considerar uma classificação baseada em P(1), como se pode

observar na Figura 15:

Page 46: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

46

Figura 14: Intervalos de classificação da qualidade creditícia

Rating Outros B- B … AA AA+ AAA

Probabilidade P(1) 1 0

Considere-se a probabilidade ( )iP 1 que permite classificar o registo de uma IF no

rating i. Pode definir-se o intervalo de classificação para o rating kr da entidade k

( ) ( ) ( )[ ] 17,...,1,1,11: 1 =∈∈ − iPPPir iikk

onde

( ) 11 0 =P

( ) 01 17 =P

( )S

' Xβαie

P−−+

=11

11

e onde

∑= =ij jcNranks 1 , representa o registo s da amostra de construção, sendo jcN , o

número de IF’s na amostra de construção, com rating observado igual a j.

Assim, tendo em consideração os percentis de P(1) referentes às percentagens de

elementos de cada um dos níveis de rating presentes na amostra, definem-se os intervalos de

classificação:

Page 47: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

47

Figura 15: Intervalos de classificação

Nível Nº Registos Acumulado P(1)i P(1)i-117 42 42 0.000% 0.001%16 21 63 0.001% 0.002%15 95 158 0.002% 0.005%14 227 385 0.005% 0.020%13 228 613 0.020% 0.042%12 251 864 0.042% 0.077%11 254 1,118 0.077% 0.147%10 210 1,328 0.147% 0.232%9 145 1,473 0.232% 0.434%8 101 1,574 0.434% 0.801%7 50 1,624 0.801% 1.447%6 74 1,698 1.447% 5.447%5 39 1,737 5.447% 11.978%4 19 1,756 11.978% 16.301%3 37 1,793 16.301% 35.513%2 10 1,803 35.513% 46.430%1 14 1,817 46.430% 100.000%

Intervalos de classificação

Com base nos intervalos de classificação de rating definidos, é possível classificar

individualmente cada IF, associando-lhe directamente uma classe estimada de rating,

consoante o valor de P(1) estimado.

Utilizando o mesmo registo analisado anteriormente, considere-se o seguinte exemplo

de aplicação do critério de classificação definido.

Page 48: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

48

Figura 16: Exemplo de aplicação do critério de classificação

Campo Valor Prob(Y=1) 0.016% Rating 14Index 77Score 14VAR1 3VAR2 2 P(1)i P(1)i-1 NívelVAR3 6.71% 0.000% 0.001% 17VAR5 52.54% 0.001% 0.002% 16VAR6 0.13% 0.002% 0.005% 15VAR8 11.69% 0.005% 0.020% 14VAR9 4.01% 0.020% 0.042% 13

VAR11 0.72% 0.042% 0.077% 12VAR12 3.43% … … …VAR13 0.00% 11.978% 16.301% 4VAR15 2.34% 16.301% 35.513% 3VAR16 5.39% 35.513% 46.430% 2VAR17 -1.33% 46.430% 100.000% 1

Intervalos de classificação

1

32

Utilizando os parâmetros para calcular a probabilidade P(1) e os intervalos de

classificação definidos, obtém-se uma classificação do registo na classe 14, que corresponde

exactamente ao rating observado para a IF nesse registo.

Aplica-se este procedimento a cada um dos registos da amostra de construção para

obter uma estimativa da classificação de rating para cada uma das entidades.

4.3. Medidas de Qualidade de Predição

Nesta secção pretende-se analisar o nível global de adequação do Modelo,

comparando os valores estimados pelo Modelo com as observações reais de rating.

Para analisar a adequação do Modelo, realizam-se testes não só ao nível da amostra de

construção, mas também ao nível da amostra de teste. A utilização das duas amostras permite

aferir se o Modelo não está excessivamente ajustado à construção e ao mesmo tempo pouco

ajustado às IF’s excluídas da amostra de construção.

Classificaram-se cada um dos registos das amostras de construção e teste utilizando a

probabilidade de pertença P(1) como referido na secção anterior. Considerando os intervalos

de classificação definidos, associa-se uma categoria de rating estimada a cada registo das

Page 49: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

49

amostras. Comparam-se posteriormente as estimativas com os ratings efectivamente

observados, calculando as percentagens de acerto, conforme se apresenta nas tabelas que se

seguem:

Figura 17: Análise de acertos (amostra C)

17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 117 18 2 5 6 9 2 0 0 0 0 0 0 0 0 0 0 016 2 2 5 3 8 1 0 0 0 0 0 0 0 0 0 0 015 5 1 13 34 20 7 3 2 0 0 0 2 2 4 2 0 014 10 7 37 62 51 36 9 4 4 4 1 2 0 0 0 0 013 3 6 21 59 44 49 34 4 5 3 0 0 0 0 0 0 012 1 1 10 41 41 46 43 39 10 15 4 0 0 0 0 0 011 1 0 1 11 28 65 55 46 29 7 7 4 0 0 0 0 010 1 0 0 2 14 23 64 53 26 14 3 10 0 0 0 0 09 0 2 2 6 4 5 28 32 29 22 9 5 1 0 0 0 08 0 0 1 3 4 8 12 16 19 18 7 11 1 1 0 0 07 0 0 0 0 1 2 4 8 11 5 8 2 3 1 5 0 06 0 0 0 0 3 5 2 5 10 12 8 12 6 4 3 2 25 0 0 0 0 0 1 0 0 1 0 2 10 5 1 13 5 14 0 0 0 0 0 1 0 0 0 1 1 5 6 1 3 0 13 0 0 0 0 0 0 0 1 0 0 0 7 8 4 6 3 82 0 0 0 0 0 0 0 0 1 0 0 1 3 3 1 0 11 0 0 0 0 1 0 0 0 0 0 0 3 4 0 4 0 2

ESTIMADO

-4 -3 -2 -1 0 1 2 3 41.9% 5.3% 11.8% 19.5% 20.6% 16.6% 12.5% 3.9% 3.5%

Análise de Acertos

0 notch 20.58%<=1 notch 56.63%<=2 notch 80.96%<=3 notch 90.15%<=4 notch 95.60%

Análise de Acertos

Page 50: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

50

Figura 18: Análise de acertos (amostra T)

17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 117 9 1 0 1 3 0 0 0 0 0 0 0 0 0 0 0 016 3 0 0 6 5 0 0 0 0 0 0 0 0 0 0 0 015 2 0 1 14 7 3 3 1 1 0 0 1 0 0 0 0 014 3 4 15 24 15 8 5 3 2 3 1 0 0 0 0 0 013 3 6 9 25 10 20 10 6 1 1 1 0 0 0 0 0 012 3 1 6 18 17 26 12 9 7 7 2 2 0 0 0 0 011 1 0 1 9 8 26 26 20 7 6 0 3 0 0 0 0 010 1 0 0 1 6 9 16 22 10 6 2 4 0 0 0 0 09 0 0 1 2 2 5 17 14 15 11 2 2 1 1 0 0 08 0 0 0 0 0 3 8 8 7 4 4 6 1 0 0 0 07 0 0 0 0 1 2 4 0 6 2 1 4 1 0 2 0 06 0 0 0 0 0 0 2 1 1 7 2 8 4 1 3 1 25 0 0 0 0 0 0 0 0 0 1 2 4 1 4 5 2 14 0 0 0 0 0 0 0 0 0 0 3 6 1 0 3 1 23 0 0 0 0 0 0 0 0 0 0 0 0 2 1 2 1 12 0 0 0 0 0 0 0 0 0 0 0 0 1 2 0 0 01 1 0 0 0 0 0 0 0 0 0 1 1 4 1 1 0 0

ESTIMADO

-4 -3 -2 -1 0 1 2 3 42.7% 6.6% 13.4% 17.6% 19.8% 16.3% 9.3% 6.0% 3.4%

Análise de Acertos

0 notch 19.76%<=1 notch 53.71%<=2 notch 76.39%<=3 notch 88.99%<=4 notch 95.09%

Análise de Acertos

O nível de acertos 1 é semelhante para ambas as amostras, o que indica que o Modelo

não se encontra demasiado ajustado à amostra de estimação, e que é suficientemente

adaptável à classificação de IF’s externas à construção do próprio Modelo.

O resultado do ajustamento é bastante satisfatório, sobretudo assumindo que o

desfasamento de 3 ratings implica um nível de acerto de aproximadamente 90%, o que

representa um grau de confiança aceitável para as estimativas realizadas, considerando a

granularidade da estimativa. 1 Notch: número de ratings de diferença entre o observado e o estimado (afastamento)

Page 51: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

51

Adicionalmente, toma-se como ponto de referência para a qualidade dos resultados a

análise efectuada pela Fitch com base no seu modelo de classificação de rating – denominado

Equity Implied Rating and Probability of Default Model ou EIR. Nesse modelo, a Fitch utiliza

o valor de capital de entidades e informação financeira disponível sobre as mesmas, para criar

um modelo de predição do rating, recorrendo a uma matriz de Hit-Miss-Match (HMM) para

apresentar os resultados [17]. No relatório publicado pela Fitch sobre o EIR, é apresentado um

teste à performance do Modelo [17, pág.17] com base na matriz HMM, cujos resultados se

apresentam na figura seguinte:

Figura 19: Análise de acertos (Modelo Fitch EIR)

0 notch 19.40%<=1 notch 51.30%<=2 notch 73.70%

Análise de AcertosFitch - EIR model

Apesar da amostra utilizada pela Fitch ser significativamente diferente (foi

considerado um universo mais abrangente de 20 indústrias, não apenas as Instituições

Financeiras) e das diferenças nas especificações dos modelos, é interessante observar-se uma

semelhança elevada entre os resultados. Em [17] refere-se ainda que não são expectáveis

acertos a 100% e que, inclusivamente deverão existir diferenças entre o rating observado e o

esperado. Apenas numa situação de mercado com perfeita informação seria expectável que o

rating estimado e observado coincidissem [17, pág.18]. Esta mesma conclusão é apontada em

[21] ao referir que as agências não têm capacidade de estimar o “verdadeiro score” devido à

existência de assimetria de informação entre os responsáveis pelas entidades e as agências,

quer por acesso limitado/restrito à informação existente (como seja informação contabilística

incompleta [21]), quer por atrasos na observação dos factores de risco [22].

Para além deste exemplo com ratings da S&P, realizaram-se ainda outros que se

apresentam no Apêndice, sobre os ratings das agências Moody’s e Fitch, e que demonstram

um nível de qualidade da predição semelhante ao que se apresenta neste capítulo, como se

pode observar na Figura 20:

Page 52: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

52

Figura 20: Análise de acertos (Modelo Fitch EIR)

Acertos S&P Moodies Fitch S&P Moodies Fitch0 notch 20.58% 20.25% 24.43% 19.76% 22.34% 21.75%

<=1 notch 56.63% 55.95% 62.12% 53.71% 56.37% 58.85%<=2 notch 80.96% 79.47% 82.98% 76.39% 79.33% 79.74%<=3 notch 90.15% 89.19% 91.86% 88.99% 89.35% 89.77%<=4 notch 95.60% 94.28% 96.34% 95.09% 93.74% 94.67%

TesteConstrução

A motivação para a apresentação dos resultados utilizando as três agências é referida

em [18, pág. 5], e relacionada com o facto de ser inadequado apresentar apenas o rating

considerado como o mais conservador/pessimista (que seria a S&P de acordo com [18, pág.

12]) porque, não só descartaria a informação contida nas restantes fontes, como também a

qualidade do crédito não se reflecte necessariamente no rating mais pessimista (caso contrário

bastaria considerar esse mesmo rating [23, pág.46-53]).

Os resultados apresentados na figura anterior pressupõem a possibilidade de ajustar

diferentes variáveis e coeficientes consoante o rating, que poderão ser distintos dependendo

da agência de rating utilizada como base para definir o score. Esta heterogeneidade é

abordada em [18], através da comparação de scores das três agências de rating (S&P, Ficth e

Moody’s), com um modelo consensual que incorpora informação (o score) das três fontes de

forma a obter um “rating mais informativo” [18, pág.2], e cuja base consiste numa média dos

ratings das três agências num determinado momento do tempo (denominado latent consensus

score). Os resultados são bastante interessantes e mostram que o score obtido pela média das

observações é razoavelmente semelhante ao resultado obtido pelo consensus model [18, pág.

10, fig.1], exceptuando os casos de possível distorção por falta de classificação de algumas

das três agências [18, pág. 6]. Uma vez que nesta Tese se ajustam as classificações das três

agências na previsão do rating, uma simplificação que decorre directamente é a possibilidade

de utilizar a média da predição obtida pelos três modelos (ou seja, a classificação resultante

do ajustamento do rating para as três agências, cujos resultados se apresentam na Figura 20).

Note-se ainda que o trabalho apresentado em [18] assume o pressuposto de que os

ratings se encontram disponíveis em determinados momentos do tempo para possibilitar a

derivação de um rating consensual. Ora, este é precisamente o ponto de partida da presente

Tese, em que se pretende classificar a qualidade creditícia de IF’s que não se encontram

classificadas pelas agências de rating.

Page 53: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

53

Por conseguinte, é pertinente observar que, os resultados apresentados nesta Tese,

considerando as classificações obtidas para as três agências, poderiam constituir o ponto de

partida para a posterior derivação de um rating consensual, com base no modelo apresentado

em [18].

5. CONCLUSÃO E RECOMENDAÇÕES

5.1. Conclusão

Neste trabalho, procedeu-se à estimação de um Modelo de classificação da qualidade

creditícia de Instituições Financeiras, através de um modelo de regressão logística ordenada,

com método de estimação por máxima verosimilhança. Tal modelo resulta de uma análise

crítica e comparativa de vários modelos alternativos, escolhendo de entre eles, aquele que

melhor satisfaz as condições estatísticas requeridas.

Além da análise e cálculo das probabilidades de pertença a uma determinada classe de

rating, propõe-se um método que permite classificar qualquer entidade numa classe de rating.

Com este método é possível definir algumas medidas de capacidade preditiva do Modelo

baseadas na comparação de classes estimadas e classes observadas. Essas medidas, calculadas

sobre as amostras de construção e de teste revelam que o Modelo apresenta uma boa

capacidade preditiva, evidenciada por três factores:

§ Encontra-se ajustado à amostra de construção, não sendo no entanto exagerado o

seu nível de ajustamento aos registos que servem de base à própria construção

do Modelo.

§ Encontra-se ajustado à amostra de teste sendo por conseguinte generalizável e

capaz de classificar IF’s externas à amostra de construção.

§ Os procedimentos de modelização utilizados permitem obter resultados

semelhantes no ajustamento dos ratings atribuídos pelas três principais agências,

considerando-se necessário conjugar a classificação dessas três agências na

atribuição de um rating único. Perante a existência de 3 classificações

(ajustamento das classificações das 3 agências, como é o caso), uma

Page 54: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

54

simplificação na atribuição/classificação final consiste na utilização da média

dos três ratings segundo uma escala numérica (considerando as 17 classes de

rating), com o rating mais elevado (optimista) e o mais reduzido (pessimista) a

balizar a análise. Note-se que para efeitos de supervisão prudencial, no âmbito

da avaliação de risco de crédito, estão definidas algumas regras que deverão ser

consideradas, como sejam, a utilização do segundo rating mais elevado de entre

os disponíveis [24, pág.137] ou o mais elevado dos dois menores ratings

disponíveis [25, pág. 96-98].

5.2. Recomendações

Importa referir que, apesar da qualidade preditiva demonstrada pelo Modelo, existem

alguns pontos que podem ser explorados na continuação deste trabalho, a reter:

§ Poderá ser interessante analisar em pormenor o processo de construção das

agregações de Regiões ou Especializações. Nesse aspecto, a aplicação de um

método quantitativo (como a análise de clusters) para estudar esse processo de

classificação poderá revelar-se uma mais-valia.

§ Do ponto de vista da aplicabilidade do Modelo, é perfeitamente possível

expandir a análise efectuada também a empresas não financeiras classificadas

pelas agências de rating. Poderá ser considerada uma extensão bastante útil do

Modelo, uma vez que no mercado de capitais se investe frequentemente em

empresas não financeiras não cotadas

§ Poderá ser explorada a conjugação do presente Modelo com o Modelo

apresentado em [18], no sentido de, considerando o ajustamento e predição do

rating segundo cada uma das agências, derivar um rating consensual (único)

para cada IF.

§ Poderá ser explorado com maior profundidade o horizonte de predição que se

pretende aplicar na determinação do rating. Nesta tese, pretendeu-se apenas

avaliar a capacidade de determinar o rating de uma IF, num determinado

período do tempo, dadas as suas características financeiras nesse período. No

entanto, uma extensão possível deste Modelo é a utilização de variáveis

Page 55: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

55

explicativas com desfasamentos temporais, de forma a tornar o Modelo sensível

à evolução financeira (histórica) da IF. Os desfasamentos utilizados (mensais,

trimestrais, anuais) determinariam consequentemente o horizonte de predição do

Modelo.

§ O Modelo desenvolvido poderá ser utilizado na avaliação de risco de crédito de

IF’s, quer para efeitos de Supervisão Bancária (Basileia) [25] quer para efeitos

de Supervisão no Sector Segurador (Solvência II) [24]. Em qualquer um destes

dois regimes de supervisão, pretende-se avaliar a capacidade do capital da IF

suportar o risco decorrente do exercício da sua actividade no horizonte temporal

de um ano (Pilar I – requisitos de capital). No entanto, a avaliação da adequação

de capital não se restringe ao horizonte de um ano, podendo envolver o

planeamento de capital em horizontes mais alargados (por exemplo, dois ou três

anos) por forma de assegurar a consistência com o planeamento estratégico da

IF. Nesse sentido, no âmbito da avaliação de risco de crédito, enquanto risco

significativo na avaliação dos requisitos de capital, as matrizes de transição de

rating desenvolvem um papel fundamental na compreensão da evolução futura

da qualidade do crédito da IF. A informação utilizada nesta Tese, encontrando-

se em base anual, poderá ser utilizada para estimar as probabilidades de

transição de rating que compõem a uma matriz de transição de rating, à

semelhança do que é feito pela S&P [26] e pelas restantes agências de rating

como a Fitch [27] e a Moody’s [28]. Existem diversos artigos publicados nesta

área, como por exemplo Wei [29] que considera um modelo com base na cadeia

de Markov, aplicável a dívida soberana e a dívida de empresas (corporate), e

que incorpora simultaneamente o ciclo da actividade económica. Essa

informação, em conjunto com a classificação de rating das IF’s (preconizada

pelo modelo desenvolvido e apresentado nesta Tese), poderá ser utilizada na

avaliação do risco de crédito nos diversos períodos (neste caso, anuais) futuros.

Page 56: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

56

6. REFERÊNCIAS BIBLIOGRÁFICAS

[1] Agresti, A. (1990) Categorical Data Analysis. New York: John Wiley

[2] Czepiel, Scott. (2002) A. Maximum Likelihood Estimation of Logistic Regression Models:

Theory and Implementation. http://czep.net/contact.html

[3] Abdullah, Nur. (2008) Predicting Corporate Failure of Malasya’s Listed Companies:

Comparing Multiple Discriminant Analysis, Logistic Regression and The Hazard Model.

Internacional Research Journal of Finance and Economics.

[4] Mählman, Thomas. (2004) Classification and Rating Firms in the Presence of Financial

and Non-Financial Information.

[5] Ying So. (1995) A Tutorial on Logistic Regression. SAS Institute Inc., Cary, NC

[6] Cody, W.J. and Hillstrom, K.E. (1967) Chebyshev Approximations for the Natural

Logarithm of the Gamma Function, Mathematics of Computation, Vol. 21, p. 198-203.

[7] Schaffer, J.L. (2001) Lecture Notes for Statistics 544: Categorical Data Analysis I, Fall

2001. Penn State Univ. http://www.stat.psu.edu/jls/

[8] Draper, N.R. and Smith, H. (1981) Applied Regression Analysis. 2nd Ed.New York: John

Wiley.

[9] Dobson, A.J. (2002) An Introduction to Generalized Linear Models. 2nd Ed. Boca Raton,

Fl: Chapman & Hall/CRC.

[10] Eliason, S.R. (1993) Maximum Likelihood Estimation: Logic and Practice. Sage

University Paper Series on Quantitative Applications in the Social Sciences, Series n. 07-096.

Newbury Park, CA: Sage.

[11] Langohr, H.M. and P.T. (2008) The Rating Agencies and Their Credit Ratings. John

Wiley, ISBN 978-0-470-01800-2. West Sussex PO19 8SQ, England.

[12] Standard and Poor’s. (2011) RatingsDirect® On The Global Credit Portal, web page:

http://www.standardandpoors.com/products-services/ratingsdirect-global-credit-portal/en/us

[13] Standard and Poor’s. (2011) Sovereing Defaults and Rating Transition Data, 2010

Update, web page:

Page 57: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

57

http://www.standardandpoors.com/ratings/articles/en/us/?assetid=1245302231824

[14] Bloomberg L.P. (2011) Bloomberg Professional Service, web page:

http://www.bloomberg.com

[15] Bureau Van Dijk. (2011) Bankscope Data, web page:

http://www.bvdep.com/kr/bankscope.html

[16] International Monetary Fund. (2011) IMF Data, web page:

http://www.imf.org/external/data.htm

[17] Fitch Solutions. (2007) Fitch Equity Implied Rating and Probability of Default Model,

Quantitative Research Special Report, webpage: www.fitchsolutions.com

[18] Grün, B. and Hofmarcher P. (2010) Deriving consensus ratings of the big three rating

agencies, ePub Institutional Repository, Vienna University of Economics and Business

[19] Sulivan, Arthur. and Sheffrin, Steven M. (2003) Economics, Principles in action, Upper

Saddle River, New Jersey, Pearson Prentice Hall

[20] International Labour Organization (1982) Resolution concerning statistics of the

economically active population, employment and underemployment, adopted by the

Thirteenth International Conference of Labour Statisticians, Thirteenth International

Conference if Labour Statisticians

[21] D. Duffie and D. Lando. (2001) Term structures of credit spreads with incomplete

information, Econometrica

[22] X. Guo, R. A. Jarrow, and Y. Zeng. (2008) Credit risk models with incomplete

information, Mathematics of Operations Research

[23] P. Hsueh and D. Kidwell. (1988) Are two better than one? Financial Management

[24] EIOPA. (2010) Solvency II (Insurance) Quantitative Impact Study 5 (QIS5) technical

specifications. European Insurance and Occupational Pensions Association

[25] BCBS. (2004) International Convergence of Capital Measurement and Capital

Standards (Basel II – Part II - Pilar I Minimimum Capital Requirements). Basel Committee

on Banking Supervision

[26] S&P. (2010) Annual European Corporate Default Study And Rating Transitions.

Standard and Poors

Page 58: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

58

[27] Fitch. (2010) Fitch Ratings Global Corporate Finance 2010 Transition and Default

Study. Fitch

[28] Moody’s. (2010) Corporate Default and Recovery Rates, 1920-2009. Moody’s

[29] Wei, Jason Z. (2003) A multi-factor, credit migration model for sovereign and corporate

debts. Journal of International Money and Finance

Page 59: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

59

7. APÊNDICE

7.1. Aplicação do modelo sobre o rating da Fitch e Moody’s

Apresentam-se nos pontos seguintes os resultados da utilização do modelo sobre as

classificações de rating das agências Moody’s e Fitch.

7.1.1. Aplicação sobre a Moody’s

Pressupostos: Informação Histórica de Janeiro de 1998 a Dezembro de 2010, com

classificação em 17 classes de rating.

Figura 21: Análise de acertos (amostra C)

17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 117 9 5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 016 1 6 8 15 14 2 0 0 0 0 0 0 0 0 0 0 015 0 8 6 23 23 3 1 1 2 0 0 1 1 1 1 1 014 0 20 29 39 20 14 5 5 3 7 1 0 2 0 0 0 013 0 4 17 36 51 43 26 8 3 3 2 0 0 0 0 0 012 0 3 5 20 46 46 29 22 11 6 0 0 0 0 0 0 011 1 0 5 5 20 42 29 20 3 3 2 1 0 0 0 0 010 1 0 1 3 7 27 18 15 14 9 3 3 1 0 1 0 09 0 0 1 1 6 1 9 16 4 2 1 5 1 2 0 0 08 0 0 0 3 3 7 10 7 2 3 3 4 0 0 3 2 07 0 0 0 0 0 0 2 4 4 9 5 1 0 0 0 0 06 0 0 0 0 2 1 1 3 3 2 2 2 1 0 2 0 35 0 0 0 0 1 1 1 1 0 1 2 2 4 4 3 3 14 0 0 0 0 0 0 0 0 0 0 2 1 2 1 2 3 03 0 0 0 0 0 0 0 0 0 1 2 2 7 1 0 0 02 0 0 0 0 0 0 0 0 0 1 0 0 4 0 1 1 31 1 0 0 0 0 1 0 1 0 0 0 0 1 2 0 0 2

ESTIMADO

-4 -3 -2 -1 0 1 2 3 42.9% 4.5% 12.4% 19.5% 20.3% 16.2% 11.2% 5.2% 2.2%

Análise de Acertos

Page 60: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

60

0 notch 20.25%<=1 notch 55.95%<=2 notch 79.47%<=3 notch 89.19%<=4 notch 94.28%

Análise de Acertos

Figura 22: Análise de acertos (amostra T)

17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 117 4 2 0 0 0 0 0 0 0 1 0 0 0 0 0 0 016 0 3 1 5 5 1 0 0 0 0 0 0 0 0 0 0 015 0 4 4 10 9 1 0 2 0 0 0 1 0 0 5 0 014 0 9 15 16 16 5 1 2 0 0 0 0 0 0 0 0 013 0 2 9 11 24 11 12 4 0 2 0 0 0 0 0 0 012 1 0 2 7 13 19 13 12 5 1 1 2 0 0 0 0 011 1 0 0 2 10 23 18 6 4 2 0 1 0 0 0 0 010 0 1 1 3 5 12 8 6 5 4 2 0 0 1 1 0 09 0 0 0 0 1 3 2 4 3 1 1 0 1 0 0 1 08 0 0 0 0 0 8 1 2 2 6 2 0 1 0 0 0 07 0 0 0 0 0 0 0 2 2 2 0 1 0 0 0 0 06 0 0 0 0 1 1 0 0 1 1 2 2 3 0 2 1 05 0 0 0 0 0 0 1 1 0 1 1 2 0 1 3 2 24 0 0 0 0 0 0 0 0 0 0 0 0 0 1 2 0 03 0 0 0 0 0 0 0 0 0 0 0 3 0 1 1 0 02 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 11 0 0 0 0 1 0 0 0 1 0 0 2 0 0 0 1 0

ESTIMADO

-4 -3 -2 -1 0 1 2 3 42.7% 4.8% 11.5% 18.4% 22.3% 15.7% 11.5% 5.2% 1.7%

Análise de Acertos

0 notch 22.34%<=1 notch 56.37%<=2 notch 79.33%<=3 notch 89.35%<=4 notch 93.74%

Análise de Acertos

Page 61: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

61

7.1.2. Aplicação sobre a Fitch

Pressupostos: Informação Histórica de Janeiro de 1998 a Dezembro de 2010, com

classificação em 17 classes de rating.

Figura 23: Análise de acertos (amostra C)

17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 117 6 0 4 3 1 1 0 0 0 0 0 0 0 0 0 0 016 0 0 5 0 0 0 0 0 0 0 0 0 0 0 0 0 015 4 3 17 16 16 5 4 0 0 1 0 0 3 1 0 0 014 2 2 24 54 44 21 8 4 2 4 0 1 1 0 1 0 013 1 0 12 50 57 36 18 5 7 2 2 0 0 0 0 0 012 1 0 5 31 41 44 21 12 6 2 1 1 0 0 0 0 011 0 0 2 10 13 32 28 29 14 4 5 0 0 0 0 0 010 0 0 1 1 9 13 33 24 20 10 2 0 1 0 0 0 09 0 0 0 0 7 11 13 15 13 8 4 2 0 2 0 0 08 0 0 0 2 1 2 8 12 5 10 5 2 1 1 0 0 07 0 0 0 0 0 0 1 7 6 6 2 2 5 3 1 0 06 0 0 0 0 1 0 2 2 0 0 1 5 3 1 1 1 05 0 0 0 0 0 0 1 1 2 1 6 2 5 6 1 0 14 0 0 0 1 0 0 0 3 0 1 2 0 3 0 1 2 13 0 0 0 0 0 0 0 0 0 0 1 1 3 0 2 0 22 0 0 0 0 0 0 0 0 0 0 1 1 0 0 1 0 01 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 0 0

ESTIMADO

-4 -3 -2 -1 0 1 2 3 42.0% 5.1% 10.6% 19.8% 24.4% 17.9% 10.2% 3.8% 2.5%

Análise de Acertos

0 notch 24.43%<=1 notch 62.12%<=2 notch 82.98%<=3 notch 91.86%<=4 notch 96.34%

Análise de Acertos

Page 62: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

62

Figura 24: Análise de acertos (amostra T)

17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 117 5 0 0 2 1 4 0 0 0 0 0 0 0 0 0 0 016 0 0 4 0 0 1 0 0 0 0 0 0 1 1 0 0 015 4 0 6 10 8 0 2 0 0 1 0 0 0 0 0 0 014 0 1 3 23 12 7 15 0 1 2 0 0 1 0 0 0 013 0 0 5 31 22 13 12 0 4 2 0 0 0 0 0 0 012 0 0 1 17 17 14 14 3 4 1 0 0 0 0 0 0 011 0 0 2 1 3 12 8 8 4 1 1 1 1 0 0 0 010 0 0 0 0 2 7 14 11 11 2 2 0 0 0 0 0 09 0 0 0 1 0 1 6 7 8 5 5 0 0 0 0 0 08 0 0 0 1 3 0 5 4 0 3 2 3 1 2 0 0 07 0 0 0 0 0 0 0 4 1 1 1 2 0 2 1 0 06 0 0 0 0 0 1 1 3 0 2 3 0 0 1 0 0 05 0 0 0 0 0 0 0 0 2 2 0 0 1 2 1 1 04 1 0 0 0 0 0 0 0 1 1 1 1 2 0 0 0 03 0 0 0 0 0 0 0 0 0 0 2 1 0 0 0 0 12 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 01 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0

ESTIMADO

-4 -3 -2 -1 0 1 2 3 42.1% 4.1% 10.9% 19.4% 21.7% 17.7% 10.0% 6.0% 2.8%

Análise de Acertos

0 notch 21.75%<=1 notch 58.85%<=2 notch 79.74%<=3 notch 89.77%<=4 notch 94.67%

Análise de Acertos

Page 63: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

63

7.2. Código de programação do método Stepwise

O código de Programação é composto por 3 blocos de código:

1. “0.TESE_Criar biblioteca.sas” – Criação de biblioteca (pasta ou directório) de

repositório da informação utilizada (informação base e tabelas geradas pelo

programa).

2. “0.TESE_Importar_Amostra.sas” – Importação da informação contida no ficheiro

Excel (variáveis explicada e explicativas para análise pelo programa) para tabelas

SAS que são armazenadas na biblioteca definida no primeiro bloco.

3. “1.TESE_StepWise.sas” – Execução do método StepWise de selecção de variáveis

explicativas para a classificação de rating.

Apresenta-se nos pontos seguintes o detalhe do código desenvolvido.

0.TESE_Criar biblioteca.sas

%macro Bibliotecas(); libname STEP "C:\Documents and Settings\davide.silva\My Documents\CONSULT\_SUPORTES Consult\01_MESTRADO\TESE\TESE - Programas\Bibliotecas SAS\Step"; %mend;

%bibliotecas;

0.TESE_Importar_Amostra.sas

**** Importar informação do ficheiro Excel *******; *Importar Base de Dados - Amostra C para construção do Modelo; PROC IMPORT OUT= Step.A_Base DATAFILE= "C:\Documents and Settings\davide.silva\My Documen ts\CONSULT\_SUPORTES Consult\01_MESTRADO\TESE\20110510 - TESE EXEMPLO2.xls" DBMS=EXCEL REPLACE; SHEET="'5#Amostra$'"; GETNAMES=YES; MIXED=NO; SCANTEXT=YES; USEDATE=YES; SCANTIME=YES; RUN; *Importar tabela para construção do Report em cada passo do processo;

Page 64: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

64

PROC IMPORT OUT= Step.A_InfoPasso_Tipo DATAFILE= "C:\Documents and Settings\davide.silva\My Documen ts\CONSULT\_SUPORTES Consult\01_MESTRADO\TESE\20110510 - TESE EXEMPLO2.xls" DBMS=EXCEL REPLACE; SHEET="'5#InfoPasso_Tipo$'"; GETNAMES=YES; MIXED=NO; SCANTEXT=YES; USEDATE=YES; SCANTIME=YES; RUN; *Importar tabela para construção da análise do critério de Akaike em cada passo do processo; PROC IMPORT OUT= Step.A_Passo_AIC_Tipo DATAFILE= "C:\Documents and Settings\davide.silva\My Documen ts\CONSULT\_SUPORTES Consult\01_MESTRADO\TESE\20110510 - TESE EXEMPLO2.xls" DBMS=EXCEL REPLACE; SHEET="'5#Passo_AIC_Tipo$'"; GETNAMES=YES; MIXED=NO; SCANTEXT=YES; USEDATE=YES; SCANTIME=YES; RUN; *Importar matriz de correlações entre variáveis; PROC IMPORT OUT= Step.A_Correl DATAFILE= "C:\Documents and Settings\davide.silva\My Documen ts\CONSULT\_SUPORTES Consult\01_MESTRADO\TESE\20110510 - TESE EXEMPLO2.xls" DBMS=EXCEL REPLACE; SHEET="'5#Correl_Bin$'"; GETNAMES=YES; MIXED=NO; SCANTEXT=YES; USEDATE=YES; SCANTIME=YES; RUN; *Importar Matriz de sinais teóricos das variáveis; PROC IMPORT OUT= Step.A_Sinais DATAFILE= "C:\Documents and Settings\davide.silva\My Documen ts\CONSULT\_SUPORTES Consult\01_MESTRADO\TESE\20110510 - TESE EXEMPLO2.xls" DBMS=EXCEL REPLACE; SHEET="'5#Sinais$'"; GETNAMES=YES; MIXED=NO; SCANTEXT=YES; USEDATE=YES; SCANTIME=YES; RUN; *Importar tabela de classificação das variáveis explicativas entre categoricas e contínuas; PROC IMPORT OUT= Step.A_Tipo_Variavel DATAFILE= "C:\Documents and Settings\davide.silva\My Documen ts\CONSULT\_SUPORTES Consult\01_MESTRADO\TESE\20110510 - TESE EXEMPLO2.xls" DBMS=EXCEL REPLACE; SHEET="'5#Tipo_Variavel$'"; GETNAMES=YES; MIXED=NO;

Page 65: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

65

SCANTEXT=YES; USEDATE=YES; SCANTIME=YES; RUN;

1.TESE_StepWise.sas

*MACROS deste procedimento: ; *MACRO1 -> createMacro_namesOfVars ; *MACRO2 -> obterVarName ; *MACRO3 -> N_obs_AND_vars ; *MACRO4 -> actualizaPasso ; *MACRO5 -> seleccionarModelo ; *MACRO6 -> Logistica ; *MACRO7 -> getInformacao ; *MACRO8 -> validarTendencia ; *MACRO9 -> analizaCorrel ; *MACRO10 -> testeWald ; *MACRO11 -> getVarType ; *MACRO12 -> removeVarFromMacroVar ; *MACRO13 -> getInformacao ; *MACRO14 -> decisaoPassoAIC ; *MACRO15 -> actualizaModelo ; *MACRO16 -> updateModelo ; *MACRO17 -> finalizeProcess ; *MACRO18 -> avalNumVarMacroVar ; ************************** MACRO18 ********************************************; *Esta Macro permite averiguar o número de variáveis referenciadas numa Macro-Variável; *Ex: X= V1 V2 ---------------- nVarMacro=2; %MACRO avalNumVarMacroVar(MacroVar); * Determinar número de elementos de MacroVar; *Inicialização; %LET nVarMacro=; *Variável de controle sobre situações em que MacroVar é vazia;

Page 66: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

66

%LET X= ; *Depuração dessas situações; %IF &X=&MacroVar %then %LET nVarMacro=0; %ELSE %DO; *A_Base é a BD que contém TODAS as variáveis; data Step.Var_MacroVar(keep=&MacroVar); set Step.A_Base; run; proc Transpose Data=Step.Var_MacroVar NAME=_NAME_ OUT=Step.Var_MacroVar2 (Keep=_Name_); run; Data _NULL_; set Step.Var_MacroVar2; Call Symput('nVarMacro',_N_); run; *** Limpeza de DataSets ***; proc datasets library=Step; delete Var_MacroVar Var_MacroVar2; run; *************; %END; *** Limpeza de DataSets ***; proc datasets library=Step; delete Var_macrovar Var_macrovar2; run; %PUT A Macro-Variável &MacroVar faz referência a &nVarMacro variáveis ; *"nVarMacro" contém o número de variáveis; %MEND avalNumVarMacroVar; ************************** FIM MACRO18 *****************************************; ************************** MACRO17 *********************************************; ** FINAL PROCESSO ************************************ BD_Base com VAR MODELO *********; * ------- Ordenada segundo entrada Variáveis no Modelo + EXPORTAÇÕES ---------------- *; ***************************************************************************************; %MACRO finalizeProcess; * ---------------------------------------------------------- ; * TASK 1: Criação de Dataset com ordenação de Saída do modelo; * ---------------------------------------------------------- ; %avalNumVarMacroVar(&varModelo)run; *->>>>>>MACRO18; *Inicializações; %LET I=1; proc sort Data=Step.A_Base; BY &Index;run; Data Step.BD_Modelo(keep=&Index &Score); set Step.A_Base;run; *Processo de Construção; %DO %WHILE (&I le &nVarMacro); %LET V=%SCAN(&varModelo,&I); Data Step.X_BD_Modelo(keep=&Index &V); set Step.A_Base; run; Data Step.BD_Modelo; merge Step.BD_Modelo Step.X_BD_Modelo;

Page 67: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

67

BY &Index; run; %LET I=%EVAL(&I+1); proc datasets library=Step; delete X_BD_Modelo; run; %END; * ---------------------------------------------------------- ; * TASK 2: Exportação de Ficheiros Relevantes; * ---------------------------------------------------------- ; * Convergencia do criterio maxima verosimilhança; proc export Data=Step.Log_ConvergenceStatus Outfile="C:\Documents and Settings\davide.silva\My Documents\CONSULT\_SUPORTES Consult\01_MESTRADO\TESE\TESE - Programas\0-Convergencia" DBMS=Excel2000 REPLACE; run; * Exportações dos InfoPassos; proc export Data=Step.Log_InfoPasso_Total Outfile="C:\Documents and Settings\davide.silva\My Documents\CONSULT\_SUPORTES Consult\01_MESTRADO\TESE\TESE - Programas\2-Infopassos" DBMS=Excel2000 REPLACE; run; * Exportação da InfoAIC; proc export Data=Step.Info_AIC Outfile="C:\Documents and Settings\davide.silva\My Documents\CONSULT\_SUPORTES Consult\01_MESTRADO\TESE\TESE - Programas\1-Infopasso_AIC" DBMS=Excel2000 REPLACE; run; * Exportação da BD ordenada; proc export Data=Step.BD_Modelo Outfile="C:\Documents and Settings\davide.silva\My Documents\CONSULT\_SUPORTES Consult\01_MESTRADO\TESE\TESE - Programas\3-BD_Modelo" DBMS=Excel2000 REPLACE; run; * Exportação da Informação de Modelo Final Seleccionado; proc export Data=Step.Log_fitstatistics Outfile="C:\Documents and Settings\davide.silva\My Documents\CONSULT\_SUPORTES Consult\01_MESTRADO\TESE\TESE - Programas\4-Log_fitstatistics" DBMS=Excel2000 REPLACE; run; proc export Data=Step.Log_globaltests Outfile="C:\Documents and Settings\davide.silva\My Documents\CONSULT\_SUPORTES Consult\01_MESTRADO\TESE\TESE - Programas\4-Log_globaltests" DBMS=Excel2000 REPLACE; run; proc export Data=Step.Log_modelinfo Outfile="C:\Documents and Settings\davide.silva\My Documents\CONSULT\_SUPORTES Consult\01_MESTRADO\TESE\TESE - Programas\4-Log_modelinfo" DBMS=Excel2000 REPLACE; run; proc export Data=Step.Log_parameterestimates

Page 68: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

68

Outfile="C:\Documents and Settings\davide.silva\My Documents\CONSULT\_SUPORTES Consult\01_MESTRADO\TESE\TESE - Programas\4-Log_parameterestimates" DBMS=Excel2000 REPLACE; run; proc export Data=Step.Log_TypeIII Outfile="C:\Documents and Settings\davide.silva\My Documents\CONSULT\_SUPORTES Consult\01_MESTRADO\TESE\TESE - Programas\4-Log_TypeIII" DBMS=Excel2000 REPLACE; run; * ---------------------------------------------------------- ; %MEND finalizeProcess; ************************** FIM MACRO17 *****************************************; ************************** MACRO16 *********************************************; * Actualiza macroVar "varPasso" e "varForaPasso", "newAIC" e "oldAIC"; %MACRO updateModelo; *; %LET varModelo=&varPasso; %LET varFora=&varForaPasso; %PUT *******************************************************************; %PUT * Passo &Passo ****** FOI EFECTUADO!! ***** AIC=&newAIC ****************; %PUT *******************************************************************; %PUT * Modelo: &varModelo ******; %PUT * Fora do Modelo: &varFora ******; %PUT *******************************************************************; *; %LET oldAIC=&newAIC; %LET newAIC=; *; %MEND updateModelo; ************************** FIM MACRO16 *****************************************; ************************** MACRO15 *********************************************; *Esta Macro permite actualizar o modelo, consoante a variável introduzida/removida; *através de alteração das Macro-Variáveis: varFora e varModelo; %MACRO actualizaModelo; * Recalcula o Modelo Escolhido e Prossegue; *; *Inicialização das variáveis; %LET varPasso=;%LET varForaPasso=; *; %PUT No Passo &Passo decidiu-se pela inclusão da Variável: &varToEnter; *; *Adiciona-se a Variável às variáveis do modelo no passo anterior; %LET varPasso=&varModelo &varToEnter; %PUT Assim, o modelo é composto por: varPasso= &varPasso; *; *Inicia-se varForaPasso como as últimas variáveis fora excepto a que entra; %LET varForaPasso=&varFora; *; %LET FINAL=;

Page 69: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

69

%removeVarFromMacroVar(varToRemove=&varToEnter,macroVariavel=&varFora);run; *->>>>>>MACRO12; %LET varForaPasso=&FINAL; %PUT Logo, fora do modelo estão: varForaPasso= &varForaPasso; *; *Corre-se o procedimento da Logística para depois aplicar teste Wald; %Logistica(BDAnalise=Step.A_Base,studyVar=&varPasso,indicaCateg=&Categ) run; *->>>>>>MACRO6; *; %LET varOUT=; %testeWald(MaxWALD=&p_Wald_max,studyVar=&varPasso);run; *->>>>>>MACRO10; *...a macro-var "varOUT" contém as variáveis não significativas do passo; %LET varToGetOut=&varOUT; *Indicação das variáveis não significativas; %PUT Variáveis Não Significativas: &varToGetOut; *; *; * SAÍDA DE VARIÁVEIS NÃO SIGNIFICATIVAS DO MODELO... APLICÁVEL PARA PASSO >= 2; %IF &Passo gt 1 %THEN %do; * Determinação de quantas se tem que eliminar; %LET nVarMacro=; %avalNumVarMacroVar(MacroVar=&varToGetOut)run; *->>>>>>MACRO18; %LET nVarGetOut=&nVarMacro; %LET K=1; %DO %WHILE(&K le &nVarGetOut); %LET X=%SCAN(&varToGetOut,&K); %LET FINAL=; %removeVarFromMacroVar(varToRemove=&X,macroVariavel=&varPasso);run; *->>>>>>MACRO12; %LET varPasso=&FINAL; %LET varForaPasso=&varForaPasso &X; %LET K=%EVAL(&K+1); %END; *Visualização; %PUT No Passo &Passo: Var. no Modelo:&varPasso, Var. Fora Modelo:&varForaPasso; %end; *; *Indica-se no InfoPasso_(...) qual a situação seleccionada; data Step.Infopasso_&Passo; set Step.Infopasso_&Passo; if varIN="&varToEnter" then Seleccionada="X"; run; *; * Recalcula-se o modelo sobre varPasso para determinar o REAL valor de AKAIKE após WALD; %LET newAIC=; %Logistica(BDAnalise=Step.A_Base,studyVar=&varPasso,indicaCateg=&Categ) run; *->>>>>>MACRO6; %LET newAIC=&AIC; %PUT newAIC: &newAIC; *; *** CHAMADA AO PROCEDIMENTO DE DECISÃO ***********; %LET decisaoAIC=; %decisaoPassoAIC;run; *->>>>>>MACRO14;

Page 70: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

70

%PUT decisaoAIC: &decisaoAIC; * "decisaoAIC"=1 - Segue, "decisaoAIC"=0 - Stop; *O AIC entra no processo de decisão se o passo indicado pelo utilizador foi atingido; %IF &Passo le &PassoActivAIC %THEN %DO; %LET decisaoAIC=1; %END; *; %IF &decisaoAIC eq 1 %then %DO; %updateModelo;run; *->>>>>>MACRO16; %END; %ELSE %DO; %Logistica(BDAnalise=Step.A_Base,studyVar=&varModelo,indicaCateg=&Categ)run; *->>>>>>MACRO6; %PUT STOP! O AIC não sofreu um decréscimo (newAIC=&newAIC>=oldAIC=&oldAIC).; %PUT Passo não deve ser efectuado. PARAR STEPWISE!!!!!!!!!!; %END; *; %MEND actualizaModelo; ************************** FIM MACRO15 *****************************************; ************************** MACRO14 *********************************************; *Analisa situação indicando na MacroVar "decisaoAIC" se o passo deve ser dado (1) *ou não (0). Esta macroVariável indicará se se deve ou não prosseguir; %MACRO decisaoPassoAIC; * Permite verificar se o AKAIKE decresce entre Passos; *; %PUT O AIC do Passo anterior foi &oldAIC. Neste Passo (&Passo) é &newAIC; *; %LET decisaoAIC=0; *; %IF (&newAIC lt &oldAIC) OR (&Passo eq 1) %THEN %LET decisaoAIC=1; *; *decisaoAIC= 1-SIM e 0-NãO; %PUT Efectua-se o passo? decisaoAIC: &decisaoAIC; *Coloca informação no Dataset InfoAIC; data Step.PassoAIC; set Step.A_passo_AIC_Tipo; if Passo=999 then do Passo=&Passo; if &Passo eq 1 then AIC_anterior=.; else AIC_anterior="&oldAIC"; AIC_passo="&newAIC"; end;

Page 71: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

71

run; *; data Step.Info_AIC; set Step.Info_AIC Step.PassoAIC; run; *; proc datasets library=Step; delete PassoAIC; run; *; %MEND decisaoPassoAIC; ************************** FIM MACRO14 *****************************************; ************************** MACRO13 *********************************************; *Esta Macro reúne a informação importante dos outputs da logística; *confinando-a em tabelas 'InfoPasso_(nº passo); %MACRO getInformacao; * Constrói Ficheiros Informativos de Cada Passo; ******************************; *Inicialização; %LET AIC=;%LET _2LogVero=; **************************************************************; *** Obter Quadro resumo e valores que permitirão a decisão ***; data Step.X_info(keep=Passo); set Step.Log_fitstatistics; Passo=_N_; if Criterion eq 'AIC' then call Symput ('AIC',InterceptAndCovariates); if Criterion eq '-2 Log L' then call Symput ('_2LogVero',InterceptAndCovariates); run; %PUT AIC=&AIC e Verosimilhança=&_2LogVero; *; *Colocá-las numa linha informativa do Passo; data Step.X_info2; set Step.X_info Step.infoPasso_&Passo; run; *; *----------------------------------------; *VALIDAÇÃO DOS SINAIS DOS COEF. DO MODELO; *----------------------------------------; %validarTendencia run; *->>>>>>MACRO8; *...se sinalOK=1 tudo bem, mas se for =0 o modelo contraria teoria económica; %PUT SinalOK= &sinalOK; *; *VALIDAÇÃO DE CORRELAÇÕES ENTRE VARIÁVEIS DO MODELO; *-----------------------------; %analizaCorrel(studyVar=&varTeste,BDcorrel=Step.A_Correl)run; *->>>>>>MACRO9; *Se correlSTATUS=0 o modelo é válido... senão assume o valor 1; %PUT correlSTATUS= &correlSTATUS; *; *----------------------------------------; *APLICAÇÃO DOS TESTES DE WALD SOBRE VARIÁVEIS MODELO; *-----------------------------; %testeWald(MaxWALD=&p_Wald_max,studyVar=&varTeste);run; *->>>>>>MACRO10; *...a macro-var "varOUT" contém as variáveis não significativas do passo; %PUT Variáveis Não-Significativas: &varOUT; *;

Page 72: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

72

*---------------------------------; data Step.X_info3; set Step.X_info2; *Selecção de apenas 1 linha; Where Passo=1 and varIN=""; Variaveis_Modelo="&varModelo"; AIC="&AIC"; _2LogVero="&_2LogVero"; varIn="&varIn"; naoSignif="&varOUT"; Passo=Passo*&Passo; if &sinalOK eq 1 then Tend_Validas="Sim"; if &sinalOK eq 0 then Tend_Validas="Não"; if &correlSTATUS eq 1 then Correl_Validas="Não"; if &correlSTATUS eq 0 then Correl_Validas="Sim"; run; *------------------------------; data Step.infoPasso_&Passo; set Step.infoPasso_&Passo Step.X_info3; run; *--------------------------------; *** Limpeza de DataSets ***; proc datasets library=Step; delete X_info X_info2 X_info3; run; *******************; %MEND getInformacao; ************************** FIM MACRO13 *****************************************; ************************** MACRO12 *********************************************; * ----------------------------------------------------------------------------- *; * Macro que permite eliminar instanciação de UMA variável de uma Macro-Variável *; * Ex: X= V1 V2 V3 ------- (elim. V2) -------- X= V1 V3 *; * ----------------------------------------------------------------------------- *; %MACRO removeVarFromMacroVar(varToRemove,macroVariavel); * Remover Var de MacroVar; *; %PUT Deseja eliminar instanciação de &varToRemove de &macroVariavel; *; *Inicialização; %LET FINAL=; *; *Associa EXCLUSIVAMENTE a Macro à análise do ficheiro A_BASE; %avalNumVarMacroVar(MacroVar=&macroVariavel)run; *->>>>>>MACRO18; %LET Elementos=&nVarMacro; *; %LET I=1; %DO %WHILE (&I le &Elementos);

Page 73: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

73

%LET varX=%SCAN(&macroVariavel,&I); %IF &varX eq &varToRemove %THEN %LET I=%EVAL(&I+1); %ELSE %DO; %LET FINAL=&FINAL &varX; %LET I=%EVAL(&I+1); %END; %END; *; %PUT A Macro-Variável obtida, após eliminação de &varToRemove, é &FINAL; *; %MEND removeVarFromMacroVar; ************************** FIM MACRO12 *****************************************; ************************** MACRO11 *********************************************; *Classifica uma variável dada como input como Categórica/Não Categórica; *Ex: Qual o tipo de Var1? - - - - - &Tipo_Var=Categórica; %MACRO getVarType(varName); * Obter tipo Variável (Categ/Não Categ); *-----------------------; %LET Tipo_Var=; *-----------------------; data Step.X_varType_Draft1; set Step.A_Tipo_Variavel; where Variavel eq "&varName"; run; *-----------------------; proc sort DATA=Step.X_varType_Draft1; BY Variavel;run; *-----------------------; data _NULL_; set Step.X_varType_Draft1; Array r{1} Tipo; call Symput('Tipo_Var',r(1)); run; *-----------------------; %PUT A variável é do tipo &Tipo_Var; *--------------------- --; *** Limpeza de DataSets ***; proc datasets library=Step; delete X_vartype_draft1; run; *-----------------------; %MEND getVarType; ************************** FIM MACRO11 *****************************************; ************************** MACRO10 *********************************************; * ANÁLISE WALD - Incluindo na MacroVar "varOUT" as Não Signif. *********; %MACRO testeWald(MaxWALD,studyVar); * Efectua Testes de Wald sobre um Modelo; *; *FASE 0: Generalidades necessárias à análise; *-------------------------------------------; *Obtenção do número de variáveis do modelo; %avalNumVarMacroVar(MacroVar=&studyVar);run; *->>>>>MACRO18; %LET numVarIN=&nVarMacro;

Page 74: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

74

*; *-------------------------------------------; *FASE 1: Verificar se Existem Variáveis Categóricas no Modelo. A análise é distinta: - Sim Existem! - A análise tem por base o ficheiro Log_TypeIII - Não Existem! - A análise tem por base o ficheiro Log_parameterestimates; **************************** Averiguação da Existência de Var Categóricas *** INICIO; %LET existCateg=N; %LET J=1; %DO %WHILE (&J le &numVarIN); %LET Var=%Scan(&studyVar,&J); %getVarType(varName=&Var);run; *->>>>>>>>MACRO11; %PUT &Var é do tipo &Tipo_Var; %IF &Tipo_Var ne Contínua %THEN %DO; %LET existCateg=S; %LET J=&numVarIN; %END; %LET J=%EVAL(&J+1); %END; ******************************* Averiguação da Existência de Var Categóricas *** FIM; *; ****************************** Selecção do Ficheiro a utilizar na análise *** INICIO; %IF &existCateg eq S %THEN %DO; data Step.Wald_Data1(keep=Variable ProbChiSq); set Step.Log_TypeIII; where Variable ne "Intercept"; run; %END; %ELSE %DO; data Step.Wald_Data1(keep=Variable ProbChiSq); set Step.Log_parameterestimates; where Variable ne "Intercept"; run; %END; ********************************* Selecção do Ficheiro a utilizar na análise *** FIM; *; *FASE 2: Análise de Wald Propriamente Dita; *; ****************************** Teste de Wald sobre cada Variável Modelo *** INICIO; %LET varOUT=; *inicialização; %LET pValueWald=0; %LET J=1; %DO %WHILE (&J le &numVarIN); %LET Var=%Scan(&studyVar,&J); *; data _NULL_; set Step.Wald_data1; if Variable eq "&Var" then call symput ('pValueWald',ProbChiSq); run; *;

Page 75: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

75

%IF &pValueWald gt &MaxWALD %THEN %DO; %LET varOUT=&varOUT &Var; %END; %LET J=%EVAL(&J+1); %END; ********************************* Teste de Wald sobre cada Variável Modelo *** FIM; *; **** A Macro Variável "varOUT" contém indicação das variáveis não signif. ****; %PUT As variáveis não significativas deste modelo: &varOUT; *; *** Limpeza de DataSets *** União de Resultados ***; proc datasets library=Step; delete Wald_Data1; run; *; %MEND testeWald; ************************** FIM MACRO10 *****************************************; ************************** MACRO9 *********************************************; *Macro que averigua se as variáveis em análise são correlacionadas; *"correlSTATUS" guarda info (sim=1/não=0) se existe correlação entre as variáveis; %MACRO analizaCorrel(studyVar,BDcorrel); *Analisa correlação entre var modelo; *; *Inicialização de MacroVariáveis; %LET correlStatus=0; %LET sumCorrel=0; %LET nVarCorrel=0; *; *Cópia; data Step.X_Correl(keep=Correl &studyVar); set &BDcorrel; run; *; *Selecção das variáveis; proc Transpose Data=Step.X_Correl NAME=_NAME_ OUT=Step.X_Correl2 (Keep=_Name_); run; *; data Step.X_Correl3(keep=Correl); set Step.X_Correl2; Correl=_Name_; run; *; *Construção da matriz pequena (#studyvar)x(#studyvar); data Step.X_Correl4; merge Step.X_Correl3(in=a) Step.X_Correl(in=b); BY Correl; if a and b then output Step.X_Correl4; run; *; proc sort Data=Step.X_Correl3; BY Correl;run; proc sort Data=Step.X_Correl; BY Correl;run;

Page 76: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

76

*; *Obtenção da soma dos elementos da matriz; proc sort DATA=Step.X_Correl4; BY Correl;run; proc means DATA=Step.X_Correl4 NOPRINT; output out=Step.X_Correl5(Drop=_TYPE_ _FREQ_) sum=; run; proc Transpose Data=Step.X_Correl5 NAME=_NAME_ OUT=Step.X_Correl6(keep=COL1); run; proc sort DATA=Step.X_Correl6; BY COL1;run; proc means DATA=Step.X_Correl6 NOPRINT; output out=Step.X_Correl7(Drop=_TYPE_ _FREQ_) sum=; run; data _NULL_; set Step.X_Correl7; *MacroVariável que contém a soma dos elementos da matriz; call symput('sumCorrel',COL1); run; *; *Determinação do número de variáveis em análise; %avalNumVarMacroVar(MacroVar=&studyVar)run; *->>>>>>MACRO18; %Let nVarCorrel=&nVarMacro; *; *DECISÃO ACERCA DAS CORRELAÇÕES (&correlSTATUS); * Se soma dos elementos da submatriz é igual ao número de variáveis em análise *(situação correspondente a uma matriz identidade), não existe correlação entre * as variáveis. Caso seja superior as variáveis estão correlacionadas; %IF &sumCorrel gt &nVarCorrel %THEN %LET correlSTATUS=1; *; *** Limpeza de DataSets *** União de Resultados ***; proc datasets library=Step; delete X_correl X_correl2 X_correl3 X_correl4 X_correl5 X_correl6 X_correl7; run; *; %MEND analizaCorrel; ************************** FIM MACRO9 *****************************************; ************************** MACRO8 *********************************************; *Esta Macro "olha" para SINAL COEF. e verifica se estão de acordo com a *teoria económica. Para isso compara com o sinal indicado em A_Sinais; %MACRO validarTendencia; * Verifica se tendências coincidem com Teo. Económica; *sinalOK - indica se a tendência é concordante (1) ou não (0); %LET sinalOK=1; *-----------------------------; Data Step.X_ModeloAnalise(Drop=ClassVal0 DF); set Step.Log_parameterestimates; Where Variable ne 'Intercept'; run; proc Sort DATA=Step.X_ModeloAnalise; BY Variable;run; *-----------------------------;

Page 77: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

77

Data Step.X_Sinais; set Step.A_Sinais; Variable=Variavel; run; proc Sort DATA=Step.X_Sinais; BY Variable; run; *-----------------------------; *NOTA: Processo "merge" é CAPS Sensitive; *-----------------------------; Data Step.X_ModeloAnalise2(Drop=Variavel); merge Step.X_ModeloAnalise Step.X_Sinais; BY Variable; run; Data Step.X_ModeloAnalise3; set Step.X_ModeloAnalise2; where Estimate ne .; run; *-----------------------------; *Análise variável a variável; Data Step.X_ModeloAnalise4; set Step.X_ModeloAnalise3; *Se a variável é significativa e Sinal Real*Teórico é negativo - NÃO OK!; IF (ProbChiSq lt &p_Wald_max) AND (Estimate*Sinal lt 0) THEN Verify='XX'; ELSE Verify='ok'; run; *-----------------------------; *Análise e Passagem para a MACRO-VARIÁVEL; data _NULL_; set Step.X_ModeloAnalise4; if Verify = 'XX' then call Symput('sinalOK',0); run; *-----------------------------; *** Limpeza de DataSets ***; proc datasets library=Step; delete X_modeloanalise X_modeloanalise2 X_modeloanalise3 X_modeloanalise4 X_Sinais; run; *-----------------------------; %MEND validarTendencia; ************************** FIM MACRO8 *****************************************; ************************** MACRO7 ********************************************; *Esta Macro reúne a informação importante dos outputs da logística; *confinando-a em tabelas 'InfoPasso_(nº passo); %MACRO getInformacao; * Constrói Ficheiros Informativos de Cada Passo; ******************************; *Inicialização; %LET AIC=; %LET _2LogVero=; **************************************************************; *** Obter Quadro resumo e valores que permitirão a decisão ***; data Step.X_info(keep=Passo); set Step.Log_fitstatistics; Passo=_N_;

Page 78: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

78

if Criterion eq 'AIC' then call Symput ('AIC',InterceptAndCovariates); if Criterion eq '-2 Log L' then call Symput ('_2LogVero',InterceptAndCovariates); run; %PUT AIC=&AIC e Verosimilhança=&_2LogVero; *; *Colocá-las numa linha informativa do Passo; data Step.X_info2; set Step.X_info Step.infoPasso_&Passo; run; *; *----------------------------------------; *VALIDAÇÃO DOS SINAIS DOS COEF. DO MODELO; *----------------------------------------; %validarTendencia run; *->>>>>>>MACRO8; *...se sinalOK=1 tudo bem, mas se for =0 o modelo contraria teoria económica; %PUT SinalOK= &sinalOK; *; *VALIDAÇÃO DE CORRELAÇÕES ENTRE VARIÁVEIS DO MODELO; *-----------------------------; %analizaCorrel(studyVar=&varTeste,BDcorrel=Step.A_Correl)run; *->>>>>MACRO9; *Se correlSTATUS=0 o modelo é válido... senão assume o valor 1; %PUT correlSTATUS= &correlSTATUS; *; *----------------------------------------; *APLICAÇÃO DOS TESTES DE WALD SOBRE VARIÁVEIS MODELO; *-----------------------------; %testeWald(MaxWALD=&p_Wald_max,studyVar=&varTeste);run; *->>>>>>>MACRO10; *...a macro-var "varOUT" contém as variáveis não significativas do passo; %PUT Variáveis Não-Significativas: &varOUT; *; *---------------------------------; data Step.X_info3; set Step.X_info2; *Selecção de apenas 1 linha; Where Passo=1 and varIN=""; Variaveis_Modelo="&varModelo"; AIC="&AIC"; _2LogVero="&_2LogVero"; varIn="&varIn"; naoSignif="&varOUT"; Passo=Passo*&Passo; if &sinalOK eq 1 then Tend_Validas="Sim"; if &sinalOK eq 0 then Tend_Validas="Não"; if &correlSTATUS eq 1 then Correl_Validas="Não"; if &correlSTATUS eq 0 then Correl_Validas="Sim"; run; *------------------------------; data Step.infoPasso_&Passo; set Step.infoPasso_&Passo Step.X_info3; run; *--------------------------------;

Page 79: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

79

*** Limpeza de DataSets ***; proc datasets library=Step; delete X_info X_info2 X_info3; run; *******************; %MEND getInformacao; ************************** FIM MACRO7 *****************************************; ************************** MACRO6 ********************************************; *Dando, BD com variáveis, lista de var. estudo e indicação var categóricas; *computa a regressão logística fornecendo uma série de outputs; %MACRO Logistica(BDAnalise,studyVar,indicaCateg); * Cálculo da Regressão Logística; *; * Codificação Dummy (0/1), referencia:LAST categoria; *descending REF=LAST; proc logistic DATA=&BDAnalise; CLASS &indicaCateg / PARAM=REFERENCE; MODEL &Score=&studyVar; ODS output Logistic.ParameterEstimates=Step.Log_ParameterEstimates Logistic.GlobalTests=Step.Log_GlobalTests Logistic.FitStatistics=Step.Log_FitStatistics Logistic.ConvergenceStatus=Step.Log_ConvergenceStatus Logistic.ModelInfo=Step.Log_ModelInfo Logistic.Type3=Step.Log_TypeIII; run; *; *ordenaçao das variaveis a apresentar; data Step.Log_ParameterEstimates_Ordem; set Step.Log_ParameterEstimates; ordem=substr(variable,4); ordem=input(ordem,best4.); if ordem=. then ordem=0; run; proc sort data=Step.Log_ParameterEstimates_Ordem out=Step.Log_ParameterEstimates (drop= ordem); by ordem classval0; run; *fim de ordenação; *Obtenção do AIC referente ao modelo estimado; data _NULL_; set Step.Log_fitstatistics; Passo=_N_; if Criterion eq 'AIC' then call Symput ('AIC',InterceptAndCovariates); run; *; %MEND Logistica; ************************** FIM MACRO6 *****************************************; ************************** MACRO5 ********************************************;

Page 80: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

80

*Esta Macro selecciona em cada Passo o Melhor Modelo (MAIOR VEROSIMILHANÇA); %MACRO seleccionarModelo; * Seleccionar do Melhor Modelo do Passo - Crité. Verosim.; *; %PUT Antes deste passo as variáveis NO MODELO eram: &varModelo; %PUT Antes deste passo as variáveis FORA do MODELO eram: &varFora; *Inicialização das VARIÁVEIS com INFORMAÇÃO de FINAL do PASSO; %LET MenorVero=99999999.99; %LET varToEnter= ; *Detecção do número de variáveis fora; %LET nVarToTest=; %avalNumVarMacroVar(MacroVar=&varFora)run; *->>>>>MACRO18; %LET nVarToTest=&nVarMacro; *"&nVarMacro" indica o número de variáveis; *; %LET K=1; %DO %WHILE (&K le &nVarToTest); *TESTE: NO FINAL SUBSTITUIR POR ->(&K le &nVarToTest); *; *Inicialização das varIN e varOUT; %LET varIN=; %LET varOUT=; *; %LET VarIn=%SCAN(&varFora,&K); %PUT Iteracção:&K , Variável Introduzida:&VarIn; %LET varTeste=&varModelo &varIn; *Corre-se Procedimento da Logística...; %Logistica(BDAnalise=Step.A_Base,studyVar=&varTeste,indicaCateg=&Categ) run;*->>>>MACRO7; *Retira-se a informação referente a este modelo; %LET sinalOK=0;%LET correlSTATUS=0;*inicializações; %getInformacao run; *->>>>>>>MACRO8; *; *--- Verificação de qual o melhor modelo feita iteractivamente; *; *Caso o sinal coincida com teórico (&sinalOK=1)... apenas neste caso; *Caso as var em análise não sejam correlacion.(&correlSTATUS=0)... apenas neste caso; *Atenção que _2LogVero=-2Log(Verosimilh.) - logo pretende-se o modelo de "_2LogVero" *miníma que corresponde a Verosimilhança Máxima; %IF &_2LogVero lt &MenorVero AND &sinalOK eq 1 AND &correlSTATUS eq 0 %THEN %DO; %LET MenorVero=&_2LogVero; %LET varToEnter=&varIn; %END; *; %LET K=%EVAL(&K+1); %END; ****************; *; proc datasets library=Step; delete Log_fitstatistics Log_globaltests Log_modelinfo Log_TypeIII Log_parameterestimates Log_ParameterEstimates_Ordem;

Page 81: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

81

run; *; %PUT Neste passo deu entrada no modelo: &varToEnter, tendo o modelo Verosimilhança: &MenorVero; *; %MEND seleccionarModelo; ************************** FIM MACRO5 *****************************************; ************************** MACRO4 ********************************************; *Esta Macro INICIALIZA o próximo Passo; %MACRO actualizaPasso; * Processo de incrementação dos sucessivos passos; *Actualização do Passo; %LET Passo=%EVAL(&Passo+1); *se Passo=1 contrói-se um dataset que contém informação dos AIC; %IF &Passo eq 1 %then %DO; data Step.Info_AIC; set Step.A_passo_aic_tipo; where 1>2; run; %END; *A cada passo o algoritmo indica o sucedido para cada teste... inicializa-se para cada passo; data Step.infoPasso_&Passo; set Step.A_infopasso_tipo; where 1>2; run; %MEND actualizaPasso; ************************** FIM MACRO4 *****************************************; ************************** MACRO3 ********************************************; * Macro que permite num Dataset: Index/Score/Variaveis, obter #Variaveis; %macro N_obs_AND_vars(Dset); %local dsid; %global nObs; %global nVars; *abertura do dataset na memória; %LET dsid=%sysfunc(open(&Dset)); *-----------------------; *Número de Observações; %LET nObs=%sysfunc(attrn(&dsid,nObs)); %PUT O Dataset &Dset tem &nObs observações.; *Número de Variáveis + Score + Index; %LET nVars=%sysfunc(attrn(&dsid,nVars)); *número de variáveis real será (nVars-Score-Index); %PUT O Dataset &Dset contém &nVars variáveis.; %PUT Descontando &Index e &Score se for o caso, está-se perante &nVars -&VarNaoContaveis variáveis; *-----------------------; *fecho do dataset da memória; %let dsid=%sysfunc(close(&dsid)); %mend N_obs_AND_vars;

Page 82: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

82

*************************** FIM MACRO 3 **************************************; ************************** MACRO2 ********************************************; * Obter a Lista dos Nomes das Variáveis numa determinada coluna do Dataset; %macro obterVarName(Dset,col); %local dsid; %global NomeVar; %LET dsid=%sysfunc(open(&Dset)); %LET NomeVar=%sysfunc(varname(&dsid,&col)); %LET dsid=%sysfunc(close(&dsid)); %PUT Na coluna &col das Variáveis no Dataset &Dset está: &NomeVar; %mend obterVarName; *************************** FIM MACRO 2 **************************************; ************************** MACRO1 ********************************************; * Macro que cria uma Macro-Variável com instanciação das variáveis em análise; * VarNaoContaveis - input numérico que indica que das k primeiras variáveis do Dataset não deverão ser lidos os nomes; %macro createMacro_namesOfVars(Dataset,VarNaoContaveis); %global namesOfVars; %LET namesOfVars=; %N_obs_AND_vars(&Dataset);run;*->>>>>>>>MACRO3; %LET S=%EVAL(&VarNaoContaveis+1); * Equivale à coluna 1 das variáveis; %DO %WHILE (&S le &nVars); %obterVarName(Dset=&Dataset,col=&S);run;*->>>>>>>>MACRO2; %LET namesOfVars=&namesOfVars &NomeVar; %LET S=%EVAL(&S+1); %END; %PUT; %PUT A lista de Variaveis em estudo é: &namesOfVars; %mend createMacro_namesOfVars; *************************** FIM MACRO 1 **************************************; ************************* Programa StepWise ********************************; ***************** CÓDIGO DE DIRECCIONAMENTO DO PROGRAMA ********************; ****************************************************************************; ****************************************************************************; ******************** PARAMETRIZAÇÕES DESTE APLICATIVO **********************;

Page 83: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

83

****************************************************************************; *** -------------------------------------------------------------------- ***; *** Colocar cabeçalhos das colunas de Indice e Target - tabela base ***; **; %LET Index=Index; %LET Score=Score; ***; *** -------------------------------------------------------------------- ***; *** Identificação das variáveis Categóricas e Contínuas ---------------- ***; **; %LET allVar=; %LET namesOfVars=; ***; **; %createMacro_namesOfVars(Step.A_base,2);run; *->>>>>MACRO1 ***; **; %LET allVar=&namesOfVars; %LET namesOfVars=; ***; *** -------------------------------------------------------------------- ***; *** Definir variáveis categóricas ***; **; %LET Categ=Var1 Var2; ***; *** -------------------------------------------------------------------- ***; **; %PUT Variáveis em Teste: &allVar; ***; **; %PUT Variáveis Categóricas: &Categ; ***; ** -------------------------------------------------------------------- ***; *** Defin. p-value's teste Wald - Significatividade das Variáveis ------ ***; **; %LET p_Wald_max=0.05; ***; *** -------------------------------------------------------------------- ***; *** Passo a partir do qual o AIC passa a ser considerado na selecção --- ***; **; %LET PassoActivAIC=3; ***; *** -------------------------------------------------------------------- ***; *** Declaração de Macro-Variáveis -----------------------------(Scope)-- ***; **; %LET Tipo_Var=; * Macro: getVarType ***; **; %LET nVarMacro=; * Macro: avalNumVarMacroVar ***; **; %LET FINAL=; * Macro: removeVarFromMacroVar ***; **; %LET sinalOK=; * Macro: validarTendencia ***; **; %LET correlSTATUS=; * Macro: analizaCorrel ***; **; %LET varOUT=; * Macro: testeWald ***; **; %LET varIN=; * Macro: getInformacao ***;

Page 84: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

84

**; %LET AIC=; * Macro: getInformacao ***; **; %LET _2LogVero=; * Macro: getInformacao ***; **; %LET varToEnter=; * Macro: seleccionarModelo ***; **; %LET varTeste=; * Macro: seleccionarModelo ***; **; %LET MenorVero=; * Macro: seleccionarModelo ***; **; %LET newAIC=; * Macro: decisaoPassoAIC ***; **; %LET oldAIC=; * Macro: decisaoPassoAIC ***; **; %LET decisaoAIC=; * Macro: decisaoPassoAIC ***; **; %LET varPasso=; * Macro: actualizaPasso ***; **; %LET varForaPasso=; * Macro: actualizaPasso ***; **; %LET varToGetOut=; * Macro: actualizaPasso ***; **; %LET varModelo=; * Macro: updateModelo ***; **; %LET varFora=; * Macro: updateModelo ***; **; %LET Passo=; * Macro: updateModelo ***; *** -------------------------------------------------------------------- ***; ****************************************************************************; **-***-***-***-***-***-***-***-***-***-***-***-***-***-***-***-***-***-***-** ** INICIALIZAÇÃO DO PROCESSO STEPWISE DE SELECÇÃO DE VARIÁVEIS ** **-***-***-***-***-***-***-***-***-***-***-***-***-***-***-***-***-***-***-**; *INICIALIZAÇÃO ABSOLUTA: *-------------------------------------------------------; *Inicialmente, não existem variáveis no modelo; %LET varModelo= ; *Inicialmente TODAS as variáveis estão FORA do MODELO; %LET varFora=&allVar; *-------------------------------------------------------; *INICIALIZAÇÃO PROCESSO; *-------------------------------------------------------; %LET Passo=0; *-------------------------------------------------------; **-***-***-***-***-***-***-***-***-***-***-***-***-***-***-***-***-***-***-** ** FINAL DO PROCESSO DE INICIALIZAÇÃO **

Page 85: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

85

**-***-***-***-***-***-***-***-***-***-***-***-***-***-***-***-***-***-***-*; ********************************************************************* *** --- NOTAS TEÓRICAS SUBJACENTES À CONSTRUÇÃO DO ALGORITMO: --- *** ********************************************************************* *** Critérios de Entrada: --------------------------------------- *** *** - AKAIKE decresce relativamente ao modelo Passo anterior *** *** - O modelo seleccionado no Passo é aquele com maior Vero *** *** - Sinal dos coeficientes não contraria tendencia teórica *** *** - Não contém variáveis não-significativas - Teste Wald *** *** - Não contém variáveis correlacionadas entre si *** *** Critérios de Saída: ----------------------------------------- *** *** - Teste de Wald - Variáveis Não Significativas *** *** Critérios de Paragem: --------------------------------------- *** *** - varOUT sem variáveis candidatas a "entrar" *** *** - AKAIKE que cresça relativamente ao do Passo anterior *** *** - Não selecção de qualquer variável no Passo (var entra e *** *** sai por Wald) *** *** - Inexistencia de modelos válidos (sinais, correl.) *** ********************************************************************* *********************************************************************; *************************** PROCESSO A REPETIR ATÉ OBTER MODELO *****; %Macro Executar_Stepwise(); %let decisaoAIC=1; %DO %WHILE (&decisaoAIC=1); *Adianta o Passo em 1 unidade; %actualizaPasso;run; *->>>>>>>>>>MACRO4; ***---***---***---***---***---***---***---***---***---***---***---***; %PUT Variáveis Presentes no Modelo ao Início do Passo &Passo: &varModelo; %PUT Variáveis Fora do Modelo (Seleccionáveis): &varFora; *Devolve &varToEnter - modelo seleccionado; %seleccionarModelo;run; *->>>>>>>MACRO5; ***---***---***---***---***---***---***---***---***---***---***---***; *Procede a uma actualização do modelo; *->>>>>>>>>>MACRO4; %actualizaModelo;run; *criar tabela com as decisoes tomadas em cada passo; %LET I=1; %DO %WHILE (&I le &Passo); *tabela auxiliar; data Step.auxil_InfoPasso_Total; set Step.Infopasso_&I;

Page 86: FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA …

86

where Seleccionada='X'; run; *actualizar tabela com as decisoes tomadas em cada passo; %if &I = 1 %then %do; data Step.Log_InfoPasso_Total; set Step.auxil_InfoPasso_Total; run; %end; %else %do; proc sql; create table Step.Log_InfoPasso_Total as select * from Step.Log_InfoPasso_Total outer union corr select * from Step.auxil_InfoPasso_Total; quit; %end; %LET I=%EVAL(&I+1); %END; %END; %Mend Executar_Stepwise; %Executar_Stepwise(); ****************************FINAL DO PROCESSO A REPETIR ATÉ OBTER MODELO *****; *********************************************************************; *EXECUTAR APENAS NO FINAL DE SELECCIONADO O MODELO; * NOTA: Antes de executar o procedimento alterar as paths de output na macro; *; **EXECUTAR APÓS OBTENÇÃO DO MODELO ********* FINAL PROCESSO *********; %finalizeProcess run; *->>>>>>>>>>MACRO17; ******************************************** FINAL PROCESSO *********; ********************************************************************** *** ESTIMAÇÃO INDIVIDUAL DE UM MODELO LOGISTICO ********************** **********************************************************************; /*%Logistica(BDAnalise=Step.A_Base,studyVar=&varTeste,indicaCateg=&Categ)run; *->>>>>>>>>>MACRO6; **********************************************************************;*/

7.3. Ficheiro Excel “Construção da amostra.xls”

Este ficheiro encontra-se em formato electrónico, no CD que acompanha a Tese, com

o mesmo nome (“Modelos Econométricos de Classificação de Rating de Instituições

Financeiras”).