art 020-tese sandra cristina marchiori

UNIVERSIDADE ESTADUAL PAULISTA - UNESP FACULDADE DE ENGENHARIA DE ILHA SOLTEIRA PROGRAMA DE PS-GRADUAO EM ENGENHARIA ELTRICA

Desenvolvimento de um Sistema para Anlise da Estabilidade Transitria de Sistemas de Energia Eltrica via Redes Neurais

Sandra Cristina Marchiori Carlos Roberto Minussi(Orientador)

Tese de Doutorado submetida ao Programa de Ps-graduao em Engenharia Eltrica da

Faculdade de Engenharia de Ilha Solteira UNESP, como parte dos requisitos para a obteno do ttulo de Doutor em Engenharia Eltrica.

Ilha Solteira SP, fevereiro de 2006.

Esta tese de doutorado foi desenvolvida com o apoio (bolsa de estudo e reserva tcnica) da Fundao de Amparo Pesquisa do Estado de So Paulo FAPESP, processo n 01/10689-9. i

Aos meus pais Norival e Odelir. ii

Ao meu marido, Wesley. iii

Agradecimentos

Ao Prof. Dr. Carlos Roberto Minussi, pela orientao precisa, pela confiana e tolerncia demonstradas, que foram fundamentais para a concluso deste trabalho. Aos professores do curso de ps-graduao do departamento de engenharia eltrica, especificamente queles com os quais convivi ao longo do curso, pela experincia e conceitos transmitidos, que contriburam para a execuo deste trabalho. Em particular, agradeo a Prof. Dra. Anna Diva pela presteza e apoio sempre que solicitado. Aos membros da banca de avaliao desta tese (Joo Onofre Pereira Pinto, Arlan Luiz Bettiol, Antonio Padilha Feltrin, Maria do Carmo Gomes da Silveira), pelas valiosas crticas e sugestes que enriqueceram o contedo. Aos colegas da ps-graduao pelos momentos importantes que compartilhamos. Aos funcionrios da seo de ps-graduao, pela ateno e dedicao. Aos funcionrios do Departamento de Engenharia Eltrica DEE, com ateno especial para o setor de informtica e para a secretaria. Aos meus pais, Norival e Odelir, e a meus irmos, Selma e Paulo, por sempre estarem presente em minha vida, apoiando-me e incentivando-me em todos os momentos. Ao meu marido, Wesley, pelo carinho e compreenso nos momentos mais difceis, expresso meus melhores sentimentos. queles que no foram citados, mas que de alguma forma, contriburam para a realizao deste trabalho.

iv

Agradecimento Especial

Fundao de Amparo Pesquisa do Estado de So Paulo FAPESP, pelo auxlio financeiro dado a esta pesquisa (bolsa de estudo e reserva tcnica, processo n 01/10689-9).

v

Biografia da Autora

Nascida em 04 de janeiro de 1977, em Guararapes, estado de So Paulo.

Graduada em Matemtica pela Universidade Federal de Mato Grosso do Sul UFMS, em 1998.

Mestre em Engenharia Eltrica pela Universidade Estadual Paulista UNESP, em 2001.

Autora e co-autora de 05 trabalhos publicados na rea de Estabilidade Transitria de Sistemas de Energia Eltrica.

vi

Resumo

Esta pesquisa apresenta uma metodologia para a anlise da estabilidade transitria de primeira oscilao de sistemas de energia eltrica usando uma rede neural baseada na arquitetura ART (Adaptive Resonance Theory), designada rede neural ARTMAP Euclidiana. A margem de segurana (mtodo da energia) empregada como critrio de anlise de estabilidade transitria, considerando-se, na forma preliminar, o modelo clssico e defeitos tipo curto-circuito trifsico com sada de linha de transmisso. A metodologia proposta est concebida, ainda, com a possibilidade de se considerar modelos mais elaborados (e.g., o modelo de Park), se comparados ao modelo clssico. Esta alternativa pode se tornar exeqvel, por meio do uso de um segundo mdulo neural e de um ndice, para fins de treinamento, gerado considerando-se uma combinao, por exemplo, da margem de segurana (anlise quantitativa / qualitativa com mdia preciso) e de informaes fornecidas por processo de simulao (anlise qualitativa com alta preciso). As arquiteturas ART apresentam as caractersticas de estabilidade e plasticidade, as quais so imprescindveis para a realizao do treinamento e execuo da anlise de forma rpida. A verso ARTMAP Euclidiana proporciona solues mais precisas e mais rpidas, se comparada configurao ARTMAP nebulosa. O funcionamento da rede constitudo por trs fases principais: treinamento (ou aprendizado), anlise e treinamento continuado. A realizao da fase de treinamento requer uma grande quantidade de processamento, enquanto que a fase de anlise efetivada, praticamente, sem esforo computacional. Esta , portanto, a principal justificativa para o uso de redes neurais para a resoluo de problemas complexos que exigem solues rpidas, como o caso de aplicaes em tempo real. O treinamento continuado constitui-se de um procedimento que permite manter, permanentemente, a extrao do conhecimento do problema da anlise de estabilidade transitria a partir do treinamento realizado e informaes disponibilizadas na operao do sistema: resultados das anlises via simulao, etc. Por conseguinte, nesta pesquisa ser, tambm, formulada a rotina referente ao treinamento continuado. A rede neural proposta permite abordar, simultaneamente, vrias topologias da rede eltrica, constituindo, deste modo, uma alternativa de anlise da estabilidade transitria de sistemas reais em tempo real. Como forma de ilustrar a estrutura neural proposta, apresenta-se uma aplicao considerando-se um sistema eltrico (multimquinas) composto por 10 mquinas sncronas, 45 barras e 73 linhas de transmisso. vii

Abstract

This work presents a methodology for transient stability analysis of first swing of electrical energy systems, using a neural network based on ART (Adaptive Resonance Theory), named Euclidean ARTMAP neural network. The security margin (energy method) is used as a criterion for transient stability analysis, considering, in the preliminary form, the classical model and faults like three-phase short-circuit with outage of a transmission line. The proposed methodology is conceived, even that, with the possibility to consider more elaborated models (e.g., the Park model), when compared to the classical model. This alternative can become executable, through the use of a second neural module and an index for training, generated considering a combination, for example, the security margin (quantitative / qualitative analysis with precision average) and information provided by simulation process (qualitative analysis with precision high). The ART neural network presents stability and plasticity characteristics, which are very important for realization of the training and analysis, executed in a very fast way. The Euclidean ARTMAP version gives more accurate solutions and more fast, when compared to the Fuzzy ARTMAP. The performance of neural network is constituted of three principal phases: training (or learning), analysis and continuous training. The training phase needs a great quantity of processing time for the realization, whereas the analysis phase is effectuated almost without computational effort. Therefore, this is the principal justification to use neural network for solving complex problems that need fast solutions, as the case of real time applications. The continuous training is constituted of a procedure that allows to maintain, permanently, the extraction of the knowledge from the problem of the transient stability analysis starting from the accomplished training and available information in the operation of the system: analysis results through simulation, etc. Consequently, in this work it will also be formulated the routine referring to continuous training. The proposed neural network permits to treat, concomitantly, various topologies of the electrical power system, constituting, this way, an alternative to transient stability analysis of systems in real time. To illustrate the proposed neural framing, an application is presented considering an electric system (multimachine) composed of 10 synchronous machines, 45 buses, and 73 transmission lines.

viii

Notao e Simbologia

Letras no estilo negrito, maisculas e minsculas, representam matrizes e vetores, respectivamente. Os vetores seguem a representao por linha, ao invs por coluna como comumente adotada na literatura. Esta opo torna-se mais atrativa quando se empregam redes neurais, baseadas na Teoria da Ressonncia Adaptativa, que se constituem a base do desenvolvimento desta tese. MDL SEE RNA ART CA ng PTi PGi Wcinifs 0

= = = = = = = = = = = =

Mtodo Direto de Lyapunov Sistemas de Energia Eltrica Redes Neurais Artificiais Adaptive Resonance Theory (Teoria da Ressonncia Adaptativa) Centro de ngulos nmero de mquinas sncronas potncia mecnica do eixo da turbina potncia eltrica gerada energia cintica total do gerador mais turbina freqncia nominal do sistema potncia referente s perdas eltricas energia cintica da i-sima mquina sncrona medida na freqncia nominal posio angular do rotor em relao a uma referncia que gira de modo sncrono

Pd i

Wcini0

i

ix

Di

=

um parmetro positivo da mquina sncrona denominado constante de amortecimento do rotor

Hi Pmi Pei Pri

=

constante de inrcia definida por: potncia mecnica de entrada (pu) potncia eltrica de sada (pu) potncia nominal total da i-sima mquina sncrona

s

velocidade sncrona (rad. elt./s) ngulo do rotor da i-sima mquina sncrona referida ao CA (rad. elt.) = ngulo do rotor da i-sima mquina sncrona medida com relao a uma mquina que gira velocidade sncrona (rad. elt.)

i i

PCOA NG

potncia acelerante do Centro de ngulos conjunto de ndices das mquinas que compem o sistema

MrEcrit r Eer

== =

margem de seguranaenergia total crtica do sistema energia total do sistema avaliada no instante de eliminao do defeito (te)

r

=

nmero de contingncias energia total do sistemaenergia cintica energia potencial

E (, ) = Ec () Ep ( )

pPEBS

= =

ponto de equilbrio ps-falta

Potential Energy Boundary Surface (Superfcie Limite de Energia Potencial)

x

D ( ).,.

==

derivada direcional da Energia Potencialproduto interno de dois vetores n-dimensionais;

e

=

norma euclidiana

LTM STM

= = = = =

Long Term Memory (Memria de Longo Prazo) Short Term Memory (Memria de Curto Prazo)campo de pr-processamento de neurnios campo de neurnios que processa os dados de entrada campo de neurnios que agrupa os padres de treinamento em categorias de reconhecimento

F0 F1 F2

ai Tjwj

= = = = = = = = =

parmetro de vigilncia parmetro de escolha taxa de treinamento padro de entrada para a rede ART nebulosa funo escolha vetor de pesos operador nebuloso AND operador de interseo crisp max{Tj : j = 1, ..., M} ndice da categoria escolhida atualizao do vetor de pesos tamanho do retngulo Rj xi

TJ J( w Jnovo )

Rj

v j = u cj

vj uj

= = =

vetor bi-dimensional pertencente ao vrtice de Rj vetor bi-dimensional pertencente ao vrtice de Rj ativao do neurnio vazio (categoria de reconhecimento sem a presena de nenhum padro de entrada)

T0

Xr

vetor padro de entrada da rede neural ARTMAP Euclidiana (entrada do mdulo ARTa) correspondente r-sima contingncia

Pi Qi

= = =

potncia eltrica ativa da i-sima barra do sistema potncia eltrica reativa da i-sima barra do sistema vetor que contm os ndices das contingncias e informao sobre a topologia do sistema, representado em cdigo binrio [0,+1]

r

ns nc

= =

nmero de barras do sistema nmero de bits correspondente ao nmero (ndice) da contingncia e configurao do sistema

PG0 QG0 PL0 QL0

= = = = =

vetor de potncia ativa dos geradores do caso base vetor de potncia reativa dos geradores do caso base vetor de potncia ativa das cargas do caso base vetor de potncia reativa das cargas do caso base potncia ativa no i-simo gerador, fixada aleatoriamente (ou pseudoaleatoriamente)

PGi

(G)

= =

conjunto de barras de gerao percentual de variao da demanda (valores positivos e negativos: por exemplo, PER = 10% correspondem a 90 e 110% do caso base, respectivamente) xii

PER

AGi

=

nmero aleatrio de uma seqncia de NG nmeros gerados a partir de uma semente dada. Variando-se a semente, ter-se- uma seqncia diferente de valores, cujo espectro de variao est compreendido entre 0 e 1: AGi [0, 1]

PLi ALi

= =

potncia ativa na i-sima carga fixada aleatoriamente nmero aleatrio de uma seqncia de NL nmeros gerados a partir de uma semente dada, ALi [0, 1]

(L)

= = = = = = = =

conjunto de barras de cargas esforo de deslocamento da margem de segurana valor da margem de segurana inicial do intervalo valor da margem de segurana final do intervalo intervalo da margem de segurana ndice que indica o k-simo intervalo margem de segurana mnima preestabelecida margem de segurana mxima preestabelecida vetor sada da rede neural ARTMAP Euclidiana (entrada do mdulo ARTb) vetor correspondente ao k-simo intervalo da margem de segurana associada contingncia representada em cdigo binrio

MA MB

IMS kMmin Mmax Y IMS k

Ncmin

=

nmero mnimo de membros que uma categoria, formada na fase de treinamento, deve conter para ser considerada eficiente para realizar uma boa predio

Nmin

=

nmero

mnimo

de

membros

que

uma

categoria

indexada

como

indeterminada deve conter para ser definida como novidade

xiii

Nmax

=

nmero

mximo

de

iteraes

que

uma

categoria

indexada

como

indeterminada, sem ter atingido Nmin, deve aguardar para ser rejeitada como nova informao e eliminada do processo.

xiv

Sumrio

1 2

Introduo ............................................................................................................ Modelo do Sistema ............................................................................................... 2.1 2.2 2.3 2.4 Introduo..................................................................................................... Modelo da Mquina Sncrona ......................................................................

1 6 6 8

Modelo do Sistema Referido ao Centro de ngulos .................................... 12 Concluso ..................................................................................................... 15

3

Anlise de Estabilidade Transitria ................................................................... 16 3.1 3.2 3.3 3.4 Introduo..................................................................................................... 16 Margem de Segurana .................................................................................. 17 Critrio e Algoritmo de Anlise da Estabilidade Transitria ....................... 19 Concluso ..................................................................................................... 21

4

Redes Neurais Artificiais..................................................................................... 22 4.1 4.2 4.3 4.4 4.5 Introduo..................................................................................................... 22 Inspirao Biolgica..................................................................................... 23 Histrico ....................................................................................................... 25 Modelo Artificial .......................................................................................... 26 Caractersticas Gerais das Redes Neurais..................................................... 29 4.5.1 Estrutura da Rede Neural................................................................... 30 4.5.2 Treinamento da Rede Neural ............................................................. 31 4.6 Regras de Adaptao dos Pesos ................................................................... 33 4.6.1 Aprendizagem pela Regra de Hebb ................................................... 34 4.6.2 Aprendizagem pela Regra de Delta ................................................... 35 4.6.3 Aprendizagem Competitiva ............................................................... 35 xv

4.7 5

Concluso ..................................................................................................... 36

Teoria da Ressonncia Adaptativa..................................................................... 37 5.1 5.2 5.3 5.4 5.5 5.6 5.7 Introduo..................................................................................................... 37 Redes Baseadas na Teoria da Ressonncia Adaptativa ................................ 38 Caractersticas Bsicas dos Sistemas ART................................................... 40 Algoritmo ART Nebuloso ............................................................................ 44 Representao Geomtrica do Algoritmo ART Nebuloso ........................... 47 Algoritmo ARTMAP Nebuloso ................................................................... 51 Concluso ..................................................................................................... 53

6

Rede Neural ARTMAP Baseada na Distncia Euclidiana............................... 54 6.1 6.2 6.3 Introduo..................................................................................................... 54 ARTMAP Euclidiana ................................................................................... 55 Concluso ..................................................................................................... 60

7

Anlise de Estabilidade Transitria: Soluo Proposta via Rede ................... 61 Neural ARTMAP Euclidiana 7.1 7.2 7.3 7.4 7.5 Introduo..................................................................................................... 61 Estmulos de Entrada.................................................................................... 62 Estmulos de Sada ....................................................................................... 65 Representao Esquemtica do Trabalho Proposto...................................... 70 Concluso ..................................................................................................... 74 75

8

Algoritmo de Execuo do Treinamento Continuado 8.1 8.2

Introduo..................................................................................................... 75 Algoritmo de Execuo do Treinamento Continuado .................................. 75 8.2.1 Critrio para incluso e rejeio dos dados ....................................... 76

8.3 9

Concluso ..................................................................................................... 78

Aplicao............................................................................................................... 79

xvi

9.1 9.2 9.3 9.3 10

Introduo..................................................................................................... 79 Configurao do Sistema.............................................................................. 79 Resultados Considerando o Treinamento Continuado ................................. 89 Concluso ..................................................................................................... 92

Concluso e Sugestes Para Trabalhos Futuros ............................................... 93 10.1 Concluso ..................................................................................................... 93 10.2 Sugestes para Trabalhos Futuros ................................................................ 94

11

Referncias Bibliogrficas................................................................................... 96 Apndice A Algoritmo Computacional para a Determinao da ................. 103 Margem de Segurana Apndice B Apndice C Dados do Sistema de Energia Eltrica....................................... 105 Artigos Publicados Relacionados com a Pesquisa de............... 110 Doutorado

xvii

Captulo 1

Introduo

A anlise de estabilidade (de ngulo e de tenso) constitui-se num importante procedimento de investigao em sistemas eltricos de potncia. Ela tem por objetivo analisar e executar estratgias que visem garantir o suprimento de energia com qualidade e, ainda, evitar, ou pelo menos, minimizar a interrupo do fornecimento de energia aos consumidores. A estabilidade associadas aos ngulos corresponde estabilidade transitria que consiste na avaliao dos efeitos procedentes de perturbaes que causam grandes e indesejveis oscilaes nos ngulos das mquinas sncronas [Pai, 1981]. Esta anlise pode ser realizada atravs das solues das equaes diferenciais no-lineares que descrevem a dinmica do sistema (equao de oscilao da mquina sncrona) e, posteriormente, via anlise da evoluo da posio angular de cada mquina sncrona ao longo do tempo, constituindo-se na rotina conhecida como simulao [Stott, 1979]. As tcnicas utilizadas para a simulao so precisas e no apresentam restries quanto ao tipo de modelo empregado. Porm, demandam um tempo de CPU considervel, tendo em vista que envolve clculos complexos. Tambm, via de regra, fornece somente a informao qualitativa, ou seja, o sistema estvel ou instvel para uma determinada contingncia. Este tipo de informao nem sempre til operao, principalmente nos casos instveis em que se faz necessria a adoo de medidas preventivas (realocao de gerao, corte de carga, etc.), as quais so quantificadas em funo do conhecimento de quanto (informao quantitativa) instvel o sistema. Um procedimento alternativo consiste na obteno da anlise sem resolver tais equaes diferenciais. Neste contexto, encontra-se o Mtodo Direto de Lyapunov (MDL), cujos resultados so considerados satisfatrios quando se emprega, principalmente, o modelo clssico [Pai, 1981]. Tendo em vista a grande quantidade de defeitos a serem analisados, a complexidade e a grande dimenso dos atuais Sistemas de Energia Eltrica (SEE), a simulao, assim como o mtodo direto de Lyapunov, so alternativas que ainda no1

oferecem totais condies para aplicaes em tempo-real. Novas abordagens de anlise, baseadas na inteligncia artificial, em especial as redes neurais, tm sido abordadas na literatura com o propsito de superar tais dificuldades. Assim sendo, este trabalho visa investigar a aplicao de Redes Neurais Artificiais (RNA) na anlise da estabilidade transitria de SEE. As contingncias consideradas neste trabalho so defeitos de curto-circuito trifsico equilibrado com sada de linha de transmisso. Esta proposta permite, ainda, considerar vrias topologias da rede eltrica que, certamente, um cenrio mais plausvel, do ponto de vista da operao, se comparado a uma nica topologia como comumente adotado na literatura. Trata-se, por conseguinte, de um procedimento inovador, no contexo de aplicaes de redes neurais, se comparado s demais propostas atualmente disponveis. A anlise de estabilidade transitria, utilizando redes neurais, tem sido feita de forma geral via emprego de redes feedforward, com treinamento baseado no algoritmo retropropagao (backpropagation). Esta tcnica tem se mostrado eficiente, sendo considerada, pela literatura especializada, como um benchmark em termos de preciso. Contudo, o tempo de processamento relativamente alto. Ressalta-se que na literatura especializada encontram-se poucas referncias que abordam o problema da anlise de estabilidade atravs do emprego de redes neurais [Marchiori et al., 2002; Minussi et al., 2001; Pao & Sobajic, 1991; Silveira et al., 2003], entre outras referncias. Desta forma, pretende-se investigar o uso da rede neural ARTMAP Euclidiana [Vuskovic & Du, 2002a]. Esta rede faz parte de um conjunto de propostas (ART, ART1, ART2 e ARTMAP) [Carpenter et al., 1992] destinadas classificao de padres binrios e/ou analgicos, com treinamento supervisionado ou no-supervisionado. A rede ARTMAP uma arquitetura baseada no treinamento supervisionado para mapeamentos multientradas e multisadas. A rede ART (Adaptive Resonance Theory ) [Carpenter et al., 1992] possui a caracterstica de estabilidade (capacidade de aprender atravs do ajuste dos seus pesos) e plasticidade (capacidade de continuar a aprender com a incluso de novos padres sem perder a memria com relao aos padres anteriores). A rede ARTMAP Euclidiana foi proposta na literatura como alternativa para superar algumas dificuldades operacionais encontradas nas redes neurais da famlia ART. Os dados de entrada para a rede, diferente da rede neural ARTMAP, no so necessariamente normalizados e codificados, o que reduz, metade, a dimenso do vetor de entrada e diminui o tempo de execuo do treinamento e anlise. A preciso dos resultados tambm melhorada com essa concepo, pois a representao geomtrica das categorias da rede neural, que antes era de hiper-retngulos, passa a ser2

representada por crculos, que, em muitos casos, pode ser a melhor forma para agrupar dados. Outra vantagem do emprego desta estrutura neural, refere-se propriedade de realizao do treinamento de forma continuada. Com este recurso, a rede neural pode ser treinada de modo off-line, considerando um conjunto de pares treinados gerado por um programa computacional professor, e permanentemente atualizado o treinamento, a partir de bases de dados ou dados simulados junto as empresas do setor eltrico. Este procedimento, a princpio pode ser implementado, via redes neurais da famlia ART, tendo em vista que uma arquitetura plstica e de funcionamento (treinamento, treinamento continuado e anlise) com tempo de execuo baixssimo, sendo, portanto, compatvel com aplicaes on-line. Visando ilustrar o mtodo proposto apresentam-se os resultados considerando-se um sistema multimquinas. Nesta tese de doutorado ser dada uma ateno especial ao desenvolvimento da rede neural, como anteriormente esboada, tendo em vista que ela dever ser bastante til, tambm, para a resoluo de outros problemas de engenharia eltrica, assim como de outras reas do conhecimento humano. Assim sendo, as principais contribuies desta pesquisa podem ser resumidas nos seguintes itens: 1. desenvolvimento de uma metodologia neural para anlise de estabilidade transitria, baseada na rede neural ARTMAP Euclidiana. Esta arquitetura tem proporcionado a obteno de resultados mais precisos e mais rpidos, em comparao arquitetura ARTMAP nebulosa [Silveira, 2003]. A maior rapidez se observa por usar vetores padres de entrada de dimenso equivalente a 50% da dimenso de tais vetores usados na verso ARTMAP nebulosa, ou seja, no h necessidade de duplicao da dimenso como estabelecida na rotina codificao complementar da famlia ART nebulosa; 2. so consideradas as anlises de sistemas para diferentes topologias e diferentes perfis de gerao / carga do sistema. Esta representao possibilita a anlise de sistemas de forma mais realista, em comparao aos habituais procedimentos adotados na literatura especializada; 3. proposto, tambm, um esquema que permite contemplar o treinamento continuado, ou seja, o treinamento realizado considerando-se um pequeno conjunto de dados, o suficiente para que a rede neural tenha atingido o aprendizado de forma satisfatria. Posteriormente, durante o processo de anlise, a intensificao do treinamento ser efetivada, atravs de um mecanismo similar adaptao de pesos na fase de treinamento,3

toda vez que o algoritmo julgar importante a incluso de novos padres na base de dados sinpticos (memria neural). Acredita-se que este mecanismo permitir realizar a anlise de estabilidade transitria em tempo real considerando-se modelos mais elaborados, se comparados ao modelo clssico, por exemplo, o modelo completo de Park [Anderson & Fouad, 2003]. Com isto poder ser possvel gerar funes complexas (ndices de estabilidade), tambm, por meio de uma segunda rede neural, que contemple a composio da informao quantitativa (algum ndice baseado na margem de segurana) e da informao qualitativa fornecida, por exemplo, por processo de simulao. Na simulao, a informao produzida constitui-se na indicao de que certa contingncia, associada determinada topologia, perfil de gerao e carga, estvel ou instvel. Da decorre o fato de ser uma tcnica de anlise qualitativa. Assim sendo, este texto est organizado em captulos e apndices, cujos contedos so assim descritos: Captulo 2. Apresentar-se- o modelo dinmico, com vistas anlise de estabilidade transitria de sistemas eltricos de potncia, representado pelo modelo clssico. Captulo 3. Ser apresentado o critrio de anlise da estabilidade transitria baseado no conceito de energia total do sistema. Captulo 4. Sero apresentados os principais conceitos sobre redes neurais artificiais. Captulo 5. Sero abordados os principais conceitos sobre as redes neurais baseadas na teoria da ressonncia adaptativa. Captulo 6. Ser apresentada a formulao da rede neural ARTMAP baseada na distncia Euclidiana que constitui o contedo principal desta pesquisa. Captulo 7. Sero estabelecidas as entradas e sadas que sero usadas no treinamento da rede neural ARTMAP Euclidiana. Captulo 8. Ser apresentada uma proposta para a realizao do treinamento continuado, baseado no conceito de deteco de novidade, bem como de anomalia, no contexto das redes neurais ART descendentes.

4

Captulo 9. Apresentar-se-o os resultados da anlise da estabilidade transitria, atravs da rede neural ARTMAP Euclidiana, considerando-se uma verso do sistema da regio sul do Brasil, composta por 45 barras, 73 linhas de transmisso e 10 mquinas sncronas. Captulo 10. Sero apresentadas as concluses. Captulo 11. Encontram-se relacionadas as referncias bibliogrficas. Apndice A. apresentado o algoritmo computacional para o clculo da margem de segurana. Apndice B. Dados do Sistema Teste (verso do sistema eltrico de potncia da regio sul do Brasil). Apndice C. Trabalhos completos publicados que esto relacionados com a pesquisa de doutorado.

5

Captulo 2

Modelo do Sistema

2.1 Introduo

Apresenta-se, neste captulo, o modelo que descreve a dinmica do sistema de energia eltrica, considerando-se as grandes oscilaes (grande aumento de carga, perda de equipamento eltrico, curto-circuito, etc.). Trata-se do modelo da mquina sncrona e sua integrao ao sistema. Este modelo representado por equaes algbricas e diferenciais nolineares. A anlise deste modelo permite inferir sobre a estabilidade do sistema. Os defeitos a serem considerados so curtos-circuitos trifsicos combinados com a sada das linhas sob defeito. Esta idealizao baseada na observao de que um curto-circuito causado por descarga atmosfrica, que incide sobre o sistema de transmisso, ocorre em linha exposta, visto que os demais equipamentos encontram-se protegidos. Deste modo, quando ocorrer este evento, para fins de simplificao, transfere-se o defeito para o barramento mais prximo. A eliminao do defeito consiste, ento, na retirada de operao, via proteo do sistema, da linha onde ocorreu a descarga atmosfrica que rompeu o isolamento e provocou o curtocircuito. O curto-circuito trifsico adotado por ser o mais severo, ainda que a sua ocorrncia seja a mais rara entre todos os tipos de curtos-circuitos. Considerando-se o caso mais severo, permite efetuar a anlise para a situao mais crtica. O objetivo desta pesquisa investigar a aplicao de redes neurais artificiais (rede neural da famlia ART [Carpenter et al., 1992]) para a realizao da anlise de estabilidade transitria, mais especificamente, a rede neural ARTMAP Euclidiana [Vuskovic & Du, 2002a]. Considera-se a anlise de estabilidade de primeira oscilao onde se pode empregar o chamado modelo clssico [Anderson & Fouad, 2003; Pai, 1981; Fouad & Vittal, 1992; Pavella et al., 2000]. A opo por esta abordagem mais simples de modelo deve-se ao fato de que, para extrair o conhecimento deste problema, via redes neurais, necessrio impor uma6

rotina de dados que constitui a fase de treinamento da rede. Estes dados devem conter informaes quantitativas e qualitativas de cada uma das contingncias. Para efetivamente constituir uma boa capacidade de generalizao (anlise de situaes no previstas nos casos simulados), faz-se necessria a utilizao de um grande nmero de dados de entrada e de sada para a fase do treinamento da rede neural. Para atender estas caractersticas, no momento, salvo melhor julgamento, somente podem ser proporcionados quando se utilizam os mtodos diretos de anlise, mais especificamente, os mtodos de energia [EPRI, 1981; Pai, 1981; Fouad & Vittal, 1992]. Estes mtodos, embora tenham apresentado grande evoluo nos ltimos anos, ainda h carncia de resultados prticos para modelos mais elaborados. Deve-se destacar que a simulao (resoluo do sistema de equaes algbricas/diferenciais no-lineares e exame das solues obtidas) considerada, pela literatura especializada, um benchmark de anlise de transitrios eletromecnicos. Nesta metodologia, pode-se simular qualquer modelo (qualquer que seja a sua sofisticao). Contudo, o grande obstculo reside na obteno somente da anlise qualitativa, ou seja, a informao se o sistema ou no estvel para uma contingncia em particular. No possvel, a princpio, a menos que se empregue o mtodo de tentativa e erro, saber quanto estvel ou instvel o sistema. Alm disto, os mtodos de simulao consomem grande quantidade de tempo para a anlise, isto porque empregam, entre outras rotinas, mtodos de integrao numrica, registros das curvas de oscilao, etc., tudo isto efetuando uma simulao por vez. Em vista disto, nesta pesquisa, ser abordado o problema da anlise de estabilidade transitria atravs de redes neurais, levando-se em conta o modelo clssico. Os dados de entrada e de sada sero fornecidos por um programa computacional que foi implementado baseado na proposta apresentada na referncia [Fonseca & Decker., 1985], que uma metodologia que emprega a resoluo das equaes diferenciais (mtodo indireto) e o mtodo da energia (mtodo direto). Este mtodo , portanto, hbrido e iterativo pois fornece o clculo da margem de segurana (e o tempo crtico) do sistema para uma lista preestabelecida de contingncias. Os resultados so bastante precisos, cujos erros observados so apenas procedentes de arredondamentos e da tolerncia adotada. Deve-se ressaltar que no h restrio quanto a adoo de modelos mais elaborados, inclusive, via simulao, para a abordagem via redes neurais. Apenas preciso evidenciar a necessidade de resultados mais completos (saber quanto estvel ou instvel o sistema frente a uma certa perturbao). Se utilizada a simulao como gerador dos estmulos7

de entrada/sada, a informao que se poderia obter da rede neural seria apenas: o sistema estvel, ou o sistema instvel associado a cada contingncia. Quando se emprega o modelo clssico e um mtodo de anlise fundamentado na funo energia do sistema, a representao dos ngulos das mquinas sncronas, referidas ao Centro de ngulos (CA) [Epri, 1981; Pai, 1981; Fouad & Vittal, 1992], constitui a melhor opo [Athay et al., 1979], visto que as perdas eltricas, que so o grande obstculo para a aplicao dos mtodos da energia, podem ser mais facilmente incorporadas no modelo. Esta ser, ento, a alternativa a ser seguida nesta pesquisa.

2.2 Modelo da Mquina Sncrona

Considerao 1. Defeito. Considera-se, nesta pesquisa, defeito como sendo um curto-circuito trifsico, equilibrado, metlico e incidente em um barramento do sistema, cuja extino dar-se- com a retirada definitiva de operao de uma linha de transmisso (ou seja, no retornando mais operao), por meio da atuao do sistema de proteo com a abertura de rels.

Assim sendo, as equaes que descrevem o comportamento dos geradores so conhecidas como equaes de oscilao. So equaes diferenciais que consideram, por exemplo, as posies angulares das mquinas, a velocidade de resposta ao distrbio, se este for equilibrado ou desequilibrado [Elgerd, 1971]. Considere, portanto, um sistema composto de ng mquinas sncronas, sendo que PTi a potncia mecnica do eixo da turbina e PGi a potncia eltrica gerada. Se estas duas potncias forem iguais, desprezadas as perdas, o gerador estar funcionando com velocidade sncrona constante [Elgerd, 1971]. Caso contrrio, se existir uma diferena, esta diferena ser usada para mudar a energia cintica ou a velocidade e dominar o conjugado de amortecimento nos enrolamentos de amortecimento.

8

A equao matemtica de acordo com as referncias [Elgerd, 1971], [Kundur, 1994] e [Venikov, 1970] pode ser expressa como:

PTi PGi =

d (Wcini ) + Pd i dt

(2.2.1)

sendo:

Wcini

energia cintica total do gerador mais turbina

f = i0 Wcini0 ; f f0 Pd i= freqncia nominal do sistema; = potncia referente s perdas;

2

(2.2.2)

Wcini0

= energia cintica da i-sima mquina sncrona medida na freqncia nominal.

A freqncia fi pode ser expressa, considerando-se as variaes em torno da freqncia nominal, da seguinte forma:

fi = f 0 + fi .Ento: f 0 + fi Wcini0 Wcini = 0 f 2

(2.2.3)

(2.2.4)

f f = 1 + 2 0 i + 0 i f f

2

0 Wcini .

Como as variaes de freqncia fi so pequenas, pode-se usar a seguinte aproximao:9

f Wcini 1 + 2 0 i Wcini0 . f

(2.2.5)

A derivada temporal da energia cintica total da i-sima mquina sncrona pode ser expressa por [Elgerd, 1971]: 2Wcini0 d d (Wcini ) = fi . dt f 0 dt

(2.2.6)

Como [Elgerd, 1971]:

fi =ento:

1 d ( i ) 2 dt

(2.2.7)

d2 d fi = 2 dt dt

1 i 2

(2.2.8)

1 d 2 i = 2 dt 2 sendo:

(2.2.9)

i

= posio angular do rotor em relao a uma referncia que gira de modo sncrono. Substituindo (2.2.9) em (2.2.6), obtm-se:0 2 d (Wcini ) = Wcin0i d i . dt f dt 2

(2.2.10)

Deve-se observar que, havendo desvios da velocidade do rotor em relao velocidade sncrona, haver a induo de correntes nos enrolamentos de amortecimento do rotor, as quais causam foras que tendem a impedir os movimentos. Este conjugado tende a crescer com a velocidade relativad i , de tal forma que [Elgerd, 1971]: dt10

Pd i Di

d i dt

(2.2.11)

sendo:

Di

= um parmetro positivo da mquina, denominado constante de amortecimento do rotor. Considerando as equaes (2.2.10) e (2.2.11), a equao (2.2.1) pode ser escrita

da seguinte forma:

Wcini0 d 2 i d PTi PGi = + Di i . 0 2 dt f dt

(2.2.12)

Colocando a equao (2.2.12) em pu (por unidade), uma vez que dada em MW, cuja base adotada a potncia nominal da i-sima mquina sncrona, tem-se [Elgerd, 1971]:

H i d 2 i d Pmi Pei = + Di i 0 2 dt f dt

(2.2.13)

sendo:

Hi

constante de inrcia definida por: Wcini0 ; = Pri

(2.2.14)

Pmi

potncia mecnica de entrada (pu)PTi ; Pri

=

(2.2.15)

Pei

potncia eltrica de sada (pu)PGi ; Pri

=

Pri

= potncia nominal total da i-sima mquina sncrona.11

Adaptando-se estas equaes ao modelo clssico, e desconsiderando o amortecimento, tem-se as seguintes equaes, apresentadas na Seo 2.3, que descrevem o comportamento dinmico das mquinas sncronas referidas ao Centro de ngulos.

2.3 Modelo do Sistema Referido ao Centro de ngulos

O comportamento dinmico da i-sima mquina pode ser descrito pela seguinte equao diferencial (equao de oscilao da mquina sncrona) [Anderson & Fouad, 2003; Pai, 1981]:

Mi

d 2 i g i ( ) = 0, i NG dt 2

(2.3.1)

sendo:

g i ( )

= Pmi Pei ( M i PCOA) / MT ;2H i

(2.3.2)

Mi

=

s

;

s

velocidade sncrona (rad. elt./s)= 2 f 0 ;

i

ngulo do rotor da i-sima mquina sncrona referida ao CA (rad. elt.)= i 0 ;

i

= ngulo do rotor da i-sima mquina sncrona medida com relao a uma mquina que gira velocidade sncrona (rad. elt.);

0

=

j NG

M

j

j ;

12

PCOA potncia acelerante do CA=

j NG

(Pm Mj

j

Pe j ) ;

MT

=

;

j NG

NG

{1, 2, ..., ng }

= conjunto de ndices das mquinas que compem o sistema;

ng

= nmero de mquinas sncronas.

A potncia eltrica usada na equao (2.3.2), considerando-se as simplificaes introduzidas no modelo clssico, pode ser calculada de vrias formas. Uma delas e mais comum consiste em realizar o clculo, a partir da matriz de admitncia reduzida s barras internas de gerao, como proposto em [Anderson & Fouad, 2003; Pai, 1981]. Trata-se de um procedimento rpido do clculo da potncia eltrica, principalmente, quando esta se refere condio de defeito (perodo de permanncia do curto-circuito) e ps- defeito (eliminao do defeito com sada da linha de transmisso), empregando o mtodo proposto na referncia [Minussi & Freitas Filho, 1998]. O modelo do sistema referido ao centro de ngulos (equao (2.3.1)) apresenta as seguintes propriedades:

Propriedade 1. A potncia acelerante do centro de ngulos, quando calculada no ponto de

equilbrio estvel, nula [Pai, 1981; Minussi, 1990].

Propriedade 2. O somatrio do produto da posio angular pela inrcia de cada mquina

sncrona do sistema igual a zero, ou seja [Pai, 1981; Minussi, 1990]:

13

j NG

M

j

j = 0.

(2.3.3)

Propriedade 3. O somatrio do produto da velocidade angular pela inrcia de cada

mquina sncrona do sistema igual a zero, ou seja [Pai, 1981; Minussi, 1990]:

j NG

M

j

j = 0.

(2.3.4)

A Propriedade 1 estabelecida a partir da formulao do problema do fluxo de potncia que determinado fazendo-se (Pm Pe = 0) para todas as mquinas que compem o sistema. Isto representa a obteno de um ponto de operao (equilbrio). Deste modo, conclui-se que a PCOA nula quando avaliada em um ponto de operao estvel do sistema. A PCOA ser diferente de zero sempre que houver deslocamento do estado em torno do ponto de equilbrio, ou seja, durante as oscilaes eletromecnicas. Da Propriedade 2 conclui-se que os ngulos is so linearmente dependentes. O mesmo ocorre com as velocidades is (Propriedade 3). Por conseguinte, o conhecimento de (ns 2) variveis de estado do sistema permite o clculo das duas variveis restantes utilizando-se as equaes (2.3.3) e (2.3.4). Estas propriedades sero teis na determinao da funo energia total do sistema, como ser abordada no Captulo 3. Outras definies e termos utilizados em problemas de estabilidade de sistemas de energia eltrica podem ser encontrados na referncia [IEEE Task Force, 1982]. Trata-se de um importante texto de referncia nesta rea de conhecimento.

14

2.4 Concluso

Foi apresentado, neste captulo, o modelo clssico que representa a dinmica das mquinas sncronas em sistemas interligados. Este modelo visa inferir sobre a anlise de estabilidade transitria de sistemas eltricos de potncia no perodo conhecido como de primeira oscilao. Este modelo encontra-se referido ao centro de ngulos que uma forma bastante adequada e pertinente, quando se emprega metodologia de anlise via mtodos diretos (ou similares), pois permite a incluso dos efeitos das perdas. No modelo clssico, com reduo s barras internas de gerao, estas perdas representam as perdas procedentes dos equipamentos eltricos, principalmente da transmisso, e de uma parcela importante referente s cargas. Neste caso, no consider-las resultaro em erros significativos a ponto de prejudicar ou invalidar as anlises. Portanto, a incluso destas perdas um item de grande importncia. Este modelo ser utilizado nos prximos captulos em que ser apresentado o mtodo de anlise e sero realizadas as simulaes, com o propsito de gerar as informaes de entrada e sada para a execuo do treinamento da rede neural.

15

Captulo 3

Anlise de Estabilidade Transitria

3.1 Introduo

A anlise de estabilidade transitria de sistemas de energia eltrica tem como objetivo verificar o comportamento destes sistemas, aps a ocorrncia de uma perturbao do tipo curto-circuito, desligamento de linha de transmisso, perda de unidades geradoras, etc. Esta anlise pode ser realizada, por exemplo, via simulao passo a passo no domnio do tempo, o que requer a soluo de dois conjuntos de equaes provenientes da modelagem dos diversos componentes do sistema: um conjunto de equaes diferenciais que descrevem basicamente os geradores sncronos e seus controles; e um conjunto de equaes algbricas que representam os estatores das mquinas sncronas, rede de transmisso e cargas. Atualmente, a simulao atravs da integrao numrica a melhor ferramenta disponvel, por permitir a representao de modelos mais abrangentes e fornecer resultados confiveis. As limitaes ficam por conta do esforo computacional envolvido e pela ausncia de resultados que informem o grau de estabilidade ou instabilidade. Outras alternativas de anlise so os mtodos diretos de resoluo, que exigem menor custo computacional, mas por outro lado, tm como desvantagem a dificuldade de modelar os vrios componentes do sistema. Neste captulo, apresenta-se o conceito de margem de segurana, que um ndice que aponta o grau de estabilidade ou instabilidade do sistema aps a ocorrncia de uma falha, o critrio e algoritmo para a anlise de estabilidade transitria, baseada em uma metodologia hbrida que combina o Mtodo Direto de Lyapunov (MDL) e a resoluo das equaes diferenciais, considerando defeito correspondente a um curto-circuito com sada de operao de linha de transmisso.16

3.2 Margem de Segurana

O diagnstico da estabilidade transitria de Sistemas de Energia Eltrica, considerando-se uma contingncia de ndice r, pode ser efetuado atravs do emprego do conceito da margem de segurana definida por [Fonseca & Decker, 1985; Fouad & Vittal, 1992]:Mr = Ecrit r Eer Ecrit r

(3.2.1)

sendo:Ecrit r Eer

= energia total crtica do sistema; = energia total do sistema avaliada no instante de eliminao do defeito (te).

A margem de segurana pode ser interpretada como uma medida de distncia em relao situao de instabilidade do sistema [Freitas Filho, 1996]. A estabilidade do sistema para a r-sima contingncia pode ser avaliada, mediante o emprego do conceito da margem de segurana, atravs do seguinte critrio [Athay et al., 1979; Fonseca & Decker, 1985; Freitas Filho, 1996; Minussi, 1990; Minussi & Freitas Filho,1998]:

Mr < 0, Mr 0,

o sistema instvel do ponto de vista da estabilidade transitria; o sistema estvel do ponto de vista da estabilidade transitria.

Ressalta-se que, quando so consideradas as condutncias de transferncia, a expresso (2.3.2) no se caracteriza como fora potencial [Minussi, 1990], conseqentemente, no possvel determinar uma funo energia potencial do sistema representada pela primeira integral do movimento que se constitui dependente do caminho de integrao, descaracterizando-a como energia potencial. Porm, por abuso de linguagem, nesta pesquisa,17

o termo energia total do sistema ser utilizado sempre que houver referncia funo tipo energia. Por conseguinte, a energia total relativa ao sistema (2.3.1) dada por [Athay et al., 1979; Pai, 1981; Fonseca & Decker, 1985; Minussi, 1990; Freitas Filho, 1996; Minussi & Freitas Filho, 1998]:E ( , ) = Ec () + Ep ( )

(3.2.2)

sendo:Ec () energia cintica

=

1 M i i2 2 i NG

;

(3.2.3)

Ep ( ) energia potencial

=

i NG

i

g i ( ) d i .

(3.2.4)

ip

O superescrito (p) refere-se ao ponto de equilbrio ps-defeito e g i ( ) dada pela equao (2.3.2). Desenvolvendo a expresso referente a energia potencial, obtm-se [Minussi, 1990; Freitas Filho, 1996]:i i i

Ep( ) =

iNG pi

Pm d + Pe d + (Mi i iNG pi

i

i

iNG pi

i

/ MT )PCOA d i .

(3.2.5)

Como a potncia mecnica considerada constante (desconsidera-se a ao do regulador de velocidade) e utilizando-se da Propriedade 3 (o terceiro membro de (3.2.5) tornase nulo) a energia total do sistema dada por [Athay,1979; Fonseca & Decker, 1985; Pai, 1981; Minussi, 1990]:

E ( , ) =

1 M i d i + Pmi 2 i NG i NG

(

i

i p d i +

)

i NG p i

Pe di

i

i

.

(3.2.6)

18

Observa-se que, em funo da considerao das condutncias de transferncia, a funo energia total do sistema (equao (3.2.6)) dependente do caminho de integrao [Fonseca & Decker, 1985; Pai, 1981; Minussi, 1990]. Para solucionar este problema, ser tomada a seguinte medida: avaliar-se- a integral medida que se conhece a evoluo dos ngulos das mquinas. Portanto, o caminho de integrao entre dois pontos quaisquer conhecido, assim a integral facilmente determinada. Esta formulao no introduz erros significativos e a integral avaliada fazendo-se uso da regra trapezoidal [Fonseca & Decker, 1985].

3.3 Critrio e Algoritmo de Anlise da Estabilidade Transitria

A energia crtica, energia mxima que o sistema pode acumular para que a sua estabilidade seja preservada, assim como o tempo crtico, so determinados, nesta pesquisa, baseados no algoritmo PEBS (Potential Energy Boundary Surface) Iterativo [Athay, 1979, Fonseca & Decker, 1985]. Para efetuar esta metodologia necessrio algum indicativo para que se possa identificar a PEBS como discutido a seguir.

Definio 1.

Derivada Direcional da Energia Potencial definida como sendo [Athay, 1979, Fonseca & Decker, 1985]: g ( ), ( p pe

D ( ) =

(3.3.1)

sendo: . , .g ( )

= produto interno de dois vetores n-dimensionais; =

[ g1 ( )

g 2 ( ) K g n ( ) ] ;

g i ( )

Pmi Pei

Mi PCOA ; MT19

e

= norma euclidiana.

Definio 2.

Superfcie Limite de Energia Potencial (PEBS em ingls) [Athay, 1979,Fonseca & Decker, 1985] definida como os pontos correspondentes aos zeros da derivada direcional (3.3.1), excetuando o ponto de equilbrio estvel do sistema.

A PEBS representa, portanto, os pontos dos mximos direcionais da energia potencial, os quais circundam o ponto de equilbrio estvel do sistema [Minussi, 1990].

Propriedade 4. A derivada direcional D ( ) possui a propriedade de se manter sempre

positiva para trajetrias estveis [Athay, 1979].

A anlise de estabilidade transitria, utilizando-se o conceito da PEBS, consiste na determinao de um ponto sobre a trajetria de defeito, por processo iterativo, de tal modo que a evoluo da trajetria ps-defeito, que comea neste ponto, encontre a mxima aproximao da superfcie limite de energia potencial. O programa computacional deste mtodo encontra-se implementado no LC (Laboratrio Computacional) do Departamento de Engenharia Eltrica da Faculdade de Engenharia de Ilha Solteira UNESP. Trata-se de um programa em linguagem Fortran, verso para microcomputador. Este algoritmo refere-se ao apresentado na referncia Fonseca & Decker, 1985. No Apndice A apresentado este algoritmo passo a passo. Deve-se ressaltar que a opo pelo mtodo PEBS, na qualidade de professor para o processo de treinamento da rede neural, como ser abordado em captulos subseqentes, foi motivada por ser uma tcnica que se encontra disponvel no Laboratrio Computacional, precisa (equiparvel simulao, quando se emprega o modelo clssico) e20

rpida. Contudo, a rede neural desenvolvida, nesta pesquisa, no mantm relao de compromisso com o mtodo PEBS. Qualquer outro procedimento pode ser perfeitamente usado para este fim, ficando, apenas a exigncia, de pelo menos, ser preciso e que gere um ndice qualitativo / quantitativo similar ao associado margem de segurana como aqui adotado.

3.4 Concluso

Neste captulo foi apresentado o critrio utilizado como indicativo da estabilidade transitria, fornecendo o conceito de margem de segurana, sendo que, esta fornece-nos uma idia de quanto o sistema se encontra estvel ou instvel. Tambm foram apresentados a metodologia PEBS Iterativa [Fonseca & Decker, 1985] e respectivo algoritmo computacional. Este algoritmo est sendo utilizado com o intuito de obter os estmulos de entrada e sada para o treinamento e diagnstico da rede neural (rede neural ARTMAP Euclidiana [Vuskovic & Du, 2002a]), que a metodologia de anlise de estabilidade transitria de sistemas de energia eltrica proposta nesta pesquisa.

21

Captulo 4

Redes Neurais Artificiais

4.1 Introduo

A simulao de capacidades cognitivas de um ser humano tem sido uma rea de pesquisa amplamente investigada. Projetam-se mquinas capazes de exibir um

comportamento inteligente, como se fossem reaes humanas. A inteligncia humana a mais avanada dentro do universo das criaturas. Essa inteligncia, dentro do corpo humano, est localizada no crebro. As entidades bsicas so os neurnios, interconectados em redes o que permitem a troca de informao entre eles, criando a inteligncia biolgica. Uma ambio bvia, que surge dessas observaes, a tentativa de copiar a estrutura e o funcionamento do crebro em um ambiente tcnico. Isso significa que a pesquisa tenta entender o funcionamento da inteligncia residente nos neurnios e mape-la para uma estrutura artificial, por exemplo uma combinao de hardware e de software, assim transformando as redes neurais biolgicas em redes neurais artificiais. Redes Neurais Artificiais (RNA) so tcnicas computacionais que apresentam um modelo matemtico inspirado na estrutura neural de organismos inteligentes e que adquirem conhecimento atravs da experincia [Simpson, 1989; Wasserman, 1989; Widrow & Lehr, 1990; Kung, 1993; Haykin, 1994; Kartalopoulos, 1996; Jain et al., 1996; Mendes Filho & Carvalho, 1997; King, 1998]. A proliferao, nos ltimos anos, de modelos de redes neurais artificiais bastante significativa. Hoje, a quantidade de modelos inspirados, sob o paradigma neural, de ordem de dezenas. Sabe-se, entretanto, que os modelos artificiais tm pouco em comum com as redes neurais reais. Por outro lado, existem paralelos entre os dois mundos que prometem que as redes neurais artificiais sejam uma aproximao apropriada para resolver problemas cognitivos complexos.22

As redes neurais vm sendo usadas, com sucesso, na soluo de problemas de reconhecimento de padro, otimizao combinatorial, modelagem de sistemas, representao de conhecimento, aproximao de funes, diagnstico e classificao, monitoramento e controle, processamento de voz e imagem, recuperao de informaes, previso, diagnsticos mdicos, composio musical, etc. Neste captulo, sero apresentados os principais conceitos sobre a teoria de redes neurais artificiais, com o objetivo de auxiliar a compreenso da metodologia proposta, a ser apresentada nos prximos captulos, a qual refere-se anlise de estabilidade transitria de sistemas de energia eltrica por redes neurais baseadas na teoria da ressonncia adaptativa [Carpenter & Grossberg, 1991c].

4.2 Inspirao Biolgica

As mais importantes caractersticas do crebro humano, que o capacitam de um comportamento inteligente, que so especialmente atrativas de serem simuladas em uma rede neural artificial, podem ser resumidas como: Robustez e tolerncia a falhas: a eliminao de alguns neurnios no afeta a funcionalidade global. Capacidade de aprendizagem: o crebro capaz de aprender novas tarefas que nunca foram executadas antes. Processamento de informao incerta: mesmo que a informao fornecida esteja incompleta, afetada por rudo ou parcialmente contraditria, um raciocnio correto possvel. Paralelismo: um imenso nmero de neurnios est ativo ao mesmo tempo. No existe a restrio de um processador que obrigatoriamente trabalhe uma instruo aps a outra.

23

Uma rede neural artificial um mecanismo (implementao em hardware e/ou software) que emula o modo como o crebro realiza uma tarefa particular ou funo de interesse [Haykin, 1994]. A rede neural artificial assemelha-se com o crebro em dois aspectos: o conhecimento adquirido pela rede, atravs de um processo de treinamento ou aprendizado; e as conexes entre os neurnios, conhecidos como pesos sinpticos, so usados para armazenar o conhecimento. O sistema nervoso formado por um conjunto bastante complexo de clulas, os neurnios. Estes neurnios possuem um papel essencial na determinao do funcionamento e comportamento do corpo humano e do raciocnio [Haykin, 1994]. O processamento local de informao no crebro efetua-se em cerca de 100 bilhes de unidades (os neurnios) que possuem uma estrutura relativamente simples. O neurnio uma clula com ncleo e corpo celular (sma do idioma grego) em que reaes qumicas e eltricas representam o processamento de informao. A sada da informao do corpo celular realizada por impulsos eltricos que se propagam atravs do axnio. No final do axnio existem inmeras ramificaes que distribuem a informao para outros neurnios vizinhos. A ligao com os outros neurnios realizada atravs de sinapses que esto conectadas a um dendrito do neurnio receptor. A sinapse dispara uma substncia qumica quando for excitada pelo impulso do axnio. A substncia se transmite entre sinapse e dendrito realizando a conexo entre dois neurnios vizinhos. Conforme as excitaes (ou inibies) que clulas vizinhas transmitem para a clula em considerao ela processa a informao novamente e a transmite via seu axnio [Simpson, 1989; Haykin, 1994; Mendes Filho & Carvalho, 1997]. Na Figura 4.1 apresenta-se o modelo simplificado de um nico neurnio biolgico e as partes que o compem. Ressalta-se que, vrios tipos de neurnios tm sido identificados, cada qual se distingue dos demais pela forma do corpo celular. Estas diferenas morfolgicas exibem especializaes funcionais importantes.

24

Ncleo Corpo celular

Axnio

Sinapse

Dendrito

Figura 4.1 Componentes de um neurnio biolgico.

4.3 Histrico

Os estudos de RNA constituem-se num dos maiores ramos da inteligncia artificial. O primeiro modelo de neurnio artificial foi formulado pelo neurofisiologista McCulloch e pelo matemtico Pitts, em 1943, cujo trabalho fazia uma analogia entre clulas vivas e o processo eletrnico, simulando o comportamento do neurnio natural, em que o neurnio possua apenas uma sada, que era uma funo de entrada (threshold) da soma do valor de suas diversas sadas [Haykin, 1994; Mendes Filho & Carvalho, 1997]. Em 1949 o psiclogo Donald Hebb, demonstrou que a capacidade da aprendizagem em redes neurais vem da alterao da eficincia sinptica, i.e., a conexo somente reforada, se tanto as clulas pr-sinpticas quanto as ps-sinpticas estiverem excitadas [Tutorial, 2005]. Hebb foi o primeiro a propor uma lei de aprendizagem especfica para as sinapses dos neurnios, servindo de inspirao para que muitos outros pesquisadores perseguissem a mesma idia. Em 1958 Rosemblatt desenvolveu o perceptron, que uma das estruturas neurais mais empregadas na literatura especializada. Nesse modelo, os neurnios esto organizados em camada de entrada e sada, em que os pesos das conexes so adaptados a fim de se atingir a eficincia sinptica [Tutorial, 2005]. No ano de 1960 surgiu a rede ADALINE (ADAptive LInear NEtwork) e a rede MADALINE (Many ADALINE), proposta por Widrow e Hoff. Na rede MADALINE foram usadas sadas analgicas em uma arquitetura de trs camadas [Widrow & Lehr,1990].25

Entre as dcadas de 60 e 70, poucas pesquisas foram publicadas pelo fato de pouca credibilidade ter sido dada aos estudos desta rea, marcada por um entusiasmo exagerado de muitos pesquisadores, que passaram a publicar muitos artigos e livros que faziam uma previso pouco confivel para a poca, sobre mquinas to poderosas quanto o crebro humano que surgiriam em um curto espao de tempo. Porm, alguns pesquisadores que realizaram importantes trabalhos nesse perodo sobre modelos de redes neurais em viso, memria, controle e auto-organizao devem ser citados: Amari, Anderson, Cooper, Cowan, Fukushima, Grossberg, Kohonen e Von der Malsburg. Em 1974, Werbos apresentou o algoritmo retropropagao (backpropagation) que possui a capacidade de treinar redes multicamadas [Werbos, 1974]. Em 1982, o fsico e bilogo Hopfield relatou a utilizao de redes simtricas para otimizao, atravs de um algoritmo de aprendizagem que estabilizava uma rede binria simtrica com realimentao. Na rede perceptron, o modelo de McCulloch-Pitts foi substitudo por um modelo diferencivel baseado em uma funo sigmoidal, permitindo que todos os pesos da rede neural possam ser adaptados pelo algoritmo retropropagao. Portanto, estas redes neurais so aplicveis, tambm, para problemas no-lineares, levando as redes neurais a um novo estgio de pesquisa. Os estudos sobre redes neurais sofreram uma grande revoluo a partir dos anos 80. A partir da, cada vez mais, esta rea de estudos tem se destacado, seja pelas promissoras caractersticas apresentadas pelos modelos de redes neurais propostos, ou pelas condies tecnolgicas atuais de implementao, que permitem desenvolver arrojadas arquiteturas neurais paralelas em hardware dedicados, obtendo assim timos desempenhos destes sistemas, bastante superiores aos sistemas convencionais.

4.4 Modelo Artificial

Assim como o sistema nervoso (de humanos) composto por bilhes de clulas nervosas, a rede neural artificial, tambm, deve ser formada por unidades que nada mais so que pequenos mdulos que simulam o funcionamento de um neurnio biolgico. Estes

26

mdulos devem funcionar de acordo com os elementos em que foram inspirados, recebendo e retransmitindo informaes. Na Figura 4.2 mostra-se o modelo de um neurnio artificial de McCulloch e Pitts [Haykin, 1994], que foi o primeiro modelo a ser formulado. Este modelo tenta simular as realidades biolgicas que ocorrem dentro de uma clula do sistema nervoso (compare com a Figura 4.1). A informao fornecida por outros neurnios consiste em n entradas, xj, para o neurnio processador. Cada entrada est associada a um peso, wj, que reflete a importncia da entrada xj. Seu processamento consiste na soma ponderada dos valores de suas entradas, resultando no chamado potencial de ativao. Neste primeiro processamento, os pesos multiplicativos, associados s entradas, emulam o efeito da intensidade das sinapses. Se o peso positivo diz-se que a conexo excitatria, caso contrrio, ela dita inibitria [Haykin, 1994; Mendes Filho & Carvalho, 1997]. Quando o potencial de ativao tem valor superior a um limiar de disparo preestabelecido, , o neurnio produz um sinal de sada de valor igual a 1. Se a ativao inferior ao limiar, ento a sada gerada tem valor 0. Essa sada ser enviada aos demais neurnios.

x1 x2Sinais de Entrada

wi1Funo de Ativao

wi 2

Combinao Linear

f

Sada

yi

Mxn

MwinPesos Sinpticos

iThreshold

Figura 4.2 Diagrama esquemtico de um neurnio artificial de McCulloch-Pitts.

A sada do isimo neurnio, segundo esse modelo, expressa como [Kartalopoulos, 1996]:

27

yi (t + 1) =

n f wij x j (t ) i j =1

(4.4.1)

sendo: t = instante de tempo em que so observadas as entradas;

wij = peso da conexo da sada da clula j a entrada desta clula; xj = valor da sada da clula j;

i = limiar de disparo desta clula;f = funo de ativao degrau definida por [Kung, 1993; Kartalopoulos, 1996]: 1, se a 0 f (a ) = . 0, se a < 0

(4.4.2)

A unidade de McCulloch-Pitts o mais popular modelo de neurnio artificial. Mas, assim como existem diversos tipos de neurnios biolgicos especializados, de acordo com o tipo de processamento a que se dedicam, tambm existem diferentes modelos de neurnios artificiais, cada um adequado a um tipo de problema especfico. Uma das modificaes mais comuns do neurnio artificial de McCulloch-Pitts o uso de outras funes de ativao. A funo de ativao define a sada de um neurnio, em termos do nvel de atividade da sua entrada. A Figura 4.3 mostra alguns exemplos de funes de ativao [Mendes Filho & Carvalho, 1997]. As funes do tipo rel so apropriadas para dados binrios, enquanto que as funes sigmoidais podem ser empregadas tanto para dados analgicos como binrios. Alm disso, as funes sigmoidais apresentam adicionalmente a vantagem de serem diferenciveis em todos os pontos [Kartalopoulos, 1996].

28

f (s)

f (s)

f (s)

s

s

s

1, se s k (a) f (s ) = s, se - k < s < k 0, se s k

1, se s 0 (b) f (s ) = 1, se s 0

(c) f (s ) =

1 1 + e s

Figura 4.3 Exemplos de funes de ativao: (a) Linear por partes; (b) Rel; (c) Sigmoidal. sendo: k = constante qualquer; = inclinao da funo sigmoidal.

Definiu-se uma entidade de processamento relativamente simples que calcula uma funo de sada y, a partir de entradas xj e dos pesos wj, com uma funo de ativao predefinida. O potencial e flexibilidade do clculo, baseado em redes neurais, vm da criao de conjuntos de neurnios que esto interligados entre si. Esse paralelismo de elementos, com processamento local, cria a inteligncia global da rede. Um elemento da rede recebe um estmulo nas suas entradas, processa esse sinal e emite um novo sinal de sada que, por sua vez, recebido pelos outros elementos.

4.5 Caractersticas Gerais das Redes Neurais

Arquiteturas neurais so tipicamente organizadas em camadas, com unidades que podem estar conectadas s unidades da camada posterior. Usualmente as camadas so29

classificadas em trs grupos: camada de entrada, onde os padres so apresentados rede; camadas intermedirias ou escondidas, onde feita a maior parte do processamento atravs das conexes ponderadas; e camada de sada, onde o resultado final concludo e apresentado [Haykin, 1994]. Uma rede neural especificada, principalmente, pela sua topologia, caractersticas dos ns e regras de treinamento. A seguir, ser analisada a classificao das redes neurais de acordo com sua estrutura e processos de treinamento.

4.5.1 Estrutura da Rede Neural

As redes neurais podem ser classificadas em dois tipos quanto a sua estrutura, que se refere ao mtodo de propagao da informao recebida [Simpson, 1989; Wasserman, 1989; Haykin, 1994; Kartalopoulos, 1996; Mendes Filho & Carvalho, 1997]:

Redes Neurais Recorrentes. Uma rede definida como recorrente se ela contm laos de realimentao, ou seja, contm conexes das sadas de uma determinada camada para a entrada da mesma ou de camadas anteriores.

Redes Neurais No-recorrentes. Esta rede se caracteriza estruturalmente por estar disposta em camadas. Nestas redes cada camada de neurnios recebe sinais somente das camadas anteriores, ou seja, elas no possuem laos de realimentao.

As redes que possuem uma estrutura recorrente desenvolvem uma memria nos neurnios internos. As redes no-recorrentes ou feedforward no possuem memria, sendo que, sua sada exclusivamente determinada em funo da entrada e dos valores dos pesos. A Figura 4.4 ilustra os dois tipos de redes descritos.

30

(a)

(b)

Figura 4.4 Principais topologias de redes neurais artificiais: (a) Rede neural no-recorrente; (b) Rede neural recorrente.

4.5.2 Treinamento da Rede Neural

Uma vez definida a rede neural, essa tem de ser treinada. A propriedade mais importante das redes neurais a habilidade de aprender e com isso melhorar seu desempenho. Isso feito atravs de um processo iterativo de ajustes aplicado a seus pesos que corresponde o treinamento. O aprendizado ocorre quando a rede neural atinge uma soluo generalizada para uma classe de problemas. A maioria dos modelos de redes neurais possui alguma regra de treinamento, em que os pesos de suas conexes so ajustados de acordo com os padres apresentados. Em outras palavras, elas aprendem atravs de exemplos. A rede neural passa por um processo de treinamento a partir de casos reais conhecidos, adquirindo a sistemtica necessria para executar adequadamente o processamento desejado dos dados fornecidos. Sendo assim, a rede neural capaz de extrair regras bsicas a partir de dados reais, diferindo da computao programada, em que necessrio um conjunto de regras pr-fixadas e algoritmos. O processo de treinamento da rede pode ser entendido como um problema de atualizao dos pesos de conexo tal que ela possa realizar eficientemente uma tarefa especfica. Existem muitos tipos de algoritmos de treinamento especficos para determinados31

modelos de redes neurais. Estes algoritmos diferem entre si principalmente pelo modo como os pesos so modificados. Outro fator importante a maneira pela qual uma rede neural se relaciona com o ambiente. Nesse contexto existem, basicamente, os seguintes paradigmas de treinamento [Kung, 1993; Haykin, 1994]:

Treinamento Supervisionado. Consiste no ajuste de pesos de uma rede neural para fornecer sadas desejadas, considerando-se o conjunto de padres de entrada.

Treinamento No-supervisionado. Consiste no ajuste de pesos de uma rede neural levando-se em conta somente o conjunto de padres de entrada.

Treinamento Hbrido. Combina treinamento supervisionado e treinamento nosupervisionado. Parte dos pesos so ajustados atravs do treinamento supervisionado, enquanto outros so obtidos atravs de treinamento no-supervisionado.

No treinamento supervisionado, a rede neural treinada com o auxlio de um professor. Para tanto, a rede necessita de um vetor de entrada e vetor alvo representando a sada desejada. Juntos eles so chamados de par de treinamento. Toda vez que for apresentada rede uma entrada, deve-se verificar se a sada obtida (gerada a partir de clculos efetuados com os pesos que a rede possui) confere com a sada desejada para quela entrada. Sendo diferente, a rede dever ajustar os pesos de forma que armazene o conhecimento desejado. Essa iteratividade dever ser repetida com todo o conjunto de treinamento (entradas e sadas), at que a taxa de acerto esteja dentro de uma faixa considerada satisfatria. Um dos algoritmos mais difundidos para treinamento deste tipo de rede o algoritmo retropropagao (backpropagation no idioma ingls) [Werbos, 1974; Wasserman, 1989; Haykin, 1994; Jain et al., 1996]. Este algoritmo foi proposto por Werbos em 1974 [Werbos, 1974].

32

O treinamento no-supervisionado no necessita de um alvo para as sadas e, portanto, nenhuma comparao necessria para respostas predeterminadas. O conjunto de treinamento consiste exclusivamente de vetores de entrada. A rede processa essas entradas e se organiza de modo que acabe classificando-as usando, para isso, seus prprios critrios. Esse tipo de rede utiliza os neurnios como classificadores, e os dados de entrada, como elementos para classificao. O processo de classificao fica por conta da rede neural e o seu algoritmo de aprendizado. A auto-organizao demonstrada nas redes neurais nosupervisionadas, envolve o processo de competio e o processo de cooperao entre os neurnios da rede. A Figura 4.5 ilustra os dois paradigmas de treinamentos mencionados.

Estmulo

REDE NEURAL

Sada

Estmulo

REDE NEURAL

Sada

REGRA DE APRENDIZADO

REGRA DE APRENDIZADO

Sada desejada

(a)

(b)

Figura 4.5 Principais modos de treinamentos de uma rede neural: (a) Treinamento supervisionado; (b) Treinamento no-supervisionado.

4.6 Regras de Adaptao dos Pesos

Durante o processo de aprendizagem os pesos normalmente percorrem uma modificao iterativa. Na iterao l o peso entre o neurnio i e o neurnio j (vide Figura 4.6),( wijl ) , influencia a funo calculada pela rede. O algoritmo de treinamento julga a qualidade do ( peso e eventualmente determina se o peso deve sofrer uma modificao wijl ) no seu valor na

33

prxima iterao l + 1. Assim, se define a regra bsica de adaptao dos pesos [Rauber, 2005]:( ( ( wijl +1) = wijl ) + wijl ) .

(4.6.1)

Costuma-se iniciar os pesos aleatoriamente. O algoritmo de aprendizagem percorre um nmero fixo de iteraes e/ou at que uma condio de parada seja atingida.

w ji wiiNeurnio i

wijNeurnio j

w jj

Figura 4.6 Pesos entre neurnios (caso geral com realimentao).

4.6.1 Aprendizagem pela Regra de Hebb

Um dos trabalhos pioneiros nos estudos de sistemas capazes de adquirir conhecimento foi desenvolvido por Hebb, em 1949. Ele criou uma hiptese de que o peso de ligao entre dois neurnios que esto ativos ao mesmo tempo deve ser reforado. Essa lei traduz-se para a regra de aprendizagem de Hebb [Rauber, 2005]:

wij = yi y j

(4.6.1.1)

em que a taxa de aprendizagem um fator de escala positivo que determina a velocidade da aprendizagem. A definio dessa regra baseia-se em estudos biolgicos do crebro, mas como j foi constatada, a correspondncia do modelo matemtico com a realidade biolgica somente uma idealizao aproximada. A regra de Hebb define um algoritmo de adaptao dos pesos, porm sem a definio de um objetivo a atingir, por exemplo, minimizar um erro entre um valor desejado e calculado.34

4.6.2 Aprendizagem pela Regra de Delta

A regra de delta, ou regra de Widrow-Hoff, como tambm conhecida, uma regra de adaptao de pesos com um objetivo bem visvel [Widrow, 1990]. Um funo y 'j calculada na sada (neurnio j) da rede. O valor desejado y j que a rede deve calcular conhecido durante o treinamento supervisionado. Assim, pode-se calcular o erro e j = y j y 'j entre o valor calculado e o valor desejado. O peso entre o neurnio i e o neurnio j que responsvel por esse erro deve ser, ento, modificado proporcional ativao e ao erro, escalado por uma taxa de aprendizagem [Rauber, 2005]:wij = e j y i = y j y 'j y i .

(

)

(4.6.2.1)

Para esta regra, o objetivo do algoritmo de treinamento minimizar o erro entre os valores calculados pela rede e desejados pelos exemplos fornecidos num problema de aprendizagem supervisionada.

4.6.3 Aprendizagem Competitiva

No treinamento competitivo, consideram-se as redes neurais em que um nico neurnio pode ser ativo ao mesmo tempo. Isso significa que somente o vencedor i* emite um sinal de ativao y i* = 1 , e todos os outros neurnios tm ativao igual a zero, yi = 0 para

i i*. um aprendizado no-supervisionado, e essa regra pode ser descrita pela seguinte equao, sendo a taxa de aprendizagem [Rauber, 2005]: wij = yi xi wij .

(

)

(4.6.3.1)

O efeito dessa regra que os pesos wi se deslocam em direo ao estmulo (entrada) da rede, x. Quando o aprendizado competitivo utilizado, os neurnios competem entre si pelo direito de atualizar seus pesos. Estes algoritmos de aprendizado tm sido mais35

usados em problemas que abordam a classificao, a extrao de caractersticas, a compresso de dados e a formao de clusters (agrupamentos). Exemplos de redes neurais que utilizam aprendizagem competitiva para adaptar os pesos so o modelo auto-organizvel de Kohonen [Kohonen, 1987] e as redes da famlia ART [Carpenter & Grossberg, 1991c].

4.7 Concluso

Neste captulo, foram apresentados os principais conceitos, envolvendo redes neurais artificiais, a estrutura bsica de um neurnio biolgico, e as principais caractersticas associadas s diferentes estruturas de neurnio artificial. Foram apresentados os principais paradigmas de treinamento e regras de aprendizagem para a adaptao dos pesos da rede. No prximo captulo, ser dada ateno especial a uma classe de redes neurais, as redes baseadas na Teoria da Ressonncia Adaptativa [Carpenter & Grossberg, 1991c] que ser a essncia da pesquisa proposta.

36

Captulo 5

Teoria da Ressonncia Adaptativa

5.1 Introduo

Umas das mais importantes caractersticas das Redes Neurais Artificiais (RNA) refere-se a capacidade de generalizao, ou seja, produzir respostas para padres de entradas que so similares, mas no idnticos, aos padres apresentados rede durante o seu treinamento. Quando uma rede multicamadas treinada com o algoritmo retropropagao (backpropagation) [Werbos, 1974], e.g., espera-se que ela fornea como resposta a classificao correta correspondente ao padro de entrada, e que ela continue a responder satisfatoriamente a quaisquer padres de entrada, dentro do domnio, apresentados futuramente. Entretanto, o conhecimento a respeito de determinado domnio do mundo real pode se modificar ao longo do tempo. O mesmo acontece com os padres de entrada de uma RNA, que podem modificar com o tempo para acomodar as mudanas ocorridas. Assim, para um nmero de aplicaes, o desempenho da rede pode decair gradativamente medida que o tempo passa, uma vez que os pesos definidos na fase de treinamento no refletem as novas situaes. Para adaptar novos padres de entrada indefinidamente, um algoritmo de aprendizado de RNA deve ser plstico. Uma alternativa para solucionar este problema seria retreinar a rede com os novos padres de entrada. Entretanto, isto pode levar perda de informaes aprendidas anteriormente. Para preservar o conhecimento previamente aprendido, um algoritmo de treinamento de RNA no deve ser somente plstico, mas tambm estvel. Uma outra soluo seria retreinar a rede freqentemente com os novos e os antigos padres. Isto resolveria o problema, mas est longe de representar uma soluo vivel. Este conflito conhecido como dilema estabilidade-plasticidade [Carpenter & Grossberg, 1991c].37

Sendo assim, necessrio, ento, um modelo de RNA incremental, que no precise recomear seu treinamento do ponto inicial a cada vez que aparecerem novos padres de entrada e que preserve o conhecimento adquirido anteriormente. Uma famlia de RNA denominada ART (Adaptive Resonance Theory) [Carpenter & Grossberg, 1991c] foi desenvolvida para solucionar este dilema. Neste trabalho, faz-se o uso de uma arquitetura neural da Teoria da Ressonncia Adaptativa, designada ARTMAP Euclidiana [Vuskovic & Du, 2002a], que uma generalizao da rede ART1 [Carpenter & Grossberg, 1987a]. Sendo assim, a seguir, apresentam-se os principais conceitos sobre redes neurais desta teoria, os quais so a essncia da pesquisa proposta.

5.2 Redes Baseadas na Teoria da Ressonncia Adaptativa

A origem da Teoria da Ressonncia Adaptativa (ART, de Adaptive Resonance Theory) pode ser dada a Von der Malsburg, em 1973, que foi um dos primeiros a apresentar uma rede neural artificial com caracterstica auto-organizvel para modelagem do crtex visual dos maiores vertebrados, e influenciou o trabalho de Teuvo Kohonen e Steven Grossberg [Anagnostopoulos, 2001]. Para emular a atividade neural organizada em sistemas biolgicos sem ter de implementar conexes de realimentao no-lineares, Kohonen desenvolveu o mapa de caractersticas auto-organizvel, designado rede SOFM (Self Organizing Feature Map), com treinamento no-supervisionado [Kohonen, 1982], e posteriormente desenvolveu a arquitetura de quantizao de vetores de aprendizagem, LVQ (Learning Vector Quantization), com treinamento supervisionado [Kohonen, 1987]. De outro lado, Grossberg levantou questes sobre o dilema estabilidadeplasticidade [Grossberg, 1976]: como pode um sistema treinado permanecer plstico (adaptativo) em resposta a uma nova informao, e ainda permanecer estvel em resposta a informaes irrelevantes? Como pode um sistema preservar seu conhecimento j adquirido e ao mesmo ser flexvel o suficiente para armazenar nova informao? Como pode um sistema decidir quando passar do estado estvel ao plstico e vice-versa? Grossberg respondeu a essas questes com a teoria da ressonncia adaptativa (ART). Em uma rede baseada na teoria da38

ressonncia adaptativa, informaes so trocadas entre as camadas da rede. O treinamento possvel na rede quando ocorre ressonncia da atividade neural, ou seja, quando um padro j treinado apresentado e a rede o reconhece; e quando um novo padro de entrada apresentado e a rede percebe que o padro constitui uma nova informao e, ento, entra em estado ressonante para memoriz-lo. Assim, a primeira arquitetura baseada na teoria da ressonncia adaptativa a rede Grossberg, denominada GN (Grossberg Network) [Grossberg, 1976]. A rede GN apresenta duas camadas, sendo que a primeira realiza a normalizao dos dados de entrada enquanto a segunda, que uma camada competitiva com conectividade de realimentao no-linear, realiza a seleo dos padres de sada e os armazena na memria de curto prazo. Adicionalmente, os pesos adaptativos representam a memria de longo prazo do modelo. O comportamento do modelo descrito por um conjunto de equaes diferenciais no-lineares. Baseado no modelo de Grossberg, GN, a arquitetura ART1 foi desenvolvida para realizar agrupamentos de padres binrios, por Carpenter e Grossberg em 1987, realizando o treinamento no-supervisionado [Carpenter & Grossberg, 1987a]. A partir de ento, a arquitetura ART1 tornou-se o mais famoso modelo da famlia ART, em termos de pesquisa relacionada e aplicaes. No mesmo ano, 1987, ART1 foi estendida para manipular padres com valores reais e a arquitetura foi designada ART2 [Carpenter & Grossberg, 1987b]. A rede ARTMAP, composta por dois mdulos ART1, foi a primeira arquitetura baseada na teoria da ressonncia adaptativa apropriada para a tarefa de classificao, apresentando treinamento supervisionado [Carpenter et al., 1991a]. Numa concepo diferenciada de ART2, a rede ART Nebulosa foi tambm designada para agrupamentos de padres com valores reais [Carpenter et al., 1991b]. Em 1992, a arquitetura ARTMAP foi estendida para ARTMAP Nebulosa para a classificao de padres com valores reais, usando o treinamento supervisionado [Carpenter et al., 1992]. Diversas variaes da arquitetura ART tm sido desenvolvidas desde ento. Pesquisas em todo o mundo foram e esto sendo realizadas no sentido de melhorar as propriedades de generalizao destas arquiteturas, tornando-as mais eficientes tanto no sentido de rapidez no processamento da rede quanto de preciso de resultados, cada qual visando adaptar-se aos problemas que pretendem resolver e maximizar o seu desempenho. Dentre as diversas variaes pode-se citar: PROBART [Marriott, 1995], ART-EMAP [Carpenter & Ross, 1995], ARTMAP GAUSSIANA [Williamson, 1996], ARTMAP-FD

39

[Carpenter et al., 1997], ARTMAP Boosted [Verzi et al., 1998], ARTMAP [Goms-Snches et al., 2002], etc.

5.3 Caractersticas Bsicas dos Sistemas ART

A teoria da ressonncia adaptativa apropriada para aplicaes de reconhecimento de padres, e indicada para classificao de padres. ART um sistema que auto-organiza padres de entrada em categorias de reconhecimento, mantendo um equilbrio entre as propriedades de plasticidade e de estabilidade. A propriedade de plasticidade define a habilidade da rede em criar novas categorias de reconhecimento, quando padres estranhos estimulam a rede ART. A propriedade de estabilidade responsvel pela habilidade em agrupar padres similares na mesma categoria de reconhecimento. Uma regra de similaridade, que define onde agrupar um padro, determinada por um grau de semelhana entre um padro previamente armazenado. A rede ART um modelo de treinamento competitivo no-supervisionado. destinada para treinar, rpida e estavelmente, categorias de reconhecimento em resposta a uma seqncia arbitrria de padres de entradas. ART formada por dois principais subsistemas [Carpenter & Grossberg, 1991c]: o subsistema de ateno e o subsistema de orientao (vide Figura 5.1). O subsistema de ateno consiste de dois campos de neurnios: F1, que processa os dados de entrada; e F2, que agrupa os padres de treinamento em categorias de reconhecimento, em que cada campo pode consistir de vrias camadas de neurnios. Estes campos so conectados com pesos de conexo, que so responsveis pelo armazenamento das informaes atravs de um processo que envolve a escolha da categoria, critrio de equalizao e treinamento. O subsistema de orientao controlado por um parmetro de vigilncia (), que determina se um padro de entrada pode ser includo em uma das categorias existentes. Os neurnios da camada F2, camada que representa as categorias de reconhecimento, so de dois tipos: comprometidos e descomprometidos (ou livres) [Carpenter & Grossberg, 1991c]. Os ns comprometidos so aqueles que armazenam as informaes dos padres j apresentados rede, representando categorias reais, e os ns descomprometidos so ns vazios, que representam a memria em branco da rede.40

Subsistema de ateno

SADA

Subsistema de orientao

F2

...

...

reajuste

F1

...

ENTRADA

Figura 5.1 Arquitetura bsica da rede ART.

A formao dos pesos de conexo alocados entre as camadas F1 e F2 detalhada na Figura 5.2. Trata-se de uma conexo entre N componentes de atividade correspondentes aos componentes do vetor de entrada a (em F1) e M neurnios na atividade F2. A escolha do nmero M arbitrria, porm, deve ser suficiente para abrigar todas as categorias formadas em F2. Assim sendo, costuma-se adotar o nmero M igual ao nmero de vetores padres a serem armazenados, ou seja, ter-se-iam, no mximo, M categorias formadas (uma para cada padro). Essa situao pouco plausvel do ponto de vista prtico, considerando que algumas categorias podem ficar vazias, ou seja, no armazenam nenhuma informao, mas ocupam memria no sistema. Outra alternativa que pode ser adotada a criao contnua de novos neurnios medida que novas categorias so formadas, sendo esta mais interessante se comparada anterior, visto que trabalha com um nmero reduzido de neurnios, sendo, portanto, mais rpida. Estas duas alternativas podem ser facilmente implementadas nas redes neurais ART.

41

Neurnio vencedor

F2

1

2

...

j

j+1

...

J

...

M

T j (funo escolha)

w j1 w j 2 w j 3

w jN ...N-1

w j = [ w j1

w j 2 K w jN ]

F1

1

2

3

N

a (vetor de entrada)

Figura 5.2 Formao do vetor de peso que conecta as camadas F1 e F2 da rede ART.

O processo de classificao de rede ART consiste de quatro fases principais: reconhecimento, comparao, busca e treinamento [Carpenter & Grossberg, 1991c].

1) Reconhecimento

Cada neurnio do campo F1 (camada de entrada) recebe sinais de baixo para cima do vetor de entrada e de cima para baixo do campo F2 (camada de sada, que representa a categoria ativa). A atividade calculada e o vetor resultante comparado com todos os vetores de pesos j armazenados na rede (memria) para encontrar o que mais se assemelha ao padro de entrada atual. O neurnio do campo F2, com maior valor de ativao, selecionado como provvel categoria para armazenar o novo padro. O neurnio selecionado envia ao campo F1 seu prottipo.

2) Comparao Nesta fase acontece um mecanismo de reajuste, que responsvel por testar a similaridade entre o vetor de entrada e o vetor de comparao, z, que o vetor resultante da42

atividade calculada no campo F1 mediante o vetor prottipo dado pelo campo F2 aps a fase de reconhecimento. A maneira pela qual se define como de que modo a comparao ir ocorrer definida por um parmetro chamado vigilncia (), que determina se um padro de entrada pode ser includo em uma das categorias existentes. Se o valor da comparao for maior do que , ento o padro de entrada includo na categoria ativa, caso contrrio, a rede entre em fase de busca.

3) Busca Durante esta fase, a rede procura um novo neurnio do campo F2 para representar o vetor de entrada atual. O neurnio da camada de sada rejeitado na fase de comparao anterior desabilitado nesta seleo. O vetor de entrada reapresentado, e a rede entra novamente na fase de comparao, que termina com o teste no mecanismo de reajuste para determinar a similaridade entre o novo prottipo escolhido e o vetor de entrada atual. Este processo repetido, desabilitando neurnios da camada de sada, at encontrar um neurnio de sada que melhor se assemelhe ao vetor de entrada corrente, dentro dos limites do parmetro de vigilncia . Se nenhum neurnio de sada for encontrado, o vetor de entrada ento considerado de uma classe desconhecida, sendo alocado um neurnio de sada que no esteja associado ainda a nenhuma categoria para represent-lo.

4) Treinamento O algoritmo de aprendizado da rede ART no-supervisionado e pode ser ativado a qualquer momento, permitindo que a rede aprenda novos padres continuamente. H dois tipos de treinamento para a rede ART: aprendizado rpido e aprendizado lento [Carpenter & Grossberg, 1991c]. No aprendizado rpido, os pesos de conexo so ajustados para seus valores timos em poucos ciclos, geralmente em apenas um ciclo de treinamento. No aprendizado lento, os pesos so ajustados lentamente em vrios ciclos de treinamento, possibilitando um ajuste melhor dos pesos da rede aos padres de treinamento.

43

As redes ARTs so muito sensveis a variaes em seus parmetros durante o treinamento. O parmetro mais crtico o parmetro de vigilncia () que controla a resoluo do processo de classificao. Se assume um valor baixo, e.g., a rede permite que padres no muitos semelhantes sejam agrupados na mesma categoria de reconhecimento, criando poucas classes. Se a for atribudo um valor alto (prximo a 1), pequenas variaes nos padres de entrada levaro criao de novas classes. A seguir, apresenta-se o algoritmo da arquitetura ART nebulosa, que uma generalizao da rede ART1.

5.4 Algoritmo ART Nebuloso

ART nebulosa uma generalizao da rede ART1. A generalizao alcanada usando as operaes da teoria de conjuntos nebulosos [McNEIL & Thro, 1994; Terano et al., 1987] ao invs das operaes da teoria de conjuntos binrios. A estrutura geral da rede ART Nebulosa essencialmente a mesma de ART1. A arquitetura consiste de um campo de prprocessamento de neurnios, F0, que modifica o vetor de entrada atual a, e um campo F1 que recebe ambas entradas de F0 e entradas de F2. A camada F1 possui 2N ns (neurnios), enquanto a camada F2 possui um nmero sufi

art 020-tese sandra cristina marchiori

Documents