You are on page 1of 230

Notas em Matemtica Aplicada

??

Editores Clia A. Zorzo Barcelos


Universidade Federal de Uberlndia - UFU Uberlndia, MG, Brasil

Eliana X.L. de Andrade


Universidade Estadual Paulista - UNESP So Jos do Rio Preto, SP, Brasil

Maurlio Boaventura
Universidade Estadual Paulista - UNESP So Jos do Rio Preto, SP, Brasil A Sociedade Brasileira de Matemtica Aplicada e Computacional - SBMAC publica, desde as primeiras edies do evento, monograas dos cursos que so ministrados nos CNMAC. A partir do XXVI CNMAC, para a comemorao dos 25 anos da SBMAC, foi criada a srie Notas em Matemtica Aplicada para publicar as monograas dos minicursos ministrados nos CNMAC. O livro correspondente a cada minicurso deve ser preparado em Latex (compatvel com o Miktex verso 2.7), as guras em eps ou jpeg e deve ter entre 60 e 100 pginas. O texto deve ser redigido de forma clara, acompanhado de uma excelente reviso bibliogrca e de exerccios de vericao de aprendizagem ao nal de cada captulo. Alm do livro, cada responsvel por minicurso deve preparar transparncias e outros materiais didticos que julgar convenientes. Todo o material ser colocado disposiao dos interessados no site da SBMAC. objetivo da srie publicar textos dos encontros regionais e de outros eventos patrocinados pela SBMAC.

Sociedade Brasileira de Matemtica Aplicada e Computacional

2009

Notas em Matemtica Aplicada

Ttulos publicados para o XXXII CNMAC - 2009

38 39 40 41 42 43

Veja outros ttulos da srie ao final deste livro.


Arquivos no formato pdf disponveis em http://www.sbmac.org.br/notas.php

TCNICAS DE INTELIGNCIA COMPUTACIONAL INSPIRADAS NA NATUREZA: APLICAO EM PROBLEMAS INVERSOS EM TRANSFERNCIA RADIATIVA

Antnio Jos da Silva Neto


ajsneto@iprj.uerj.br Instituto Politcnico Universidade do Estado do Rio de Janeiro

Jos Carlos Becceneri


becce@lac.inpe.br Laboratrio Associado de Computao e Matemtica Aplicada Instituto Nacional de Pesquisas Espaciais

Sociedade Brasileira de Matemtica Aplicada e Computacional

So Carlos - SP, Brasil 2009

Coordenao Editorial: Sandra Mara Cardoso Malta Coordenao Editorial da Srie: Eliana Xavier Linhares de Andrade Editora: SBMAC Impresso na Grca: Capa: Matheus Botossi Trindade Patrocnio: SBMAC Copyright c 2009 by Eliana Xavier Linhares de Andrade, Cleonice Ftima Bracciali e Rogrio da Silva Direitos reservados, 2009 pela SBMAC. A publicao nesta srie no impede o autor de publicar parte ou a totalidade da obra por outra editora, em qualquer meio, desde que faa citao edio original. Catalogao elaborada pela Biblioteca do IBILCE/UNESP Bibiotecria: Maria Luiza Fernandes Jardim Froner Silva Neto, Antnio J. Tcnicas de Inteligncia Computacional Inspiradas na Natureza: Aplicaes em Problemas Inversos em Transferncia Radiativa - So Carlos, SP : SBMAC, 2009, ?? p., 20.5 cm - (Notas em Matemtica Aplicada; v. ??) ISBN ?? 1. Inteligncia Computacional 2. Bio-inspirado 3. Problemas Inversos I. Silva Neto, Antnio J. II. Becceneri, Jos C. III. Luz, Eduardo F. P. IV. Chalhoub, Ezzat S. V. de Sousa, Fabiano L. VI. Soeiro, Francisco J. C. P. VII. Campos Velho, Haroldo F. VIII. Biondi Neto, Luiz IX. Stephany, Stephan X. Sacco, Wagner F. XI. Silva, Jos D. S. XII. Lobato, Fran S. XIII. Steen Jr., Valder XIV. Ttulo. XV. Srie. CDD - 51

Para Gilsineida, Lucas e Lusa Antnio Jos da Silva Neto Para Rossana, Leandro e Amanda Jos Carlos Becceneri

Agradecimentos
Os autores deste livro agradecem o empenho do aluno de doutorado Eduardo P. F. Luz, do INPE - Instituto Nacional de Pesquisas Espaciais, que em um perodo relativamente curto, mas com um investimento concentrado de tempo, foi capaz de preparar a verso nal de todo o texto em LaTeX, assim como a colaborao da Dra.Nancy Isabel Alvarez Acevedo, do Instituto Politcnico da Universidade do Estado do Rio de Janeiro, na digitao dos Captulos 2 e 3. Agradecem tambm a Comisso Cientca do XXXII Congresso Nacional de Matemtica Aplicada e Computacional pela aprovao do mini-curso homnimo, que levou preparao deste material. Finalizando, agradecem o apoio nanceiro dos seguintes rgos de fomento que tm permitido o desenvolvimento das atividades de pesquisa e formao de recursos humanos nos nveis de graduao e de ps-graduao envolvendo trs instituies de pesquisa e ensino do pas: CAPES Fundao Coordenao de Aperfeioamento de Pessoal de Nvel Superior CNPq Conselho Nacional de Desenvolvimento Cientco e Tecnolgico FAPERJ Fundao Carlos Chagas Filho de Amparo Pesquisa do Estado do Rio de Janeiro FAPESP Fundao de Amparo Pesquisa do Estado de So Paulo

Lista de Abreviaturas e Siglas


ACO ANN BP DE GA GEO IA IC LF LM MLP PCA PSO SA Otimizao por Colnia de Formigas (Ant Colony Optimization ) Redes Neurais Articiais (Articial Neural Networks ) Retropropagao (Back Propagation ) Evoluo Diferencial (Dierential Evolution ) Algoritmos Genticos (Genetic Algorithms ) Otimizao Extrema Generalizada (Generalized Extremal Optimization ) Inteligncia Articial Inteligncia Computacional Lgica Fuzzy Mtodo de Levenberg-Marquardt Perceptron de Mltiplas Camadas (Multilayer Perceptron ) Algoritmo de Coliso de Partculas (Particle Collision Algorithm ) Otimizao por Enxame de Partculas (Particle Swarm Optimization ) Recozimento Simulado (Simulated Annealing )

Contedo
Prefcio 1 Introduo 2 Transferncia Radiativa 2.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Formulao Matemtica do Problema de Transferncia Radiativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Meio participante homogneo unidimensional . . . . . 2.2.2 Meio participante heterogneo unidimensional em duas camadas . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Soluo do Problema de Transferncia Radiativa . . . . . . . 2.3.1 Meio participante homogneo unidimensional . . . . . 2.3.2 Meio participante heterogneo unidimensional em duas camadas . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . 3 Problemas Inversos em Transferncia Radiativa - Uma Formulao Implcita 3.1 O Que um Problema Inverso? . . . . . . . . . . . . . . . . . 3.2 Uma Formulao Implcita para o Problema Inverso . . . . . 3.3 Dados Experimentais . . . . . . . . . . . . . . . . . . . . . . . 3.4 Soluo do Problema Inverso com o Mtodo de LevenbergMarquardt (LM) . . . . . . . . . . . . . . . . . . . . . . . . . 3.5 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . 4 Fundamentos de Otimizao e Inteligncia Computacional 4.1 Conceitos Bsicos na rea de Otimizao . . . . . . . . . . . . 4.1.1 O Problema do Caixeiro Viajante (PCV) . . . . . . . 4.1.2 Formulao do PCV como um Problema de Otimizao 11 15 17 19 19 20 20 23 25 25 30 33 35 35 37 40 41 43 45 45 46 46

12 4.1.3 Espao de Busca . . . . . . . 4.1.4 Algoritmos . . . . . . . . . . 4.1.5 Heursticas e Meta-heursticas Inteligncia Articial . . . . . . . . . 4.2.1 Conexionista . . . . . . . . . 4.2.2 Simblica . . . . . . . . . . . Inteligncia Computacional . . . . . 4.3.1 Otimizao . . . . . . . . . . 4.3.2 Lgica Nebulosa (LF) . . . . 4.3.3 Sistemas Hbridos (SHs) . . . Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 48 48 51 52 54 55 55 62 63 64 67 67 69 73 75 77 77 78 80 80 81 81 81 82 84 85 85 89 89 90 92 93 98 100 104

4.2

4.3

4.4

5 Recozimento Simulado (Simulated Annealing ) 5.1 Motivao e Histrico do Mtodo . . . . . . . . . . . . . . 5.2 Descrio do Algoritmo . . . . . . . . . . . . . . . . . . . 5.3 Aplicao ao Problema Inverso de Transferncia Radiativa 5.4 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . 6 Algoritmos Genticos (Genetic Algorithms ) 6.1 Motivao e Histrico do Mtodo . . . . . . . . . . . . . . 6.2 Descrio do Algoritmo . . . . . . . . . . . . . . . . . . . 6.2.1 Seleo . . . . . . . . . . . . . . . . . . . . . . . . 6.2.2 Cruzamento . . . . . . . . . . . . . . . . . . . . . . 6.2.3 Mutao . . . . . . . . . . . . . . . . . . . . . . . . 6.2.4 Determinao do tamanho da cadeia binria . . . . 6.2.5 Algoritmo . . . . . . . . . . . . . . . . . . . . . . . 6.3 Aplicao ao Problema Inverso de Transferncia Radiativa 6.4 Consideraes nais . . . . . . . . . . . . . . . . . . . . . 7 Redes Neurais Articiais (Articial Neural Networks ) 7.1 Motivao e Histrico do Mtodo . . . . . . . . . . . . . . 7.2 Descrio do Algoritmo . . . . . . . . . . . . . . . . . . . 7.2.1 Modelo do Neurnio Articial . . . . . . . . . . . . 7.2.2 Processamento Neural . . . . . . . . . . . . . . . . 7.2.3 Perceptron . . . . . . . . . . . . . . . . . . . . . . 7.2.4 Perceptron de Mltiplas camadas . . . . . . . . . . 7.2.5 Mquinas de Comit . . . . . . . . . . . . . . . . . 7.3 Aplicao ao Problema Inverso de Transferncia Radiativa 7.4 Consideraes Finais . . . . . . . . . . . . . . . . . . . . .

. . . .

. . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

13 8 Algoritmos Neuro-Nebulosos (Neuro-Fuzzy Algorithms ) 8.1 Motivao e Histrico do Mtodo . . . . . . . . . . . . . . . 8.2 Descrio do Algoritmo . . . . . . . . . . . . . . . . . . . . 8.2.1 Sistema Fuzzy . . . . . . . . . . . . . . . . . . . . . 8.2.2 Denies e Terminologia . . . . . . . . . . . . . . . 8.3 Aplicao ao Problema Inverso de Transferncia Radiativa . 8.4 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . 105 105 106 107 109 120 121

. . . . . .

9 Otimizao por Colnia de Formigas (Ant Colony Optimization ) 125 9.1 Motivao e Histrico do Mtodo . . . . . . . . . . . . . . . . 125 9.2 Descrio do Algoritmo . . . . . . . . . . . . . . . . . . . . . 127 9.3 Aplicao ao Problema Inverso de Transferncia Radiativa . . 132 9.3.1 Problema inverso adotado como exemplo . . . . . . . 132 9.3.2 Aplicao do ACO ao problema inverso escolhido . . . 133 9.3.3 Resultados numricos da aplicao do ACO ao exemplo de problema inverso . . . . . . . . . . . . . . . . . 137 9.3.4 Resultados numricos da aplicao da hibridizao do ACO com o mtodo Levenberg-Marquard ao exemplo de problema inverso . . . . . . . . . . . . . . . . . . . 139 9.4 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . 142 10 Otimizao por Enxame de Partculas (Particle Swarm Optimization ) 143 10.1 Motivao e Histrico do Mtodo . . . . . . . . . . . . . . . . 143 10.1.1 Bases scio-cognitivas . . . . . . . . . . . . . . . . . . 144 10.2 Descrio do Algoritmo . . . . . . . . . . . . . . . . . . . . . 145 10.2.1 Implementao . . . . . . . . . . . . . . . . . . . . . . 149 10.2.2 Algumas variantes do PSO . . . . . . . . . . . . . . . 150 10.3 Aplicao ao Problema Inverso de Transferncia Radiativa . . 152 10.4 Consideraes nais . . . . . . . . . . . . . . . . . . . . . . . 153 11 Otimizao Extrema Generalizada (Generalized Extremal Optimization ) 157 11.1 Motivao e Histrico do Mtodo . . . . . . . . . . . . . . . . 157 11.2 Descrio do Algoritmo . . . . . . . . . . . . . . . . . . . . . 159 11.2.1 O Modelo Simplicado de Evoluo de Bak-Sneppen . . . . . . . . . . . . . . . . . . . . . . . 159 11.2.2 O GEO cannico . . . . . . . . . . . . . . . . . . . . . 160 11.2.3 Um Exemplo Simples da Utilizao do GEO Cannico 163 11.2.4 Algumas Consideraes Sobre Novas Verses do GEO 165 11.3 Aplicao ao Problema Inverso de Transferncia Radiativa . . 165

14 11.4 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . 170 12 Algoritmo de Coliso de Partculas (Particle Collision Algorithm ) 171 12.1 Motivao e Histrico do Mtodo . . . . . . . . . . . . . . . . 171 12.2 Descrio do Algoritmo . . . . . . . . . . . . . . . . . . . . . 172 12.2.1 A verso cannica . . . . . . . . . . . . . . . . . . . . 172 12.2.2 Consideraes sobre novas verses do PCA . . . . . . 175 12.3 Aplicao ao Problema Inverso de Transferncia Radiativa . . 177 12.3.1 Meio homogneo unidimensional . . . . . . . . . . . . 178 12.3.2 Meio heterogneo unidimensional em duas camadas . . 180 12.4 Consideraes nais . . . . . . . . . . . . . . . . . . . . . . . 182 13 Evoluo Diferencial (Dierential Evolution ) 13.1 Motivao e Histrico do Mtodo . . . . . . . . . . . . . . . 13.2 Descrio do Algoritmo . . . . . . . . . . . . . . . . . . . . 13.2.1 A Inicializao do Algoritmo de DE . . . . . . . . . 13.2.2 O Operador de Mutao . . . . . . . . . . . . . . . . 13.2.3 O Operador de Cruzamento . . . . . . . . . . . . . . 13.2.4 O Operador de Seleo . . . . . . . . . . . . . . . . . 13.2.5 O Critrio de Parada . . . . . . . . . . . . . . . . . . 13.3 Aplicao ao Problema Inverso de Transferncia Radiativa . 13.3.1 Meio homogneo unidimensional . . . . . . . . . . . 13.3.2 Meio heterogneo unidimensional em duas camadas . 13.4 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . 14 Consideraes Finais Bibliograa . . . . . . . . . . . 183 183 185 185 186 188 188 189 190 191 193 196 199 201

Prefcio
J h algum tempo os autores dos captulos deste livro vm trabalhando em conjunto buscando a aplicao de mtodos estocsticos, em particular heursticas bioinspiradas, na soluo de problemas inversos, principalmente aqueles envolvendo o fenmeno de transferncia radiativa. Devido relevncia das aplicaes destes problemas, por exemplo em sensoriamento remoto, modelos climticos e ambientais, e tica hidrolgica, bem como atualidade das tcnicas de Inteligncia Computacional inspiradas na natureza, decidiram, com base em suas experincias e nos trabalhos por eles publicados em diversos eventos cientcos e peridicos nacionais e internacionais, preparar este material. Este cumpre alguns propsitos centrais: apresentar uma descrio sucinta do problema de transferncia radiativa e das heursticas bio-inspiradas, inclusive com a apresentao dos algoritmos destas, e tambm apresentar os resultados obtidos com a utilizao destes mtodos, bem como de suas hibridizaes com mtodos estocsticos e mtodos determinsticos. Obviamente existe um conjunto muito maior de mtodos publicados na vasta literatura recente sobre o assunto, mas os nove mtodos apresentados neste livro foram implementados pelos autores, e sempre considerando como problemas modelo a transferncia radiativa em meios homogneos unidimensionais e meios heterogneos unidimensionais multi-camadas. O nvel exigido de clculo e computao acessvel tanto para alunos que estejam em estgios avanados de seus cursos de graduao em Matemtica, Computao ou Engenharia, bem como para alunos de ps-graduao nestas reas. Pesquisadores que tambm queiram ter um primeiro contato com os assuntos mencionados acima podero encontrar um material acessvel e que contm um bom nmero de referncias a outros trabalhos que podem apresentar um maior nvel de detalhe em cada um dos assuntos tratados. 30 de abril de 2009. Antnio Jos da Silva Neto
Nova Friburgo, RJ

Jos Carlos Becceneri So Jos dos Campos, SP

15

Captulo 1

Introduo
Antnio Jos da Silva Neto Jos Carlos Becceneri Devido s relevantes aplicaes em diversas reas da atividade humana, um nmero crescente de pesquisadores tem se dedicado anlise e soluo de problemas inversos. Nas reas das engenharias e da computao, cada vez mais os pesquisadores voltam um olhar para a natureza na tentativa de apreender como solucionar os problemas reais, entre os quais os problemas inversos. Esse olhar para a natureza se justica pela simples razo de que ela tem evoludo atravs de milhes de anos, dando solues otimizadas a todos os problemas naturais que ocorrem. Ento, por que no aprender com ela? justamente isso que uma parte da Inteligncia Computacional, a que desenvolve os algoritmos inspirados na natureza, os chamados algoritmos bio-inspirados, tenta fazer: desenvolver tcnicas computacionais cujos modelos tentam imitar comportamentos de seres encontrados na natureza, tais como, formigas, pssaros, abelhas e vaga-lumes, entre outros. Os autores deste livro tm apresentado e publicado diversos trabalhos em congressos e peridicos nacionais e internacionais, e tm tido a oportunidade de acompanhar o signicativo crescimento do interesse nestas reas de pesquisa. Neste livro dado enfoque na formulao e na soluo de problemas inversos empregando tcnicas de inteligncia computacional inspiradas na natureza. So ento usados como exemplos didticos tanto na formulao quanto na soluo dos problemas inversos, problemas associados transferncia radiativa em meios participantes, i.e. meios absorvedores, espalhadores e emissores. Estes problemas esto relacionados a diversas aplicaes 17

18

Introduo

relevantes tais como tomograa, tica hidrolgica, e modelos climticos. Os principais objetivos deste livro so: fornecer de forma sucinta e clara os fundamentos matemticos envolvidos na formulao e na soluo de problemas diretos e inversos, tendo por base o fenmeno de transferncia radiativa, i.e. interao de radiao com meios participantes (emissores, absorvedores e espalhadores); descrever algumas tcnicas de inteligncia computacional inspiradas na natureza; apresentar a aplicao das tcnicas de inteligncia computacional para a soluo de problemas inversos. apresentada a seguir a estrutura deste livro. No Captulo 2 apresenta-se o problema de transferncia radiativa que ser utilizado nos Captulos de 5 a 13, bem como a sua importncia em diversos problemas atuais. No Captulo 3 explica-se o que so problemas inversos e porque so to estudados atualmente. No Captulo 4 so discutidos os conceitos de Inteligncia Computacional e Inteligncia Articial, so apresentados brevemente as tcnicas que sero estudadas nos demais captulos e tambm os conceitos mais comumente utilizados na rea de otimizao. Nos Captulos de 5 a 13 so apresentadas as nove metaheursticas consideradas neste livro. Todos esses possuem quatro subsees: uma explicao da motivao do mtodo, a explicao do algoritmo computacional, sua aplicao ao problema de transferncia radiativa e consideraes nais. O Captulo 5 apresenta a metaheurstica Recozimento Simulado, o Captulo 6 os Algoritmos Genticos, o Captulo 7 as Redes Neurais, o Captulo 8 os Algoritmos Neuro-Nebulosos, o Captulo 9 a Colnia de Formigas, o Captulo 10 a Otimizao por Enxame de Partculas, o Captulo 11 a Otimizao Extrema Generalizada, o Captulo 12 a Coliso de Partculas e o Captulo 13 os Algoritmos de Evoluo Diferencial. O Captulo 14 apresenta as consideraes nais dos editores deste livro, com base na experincia que obtiveram durante a edio do mesmo. Ao nal so apresentadas as referncias bibliogrcas utilizadas em todos os captulos deste livro.

Captulo 2

Transferncia Radiativa
Antnio Jos da Silva Neto Ezzat Selim Chalhoub Haroldo Fraga de Campos Velho

2.1

Introduo

A formulao e a soluo de problemas diretos e inversos em transferncia radiativa esto diretamente relacionadas a um grande nmero de reas de elevado interesse cientco e tecnolgico, tais como tomograa [125, 41], sensoriamento remoto e cincias ambientais [244, 254, 101, 84], e a estimativa de propriedades radiativas [129, 91, 240, 275], entre muitas outras. Muitas abordagems foram desenvolvidas para a soluo destes problemas. Hansen e Travis [102] e Lenoble [143] forneceram excelentes artigos de reviso dos mtodos para a soluo do problema direto de transferncia radiativa, e McCormick [168] fez o mesmo com relao aos problemas inversos. Recentemente tem sido observado um interesse crescente nos mtodos estocsticos de Monte Carlo para a soluo do problema direto [164, 55, 17, 191], bem como em variantes do Mtodo de Ordenadas Discretas [45, 47, 48], que foi inicialmente proposto por Wick [264] e Chandrasekhar [52, 53]. Alguns pesquisadores tm tambm realizado comparaes entre diferentes estratgias visando identicar mtodos precisos e rpidos, do ponto de vista computacional, para serem usados tanto nos problemas diretos quanto nos problemas inversos em transferncia radiativa [118, 38, 49, 50]. 19

20

Transferncia Radiativa

2.2

Formulao Matemtica do Problema de Transferncia Radiativa

Neste livro usado o problema inverso de transferncia radiativa em meios participantes, i.e. meios absorvedores, espalhadores e emissores, como o problema base para o emprego de tcnicas de inteligncia computacional para a estimativa de propriedades radiativas, com o problema inverso sendo formulado como um problema de otimizao. Neste captulo apresentado o problema direto de transferncia radiativa em um meio homogneo plano-paralelo, e tambm em um meio heterogneo formado por duas camadas.

2.2.1

Meio participante homogneo unidimensional

Na Figura 2.1 representado um meio participante, isto absorvedor, espalhador e emissor, unidimensional de espessura L, com paredes reetoras difusas, sujeito incidncia de radiao externa com intensidades f1 e f2 .

Figura 2.1: Representao esquemtica de um meio participante unidimensional


com superfcies internas reetoras difusas e submetido incidncia de radiao externa de intensidades f1 e f2 .

A formulao matemtica do problema de transferncia radiativa no meio, i.e. interao da radiao com o meio participante, em regime permanente, para um dado comprimento de onda (a dependncia omitida para simplicar a notao), homogneo, ou seja as propriedades radiativas so constantes, o espalhamento isotrpico, e com simetria azimutal, dada pela verso linear da equao de Boltzmann [186],

Formulao Matemtica do Problema de Transferncia Radiativa

21

I (x, ) s + I (x, ) = x 2

I (x, )d + S (x, );
1

0 < x < L, 1 1
1

(2.2.1a) (2.2.1b) (2.2.1c)

I (0, ) = f1 () + 21
0

I (0, ) d ; > 0
1

I (L, ) = f2 () + 22
0

I (L, ) d ; < 0

onde I representa a intensidade da radiao, x a coordenada espacial, o cosseno do ngulo polar (vide Figura 2.1), s o coeciente de espalhamento, S uma fonte interna de radiao, e 1 e 2 as reetividades difusas nas superfcies internas do meio, respectivamente em x = 0 e x = L, e o coeciente de extino total = a + s (2.2.2)

onde a o coeciente de absoro. Apenas para citar um exemplo, na Tabela 2.1 so fornecidos os valores dos coecientes de absoro e de espalhamento para a gua do mar. Tipo gua do mar pura (pure sea water) oceano longe da costa (clear ocean) oceano junto costa (coastal ocean) gua turva (turbid water)
mar, [177].

a (m1 ) 0,0405 0,114 0,179 0,366

s (m1 ) 0,0025 0,037 0,219 1,824

Tabela 2.1: Coecientes de absoro a e de espalhamento s para a gua do

Quando a geometria, as propriedades radiativas e as condies de contorno so conhecidas, o problema de transferncia radiativa formulado com as equaes (2.2.1) pode ser resolvido fornecendo os valores calculados da intensidade da radiao, I (x, ), em todo o domnio espacial, 0 x L, e angular, 1 1. Este o problema direto de transferncia radiativa em um meio homogneo unidimensional.

22

Transferncia Radiativa

Em problemas envolvendo a transferncia radiativa usual o emprego da varivel tica, , denida como
x

d = dx =
0

dx

(2.2.3)

Considerando a integrao em todo o domnio espacial obtm-se a espessura tica do meio,


L

0 =
0

dx

(2.2.4)

que para um meio homogneo corresponde a 0 = L (2.2.5)

Dividindo a equao (2.2.1a) pelo coeciente de extino total denido na equao (2.2.2) e empregando as denies da varivel tica e da espessura tica 0 , nas equaes (2.2.3) e (2.2.4), respectivamente, bem como desprezando o termo de fonte interna S (x, ), o problema de transferncia radiativa em um meio participante absorvedor e espalhador formulado matematicamente por [186], 1 I (, ) + I (, ) = I (, )d ; 2 1 0 < < 0 , 1 1
1

(2.2.6a) (2.2.6b) (2.2.6c)

I (0, ) = f1 () + 21
0

I (0, ) d ; > 0
1

I (0 , ) = f2 () + 22
0

I (0 , ) d ; < 0

onde o albedo de espalhamento simples, que corresponde razo entre o coeciente de espalhamento e o coeciente de extino total s s = (2.2.7) a + s e os outros smbolos nas equaes (2.2.6) j foram denidos anteriormente. Apenas para citar um exemplo, na Tabela 2.2 so fornecidos os valores do coeciente de extino total, da espessura tica e do albedo de espalhamento simples considerando uma lmina de gua do mar com 5 m de espessura. Para citar um segundo exemplo, na Tabela 2.3 so fornecidos os valores do coeciente de extino e da espessura tica para nuvens cirrus. Os valores apresentados foram obtidos por Das et al. [69] na Univesidade Central Nacional de Taiwan. =

Formulao Matemtica do Problema de Transferncia Radiativa Tipo gua do mar pura (pure sea water) oceano longe da costa (clear ocean) oceano junto costa (coastal ocean) gua turva (turbid water)
= a + s (m1 ) 0 = L =
s

23
s a +s

0,043 0,151 0,398 2,190

0,215 0,755 1,990 10,95

0,058 0,245 0,550 0,833

Tabela 2.2: Coeciente de extino total , espessura tica 0 e albedo de espalhamento simples para a gua do mar. Valores calculados a partir da Tabela 2.1 para uma lmina de gua com L = 5 m de espessura. Tipo de nuvem cirrus Sub-visvel (0 < 0, 03) (sub-visible ) Fina (0, 03 < 0 < 0, 3) (thin ) Espessa (0 > 0, 3) (dense ) Propriedade (km1 ) 0 (km1 ) 0 (km1 ) 0 Mdia anual 0, 013 0, 008 0, 012 0, 008 0, 118 0, 15 0, 114 0, 071 0, 42 0, 33 0, 67 0, 4

Tabela 2.3: Propriedades mdias de nuvens cirrus obtidas na Universidade Central Nacional de Taiwan no perodo de 1999 a 2006 [69]. o coeciente de extino e 0 a espessura tica (optical depth ) Nos problemas tratados neste livro, considera-se que as fontes externas de radiao so isotrpicas, e, portanto, = A1 = constante , > 0 = A2 = constante , < 0 (2.2.8a) (2.2.8b)

f1 () f2 ()

2.2.2

Meio participante heterogneo unidimensional em duas camadas

H um elevado interesse no tratamento do problema de transferncia radiativa em meios multi-camadas [212, 260, 268, 231], devido a relevantes aplicaes em diferentes reas tais como modelos climticos regionais e globais [101], pesquisa sobre o Sistema Solar [107], sensoriamento remoto da

24 Terra [254] e estudos de nuvens [26].

Transferncia Radiativa

Na Figura 2.2 representado um meio participante, isto absorvedor, espalhador e emissor, unidimensional, composto por duas camadas de espessura L1 e L2 , com paredes internas reetoras difusas, sujeito incidncia de radiao externa com intensidades f1 e f2 .

Figura 2.2: Representao esquemtica de um meio participante heterogneo unidimensional composto por duas camadas com superfcies internas reetoras difusas e submetido incidncia de radiao externa de intensidades f1 e f2 .

A formulao matemtica do problema de transferncia radiativa em regime permanente no meio heterogneo unidimensional composto por duas camadas cinzas, ou seja as propriedades radiativas no dependem do comprimento de onda, homogneas, ou seja as propriedades radiativas so constantes em cada camada, com espalhamento isotrpico, e simetria azimutal, dada pela verso linear da equao de Boltzmann [231], Regio 1
1 s I1 (x, ) + 1 I1 (x, ) = 1 I1 (x, )d ; x 2 1 0 < x < L1 , 1 1 1

(2.2.9a) (2.2.9b) (2.2.9c)

I1 (0, ) = f1 () + 21
0 1

I1 (0, ) d ; > 0 I1 (L1 , ) d ; < 0


0

I1 (L1 , ) = (1 3 )I2 (L1 , ) + 22

Soluo do Problema de Transferncia Radiativa Regio 2


1 s I2 (x, ) + 2 I2 (x, ) = 2 I2 (x, )d ; x 2 1 L1 < x < L1 + L2 , 1 1 1

25

(2.2.10a)

I2 (L1 , ) = (1 2 )I1 (L1 , ) + 23


0 1

I2 (L1 , ) d ; > 0 (2.2.10b) I2 (L1 + L2 , ) d ; < 0 (2.2.10c)

I2 (L1 + L2 , ) = f2 () + 24
0

onde Ii representa a intensidade da radiao na camada i, com i = 1 ou 2, i o coeciente de extino total, i = ai + si (2.2.11)

ai o coeciente de absoro, si o coeciente de espalhamento, e j so as reetividades difusas, com j = 1, ..., 4. Os outros smbolos matemticos foram denidos na subseo anterior. Quando a geometria, as propriedades radiativas e as condies de contorno so conhecidas, o problema de transferncia radiativa formulado com as equaes (2.2.9) e (2.2.10) pode ser resolvido fornecendo os valores calculados da intensidade da radiao I1 (x, ) para 0 x L1 , e I2 (x, ) para L1 x L1 + L2 , em todo o domnio angular, 1 1. Este o problema direto de transferncia radiativa em um meio heterogneo unidimensional formado por duas camadas homogneas.

2.3

Soluo do Problema de Transferncia Radiativa

Conforme descrito na Seo 2.1, diversas abordagens foram desenvolvidas para a soluo do problema de transferncia radiativa [102, 143]. aqui descrita a abordagem empregando o Mtodo de Ordenadas Discretas [53] e o Mtodo de Diferenas Finitas [229]. Esta abordagem foi empregada para a soluo dos problemas diretor relativos aos Captulos 5 a 12.

2.3.1

Meio participante homogneo unidimensional

Na Figura 2.3 representada a discretizao do domnio angular. Na Figura 2.4 representada a discretizao do domnio espacial para o meio participante homogneo unidimensional.

26

Transferncia Radiativa

Figura 2.3: Discretizao do domnio angular, 1 1.

Figura 2.4: Discretizao do domnio espacial para o meio homogneo unidimensional, 0 0 . As intensidades da radiao nos domnios angular e espacial discretizados so representadas por i Im = I (i , m ), com i = (i 1), i = 1, 2, ..., Nx e onde = m = 1, 2, ..., M (2.3.12)

0 (2.3.13) Nx 1 O termo integral no lado direito da equao (2.2.6a) substitudo por uma quadratura de Gauss-Legendre [53, 4] q = 2
i

I (, )d 2 1

M i an In n=1

(2.3.14)

onde an , n = 1, 2, ..., M, so os pesos da quadratura correspondentes aos pontos de colocao, n . Como um exemplo, na Tabela 2.3 so apresentados os pontos de colocao e os pesos para o caso com M = 20. Observe que M i+1 = i , com i > 0, i = 1, 2, ..., e aM i+1 = ai , i = 1, 2, ..., M 2 M , 2 (2.3.15) (2.3.16)

Soluo do Problema de Transferncia Radiativa i 1 2 3 4 5 6 7 8 9 = 10 i = M i+1 0,07652 0,22778 0,37370 0,51086 0,63605 0,74633 0,83911 0,91223 0,96397 0,99312 ai = aM i+1 0,15275 0,14917 0,14209 0,13168 0,11819 0,10193 0,08327 0,06267 0,04060 0,01761

27

M 2

Tabela 2.4: Pontos de colocao, i , e pesos correspondentes, ai , para a quadratura Gauss-Legendre com M = 20, [4].

Considerando aproximaes por diferenas nitas avanadas e atrasadas para o primeiro termo do lado esquerdo da equao (2.2.6a) obtm-se

I (, ) I (, )

=
(i ,m )

i+1 i Im Im ,

e (2.3.17)

=
(i ,m )

i i1 Im Im

Das equaes (2.2.6a), (2.3.14) e (2.3.17) obtm-se ento

i+1 Im = i1 Im =

m 1+ m 1

i q m i i Im q m
i Im +

(2.3.18a) (2.3.18b)

A equao (2.2.6.b) na superfcie de contorno = 0 aproximada por

28

Transferncia Radiativa

M 1 Im = f1 (m ) + 21 n=M/2+1 1 an |n |In ,

com m = 1, 2, ..., M 2
M/2 Nx = f2 (m ) + 22 Im Nx , an n In n=1 M 2 +

(2.3.19a)

A equao (2.2.6c) na superfcie de contorno = 0 aproximada por

com m =

1, M 2 + 2, ..., M (2.3.19b)

A partir da equao (2.3.19a) realizada ento uma marcha para frente i+1 com a equao (2.3.18a), para m = sendo calculados os valores de Im M 1, 2, ..., 2 , e i = 1, 2, ..., Nx 1. A partir da equao (2.3.19b) realizada ento uma marcha para trs i1 com a equao (2.3.18b), para m = sendo calculados os valores de Im M M 2 + 1, 2 + 2, ..., M , e i = Nx , Nx 1, ..., 2. As marchas para frente e para trs so repetidas at que um critrio de parada seja atendido, como por exemplo a convergncia nos valores da intensidade da radiao. As intensidades da radiao que efetivamente emergem em = 0 e = 0 so dadas por
ef 1 1 Im = (1 1 )Im Nx ef Nx Im = (1 2 )Im

, para m =

M 2

+ 1, M 2 + 2, ..., M
M 2

(2.3.20a) (2.3.20b)

, para m = 1, 2, ...,

Na Figura 2.5 so apresentados os valores calculados para as intensidades da radiao (radincias) empregando quatro mtodos [50]: SM DO (Single Mesh Discrete Ordinates) - Mtodo das Ordenadas Discretas com o Mtodo de Diferenas Finitas. Este o mtodo descrito nesta seo para o meio participante homogneo unidimensional, e na prxima seo para o meio participante heterogneo unidimensional em duas camadas. M C - Mtodo de Monte Carlo ASN (Analytical Discrete Ordinates) - Mtodo Analtico de Ordenadas Discretas. LT SN (Laplace Transform Discrete Ordinates) - Mtodo das Ordenadas Discretas com Transformada de Laplace.

Soluo do Problema de Transferncia Radiativa

29

Figura 2.5: Intensidade da radiao emergente em = 0 (para < 0) e em


= 0 (para > 0) para diferentes valores do albedo de espalhamento simples e da espessura tica 0 . f1 () = A1 = 1; f2 () = A2 = 0; 1 = 2 = 0.

Para os quatro casos apresentados foram consideradas fontes externas isotrpicas com intensidades f1 () = A1 = 1 e f2 () = A2 = 0. Vide equaes (2.2.8). Tambm foi considerado que as paredes do meio so transparentes, ou seja 1 = 2 = 0. Vide equaes (2.2.6).

30

Transferncia Radiativa

2.3.2

Meio participante heterogneo unidimensional em duas camadas

Na Figura 2.6 representada a discretizao do domnio espacial para o meio participante heterogneo unidimensional em duas camadas (vide Figura 2.2). A discretizao do domnio angular idntica quela apresentada na Figura 2.3.

Figura 2.6: Discretizao do domnio espacial para o meio heterogneo unidimensional em duas camadas.

Considerando um espaamento regular entre os ns do domnio espacial discretizado

x(1) x(2)

= =

L1 Nx L2 K Nx

(2.3.21a) (2.3.21b)

substituindo os termos integrais no lado direito das equaes (2.2.9) e (2.2.10) por quadraturas Gauss-Legendre, e usando aproximaes por diferenas nitas avanadas, construda uma marcha para frente com [231]

Soluo do Problema de Transferncia Radiativa

31

2 I1 m = f1m + 21

an |n |I12n , m = 1, 2, ..., M 2
n= M 2 +1

(2.3.22)

M I1m2 = 1m I1m2 + bi 1m , m = 1, 2, ..., 2 , i = 1, 2, ..., Nx

i+ 1

i 1

(2.3.23a)

onde
i q1 =

s1 2
1 2

M i an I1 n , i = 1, 2, ..., Nx n=1

(2.3.23b) (2.3.23c)

bi 1m =
N +1 2

i q1 m + x(1)

, m = 1, 2, ..., M 2 , i = 1, 2, ..., Nx
1 N +2

x I2m

x = (1 2 )I1m

+ 23

an |n |I2nx
n= M 2 +1

N +1 2

(2.3.24)

m = 1, 2, ..., M 2
M I2m2 = 2m I2m2 + bi 2m , m = 1, 2, ..., 2 , i+ 1 i 1

i = Nx + 1, Nx + 2, ..., K onde
i q2 = i q2 +

(2.3.25a)

s2 2

M i an I2 n , i = Nx + 1, Nx + 2, ..., K n=1

(2.3.25b) (2.3.25c)

bi 2m =

m x(2)

2 2

, m = 1, 2, ..., M 2 , i = Nx + 1, Nx + 2, ..., K

i Ilm

= Il (xi , m ) = i = e

Ilm 2 + Ilm 2 , m = 1, 2, ..., M, 2 1, 2, ..., Nx para l = 1


M 2

i+ 1

i 1

i = Nx + 1, Nx + 2, ..., K para l = 2 (2.3.26) f1m = f1 (m ), m = 1, 2, ..., (2.3.27)

A intensidade da radiao que efetivamente emerge em x = L1 + L2 dada por 1 K+ 1 ef K + 2 (2.3.28) I2m = (1 4 )I2m 2 , m = 1, 2, ..., M 2

32

Transferncia Radiativa

Usando novamente as quadraturas de Gauss-Legendre e uma aproximao por diferenas nitas atrasadas construda uma marcha para trs com [231]
K+ 1 I2m 2
M 2

= f2m + 24
n=1

an n I2n
i+ 1

1 K+ 2

, m=

M 2

+ 1, M 2 + 2, ..., M

(2.3.29)

I2m2 = onde
i q2

i 1

I1m2 i M M + 2 m , m = 2 + 1, 2 + 2, ..., M, 2m i = K, K 1, ..., Nx + 1


M

(2.3.30a)

s = 2 2

i 2m =

i an I2 n, n=1 i q2 , m 2 x(2) + 2

i = Nx + 1, Nx + 2, ..., K m=
M 2

(2.3.30b)

+ 1, M 2 + 2, ..., M, (2.3.30c)

i = K, K 1, ..., Nx + 1
Nx + 1 2 I1m
1 Nx + 2 3 )I2m M 2 1 N +2

= (1

+ 22 m
n=1 =M 2

an n I1nx

, (2.3.31)

+ 1, M 2 + 2, ..., M

i 1 Im 2

I 2 i M M = 1m + 1 m , m = 2 + 1, 2 + 2, ..., M, 1m i = Nx , Nx 1, ..., 1
i q1 = i q1 m + x(1) 1 2

i+ 1

(2.3.32a)

onde s1 2
M i an I1 n , i = 1, 2, ..., Nx n=1 M 2

(2.3.32b)

i 1 m =

, m=

+ 1, M 2 + 2, ..., M, (2.3.32c) (2.3.33)

i = Nx , Nx 1, ..., 1 f2m = f2 (m ), m =
1 x(1) 2m x(1) 1+ 12m

M 2

+ 1,

M 2

+ 2, ..., M

e os demais smbolos j foram denidos anteriormente, com a exeo de 1m =


1

, m = 1, 2, ..., M

(2.3.34)

Consideraes Finais 2m = por


ef 1/2 I1m 1
2 x(2) 2m x(2) 1+ 22m

33 , m = 1, 2, ..., M (2.3.35)

A intensidade da radiao que efetivamente emerge em x = 0 dada = (1 1 )I1m , m =


1/ 2 M 2

+ 1, M 2 + 2, ..., M

(2.3.36)

De forma a obter uma aproximao da soluo do problema de transferncia radiativa formulado matematicamente com as equaes (2.2.9) e (2.2.10) so realizadas sucessivamente marchas para frente e para trs com as equaes (2.3.22) a (2.3.27) e (2.3.29) a (2.3.33), respectivamente, at que um critrio de parada seja satisfeito, como por exemplo
i k+1 i k < , m = 1, 2, ..., M, i = 1, 2, ..., Nx para l = 1 Ilm Ilm

e i = Nx + 1, Nx + 2, ..., K para l = 2 (2.3.37) onde uma tolerncia denida a priori e k o ndice da iterao (marcha).

2.4

Consideraes Finais

O albedo de espalhamento simples e as reetividades difusas j , com j = 1 ou 2 para o meio homogneo unidimensional, e j = 1, ..., 4 para o meio heterogneo unidimensional em duas camadas, so grandezas cujos valores esto no intervalo [0, 1]. A espessura tica uma grandeza positiva, no possuindo um limite superior. Porm, para a soluo dos problemas inversos com os mtodos descritos neste livro necessrio denir uma regio de busca para os valores das incgnitas, sendo ento escolhido um valor mximo 0 usualmente entre 2 e 10, exceto quando indicado de outra forma. Em resumo, tem-se 01 0 j 1 j = 1 ou 2, ou j = 1, ..., 4 0 0 0 (2.4.38) (2.4.39) (2.4.40)

onde 0 um limite superior articial escolhido de acordo com o problema que se deseja resolver. Este mesmo procedimento empregado para a espessura tica adotado para as intensidades das fontes externas, A1 e A2 , bem como para os coecientes de absoro e de espalhamento, a e s , no meio heterogneo unidimensional de duas camadas. No Captulo 13 no foi utilizado o Mtodo de Ordenadas Discretas com Diferenas Finitas descrito na Seo 2.3. Neste caso foi empregado o mtodo de colocao [255, 269].

34

Transferncia Radiativa

Captulo 3

Problemas Inversos em Transferncia Radiativa Uma Formulao Implcita


Antnio Jos da Silva Neto Haroldo Fraga de Campos Velho

3.1

O Que um Problema Inverso?

Em primeiro lugar vamos denir o que um problema direto. Considere o problema de transferncia radiativa descrito no Captulo 2, representado esquematicamente na Figura 2.1 para um meio participante homogneo unidimensional e na Figura 2.2 para um meio participante heterogneo unidimensional, composto por duas camadas. A radiao externa incidente nas superfcies de contorno entra no meio e interage com o mesmo. Para este processo, que envolve os fenmenos de absoro e de espalhamento, dispe-se de um modelo que descrito matematicamente pela verso linear da equao de Boltzmann. Nos dois casos aqui considerados, i.e. meio homogneo unidimensional e meio heterogneo unidimensional em duas camadas, tem-se as formulaes matemticas descritas respectivamente pelas equaes (2.2.1) ou (2.2.6), e pelas equaes (2.2.9, 2.2.10). Quando a geometria, as propriedades radiativas e as condies de contorno so conhecidas, o problema de transferncia radiativa pode ser resol35

36

Problemas Inversos em Transferncia Radiativa

vido fornecendo os valores calculados da intensidade da radiao. Este o Problema Direto (PD). Conforme a representao feita na Figura 3.1(a), a partir do conhecimento dos fenmenos envolvidos em um determinado processo, sendo aqui considerado o problema de transferncia radiativa, e do modelo matemtico usado para descrev-lo, incluindo a geometria do meio sob anlise, e de uma causa conhecida, por exemplo a intensidade da radiao incidente nas superfcies de contorno no meio participante, pode ser calculado o efeito, ou seja a intensidade da radiao (radincia) em qualquer ponto do meio e em qualquer direo angular. A incgnita do problema direto de transferncia radiativa, i.e. o efeito, , portanto, a intensidade da radiao.

Figura 3.1: Representao esquemtica do Problema Direto (a) e do Problema


Inverso (b) [215].

Considere agora que a condio de contorno, i.e. a intensidade de uma ou das duas fontes externas de radiao, e/ou as propriedades radiativas do meio, i.e. os coecientes de absoro e de espalhamento e as reetividades difusas, no so conhecidos. Porm, esto disponveis valores experimentais da intensidade da radiao, Y , medidos externamente ao meio conforme representado na Figura 3.2. possvel ento determinar as incgnitas do problema a partir destes dados experimentais? Fazendo esta pergunta de outra forma, possvel determinar a causa, i.e. as intensidades da radiao externa incidente, e/ou o que se desconhece do processo que est sendo investigado, i.e. as propriedades radiativas, a partir dos valores medidos experimentalmente da radiao

Uma Formulao Implcita para o Problema Inverso

37

Figura 3.2: Representao esquemtica de um meio participante homogneo unidimensional e da radiao que emerge do mesmo com intensidade Y e que medida experimentalmente. que emerge do meio? Este o Problema Inverso (PI), representado esquematicamente na Figura 3.1 (b). Diversas questes relevantes com relao soluo do problema inverso surgem, como por exemplo a existncia e a unicidade da soluo, o condicionamento do mesmo e a possvel amplicao dos rudos, e a sensibilidade dos dados experimentais ( e do modelo) s incgnitas que se deseja determinar. No o objetivo deste livro tratar cada um destes temas, e so sugeridas ento as Refs. [25, 249, 82, 40, 57, 218, 215] para o leitor interessado.

3.2

Uma Formulao Implcita para o Problema Inverso

Existem diversas formas de formular e de resolver os problemas inversos, e consequentemente existem diversas classicaes para os mesmos [40]. Beck divide os problema inversos em dois grupos: estimativa de parmetros e estimativa de funes [24]. Esta classicao baseada na dimenso do objeto matemtico a ser estimado, i.e. uma constante (dimenso nita), ou uma funo (dimenso innita). Silva Neto e Moura Neto [218] propuseram uma classicao que tambm leva em conta a dimenso do modelo matemtico usado na representao do processo estudado. Desta forma um modelo de dimenso innita (representado por equaes diferenciais parciais, ou equaes integro-diferenciais, por exemplo) pode estar relacionado estimativa de objetos matemticos tanto de dimenso nita quanto de dimenso innita. Do ponto de vista dos mtodos desenvolvidos para a formulao e soluo

38

Problemas Inversos em Transferncia Radiativa

de problemas inversos, Dulikravich et al. [79] indicam que estes podem ser agrupados basicamente de acordo com duas abordagens: mtodos inversos puros e mtodos baseados em otimizao. Neste livro fazemos referncia s formulaes explcitas e implcitas para os problemas inversos [207, 216, 221], e esta clasicao parece estar em acordo com aquela de Dulikravich e colaboradores. Na formulao explcita as equaes usadas na modelagem do problema direto so manipuladas, obtendo-se uma expresso onde as incgnitas a serem determinadas aparecem explicitamente. Roberty, Silva Neto e colaboradores propuseram e implementaram o mtodo fonte-detetor [220, 120], que requer a soluo do problema direto, e McCormick e Silva Neto [217] propuseram e implementaram um mtodo analtico baseado nos momentos da radiao emergente do meio, que no requer a soluo do problema direto. Na Ref. [221] Roberty, Silva Neto e colaboradores apresentam tambm uma formulao explcita matricial. Com relao s formulaes implcitas, uma abordagem muito usual empregada na soluo de problemas inversos em transferncia radiativa consiste na minimizao de uma funo objetivo, tambm denominada funo custo, como por exemplo aquela dada pela soma dos resduos quadrados entre os valores calculados com o modelo e os valores medidos experimentalmente para a intensidade da radiao. O ponto focal da busca da soluo do problema inverso passa ento a ser o emprego de mtodos determinsticos, mtodos estocsticos e/ou mtodos hbridos para a minimizao da funo objetivo. Considere que no problema inverso relativo ao meio participante homogneo unidimensional descrito na subseo 2.2.1 deseja-se determinar a espessura tica 0 , o albedo de espalhamento simples, , e as reetividades difusas 1 e 2 . Tem-se ento o vetor de incgnitas T Z = {0 , , 1 , 2 } (3.2.1)

onde o sobrescrito T indica transposta. Os Captulos 5 a 12 deste livro tratam deste problema. No Captulo 13 considerado um problema inverso um pouco diferente no qual as intensidades das fontes externas isotrpicas de radiao so consideradas desconhecidas, i.e. A1 e A2 , alm do albedo de espalhamento simples e da espessura tica 0 . O vetor de incgnitas corresponde ento a T Z = {, 0 , A1 , A2 } (3.2.2) No problema inverso relativo ao meio participante heterogneo unidimensional em duas camadas descrito na Seo 2.2.2 deseja-se determinar os coecientes de absoro a e de espalhamento, s , nas duas camadas.

Uma Formulao Implcita para o Problema Inverso Tem-se ento o vetor de incgnitas T Z = {s1 , a1 , s2 , a2 }

39

(3.2.3)

Considere agora que dados experimentais da radiao que deixa o meio, i.e. Yi , com i = 1, 2, ..., Nd , onde Nd o nmero total de dados experimentais, esto disponveis. Na Figura 3.3 representada a situao na qual os dados experimentais so obtidos nas superfcies de contono do meio e, por convenincia, nas posies angulares correspondentes discretizao do domnio angular descrita na Seo 2.3.1 (vide Figura 2.3). Nesta situao tem-se ento Nd = M .

Figura 3.3: Representao esquemtica dos dados experimentais Yi , i = obtidos na supercie = 0 (para > 0), e Yi , i = M + 1, M + 2, ..., M 1, 2, ..., M 2 2 2 na supercie = 0 (para < 0). Para o problema inverso relacionado ao meio participante heterogneo unidimensional em duas camadas tambm so utilizados dados experimentais medidos na interface entres as duas camadas, mas tambm por convenincia, estes so adquiridos nas posies angulares correspondentes discretizao do domnio angular representada na Figura 2.3. Como tambm so usados os dados experimentais obtidos nas superfcies de contorno, tem-se neste caso um total de Nd = 2M dados experimentais. Os dados medidos no interior do meio, na interface entre as duas camadas, so necessrios para resolver o problema de no-unicidade da soluo que ocorre quando apenas os dados obtidos por detetores externos so considerados. Para a abordagem de interesse neste livro, o problema inverso de transferncia radiativa formulado como um problema de otimizao no qual se

40

Problemas Inversos em Transferncia Radiativa

busca minimizar a funo objetivo dada pela soma dos resduos quadrados, Q Z =
Nd i=1

Ii Z Yi

= FTF

(3.2.4)

onde Ii e Yi correspondem respectivamente ao valor calculado e ao valor medido experimentalmente da intensidade da radiao para uma mesma posio e para uma mesma direo do ngulo polar representado por = cos, e os elementos do vetor de resduos F correspondem a Fi = Ii Z Yi ; i = 1, 2, ..., Nd (3.2.5)

Esta formulao para o problema inverso denominada de formulao implcita porque as incgnitas do problema, representadas pelo vetor Z , no aparecem explicitamente na formulao. Elas esto embutidas na formulao dos problemas diretos correspondentes e os seus efeitos para os problemas inversos so percebidos quando os problemas diretos so resolvidos e participam ento da composio da funo objetivo dada pela equao (3.2.4).

3.3

Dados Experimentais

Para a soluo de problemas inversos deve-se sempre buscar o uso de dados experimentais reais porque desta forma pode ser vericado se o modelo matemtico empregado representa adequadamente os fenmenos envolvidos no processo sob anlise. Porm, nem sempre se tem acesso a estes dados, e alm disso uma etapa importante no desenvolvimento de uma metodologia para a formulao e soluo de problemas inversos consiste na avaliao do desempenho do mtodo desenvolvido. uma prtica usual, portanto, a gerao de dados experimentais sintticos atravs da adio de rudos pseudoaleatrios, aos valores calculados da intensidade da radiao empregando os valores exatos das incgnitas que se deseja determinar, ou seja Yi = Ii Z exato + i (3.3.6)

onde i um nmero aleatrio gerado no intervalo [1, 1] e simula o desvio padro dos erros experimentais. Esta abordagem que emprega o mesmo modelo matemtico para gerar os dados experimentais sintticos e depois para resolver o problema inverso denominada crime inverso (inverse crime ). Porm, apesar de no permitir a avaliao do modelo matemtico do problema direto quanto representao

Soluo do Problema Inverso com LM

41

dos fenmenos envolvidos no processo sob anlise, esta abordagem permite uma boa avaliao do mtodo desenvolvido para o problema inverso porque tem-se o conhecimento prvio da soluo que se deseja obter, Z exato , e tambm exercido o controle do nvel de rudo presente no dado experimental. Uma maneira de atenuar o crime inverso, como um estgio anterior ao uso de dados experimentais reais, consiste no uso de um mtodo para a soluo do problema direto e gerao do dado experimental sinttico, e o uso de outro mtodo na soluo do problema inverso.

3.4

Soluo do Problema Inverso com o Mtodo de Levenberg-Marquardt (LM)

O mtodo de Levenberg-Marquardt (LM) [163] um mtodo determinstico baseado no gradiente, de busca local, muito empregado na soluo de problemas inversos formulados implicitamente como problemas de otimizao [218]. Buscando a minimizao da funo objetivo dada pela equao (3.2.4) escrita a equao do ponto crtico Q Z Q Z = 0 com j = 1, . . . , Nz = 0, i.e. Zj Z JT F Z = 0 (3.4.7)

onde Nz representa o nmero de incgnitas, que leva ento equao (3.4.8)

onde o sobrescrito T indica transposta e J representa a matriz Jacobiana cujos elementos so calculados usando Jij = Ii Zj (3.4.9)

com i = 1, 2, ..., Nd e j = 1, 2, ..., Nz , onde Nd representa o nmero total de dados experimentais. Fazendo uma expanso de Taylor e retendo apenas os termos at a primeira ordem, resulta F Z n+1 = F Z n + J Z n onde Z n = Z n+1 Z n Z n+1 = Z n + Z n (3.4.10) (3.4.11)

42

Problemas Inversos em Transferncia Radiativa Das equaes (3.4.8) a (3.4.11) obtm-se T T (J n ) J n Z n = (J n ) F n (3.4.12)

onde F n = F Z n . Visando melhorar o desempenho do algoritmo na busca do valor Z que minimiza a funo objetivo (3.2.4), Marquardt [163] props que um termo fosse adicionado diagonal da matriz J T J . Um dos revisores do trabalho de Marquardt indicou que, em 1944, Levenberg havia feito uma proposta semelhante. O mtodo passou ento a ser conhecido como o mtodo de Levenberg-Marquardt. A equao (3.4.12) passa ento a ser escrita como T T (J n ) J n + n I Z n = (J n ) F n (3.4.13)

onde n um fator de amortecimento, I representa a matriz identidade, e n um contador de iteraes. O fator de amortecimento alterado durante o processo iterativo do algoritmo visando auxiliar na convergncia do mtodo, e ao nal do procedimento iterativo ele deve estar prximo a zero [163, 218]. apresentado a seguir um algoritmo para o mtodo de Levenberg-Marquardt. Passo 0 - Obtenha os dados experimentais Passo 1 - Faa n = 0 e escolha Z 0 e 0 .
T

Yi , i = 1, 2, ..., Nd .

Passo 2 - Calcule J n e (J n ) a partir da equao (3.4.9). Passo 3 - Calcule I Z n com o problema direto, o vetor de resduos F n com a equao (3.2.5), e o valor da funo custo Q Z n com a equao (3.2.4). Passo 4 - Calcule Z n com a equao (3.4.13). Passo 5 - Calcule Z n+1 com a equao (3.4.11). Passo 6 - Verique se o critrio de parada estabelecido a priori foi atendido. Em caso armativo pare. Passo 7 - Faa Calcule Q Se Q Z n n = n + 1. n Z . Q Z n1 /a, onde a > 1, faa n = n1 /b, onde

Consideraes Finais b > 1, e volte para o Passo 2. Caso contrrio, faa com c > 1, faa Z n = Z n1 , e volte para o Passo 4.

43 n = cn1 ,

A estratgia para alterao do valor do fator de amortecimento n descrita no Passo 7 foi proposta por Marquardt [163]. Silva Neto e zisik [219] usaram os seguintes valores: a = b = c = 2 em um problema inverso em transferncia radiativa. Em muitas aplicaes, inclusive naqueles descritas nos Captulos 5 a 13 deste livro, quando aplicvel, o clculo do vetor de correes Z n foi feito empregando diretamente a equao (3.4.12), e o vetor com a nova estimativa para as incgnitas, Z n+1 foi obtido ento usando n+1 Z = Z n + Z n (3.4.14)

onde 0 < < 1. O objetivo central deste livro consiste na apresentao de um conjunto de mtodos estocsticos, de busca global, para a soluo de problemas inversos de transferncia radiativa formulados como problemas de otimizao, i.e. com uma formulao implcita. Porm, em muitos casos mostrados nos Captulos 5 a 13 so empregadas hibridizaes onde o mtodo estocstico usado para gerar uma estimativa inicial para o vetor de incgnitas, Z 0 , que ento usado no mtodo de Levenberg-Marquardt.

3.5

Consideraes Finais

Na Figura 3.4 apresentado um resumo de alguns dos conceitos discutidos neste captulo. Apenas para exemplicar so listados alguns mtodos correspondentes s formulaes explcitas e implcitas. Em todos os problemas inversos de transferncia radiativa tratados neste livro estaremos buscando determinar estimativas para os parmetros apresentados nas equaes (3.2.1) a (3.2.3), que so variveis reais. Conforme descrito na Seo 2.4, o albedo de espalhamento simples e as reetividades difusas 1 e 2 esto no intervalo [0, 1]. Para a espessura tica 0 atribudo um valor superior 0 articial apenas para a denio de uma regio de busca no intervalo [0, 0 ]. O mesmo procedimento aplicado para as intensidades da radiao externa e para os coecientes de espalhamento e absoro, s e a , quando aplicvel. Na maior parte das situaes tratadas neste livro so considerados os

44

Problemas Inversos em Transferncia Radiativa

Figura 3.4: Exemplos de formulaes explcitas e implcitas para a soluo do


problema inverso em transferncia radiativa.

seguintes valores para as intensidades das fontes de radiao externa: f1 () f2 () = A1 = 1, = A2 = 0, para > 0 para < 0 (3.5.15a) (3.5.15b)

Este um caso difcil, intencionalmente escolhido, para o tratamento do problema inverso. Conforme pode ser observado na Figura 3.2, o efeito da reetividade difusa 1 somente ser percebido no dado experimental Y em = 0 , para < 0 , aps a radiao externa entrar no meio, interagir com o mesmo atravs de interaes de absoro e espalhamento, ser reetida parcialmente de volta para o interior do meio na superfcie de contorno em = 0 , interagir novamente com o meio e aps atingir a superfcie de contorno em = 0 uma frao da radiao dada por (1 1 )I (0, ), com < 0, deixa o meio e captada pelos detetores localizados externamente superfcie em = 0. Uma anlise de sensibilidade permite identicar que a estimativa do parmetro 1 , na situao aqui descrita, de qualidade inferior estimativa dos outros parmetros de interesse [128].

Captulo 4

Fundamentos de Otimizao e Inteligncia Computacional


Luiz Biondi Neto Jos Carlos Becceneri Jos Demisio Simes da Silva Eduardo Fvero Pacheco da Luz Antnio Jos da Silva Neto

4.1

Conceitos Bsicos na rea de Otimizao

O problema de achar o valor mximo ou mnimo de uma funo objetivo, possivelmente sujeito a um conjunto de restries, conhecido como problema de otimizao. Nesta seo diversos conceitos comumente empregados em Otimizao so explicados. Para exemplicar alguns desses conceitos, o Problema do Caixeiro Viajante (PCV), pertencente rea de Otimizao Combinatria, utilizado, por ser um problema clssico e de fcil entendimento. Faz-se a ressalva de que os problemas inversos tratados nos Captulos 5 a 13, formulados como problemas de otimizao, tem por objetivo a determinao de variveis reais, mas o PCV, que trata da determinao de variveis discretas, permite apresentar de forma mais simples os conceitos bsicos em otimizao. 45

46

Fundamentos de Otimizao e Inteligncia Computacional

4.1.1

O Problema do Caixeiro Viajante (PCV)

Esse problema estabelecido do seguinte modo: Um caixeiro viajante deve visitar nc cidades e retornar cidade de onde partiu, sendo que, com exceo da cidade inicial, cada cidade deve ser visitada apenas uma vez. O objetivo minimizar o custo dessa viagem. Uma representao muito usada para este problema consiste em coloclo na forma de um grafo, onde as cidades so os ns e os caminhos entre elas so os arcos. Considere o exemplo a seguir com quatro cidades,isto nc = 4, com as coordenadas cartesianas mostradas na Tabela 4.1. Cidade A B C D x 1 3 2 5 y 1 2 4 5

Tabela 4.1: Coordenadas cartesianas de quatro cidades. Calculando-se as distncias cartesianas entre essas cidades, obtm-se os valores mostrados na Tabela 4.2. Distncias A B C D A 0, 0 2, 236 3, 162 5, 657 B 2, 236 0, 0 2, 236 3, 606 C 3, 162 2, 236 0, 0 3, 162 D 5, 657 3, 606 3, 162 0, 0

Tabela 4.2: Distncias entre as cidades da Tabela 4.1 A Figura 4.1 representa essas cidades na forma de um grafo. Para detalhes sobre o surgimento desse problema, que data de 1832, e sobre as muitas aplicaes que o mesmo pode ter, recomenda-se a leitura de [142].

4.1.2

Formulao do PCV como um Problema de Otimizao

Seja f uma funo com domnio S . Essa funo chamada de funo custo, funo de avaliao ou funo objetivo. Tem-se um problema de minimizao quando, dado f , objetiva-se encontrar s S tal que f (s ) f (s) , s S . Se o objetivo encontrar um s S tal que f (s ) f (s), s S , tem-se, ento, um problema de maximizao.

Conceitos Bsicos na rea de Otimizao

47

Figura 4.1: PCV da Tabela 4.1 na forma de grafo. As distncias no esto


representadas em escala.

Frequentemente, ao invs dos termos minimizao ou maximizao, usase o termo otimizao, sempre que no houver dvidas sobre o objetivo do problema em estudo (isto , se o objetivo encontrar um valor que minimize ou maximize). Por exemplo, em relao ao PCV, otimizar a viagem pode ter como objetivo: a) minimizar a distncia percorrida (nesse caso, a funo f mede distncia); ou b) maximizar o lucro da viagem (nesse caso, f avalia o lucro obtido com a viagem).

4.1.3

Espao de Busca

Um espao de busca um conjunto que contm todas as solues do problema que estamos tentando resolver. Esse espao pode ser nito ou innito enumervel. Considera-se que esse espao contenha apenas solues viveis, isto , aquelas que obedecem s restries do problema. Esses conceitos so exemplicados a seguir. Seja o PCV com quatro cidades rotuladas de A, B , C e D conforme representado na Figura 4.1. Uma soluo - isto , uma rota - do tipo A, B, D, C, A vivel, pois cada cidade visitada apenas uma nica vez e, ento, retorna-se cidade inicial. Uma rota do tipo A, B, C, D, B, A no representa uma soluo vivel, pois a cidade B visitada duas vezes. Um conceito importante aquele relativo a vizinhana. Designa-se por N (s) um conjunto chamado de vizinhos do ponto s. Esse conjunto constitudo por pontos de S que podem ser considerados prximos de s. Para formalizar essa denio, pode-se estabelecer uma mtrica d e um nmero real , denindo N (s) = {s S |d (s, s ) }.

48

Fundamentos de Otimizao e Inteligncia Computacional

4.1.4

Algoritmos

Um algoritmo um processo sistemtico para a resoluo de um problema. Podem-se classicar os algoritmos de diversos modos, alguns deles, denidos a seguir. Uma observao cabe neste ponto: no se pretende apresentar uma taxonomia de algoritmos e mtodos computacionais; apenas algumas das classicaes mais usadas atualmente na rea de otimizao so apresentadas. Algoritmos podem ser classicados como exatos ou aproximados. Algoritmos exatos, tais como tcnicas de enumerao do tipo branch-and-bound - veja, por exemplo, [9] ou [276] - garantem encontrar uma soluo tima para qualquer instncia de um problema de otimizao. Muitos desses problemas so N P -Difcil [92], implicando que mtodos exatos poderiam levar um tempo de computao muito grande para determinados tamanhos de entrada. Por isso, nas ltimas trs dcadas, muita ateno tem sido dada a mtodos aproximados. Os algoritmos tambm podem ser classicados em determinsticos e nodeterminsticos. Algoritmos determinsticos so aqueles nos quais, sempre que a entrada do problema for repetida, o resultado produzido ser o mesmo. J os algoritmos no-determinsticos, tambm chamados de probabilsticos, podem, diante de uma mesma entrada do problema, produzir resultados diferentes, pois consideram no seu processamento algum evento pseudo-aleatrio, como, por exemplo, a gerao de um nmero pseudo-aleatrio. Para um estudo sobre a gerao de nmeros pseudo-aleatrios em computador, recomenda-se a leitura de [132].

4.1.5

Heursticas e Meta-heursticas

O nome heurstica derivado da palavra grega heuriskein, que signica descobrir. Hoje esse termo usado para descrever um mtodo que, baseado na experincia ou julgamento, parece conduzir a uma boa soluo de um problema, mas que no garante produzir uma soluo tima [88]. Esse termo pode ser considerado como associado a um conhecimento circunstancial, no vericvel matematicamente. J o termo meta-heurstica deriva da composio de duas palavras gregas: heurstica, j explicada no pargrafo anterior, e o prexo meta, que signica aps, indicando um nvel superior de descoberta. comum encontrar-se a expresso heurstica gulosa, ou greedy heuristic . Essa heurstica resolve um problema de otimizao procurando, a cada iterao, o elemento constituinte da soluo que mais reduz o custo total naquele momento. A busca se encerra quando todos os elementos da

Conceitos Bsicos na rea de Otimizao

49

soluo tiverem sido calculados. A heurstica gulosa apresenta a vantagem de ser rpida e, em alguns casos, produzir solues ecientes. Por exemplo, considerando os dados expressos pela Figura 4.1, se uma heurstica gulosa aplicada, deve-se escolher um n inicial. Esse n inicial passa a ser o n corrente e, a partir dele, deve-se escolher, como prximo n, aquele que possui menor distncia do n corrente. Esse procedimento aplicado at que todas as cidades tenham sido visitadas. Muitas denies podem ser dadas sobre o termo meta-heurstica na computao, como, por exemplo: Uma meta-heurstica um conjunto de conceitos que podem ser usados para denir mtodos heursticos, os quais podem ser aplicados a um conjunto amplo de diferentes problemas. Em outras palavras, uma meta-heurstica pode ser vista como uma ferramenta algortmica geral que pode ser aplicada a diferentes problemas de otimizao, com modicaes relativamente pequenas para torn-la adaptvel a um problema especco [172]. Uma meta-heurstica uma estratgia de busca, no especca para um determinado problema, que tenta explorar ecientemente o espao das solues viveis desse problema. So algoritmos aproximados que incorporam mecanismos para evitar connamento em mnimos ou mximos locais. Conhecimentos especcos do problema podem ser utilizados na forma de heurstica para auxiliar no processo de busca (por exemplo, na busca de um possvel bom vizinho de um determinado ponto). Resumindo, pode-se dizer que meta-heursticas so mecanismos de alto nvel para explorar espaos de busca, cada uma usando um determinado tipo de estratgia. De grande importncia na aplicabilidade de uma meta-heurstica o balano dinmico entre diversicao e intensicao, fazendo uma distino entre os termos ingleses exploration e exploitation. O primeiro pode-se traduzir por diversicao, explorao diversicada, busca em largura ou simplesmente explorao; o segundo por explorao focada, busca em profundidade ou intensicao. Um dos desaos na aplicao de uma metaheurstica encontrar o equilbrio ideal entre diversicao e intensicao. A estratgia de busca de uma meta-heurstica depende da losoa por ela empregada, e seu objetivo escapar dos mnimos locais a m de proceder a explorao do espao de busca por solues ainda melhores. Na Figura 4.2, os pontos a e b so considerados mnimos locais e o ponto c, mnimo global entre os pontos x e y . Classicao das Meta-heursticas Talvez o modo mais intuitivo de se classicar meta-heursticas seja com base nas origens do algoritmo. Nesse sentido, pode-se diferenciar os al-

50

Fundamentos de Otimizao e Inteligncia Computacional

Figura 4.2: Mnimos locais e mnimo global.

goritmos inspirados na natureza, como os Algoritmos Genticos [110] e os Algoritmos das Formigas [32], daqueles no-inspirados na natureza, como a meta-heurstica Iterated Local Search [193]. Essa classicao pode no ser muito signicativa, visando mais a oferecer uma abordagem didtica. Por exemplo, o uso de memria na Busca Tabu [95] ou no inspirada em um processo natural? Diz-se que uma meta-heurstica bio-inspirada quando suas regras de busca tentam simular alguns aspectos do comportamento de seres vivos como, por exemplo, o j citado Algoritmo das Formigas [32, 75], o algoritmo dos Pssaros [80], o algoritmo das Abelhas [2] ou dos Vermes Luminosos [140]. No mtodo construtivo ou de trajetria, parte-se de um conjunto soluo vazio e segue-se acrescentando elementos a esse conjunto at obter uma soluo vivel para o problema. Mtodos populacionais partem de um conjunto de solues iniciais (a populao inicial) e tentam encontrar uma soluo melhor alterando-se elementos dessa populao. Um exemplo de modelo construtivo o Algoritmo das Formigas, pois este descreve uma trajetria no espao de busca durante a sua execuo. Meta-heursticas baseadas em populao, ao contrrio, executam um processo de busca modicando a populao inicial, como os Algoritmos Genticos (Genetic Algorithms, GA) e o Recozimento Simulado (Simulated Annealing, SA).

Inteligncia Articial

51

4.2

Inteligncia Articial

Apesar da pesquisa da Inteligncia Articial (IA) nos transportar antiguidade, nos remetendo at mesmo era Aristotlica, Alan Mathison Turing, matemtico ingls que desenvolveu a lgica computacional, considerado precursor da IA. Em 1950 escreveu um artigo, publicado no Jornal losco Mind, Computing Machinery and Intelligence onde descrevia o famoso Teste de Turing cuja proposta era vericar se uma mquina realmente pensava [251]. Posteriormente Turing desenvolveu a Mquina de Turing, um aparelho que deveria ler um conjunto de instrues de uma ta executandoas sequencialmente [252]. Entretanto, pode-se dizer que o nascimento ocial da IA ocorreu, de fato, logo aps a conferncia de vero em Dartmouth College, New Hampshire, USA, em 1956, justicando assim sua fama de representar uma das reas da Cincia da Computao mais recentes. Nessa Conferncia foi proposto por um grupo de jovens cientistas, John McCarthy (Dartmouth) [165], Marvin Minsky (Harvard) [174], Nathaniel Rochester (IBM) [167] e Claude Elwood Shannon (Bell Laboratories) [210] um estudo sobre o tema IA, expresso ainda pouco conhecida e utilizada para designar um tipo de inteligncia, construda pelo homem, para dotar mquinas de comportamentos inteligentes. Constitui-se dessa forma, um ramo da computao que procura representar o conhecimento atravs de smbolos diferentemente da representao feita exclusivamente por nmeros, tradicionalmente usada na computao. Para tal, faz uso de heursticas e regras aproximadas para adquirir, representar e processar adequadamente o conhecimento. Desde o incio o termo IA causou muita controvrsia. Na realidade para se criar uma denio precisa de IA seria necessrio antes denir, claramente, a prpria inteligncia o que sempre foi muito difcil. IA dispe de diversas interpretaes que podem parecer at mesmo conitantes. Assim, surgiram diversas denies operacionais, algumas apcrifas, outras nominadas, algumas mais gerais, outras mais especcas, e dentre elas julgamos importante mencionar as seguintes: IA so sistemas inteligentes articiais que pensam e agem, racionalmente, como os seres humanos; IA a capacidade de o computador processar smbolos, automatizando faculdades mentais at desconhecidas das mquinas; IA um ramo da cincia que elabora programas para computadores de maneira simblica, no lugar da forma numrica frequentemente usada;

52

Fundamentos de Otimizao e Inteligncia Computacional IA o estudo das faculdades mentais atravs do uso de modelos computacionais (Eugene Charniak e Drew McDermott) [54]; IA o estudo de como fazer os computadores realizarem tarefas que, normalmente so feitas melhor pelas pessoas (Elaine Rich) [195]; IA o estudo das computaes que tornam possvel perceber, raciocinar e agir (Patrick Henry Winston) [267]; IA o estudo e a programao de agentes inteligentes, isto , tudo que capaz de perceber, corretamente, o ambiente por meio de sensores e agir, corretamente, sobre o ambiente por meio de atuadores (David Poole) [190].

O objetivo geral da IA a concepo e implementao de sistemas inteligentes computacionais baseados em teorias e modelos criados para expressar a capacidade cognitiva do ser humano, imitando aspectos do comportamento, tais como: raciocnio, percepo, aprendizado e adaptao, dentre outros. Foram criados, quase que intuitivamente, dois ramos para a construo de sistemas inteligentes: a linha conexionista e a linha simblica. Atualmente essa diviso no parece suciente para abrigar todos os tipos de sistemas inteligentes disponveis, mas ela ser adotada, por simplicidade, nas Subsees 4.2.1 e 4.2.2.

4.2.1

Conexionista

A linha conexionista visa modelagem da inteligncia humana imitando a estrutura neuro-fsica e a funcionalidade do crebro, de seus neurnios, e de suas interligaes. Esta proposta foi formalizada quando o neurocientista Warren Sturgis McCulloch e o lgico matemtico Walter Pitts propuseram um primeiro modelo matemtico simples para um neurnio [169, 170], que modelava o funcionamento de operaes da lgica binria, atravs de um sistema de inequaes lineares de primeira ordem para representar o conhecimento relacionado. A especicao automtica dos parmetros de um neurnio ou de um conjunto de neurnios (a aprendizagem) comeou a ser buscada com o trabalho do neurosiologista Donald Hebb [106] que props a primeira regra de aprendizado para atualizar as conexes entre clulas neuronais com funcionamento descrito pelo modelo de McCulloch e Pitts. O primeiro modelo de Rede Neural Articial (Articial Neural Network, ANN) foi proposto por Frank Rosenblatt e consistia de um conjunto de neurnios dispostos em uma nica camada e denominado de Perceptron [197]. Este modelo foi criticado por Marvin Minsky e Seymour Papert [175]

Inteligncia Articial

53

que mostraram os pontos negativos investigando as propriedades matemticas da rede Perceptron, mostrando que as mesmas s se aplicavam em problemas linearmente separveis, impedindo assim a rede de, por exemplo, aprender corretamente o mapeamento de um problema no-linear simples como o OR exclusivo [105]. Por esse motivo, durante um longo perodo essa linha de pesquisa cou prejudicada e, de certa forma praticamente paralisada. Paul John Werbos [263], em sua tese de doutorado, criou um algoritmo que permitia o treinamento de redes de mltiplas camadas introduzindo o conceito de retropropagao de erro e transpondo o grande obstculo levantado por Minsky e Papert. Na poca no foi dada a devida relevncia a essa descoberta, no sendo devidamente noticiada na comunidade cientca. Posteriormente, D. E. Rumelhart, G. E. Hinton e R. J. William atravs da publicao de dois volumes sobre Processamento Paralelo e Distribudo, editada por David Rumelhart e James McClelland [199], divulgaram essas novas regras de treinamento idealizadas por Werbos, dando um novo impulso a essa linha de pesquisa. A partir dessa publicao o algoritmo de retro-propagao de erro desenvolvido por Werbos tem sido amplamente divulgado e usado. Nesse contexto, no poderiam deixar de serem citados alguns pesquisadores, igualmente responsveis pelo desenvolvimento da rea conexionista, dentre eles os seguintes: Bernard Widrow e Marcian Ho [265] que propuseram uma poderosa regra de aprendizado, produzindo o algoritmo do mnimo quadrado mdio; Nils Nilsson [183] introduziu o conceito de mquina de aprendizado; Jack D. Cowan criou um neurnio articial de disparo suave, baseado na funo logstica [63]; Stephen Grossberg criou o modelo aditivo do neurnio envolvendo equaes diferenciais no lineares [99]; C. von der Malsburg demonstrou o mapeamento auto organizvel [257]; W. Little e G. Shaw [146] propuseram um modelo probabilstico de um neurnio; Willshaw e von der Malsburg [266] publicaram o primeiro trabalho sobre mapas autoorganizveis; Tuevo Kohonen iniciou pesquisa envolvendo memrias associativas [133]; Gail Carpenter e Stephen Grossberg desenvolveram a teoria da ressonncia adaptativa (Adaptative Resonance Theory, ART) [42]; Tuevo Kohonen desenvolveu o algoritmo no supervisionado com aprendizagem competitiva [134]; John Hopeld [112] introduziu a arquitetura de redes recorrentes, trabalhando tambm na rea de memrias associativas; Dave S. Broomhead e David G. Lowe descreveram os procedimentos para utilizao de redes com funes de base radial (RBF) [35]; Vladimir Vapnik desenvolveu a Mquina de Vetor de Suporte [253]. Com a chegada dos novos microprocessadores com elevado poder computacional e baixo custo surgiu a nova gerao de computadores com grande capacidade de armazenamento e alta velocidade de processamento, que ali-

54

Fundamentos de Otimizao e Inteligncia Computacional

ada ao desenvolvimento de algoritmos especcos, inicialmente baseados nas pesquisas de Werbos (redes de mltiplas camadas), possibilitou o aprendizado de problemas complexos e altamente no lineares, desde que os mesmos fossem rigorosamente mapeados. Assim, foi dado novo impulso s pesquisas em ANNs com forte dependncia computacional (hardware e software ) [261].

4.2.2

Simblica

CAP4-12A linha simblica baseia-se na lgica tradicional e tem como pioneiros os pesquisadores Allen Newell, John Cliord Shaw e Herbert Simon que desenvolveram a primeira linguagem de IA o IPL-11 [181, 182]. Posteriormente, os mesmos pesquisadores criaram o solucionador de problemas gerais (GPS). John McCarthy [166] cria no MIT (Massachusetts Institute of Technology ) o LISP (LISt Processing ), que uma linguagem de programao funcional e que foi muito usada em IA, e at hoje os trabalhos nesse campo so realizados usando-se algum dialeto do LISP [72]. Programas inteligentes, baseados no conhecimento, procuram reproduzir o raciocnio inferencial humano na busca da soluo para os problemas. Esses programas inteligentes so constitudos basicamente de: mquina de inferncia que manipula o conhecimento representado para desenvolver uma soluo do problema, descrito nas informaes contidas na base de conhecimento; e a base de conhecimento que trabalha associada a uma base de dados contendo o conhecimento especco do problema. Entretanto, o conhecimento pode ser encontrado de inmeras formas diferentes. Um simples fato, um conjunto de fatos ou o relacionamento entre eles so exemplos tpicos de como o conhecimento pode se apresentar. Por outro lado, um conhecimento especco pode ser representado apenas sob a forma algortmica, enquanto outros, heuristicamente, atravs de regras de manuseio ou estratgias que so usadas para melhorar a ecincia do sistema, na busca da soluo de um problema complexo. Para que essas diferentes espcies de conhecimento possam ser usadas pelo computador na soluo de um problema, necessrio que eles sejam adequadamente representados dentro de um programa que possa interpret-los. Todo sistema computadorizado, que utiliza o conhecimento de um domnio especco para obter a soluo de um problema, considerado um Sistema Especialista (SE), desde que a soluo obtida pelo SE seja essencialmente a mesma, da encontrada por um especialista humano, confrontado com o mesmo problema [188]. Devido ao fato de trabalharem com o conhecimento, que uma entidade simblica, tais sistemas tambm so conhecidos como Sistemas Simblicos.

Inteligncia Computacional

55

Um SE [114] um programa inteligente de computador que usa raciocnio inferencial para solucionar problemas de um campo especco do conhecimento humano. Sua caracterstica principal a capacidade de explicao, semelhante encontrada nos seres humanos, dotados de alto grau de especializao. Percebe-se, nitidamente, que um SE se enquadra plenamente na maioria das denies conceituais e operacionais de IA mostradas inicialmente. Para facilitar o processamento do conhecimento representado pela lgica, Alain Colmerauer e colaboradores [60] desenvolveu, com base na linguagem ALGOL, uma linguagem denominada PROLOG (PROgrammation en LOGique ). uma linguagem orientada para o processamento simblico, permitindo a resoluo de problemas que envolvem a representao simblica de objetos e seus relacionamentos. O PROLOG tem a facilidade de permitir declarar fatos, especicar regras e fazer perguntas utilizando a lgica, e seu interpretador tambm um provador de teoremas [59]. O termo IA refere-se a programas ou sistemas computacionais destinados a solucionar problemas realizando processamento sobre o conhecimento especialista representado. Merece destaque o fato de que no se pode separar a histria da IA da evoluo dos computadores. Certamente, sem a evoluo da computao as pesquisas em ANNs, por exemplo, no teriam avanado tanto como pode ser vericado nas pesquisas desenvolvidas atualmente [27].

4.3

Inteligncia Computacional

As principais linhas de pesquisa ligadas no momento a IC so: Redes Neurais Articiais (Articial Neural Networks, ANNs); Otimizao (OTM); Lgica Nebulosa (Lgica Fuzzy, LF) e Sistemas Hbridos (SHs) englobando duas ou mais dessas tcnicas. As ANNs no sero tratadas aqui, pois j foram consideradas na Seo 4.2.1. Assim, a primeira tcnica a ser abordada nesta seo ser a de otimizao, nalizando com sistemas hbridos.

4.3.1

Otimizao

A rea de otimizao abrangente envolvendo vrias linhas de pesquisa: (i) Computao Evolutiva (CE), que abriga Estratgias Evolutivas (EE), Programao Evolutiva (PE), Algoritmos Genticos (Genetic Algorithms, GA) e Programao Gentica (PG); (ii) Recozimento Simulado (Simulated Annealing, SA); (iii) Otimizao por Colnia de Formigas (Ant Colony Optimization, ACO); (iv) Otimizao por Enxame de Partculas (Particle Swarm

56

Fundamentos de Otimizao e Inteligncia Computacional

Optimizaion, PSO); (v) Coliso de Partculas (Particle Collision Algorithm, PCA); (vi) Otimizao Extrema Generalizada (Generalized Extremal Optimization, GEO); e (vii) Evoluo Diferencial (Dierential Evolution, DE), entre outras. (i) Computao Evolutiva (CE) No tocante a CE, independente de usar qualquer uma das vertentes apresentadas, inicializa-se uma populao de indivduos, que representam solues para um problema de interesse, que evolui para sucessivas regies melhores no espao de busca e, atravs de processos no determinsticos de seleo e de aplicao de operadores genticos de recombinao e mutao, procura-se a melhor soluo. A diferena entre os mtodos reside na forma de representar o indivduo de uma populao, no processo de seleo e nos operadores aplicados. Estratgias Evolutivas (EE) Carolus Linnaeus acreditava em uma relao entre as espcies [113]. Posteriormente, Thomas Robert Malthus concluiu que uma populao cresce em progresso geomtrica, enquanto a produo de alimentos aumenta em progresso aritmtica, sendo o crescimento da populao limitado, ento, por doenas e pela falta de alimentos [109]. Charles Robert Darwin apresentou sua teoria de evoluo atravs da seleo natural [67]. Se variaes teis para qualquer organismo devam ocorrer para que ele venha a existir, certamente indivduos assim caracterizados tero a melhor chance de serem preservados na luta por sobrevivncia e do forte princpio de hereditariedade, eles tendero a produzir geraes com caractersticas similares. Em prosseguimento, Charles Darwin e Alfred Russel Wallace criaram a base da Gentica Populacional que indica que havendo diversidade entre indivduos de uma populao de indivduos aptos, a reproduo feita pela recombinao e mutao gentica [200]. Peter Bienert, na Universidade Tcnica de Berlim reuniu dois alunos Hans-Paul Schewefel e Ingo Rechenberg que desenvolveram e intensicaram os estudos sobre o tema [209]. A estratgia evolutiva, bioinspirada, consiste de uma metodologia de otimizao, discreta ou contnua, fundamentada na adaptao e na evoluo, usada como tcnica de busca para problemas de otimizao de parmetros de funes reais multidimensionais. Inicialmente foi usada para tratar problemas de otimizao em mecnica de uidos, operando com populaes com um nmero muito pequeno de indivduos que sofriam recombinao e mutao no processo evolutivo, preservando os melhores indivduos na nova populao (elitismo) [87]. Trabalha com vetores

Inteligncia Computacional

57

de nmeros reais e seus desvios padro, que codicam as possveis solues numricas do problema. Usa a auto-adaptao dos parmetros da estratgia, isto , aqueles que efetivamente controlam o processo evolutivo de busca, como taxas de mutao, desvios padres das mutaes, probabilidades de recombinao, incorporando-os na representao gentica dos indivduos, durante o processo evolutivo. Programao Evolutiva (PE) A Programao Evolutiva foi iniciada por Lawrence J. Fogel e aprimorada por Burgin, Atmar e D. Fogel, dentre outros [13, 14]. Fogel, em sua tese de doutorado, conceituou a programao meta-evolucionria, que trabalha com um vetor de varincias. O objetivo inicial era criar uma inteligncia atravs do desenvolvimento de mquinas de estado nito para prever eventos, a partir de observaes prvias. Posteriormente, mostrou-se que a PE se adapta a qualquer estrutura de problema. A representao do indivduo, feita com nmeros reais, pode usar qualquer estrutura de dados. Diferentemente de outras tcnicas de CE, no se usa recombinao, sendo a mutao o nico operador que atua na programao evolucionria. O processo evolutivo feito aplicando-se diversos tipos de seleo e mutao. Assim, uma populao inicial de indivduos (solues) gerada de forma aleatria e, ento, se aplica mutao. O processo se repete para cada nova soluo, com uma soluo gerando outra. Calcula-se a aptido de cada indivduo e os mais aptos so preservados. No necessrio que a populao permanea constante, ou que cada genitor gere apenas um descendente. Algoritmos Genticos (GA) Os Algoritmos Genticos so modelos computacionais, empregando tcnicas estocsticas de pesquisa, que imitam os mecanismos da evoluo e gentica natural. Combinam sobrevivncia do mais apto, cruzamento aleatrio de informao, mutao e aptido para sobrevivncia. No processo de seleo natural gera-se, aleatoriamente uma populao inicial, isto um conjunto de solues viveis do problema (indivduos ou cromossomos). Esses indivduos so avaliados e decodicados de acordo com sua funo objetivo ou funo de avaliao associando-se a cada indivduo sua respectiva aptido, isto a sua capacidade de sobrevivncia denida na modelagem do problema investigado. Ento, selecionam-se indivduos (genitores ou cromossomos genitores) proporcionando maiores chances de reproduo aos indivduos mais aptos da populao. Assim, uma soluo

58

Fundamentos de Otimizao e Inteligncia Computacional

com elevado valor de aptido ter maior probabilidade de contribuir para uma ou mais descendncias na prxima gerao. Em prosseguimento, aplicam-se os operadores genticos, normalmente, cruzamento e mutao formando-se os descendentes que iro compor a nova populao de indivduos. Na gerao da nova populao de indivduos, normalmente preservam-se os melhores indivduos da populao anterior na composio da populao seguinte (elitismo), completando o restante da populao de forma aleatria como realizado na gerao da populao inicial. No caso do cruzamento escolhe-se uma taxa de cruzamento, normalmente muito alta, e aplica-se um algoritmo probabilstico para vericar se realmente a operao vai ser aplicada ou se os genitores vo ser diretamente copiados para os descendentes. Caso a operao se realize, cada par de indivduos da populao (genitores) separado em duas partes em uma posio escolhida aleatoriamente e ento os novos indivduos da populao so criados pela troca das partes entre os genitores. Posteriormente escolhe-se uma taxa de mutao, normalmente muito baixa, e aplica-se tambm um algoritmo probabilstico para vericar se realmente a operao vai ser aplicada. Caso a operao venha a ocorrer, para cada cromossomo genitor escolhido, aleatoriamente, um nico bit cujo valor deve ser trocado. A Mutao um operador suave quando comparado com o cruzamento. O algoritmo opera adaptativamente, isto , a informao corrente inuencia na busca futura. A cada instante so contempladas diversas solues, congurando um processo paralelo de busca. Quando no se verica mais nenhuma evoluo no algoritmo, isto , percebe-se que a soluo no melhorar, entende-se que o processo convergiu para a melhor soluo possvel. aplicado na otimizao de problemas complexos e de difcil formulao matemtica, ou com grande espao de busca. John Henry Holland [110], pioneiro na rea de GA, publicou um livro retratando sua pesquisa nesta rea. David Edward Goldberg, ex-aluno de Holland, comeou a aplicar os GAs na indstria [97]. Posteriormente, vrios outros pesquisadores se dedicaram a esse estudo, como por exemplo Kenneth De Jong e Lawrence Davis [71, 70]. Programao Gentica (PG) John R. Koza introduziu a Programao Gentica na qual os indivduos no so sequncias de bits e sim programas ou autmatos, descritos por expresses e armazenados como rvores sintticas [138, 139]. Esses programas so, na verdade, os candidatos a soluo do problema que se deseja resolver. um processo de aprendizagem de programas, no sentido de torn-lo

Inteligncia Computacional

59

mais apto a resolver melhor o problema em questo. Usa operadores de recombinao e mutao que ocorrem atravs da troca de sub rvores de dois indivduos, que so programas candidatos a soluo. No h restries quanto seleo que pode ser feita de diversas formas diferentes. Na PG, inspirada na evoluo natural para soluo de um problema, o papel do conhecimento e da lgica no so relevantes e os indivduos so representados por programas suportados pela maioria das linguagens de programao [87, 13, 14, 110, 97]. Segundo John R. Koza a idia fazer com que os computadores aprendam a se programar, isto partindo de especicaes comportamentais o computador deve ser capaz de evoluir para um programa que as satisfaa plenamente, ou, pelo menos, de maneira aproximada. (ii) Recozimento Simulado (SA) Visando resolver problemas de otimizao combinatria, S. Kirkpatrick, C. D. Gellat e M. P. Vecchi, baseados em termodinmica e mecnica quntica, desenvolveram uma tcnica de busca probabilstica denominada Recozimento Simulado (SA) [126]. Esta tcnica simula o aquecimento de um slido at que ele se funda, com posterior resfriamento, de modo a formar uma estrutura cristalina perfeita sem nenhum defeito local. uma boa ferramenta para resolver problemas de otimizao combinatria. O processo de otimizao altamente dependente da soluo inicial e do critrio de vizinhana adotado, e o tempo de convergncia pode ser elevado [68]. Com base no recozimento simulado, D. H. Ackley, Georey E. Hinton e Terry J. Sejnowski [6] criaram a Mquina de Boltzmann (MB), que representa uma mquina de aprendizagem em mltiplas camadas, na verdade uma ANN, que usa estados binrios (1 e 1), conexes bidirecionais e transies probabilsticas, podendo ter unidades de neurnios ocultas e que apresenta certa semelhana com a ANN de Hopeld [112]. A ANN de Hopeld caracterizada por uma funo de energia de valor calculado pelos estados dos neurnios. A atualizao dos estados dos neurnios feita de forma aleatria e acontece at que um mnimo da funo de energia seja atingido. Cada neurnio uma entidade estocstica gerando a sada de acordo com a distribuio de Boltzmann. O algoritmo, denominado de regra de aprendizagem de Boltzmann, baseado no SA que, probabilisticamente, converge para um timo global. (iii) Otimizao por Colnia de Formigas (ACO) Insetos sociais so aquelas espcies que vivem em colnias, como por exemplo, formigas, abelhas, cupins e vespas. Formigas, como insetos sociais,

60

Fundamentos de Otimizao e Inteligncia Computacional

apresentam comportamentos extremamente interessantes no que se refere organizao de suas colnias. Tarefas como movimentao da colnia, alimentao das larvas, limpeza da colnia, busca por comida e o seu transporte para o ninho, so executadas por determinados tipos, ou at mesmo por todos os indivduos da colnia, aps uma diviso eciente do trabalho. Os trabalhos com otimizao por colnia de formigas se iniciaram com a tese de doutorado de Marco Dorigo [73], que se valeu de alguns dos comportamentos descritos acima em consonncia com certas caractersticas computacionais para criar esta nova classe de meta-heursticas. Resolvendo inicialmente problemas de construo de rotas, como o problema do caixeiro viajante, o algoritmo de colnia de formigas implementa a probabilidade de seleo de uma rota atravs da mimetizao do uso de feromnio, um composto qumico usado para a comunicao indireta entre insetos, tal como sua evaporao. A cada iterao, as formigas constroem suas rotas (solues candidatas), onde aps uma etapa de avaliao a melhor rota acaba sendo reforada com uma determinada quantidade de feromnio, o que contribui para aumentar a atrao de mais formigas para esta rota. Ao longo da execuo do algoritmo, espera-se que a melhor rota (melhor soluo) acabe por receber uma maior quantidade de feromnio e por consequncia a melhor soluo encontrada.

(iv) Otimizao por Enxame de Partculas (PSO) A otimizao por enxame de partculas, do original Particle Swarm Optimization um mtodo de busca heurstica inspirado no comportamento colaborativo e de grupo de determinadas populaes biolgicas. Esta tcnica se baseia na teoria de enxames (swarming theory ), proposta por Kennedy e Eberhart [122] tendo inspirao no comportamento de vo de bando de pssaros e no nado de cardumes de peixes. A implementao se baseia na manipulao das distncias inter-individuais, ou seja, na mimetizao da sincronia do comportamento de bando que pode ser caracterizado por uma funo que gerencia o esforo da partcula em manter uma distncia tima entre seus colegas de bando [123]. No controle da partcula, o movimento corresponde soma de trs termos distintos: o primeiro termo corresponde inrcia da partcula (conana no seu movimento); o segundo termo relaciona a atrao da partcula para o melhor ponto em que j se posicionou no espao de busca (conana em seu conhecimento); e o terceiro termo se relaciona com a atrao da partcula para o ponto de melhor soluo do bando (conana no conhecimento de grupo).

Inteligncia Computacional (v) Algoritmo de Coliso de Partculas (PCA)

61

O algoritmo de coliso de partculas, Particle Collision Algorithm, foi desenvolvido por Wagner Sacco [202] atravs de inspirao no comportamento de espalhamento (scattering ) e absoro (absortion ) de nutrons em reatores nucleares. De maneira geral, a partcula que atinge um ncleo (ou ponto no espao de busca) de baixo valor da funo objetivo, ou tness, sendo aqui considerado um problema de minimizao, absorvida e imediatamente inicia uma explorao local vizinhana desta regio. Em caso contrrio, para uma partcula atingindo um ncleo de alto valor da funo objetivo, a partcula espalhada (ou jogada) para outra regio do espao de buscas. Este comportamento permite que o espao de busca seja explorado de maneira eciente e regies de maior probabilidade de melhores resultados sejam alvo de buscas atravs de sucessivas ativaes das caractersticas de espalhamento e absoro. Para evitar a convergncia prematura para mnimos locais, o PCA implementa um esquema semelhante ao proposto por Metropolis et al. [173] para a aceitao de uma soluo sub-tima em carter temporrio dada uma certa probabilidade. (vi) Otimizao Extrema Generalizada (GEO) O mtodo da Otimizao Extrema Generalizada (Generalized Extremal Optimization ) foi desenvolvido por de Sousa [235] para ser aplicado a problemas de otimizao que apresentem um espao de projeto complexo, onde mtodos tradicionais como os do tipo gradiente sejam de difcil aplicao ou levem a solues sub-timas. O GEO foi proposto como uma generalizao do mtodo da otimizao extrema (Extremal Optimization, EO), que por sua vez se inspirou em um modelo de evoluo natural criado para mostrar a existncia de Criticalidade Auto-Organizada (Self-Organized Criticality, SOC) em ecosistemas. De fcil implementao, o GEO um mtodo de ordem zero (no utiliza informao das derivadas da funo objetivo) que pode ser aplicado a problemas com ou sem restries, que apresentem mltiplas solues sub-timas ou mesmo um espao de projeto disjunto, com qualquer combinao de variveis, contnuas, inteiras ou discretas. Ele uma meta-heurstica de busca global, como o algoritmo gentico (GA) e o recozimento simulado (SA), mas com a vantagem a priori sobre estes mtodos de possuir, em sua verso cannica, apenas um parmetro livre para ajustar. O mtodo da otimizao extrema generalizada vem mostrando ser competitivo tanto ao SA quanto ao GA bem como ecaz em resolver problemas reais de projeto timo. Desenvolvimentos recentes do algoritmo

62

Fundamentos de Otimizao e Inteligncia Computacional

incluem sua hibridizao com outros mtodos de otimizao e verses paralelizada e multi-objetivo. Finalmente, cabe ressaltar que pelos estudos realizados at o momento, e a possibilidade de ser aplicado facilmente a uma grande quantidade de problemas em diferentes reas do conhecimento, o GEO apresenta-se como um timo candidato a ser incorporado caixa de ferramentas numricas do engenheiro ou cientista. (vii) Evoluo Diferencial (DE) A metaheurstica denominada Evoluo Diferencial (Dierential Evolution, DE) baseada em operaes efetuadas a partir de uma populao inicial, onde cada indivduo representa uma soluo vivel para o problema a ser otimizado. Cada indivduo representado atravs de um vetor. Dados dois indivduos dessa populao, uma mdia ponderada calculada entre esses indivduos e, ento, um terceiro gerado considerando-se essa mdia. Gerado o indivduo novo, chama-se a funo objetivo para avaliar a qualidade do mesmo. Desse modo, uma nova populao vai sendo construda, substituindo-se os elementos menor de qualidade por aqueles com maior qualidade. O algoritmo DE foi proposto por Storn e Price [245] com o objetivo de estimar os parmetros do Polinmio de Chebychev.

4.3.2

Lgica Nebulosa (LF)

A Lgica Fuzzy (LF), Lgica Difusa ou Lgica Nebulosa foi desenvolvida na Universidade da Califrnia, em Berkeley, pelo professor Lot A. Zadeh [273]. uma lgica multivalorada capaz de absorver informaes vagas, normalmente descritas em uma linguagem natural (lnguas faladas ou escritas) e convert-las para um formato numrico, de fcil manipulao computacional [141]. Segundo E. Cox [64] a LF capaz de combinar a impreciso associada aos eventos naturais e o poder computacional das mquinas para produzir sistemas de respostas inteligentes, robustos e exveis. A. Kaufmann e M. M. Gupta [121] so da opinio que a LF composta por conceitos e tcnicas que do a forma matemtica ao processo intuitivo humano que na sua grande maioria caracterizado pela impreciso e ambiguidade. Na realidade a LF procura modelar os modos imprecisos do raciocnio humano, auxiliando na habilidade humana de tomar decises. A LF tem por objetivo principal fazer com que as decises tomadas pela mquina se aproximem cada vez mais das decises humanas [272]. Essa caracterstica se acentua, principalmente ao se trabalhar com uma grande variedade de informaes vagas, imprecisas e incertas.

Inteligncia Computacional

63

O gerenciamento das incertezas tem um papel particularmente importante, uma vez que a incerteza de informao na base de conhecimento induz uma incerteza na concluso [214]. Torna-se, ento, necessrio um sistema de inferncia que associe uma medida dessa ambiguidade e seja compreensvel e apropriadamente interpretada pelo usurio. A LF constri, inicialmente, os conjuntos nebulosos para todas as variveis de entrada e de sada, atribuindo seus respectivos universos de discurso, domnios e adjetivos e de acordo com informaes prestadas pelos especialistas da rea investigada, montando adequadamente as funes de pertinncia. Utilizando-se tambm o conhecimento dos especialistas para desenvolver o raciocnio dedutivo, modelam-se as incertezas dentro de um processo para tomada de deciso [271]. Isso fundamentado na existncia de conexes entre causa e efeito, atravs de regras, naturais ou no, denominadas regras de inferncia. Para compor esse conjunto de regras, so realizadas diversas entrevistas com os especialistas do setor investigado, visando transformar o conhecimento prtico desses prossionais em regras de inferncia [76]. A Inferncia Fuzzy o processo pelo qual se obtm as sadas do sistema. Um vetor de variveis de entrada aciona as regras (proposies Fuzzy) e denem a situao (forma) da varivel de sada correspondente. Diversos processos de inferncia Fuzzy [36, 124] podem ser usados para se obter a sada do sistema nebuloso, sendo que o mais comumente usado o mtodo MIN-MAX. A funo MIN usada para operar o interior das regras (conectivo E ) e a funo MAX para efetivamente compor os resultados de acordo com as normas T e normas S [274, 270]. Assim, para um dado vetor de entrada que alimenta o sistema, feita uma avaliao do grau de compatibilidade de cada componente de entrada com os conjuntos nebulosos correspondentes ao seu domnio. Nesse caso, a funo MIN, valendo-se dos antecedentes , produz um limite de ativao para a parte consequente da regra em estudo. Usando-se um processo de truncamento no conjunto nebuloso presente no consequente, so produzidas as ponderaes de cada consequente por seu limite de ativao. Aplicando-se a funo MAX (conectivo OU) no conjunto dos consequentes, devidamente ponderados e agregados, chega-se ao conjunto nebuloso resultante [61].

4.3.3

Sistemas Hbridos (SHs)

Todo sistema que usa mais de uma tcnica de IA (redes neurais, sistemas fuzzy, algoritmos genticos, regresso, sistemas especialistas, tcnicas de agrupamentos, etc) para a soluo de um problema de modelagem considerado um Sistema Hbrido [98]. A principal motivao deve-se ao sinergismo

64

Fundamentos de Otimizao e Inteligncia Computacional

conseguido pela associao de duas ou mais tcnicas. Assim, podem ser produzidos sistemas com maior poder de interpretao, de aprendizado, de estimativa de parmetros e de generalizao [115, 248]. Os sistemas hbridos podem ser classicados da seguinte forma: Hbrido Sequencial (hibridizao fraca ) - Um subsistema A com paradigma A atua como entrada de um subsistema B com paradigma B. Hbrido Auxiliar (hibridizao mdia ) - Um subsistema B com paradigma B chamado pelo subsistema A com paradigma A, que realiza algum servio auxiliar. Hbrido Incorporado (hibridizao forte ) - Uma combinao entre os dois paradigmas. Um exemplo deste modelo o Sistema Neuro-Fuzzy. Os Sistemas Neuro-Fuzzy (SNF) [179] permitem a integrao de conhecimentos, tanto Implcito (conjunto de dados) como Explcito (proveniente de especialistas). Facilitam a tarefa de extrao de conhecimento sob o formato de regras Fuzzy. So aplicados em diversas reas: controle, previso, reconhecimento de padres, classicao, soluo de problemas inversos, diagnsticos, aproximao de funes, dentre outras [176]. A ideia programar um sistema fuzzy numa arquitetura paralela e distribuda, de modo a aproveitar os paradigmas de aprendizado das ANNs. O objetivo do SNF usar ao mximo as propriedades das RNAs (aprendizado) e interpretao lingustica, procurando minimizar suas limitaes e decincias. Dentre os principais pesquisadores desta nova rea, podemos destacar J. S. R. Jang, que desenvolveu o modelo ANFIS Adaptive Network-based Fuzzy Inference System [116, 117], D. Nauck que criou o modelo NEFCLASS Neuro Fuzzy Classication , usado para classicao [179] e Vuorimaa que apresentou o modelo FSOM Fuzzy Self-Organized Map [258], que representa sistemas adaptativos (ANNs), interpretveis por meio de regras da LF. A Figura 4.3 apresenta um diagrama geral dessa classicao. Finalmente, importante salientar que no existe unanimidade na distino entre IA e IC, havendo ainda um certo debate sobre o assunto, embora o conceito de cada tcnica, separadamente, seja ela enquadrada em IA ou IC, ou qualquer outra classe que possa existir, possa estar muito bem denido na literatura.

4.4

Consideraes Finais

Neste captulo foram apresentados alguns conceitos importantes nas reas de otimizao, IA e IC. Para claricar o discernimento entre essas reas, apresenta-se a Figura 4.4, mostrando um diagrama de Venn, onde cada

Consideraes Finais

65

Figura 4.3: Classicao geral de sistemas hbridos. rea tratada como um conjunto de competncias com as respectivas interseces. Conclui-se que a IC um subconjunto da IA, no sentido que todo problema de IC pode ser entendido como um problema de IA, mas nem todo problema de IA visto como um problema de IC. Tambm se v que h problemas de otimizao que no so vistos como problemas de IC. Por exemplo, pode-se ter um mtodo exato do tipo branch-and-bound que no se encaixa nas reas de IA ou de IC. Este captulo pode ser visto como uma introduo aos captulos que se seguem. Na primeira parte, os conceitos bsicos encontrados na rea de otimizao foram denidos e exemplicados. Na segunda parte, discutimos os conceitos de IA, IC e as ideias bsicas de algumas metaheursticas que so empregadas nos Captulos 5 a 13. Nestes so tratadas, portanto, as metaheursticas selecionadas como casos de estudos, unindo as reas de otimizao e problemas inversos em transferncia radiativa. O mtodo de Evoluo Diferencial (DE) apesar de ter por origem a busca da melhorai do algoritmo de Recozimento Simulado, ele no inspirado na natureza conforme os outros mtodos considerados neste livro. Porm, por ser um mtodo que est atraindo a ateno de muitos pesquisadores neste momento, e ter sido aplicado nos problemas de transferncia radiativa que so usados como os problemas modelo neste livro, ele foi includo no Captulo 13.

66

Fundamentos de Otimizao e Inteligncia Computacional

Figura 4.4: Diagrama de Venn para as reas de otimizao, IA e IC

Captulo 5

Recozimento Simulado (Simulated Annealing )


Francisco Jos da Cunha Pires Soeiro Jos Carlos Becceneri Antnio Jos da Silva Neto

5.1

Motivao e Histrico do Mtodo

O Recozimento Simulado (Simulated Annealing, SA) tem sua origem na analogia entre o processo fsico do resfriamento de um metal em estado de fuso e o problema de otimizao. Baseado em ideias da mecnica estatstica e no algoritmo de simulao proposto por Metropolis et al. [173] o SA foi apresentado inicialmente como uma tcnica de otimizao combinatria por Kirkpatrick et al. [126] que o utilizaram no projeto de sistemas eletrnicos. A mecnica estatstica a disciplina central da fsica da matria condensada que estuda as propriedades agregadas de um conjunto elevado de tomos existentes em um lquido ou slido. Como o nmero de tomos da ordem de 1023 por centmetro cbico, somente as caractersticas mais provveis do sistema em equilbrio trmico sero observadas em experimentos. Isto caracterizado pelas propriedades mdias e pequenas utuaes em torno das mesmas. Cada congurao denida por um conjunto de posies atmicas {ri } e afetadas pela probabilidade de Boltzmann exp[E {ri }/kB T ], onde E {ri } a energia da congurao, kB a constante de Boltzmann e T a temperatura. 67

68

Recozimento Simulado

Uma questo fundamental na mecnica estatstica saber o que acontece ao sistema em temperaturas baixas, se o mesmo permanece em estado lquido ou se solidica e, neste caso, se atinge uma congurao cristalina ou se transforma em vidro. Isto est relacionado diretamente com a energia interna do material. Baixas temperaturas no so condies sucientes para garantir que baixos nveis de energia interna foram atingidos. Experimentos que levam a baixos nveis de energia interna do material so baseados em um recozimento cuidadoso, ou seja, numa reduo bem lenta da temperatura desde o estado de fuso do material, que vai resultar numa estrutura cristalina pura. Se no for feito assim os cristais resultantes tero muitos defeitos ou a substncia pode se transformar em um vidro, que uma estrutura apenas tima localmente. Este processo de se achar um estado de baixa energia simulado para a soluo de um problema de otimizao. A funo objetivo, ou funo custo, corresponder ao nvel de energia do sistema, que nas duas situaes, fsica ou simulada, se deseja minimizar. A temperatura do sistema fsico no tem equivalente no problema de otimizao. Esta ser apenas um parmetro de controle. No processo iterativo se apenas conguraes que levam a uma reduo da energia forem aceitas haver uma convergncia rpida de uma temperatura elevada para T = 0, o que sicamente signica uma tmpera ou uma soluo metaestvel do ponto de vista matemtico. No procedimento de Metropolis [173] foi incorporado um aproveitamento cuidadoso de passos de subida, ou seja, passos que resultam em um aumento da funo objetivo, visando facilitar a obteno do timo global. E foi esta probabilidade de se aceitar passos que levam a um valor pior da funo objetivo que levou a um algoritmo que foge dos mnimos locais possibilitando a convergncia para o timo global. Metropolis introduziu um algoritmo simples para simular o sistema de tomos em equilbrio numa determinada temperatura. Em cada passo do algoritmo so dados deslocamentos aleatrios em cada tomo e a variao de energia calculada E (E = Ei+1 Ei ). Se E < 0 o deslocamento aceito e a nova congurao passa a ser o ponto de partida para o prximo passo. No caso de E > 0, a nova congurao pode ser aceita de acordo com a probabilidade P (E ) = exp (E/kB T ) (5.1.1)

Um nmero aleatrio uniformemente distribudo no intervalo [0, 1] calculado e comparado com P (E ). O critrio de Metropolis estabelece que a congurao ser aceita se o nmero aleatrio for menor que P (E ), caso contrrio rejeitado e a congurao anterior utilizada como ponto

Descrio do Algoritmo

69

de partida para o prximo passo. Repetindo-se este procedimento bsico diversas vezes o movimento dos tomos de um material na temperatura T simulado. Utilizando-se a funo objetivo no lugar da energia e denindo-se as conguraes atmicas como conjuntos de variveis de projeto {xi }, o procedimento de Metropolis gera um conjunto de conguraes de um problema de otimizao a uma certa temperatura. Esta temperatura apenas um parmetro de controle. A constante de Boltzmann tambm passa a ser um simples fator de escala normalmente igualado unidade. O SA consiste em primeiro fundir o sistema a ser otimizado a uma temperatura elevada e depois em reduzir a temperatura at que o sistema congele e no ocorra nenhuma melhora no valor da funo objetivo. Em cada temperatura a simulao deve ser executada num nmero tal de vezes que o estado de equilbrio seja atingido. A sequncia de temperaturas e o nmero de rearranjos {xi } tentados em cada temperatura para o equilbrio representam o esquema de recozimento do SA.

5.2

Descrio do Algoritmo

Um algoritmo bsico do SA apresentado a seguir. A nomenclatura utilizada a seguinte: X a soluo gerada na iterao corrente; X a melhor soluo encontrada; f a funo objetivo; T0 a temperatura inicial; T a temperatura corrente; p um nmero real, entre 0 e 1, gerado aleatoriamente. Passo Passo Passo Passo Passo Passo Passo Passo X 1. 2. 3. 4. 5. 6. 7. 8. Atribuir a X uma soluo inicial Fazer X = X Denir uma temperatura inicial T0 Vericar se as condies de parada foram encontradas Escolher um ponto X vizinho de X Calcular E = f (X ) f (X ) Vericar se E < 0 Caso armativo fazer X = X . Se (f (X ) < f (X )) fazer X =

70

Recozimento Simulado

Passo 9. Caso negativo gerar um nmero aleatrio p . Se p < exp (E/T ) fazer X = X Passo 10. Retornar ao Passo 5 Passo 11. Atualizar T Passo 12. Retornar ao Passo 4 Alguns comentrios sobre os passos do algoritmo do SA so feitos a seguir. No Passo 1, obtm-se uma soluo inicial, o que pode ser feito de forma aleatria, normalmente com base na experincia. No Passo 2, atribui-se a X o valor da soluo inicial X , por ser a melhor soluo conhecida at este passo. No Passo 3, atribui-se a T o valor da temperatura inicial (T0 ). O parmetro T0 deve ser sucientemente grande para que todas as transies sejam inicialmente aceitas. Evidentemente, esse valor depende do tipo do problema e da instncia analisada. Na literatura, existem muitas propostas para o clculo da temperatura inicial [1]. Cita-se aqui dois exemplos: T0 = lnf (X0 ), onde f (X0 ) o valor da funo objetivo da soluo inicial ou T0 = Emax , onde Emax a diferena mxima de custo entre duas solues vizinhas. No ltimo caso, porm, o clculo pode consumir muito tempo computacional. Por isso, frequentemente, usamos uma estimativa para T0 . No Passo 4, estabelecido um critrio de parada. No cdigo utilizado neste captulo alm do nmero mximo de avaliaes da funo objetivo, o algoritmo termina pela comparao dos ltimos N pontos de mnimo encontrados ao m de cada temperatura com o mais recente mnimo e o melhor de todos encontrados ao longo de todo o processo. Se a diferena entre todos esses valores for menor que o algoritmo termina. Este critrio ajuda a assegurar que o timo global foi encontrado. No Passo 5, escolhe-se um vizinho da soluo corrente X . Essa funo de escolha essencial ao bom desempenho do algoritmo, pois, se analisarmos muitos vizinhos, podemos comprometer o tempo de processamento. No presente trabalho um novo valor de X, X , determinado variando-se o elemento i do vetor X , da seguinte maneira: xi = xi + rvi (5.2.2)

onde r um nmero aleatrio uniformemente distribudo no intervalo [1, 1] e vi o i-simo elemento de V (vetor com os comprimentos dos passos). Depois de Ns passos sobre todas as variveis de projeto (elementos de X ), o vetor V com os comprimentos dos passos correspondentes a cada varivel ajustado de modo que cerca de 50% de todos os movimentos sejam aceitos.

Descrio do Algoritmo

71

A nalidade amostrar amplamente o espao de projeto. Se um nmero elevado de pontos aceito para X , ento o passo correspondente aumentado. Para uma dada temperatura isto aumenta o nmero de rejeies e diminui a percentagem de aceitaes. No Passo 6, calcula-se a diferena entre os valores da soluo corrente e do novo ponto encontrado na vizinhana (X ). No Passo 8, se o valor da funo no ponto X for menor do que em X , ento X passa a ser a soluo corrente. Da mesma forma verica-se se o valor corrente menor que o valor armazenado em X . Em caso armativo, X recebe o valor de X . No Passo 9, caso o valor de f (X ) seja maior que o valor de f (X ), gerase um nmero aleatrio p entre 0 e 1, indicando que uma soluo pior foi encontrada em X . Se f maior ou igual a f , o critrio de Metropolis j mencionado decide se o ponto ser aceito ou no. O valor p = e|f

f |/T

(5.2.3)

computado e comparado com p . Se p > p , o novo ponto aceito, X atualizado e o algoritmo se move numa direo de subida. Se p < p , ento X rejeitado. Dois fatores diminuem a probabilidade de um movimento ascendente: baixas temperaturas e grandes diferenas nos valores da funes calculadas. Essa uma tentativa de se escapar de mnimos locais. No Passo 11, determina-se que a temperatura seja atualizada. Aps NT vezes nos ciclos (loops ) acima a temperatura reduzida. A nova temperatura dada por T = rT T (5.2.4)

onde rT um nmero entre 0 e 1. Uma temperatura baixa diminui a probabilidade de movimentos de subida, produzindo um nmero elevado de pontos rejeitados e portanto diminuindo os comprimentos dos passos. Alm disso, o primeiro ponto a ser testado em uma nova temperatura o timo atual. Passos pequenos e incio no timo atual signicam que a rea do espao de projeto mais promissora mais explorada. Todos os parmetros mencionados so denidos pelo usurio. Notese que no incio o SA tem uma estimativa grosseira do espao de projeto movendo-se com passos maiores. medida que a temperatura cai o mtodo vai lentamente focalizando a rea onde o mnimo global deve estar localizado. O uxograma do algoritmo apresentado na Figura 5.1 [37]. O cdigo do SA utilizado neste trabalho baseado no programa desenvolvido em Fortran por Goe et al. [96] que usaram um algoritmo implementado por Corana et al. [62]. Os parmetros utilizados para a soluo

72

Recozimento Simulado

Figura 5.1: Fluxograma do Recozimento Simulado (SA). do problema de transferncia radiativa apresentado na Seo 5.3 a seguir foram: T0 = 5, 0 - temperatura inicial; rT = 0, 75 - coecente de reduo de temperatura; [V ] = [1; 1; 1; 1] - vetor com o passo inicial (quatro variveis de projeto); Ns = 20 - nmero de perturbaes de cada varivel em cada passo; Nt = 5 - nmero de mudanas de passo em cada temperatura; N = 4 - nmero de temperaturas consecutivas onde o critrio de convergncia deve ser satisfeito; < 106 - critrio de convergncia; Nmax = 100.000 - nmero mximo de avaliaes da funo objetivo.

Aplicao ao Problema Inverso de Transferncia Radiativa

73

Esses parmetros foram obtidos empiricamente e produziram a necessria robustez para a soluo do problema.

5.3

Aplicao ao Problema Inverso de Transferncia Radiativa

O mtodo descrito foi aplicado ao problema inverso de transferncia radiativa em um meio homogneo unidimensional, descrito na Subseo 2.2.1 e no Captulo 3 [222, 223, 224, 225]. Os parmetros a se determinar correspondem ao vetor indicado na equao (3.2.1) as seguintes incgnitas: 0 - espessura tica; - albedo de espalhamento simples; 1 - reetividade na superfcie interna esquerda do meio participante homogneo unidimensional; 2 - reetividade na superfcie interna direita do meio participante homogneo unidimensional. No temos dados experimentais disponveis para a soluo do problema inverso. Foram utilizados dados experimentais sintticos Yi adicionando rudo pseudo-aleatrio r aos valores da intensidade da radiao trmica Ii calculados com os valores exatos das incgnitas que se deseja determinar, conforme a expresso abaixo: Yi = Ii + r (5.3.5)

onde representa o desvio padro dos erros experimentais. Esta expresso equivalente equao (3.3.6). Inicialmente consideramos apenas o caso sem rudo para avaliar a potencialidade do mtodo. Introduzimos o rudo na soluo hbrida da qual ser descrita mais adiante. Vamos analisar dois casos apresentados na Tabela 5.1. Propriedade radiativa Espessura tica 0 Albedo Reetividade difusa 1 Reetividade difusa 2 Caso 1 1, 0 0, 5 0, 1 0, 95 Caso 2 1, 0 0, 5 0, 95 0, 5

Tabela 5.1: Valores das propriedades radiativas a serem determinadas.

74

Recozimento Simulado

Como soluo inicial foram escolhidos pontos afastados da soluo exata para testar a capacidade do mtodo de enfrentar as diculdades no espao de projeto (regio de busca) e evitar os mnimos locais. Propriedade radiativa Espessura tica 0 Albedo Reetividade difusa 1 Reetividade difusa 2 Caso 1 5, 0 0, 95 0, 95 0, 1 Caso 2 5, 0 0, 95 0, 5 0, 1

Tabela 5.2: Valores iniciais das variveis. A soluo para os dois casos apresentada na Tabela 5.3. Verica-se a preciso dos resultados embora com um elevado esforo computacional.
Caso 1 2 0 0, 9999 0, 9998 0, 5002 0, 5001 1 0, 0968 0, 9497 2 0, 9499 0, 5000 Valor nal da funo objetivo eq. (3.2.4) 2, 8E 13 2, 1E 10 Nmero de avaliaes da funo objetivo 36000 36400

Tabela 5.3: Soluo obtida com o Recozimento Simulado (SA). Uma alternativa ao SA puro para a reduo do custo computacional a utilizao de um mtodo hbrido onde inicialmente o SA utilizado por alguns ciclos e depois um mtodo local baseado no gradiente como o mtodo de Levenberg-Marquardt (LM) [163] utilizado para a obteno de uma soluo mais rpida e precisa. A ideia aproveitar as qualidades dos dois tipos de mtodos. Usa-se o mtodo global para se chegar a um ponto localizado na regio de convergncia do mtodo local que ento utilizado. Ilustramos esta alternativa com o Caso 1 acima. A Tabela 5.4 mostra a soluo do LM sozinho partido do mesmo ponto utilizado pelo SA (Tabela 5.2). Neste caso foi introduzido um erro de 5% nos dados experimentais sintticos.
Iterao 0 1 2 . . . 20 Soluo exata 0 5, 0 5, 7856 7, 0822 . . . 9, 2521 1, 0 0, 95 9, 63E 1 9, 97E 1 . . . 1, 0064 0, 5 1 0, 95 6 , 6E 2 1 , 0E 4 . . . 1 , 0E 4 0, 1 2 0, 1 1 , 0E 4 1 , 0E 4 . . . 1 , 0E 4 0, 95 Funo objetivo eq. (3.2.4) 10, 0369 1, 7664 2, 5778 . . . 2, 4646 0, 0

Tabela 5.4: Resultados para o Caso 1 e erro de 5% nos dados experimentais


sintticos usando o LM.

Consideraes Finais

75

Verica-se que o LM no conseguiu convergir partindo do ponto especicado. Utilizemos ento o SA para iniciar o problema porm rodando apenas por dois ciclos (duas temperaturas) o que perfaz um total de 800 avaliaes da funo objetivo.
Caso 1 0 0, 9530 0, 5310 1 0, 0001 2 0, 9444 Valor nal da funo objetivo eq. (3.2.4) 8, 047E 3 Nmero de avaliaes da funo objetivo 800

Tabela 5.5: Soluo do SA para o Caso 1 com 2 ciclos. A partir do resultado obtido na Tabela 5.5 roda-se o LM chegando-se resposta correta em um nmero pequeno de iteraes (Tabela 5.6). Iterao 0 1 2 3 0 0, 953 0, 998 1, 001 1, 001 0, 531 0, 506 0, 503 0, 503 1 0, 0001 0, 035 0, 070 0, 099 2 0, 944 0, 949 0, 949 0, 950 Funo objetivo eq. (3.2.4) 8, 047E 3 4, 833E 3 5, 07E 6 2, 27E 6

Tabela 5.6: Soluo para o Caso 1 utilizando o LM aps 2 ciclos de SA (800


avaliaes da funo objetivo).

5.4

Consideraes Finais

Pelos resultados apresentados verica-se o bom desempenho do SA. A desvantagem o elevado esforo computacional, caracterstica comum a todos os mtodos de otimizao global. O uso de solues hbridas com a utilizao de um mtodo baseado em gradientes (mtodo local) aps alguns ciclos do SA mostrou ser uma boa alternativa para se diminuir o esforo computacional e renar a soluo.

76

Recozimento Simulado

Captulo 6

Algoritmos Genticos (Genetic Algorithms )


Francisco Jos da Cunha Pires Soeiro Luiz Biondi Neto Antnio Jos da Silva Neto

6.1

Motivao e Histrico do Mtodo

Os Algoritmos Genticos (GA) foram desenvolvidos com base nas leis de evoluo natural das espcies. Origina-se dos trabalhos de Holland e seus colaboradores [110]. Estes algoritmos tm sua base losca na Teoria de Darwin da sobrevivncia dos mais bem adaptados ao meio ambiente [67]. Pertencem categoria dos mtodos de busca estocstica com a vantagem de que esta busca ocorre nas regies do espao de projeto onde h maior potencial de se encontrar o timo global. De maneira anloga ao processo natural onde a populao de uma dada espcie se adapta ao seu habitat natural, uma populao de projetos (candidatos soluo do problema de otimizao) criada e ento permitida se adaptar ao espao de projeto. As diversas alternativas de projetos que representam uma populao numa determinada gerao so submetidas a cruzamentos entre eles, tendo o melhor projeto maior probabilidade de ser utilizado. Combinaes das melhores caractersticas dos membros no processo de cruzamento resultam em uma populao de lhos melhor que a dos pais. Se a medida que indica a adaptabilidade de uma populao correspondente funo objetivo em um 77

78

Algoritmos Genticos

problema de otimizao, vide equao (3.2.4), sucessivas geraes produziro melhores valores para a funo objetivo. A terminologia utilizada neste trabalho pode ser encontrada em Goldberg [97] e aplicaes engenharia em [100, 145]. No trabalho original de Holland [110], o GA era caracterizado por cadeias de bits representando possveis solues de um dado problema e por transformaes utilizadas para variar estas solues. No processo natural, por analogia, as informaes genticas so armazenadas em cadeias de cromossomos que so alteradas atravs de geraes para a adaptao ao meio ambiente. Esta estrutura cromossmica representa a memria da gerao e alterada pela reproduo dos indivduos. Alm da reproduo, mutaes ocasionais da informao gentica podem alterar a constituio dos cromossomos. O GA, de maneira similar natureza, utiliza cromossomos para representar as possveis solues do problema no processo de procura da melhor soluo.

6.2

Descrio do Algoritmo

O GA baseado em um processo elitista de seleo dos indivduos para reproduo. Os membros da populao mais adaptados tero maiores oportunidades de serem selecionados contribuindo mais para a melhoria da constituio dos cromossomos na gerao seguinte. Este processo facilitado se for denida uma funo de adaptabilidade que ser a medida de como um determinado indivduo bom em relao aos outros numa determinada gerao durante o processo de evoluo. Para problemas sem restries a prpria funo objetivo servir como funo de adaptabilidade. No caso de ser um problema de minimizao utilizam-se os artifcios usuais para se transformar um problema de minimizao em um problema de maximizao de uma funo. No presente trabalho onde se pretende minimizar uma funo erro utiliza-se esta funo com o sinal negativo como funo de adaptabilidade, ou seja, Fadap = Fmax = Fmin (6.2.1)

Para um problema com restries a formulao com funo penalidade exterior pode ser utilizada para transform-lo em um problema sem restries. Como transformar os diferentes projetos (solues candidatas para o problema de minimizao) em cadeias de cromossomos visto a seguir. Seja a funo objetivo abaixo com trs variveis reais:

Descrio do Algoritmo

79

Minimizar F = 100 (X1 + X2 + X3 )

(6.2.2)

Como um problema de minimizao de funo, a funo de adptabilidade ser: Fadap = 100 (X1 + X2 + X3 ) (6.2.3)

Cada varivel ser convertida em seu equivalente binrio sendo mapeada em uma cadeia de comprimento xo de 0s e 1s. A preciso numrica de cada varivel (soluo) determinar o comprimento desta cadeia. Se considerarmos uma cadeia de 10 dgitos binrios os valores mximos e mnimos de cada varivel sero os seguintes: (Xi )min = 0000000000 (Xi )max = 1111111111 (6.2.4) (6.2.5)

Um mapeamento linear converteria valores intermedirios de nmeros binrios em valores reais de variveis de projeto da seguinte forma: X = X (l ) + onde: X (u) - valor real mximo da varivel de projeto; X (l) - valor real mnimo da varivel de projeto; q - comprimento da cadeia de binrios; Xbin - valor real correspondente ao binrio atual, calculado como
q 1

X (u) X (l) Xbin 2q 1

(6.2.6)

Xbin =
k=0

2k bk , onde bk = 0 ou 1

(6.2.7)

Trs nmeros binrios correspondentes a cada varivel de projeto so justapostos formando uma cadeia de 30 dgitos 0s e 1s, isto , 10 dgitos para cada uma das trs variveis reais X1 , X2 e X3 . Esta cadeia de 30 dgitos representa uma possvel soluo do problema. Uma sequncia de tais cadeias pode ser construda para representar uma populao de solues, cada indivduo estando associado a uma funo de adaptabilidade. A Tabela 6.1 mostra uma populao de cinco projetos. Nesta tabela esto os

80

Algoritmos Genticos

valores das variveis de projeto, suas representaes binrias e o valor da funo de adaptabilidade para cada projeto. Os valores mximos e mni(u) (l ) mos permitidos para cada varivel so Xi = 10, 0 e Xi = 1, 0. Uma vez que as representaes em binrio da populao esto disponveis, simulaes da evoluo gentica podem ser efetuadas. O mecanismo articial de transformao (evoluo) dos genes compreende trs operaes: seleo, cruzamento e mutao.
Membro da populao 1 2 3 4 5 Variveis de projeto X1 X2 X3 1, 783 3, 367 3, 367 1, 730 5, 689 7, 616 3, 111 9, 604 5, 751 3, 921 5, 786 2, 865 4, 889 3, 850 8, 179 Representao Funo de binria adaptabilidade 000101100101000011010100001101 851, 70 000101001110000101011011110000 1503, 50 001111000011110100101000011100 1846, 60 010100110010001000000011010100 1257, 20 011011101001010001001100110000 1691, 80

Tabela 6.1: Exemplo de uma populao em nmeros binrios.

6.2.1

Seleo

A simulao da evoluo gentica aqui limitada a uma dimenso de populao que permanece constante ao longo de todo o processo. Dois pais selecionados criam apenas dois descendentes. Variaes destas ideias podem ser encontradas em diferentes simulaes e em diferentes trabalhos. O processo de seleo tendencioso no sentido de produzir membros mais bem adaptados e eliminar os menos adaptados. Dentre as diversas maneiras existentes, a mais simples para se selecionar os membros para cruzamento, designar uma probabilidade a cada membro baseada em sua funo de adaptabilidade. Se fi a medida de adaptabilidade do i-simo membro pode-se associar a este membro a probabilidade fi /m fi , onde m o tamanho da populao. Uma nova populao do mesmo tamanho da anterior ser criada mas com uma mdia de adaptabilidade maior. J que a seleo elitista, uma ideia bastante utilizada se levar o indivduo da populao mais bem adaptado (maior valor da funo de adaptabilidade) diretamente para a gerao seguinte, alm de, claro, faz-lo reproduzir com uma maior probabilidade que os demais.

6.2.2

Cruzamento

O processo de cruzamento permite que as caractersticas de diversos projetos sejam intercambiadas criando assim uma gerao seguinte mais adaptada. O cruzamento feito selecionando-se dois pais, baseado nas respectivas probabilidades de serem escolhidos, escolhendo-se aleatoriamente um ou dois

Descrio do Algoritmo

81

pontos na cadeia gentica (binria) e trocando os dgitos 0s e 1s entre os dois pais. Isto est ilustrado abaixo onde as cadeias binrias foram quebradas em dois pontos. Pai1 = 11001001001001101001 Pai2 = 01011100011100100010 Os pontos de cruzamento foram sublinhados. H ento a troca de dgitos formando os lhos: Filho1 = 11001100011001101001 Filho2 = 01011001001100100010 Uma probabilidade pc denida para determinar se o cruzamento ser executado. Na literatura outros tipos de cruzamento podem ser encontrados [97].

6.2.3

Mutao

A mutao protege a busca gentica de uma perda prematura de bom material gentico durante a seleo e cruzamento. O processo de mutao simplesmente feito escolhendo-se alguns poucos membros da populao e de acordo com uma probabilidade pm troca-se 0 por 1 e vice-versa num ponto escolhido aleatoriamente em suas cadeias binrias.

6.2.4

Determinao do tamanho da cadeia binria

Um nmero binrio com q dgitos permite a representao de 2q valores de uma varivel contnua. Se a varivel contnua tiver uma preciso Ac , ento o nmero de dgitos na cadeia binria ser estimada da seguinte maneira: 2q X (u) X (l) +1 Ac (6.2.8)

onde Ac representa a preciso das variveis (resoluo) e os demais smbolos j foram denidos na equao (6.2.6). Uma vantagem dos algoritmos genticos poder lidar facilmente com variveis discretas e inteiras. Neste caso faz-se na equao (6.2.8) o valor de Ac igual a 1. Para discusso das aplicaes de variveis inteiras e discretas em projetos de engenharia ver [100, 145].

6.2.5

Algoritmo

O algoritmo de um GA simples apresentado a seguir. Passo 1. Gerar uma populao inicial; Passo 2. Avaliar a funo de adaptabilidade para cada indivduo; Passo3. Vericar as condies de parada. Caso sejam satisfeitas - terminar. Caso contrrio - ir para o Passo 4;

82

Algoritmos Genticos

Passo 4. Selecionar indivduos para cruzamento; Passo 5. Criar uma nova gerao atravs do processo de cruzamento e mutao. Passo 6. Avaliar a adaptabilidade dos novos indivduos; Passo 7. Substituir a gerao anterior pela nova. Ir para o Passo 3. Alguns comentrios sobre os passos acima so apresentados a seguir. No Passo 1 a populao gerada. Esta gerao feita em binrios e muito simples. Conhecendo-se o comprimento da cadeia binria basta em cada posio gerar 0s ou 1s para se ter a populao. O tamanho da populao um dos parmetros a serem denidos. A literatura atravs da experincia de diversos pesquisadores apresenta sugestes sobre os valores bem sucedidos. Uma populao pequena tem pouco material gentico e consequentemente no faz uma boa amostragem do espao de projeto. J uma populao muito grande vai aumentar bastante o esforo computacional tornando o mtodo pouco eciente. No Passo 2 a funo de adaptabilidade de cada indivduo calculada. Isto feito no domnio dos nmeros reais (Tabela 6.1). Aqui j se pode designar uma probabilidade de seleo para cada indivduo. No Passo 3 estabelecem-se as condies de parada. Normalmente o nmero mximo de geraes denido. Pode-se limitar tambm o tempo de processamento ou o nmero de geraes passadas sem que haja melhoria na soluo do problema. No Passo 4 feita a seleo para o cruzamento. A literatura reporta diversas ideias [97]. A mais simples a roleta da sorte onde as reas so proporcionais probabilidade de cada indivduo de ser selecionado. Os mais bem adaptados tero maior probabilidade de escolha. No Passo 5 feito o cruzamento simultaneamente mutao. Aqui devem ser denidas as probabilidades de cruzamento pc e mutao pm . Estes valores so parmetros arbitrados pelo usurio e, como no caso do tamanho da populao, existem valores sugeridos pelos pesquisadores e desenvolvedores de software, baseados em experincias bem sucedidas.

6.3

Aplicao ao Problema Inverso de Transferncia Radiativa

O mtodo descrito foi aplicado ao problema inverso de transferncia radiativa descrito na Subseo 2.2.1 e no Captulo 3 [240, 224, 216, 226, 227, 85]. O cdigo do GA utilizado neste trabalho foi desenvolvido em Fortran por D. Carroll [http://cuaerospace.com/carroll/ga.html] . Foram utilizados os parmetros sugeridos pelo autor que produziram resultados satisfatrios para

Aplicao ao Problema Inverso de Transferncia Radiativa o problema em tela. npopsiz = 100 - tamanho da populao; pcross = 0, 5 - probabilidade de cruzamento; pmutate = 0, 01 - probabilidade de mutao.

83

Os parmetros do problema de transferncia radiativa a se determinar correspondem ao vetor indicado na equao (3.2.1) representando as seguintes incgnitas: 0 - espessura tica; - albedo de espalhamento; 1 - reetividade na superfcie esquerda do meio participante homogneo unidimensional; 2 - reetividade na superfcie direita do meio participante homogneo unidimensional. Vamos analisar os casos apresentados na Tabela 6.2. Propriedade radiativa Espessura tica 0 Albedo Reetividade difusa 1 Reetividade difusa 2 Caso 1 1, 0 0, 5 0, 95 0, 5 Caso 2 1, 0 0, 5 0, 1 0, 95

Tabela 6.2: Valores das propriedades radiativas a serem determinadas. O Caso 1 foi resolvido utilizando-se apenas o GA. A soluo apresentada na Tabela 6.3.
Caso 1 0 1, 0160 0, 5665 1 0, 8665 2 0, 4839 Valor nal da funo objetivo eq. (3.2.4) 6, 7E 05 Nmero de avaliaes da funo objetivo 5000 (50 geraes)

Tabela 6.3: Soluo do Algoritmo Gentico (GA) para o Caso 1 Verica-se que aps 50 geraes, ou 5000 avaliaes da funo objetivo, o valor de 1 no foi corretamente determinado. Conforme descrito na Seo 3.5, uma varivel com pequena sensibilidade. Decidiu-se para o Caso 2 utilizar uma estratgia hbrida com o mtodo de Levenberg-Marquardt

84

Algoritmos Genticos

(LM) [163], para reduzir o esforo computacional e obter um resultado mais preciso. O LM foi rodado aps apenas 3 geraes do GA, ou seja, aps 300 avaliaes da funo objetivo. Tambm neste caso foi introduzido um erro de 2,5% nos dados experimentais sintticos. O resultado apresentado na Tabela 6.4. Iterao 0 1 2 3 0 0, 965 1, 001 1, 001 1, 001 0, 495 0, 500 0, 499 0, 499 1 0, 0001 0, 101 0, 109 0, 109 2 0, 953 0, 949 0, 949 0, 949 Funo Objetivo eq. (3.2.4) 3, 715E 3 1, 591E 4 2, 387E 3 1, 946E 6

Tabela 6.4: Resultados para o Caso 2 utilizando o LM aps 3 geraes do GA e 2, 5% de erro nos dados experimentais. A soluo utilizando o mtodo hbrido bastante precisa com um esforo computacional muito menor, quando comparado com o GA puro.

6.4

Consideraes nais

Pelos resultados apresentados verica-se o bom desempenho do GA. A desvantagem o elevado esforo computacional, caracterstica comum a todos os mtodos de otimizao global, como j foi relatado no Captulo 5. O uso de solues hbridas com a utilizao de um mtodo baseado em gradientes (mtodo local) aps algumas geraes do GA mostrou ser uma boa alternativa para se diminuir o esforo computacional e se ter uma soluo mais renada. Diversas variantes do GA tem sido propostas. Uma destas variantes o GA-Epidmico, no qual, aps algumas geraes atuando o GA tradicional, parte da populao dizimada e substituda por novos indivduos [171]. A estratgia do GA-Epidmico foi aplicada com sucesso em problemas inversos de conduo do calor e produz resultados superiores ao GA padro [56]. Recentemente Cuco et al. [65] aplicaram o GA-Epidmico para um problema inverso em transferncia de massa e zeram uma comparao com o GEO (Generalized Extremal Optimization ).

Captulo 7

Redes Neurais Articiais (Articial Neural Networks )


Luiz Biondi Neto Francisco Jos da Cunha Pires Soeiro Jos Demisio Simes da Silva Ezzat Selim Chalhoub Antnio Jos da Silva Neto

7.1

Motivao e Histrico do Mtodo

O crebro humano uma estrutura biolgica que processa informaes de forma no linear e paralela. Embora se saiba que as informaes processadas pelo crebro sejam feitas de maneira totalmente diferente daquela de um computador eletrnico digital e que existe um contraste entre o processamento do crebro e o de um computador, apenas a ttulo de facilitar o entendimento faz-se, inicialmente, um paralelo entre eles. Os computadores digitais atuais podem processar na faixa de 4GHz (0, 25 ns) e ainda se tornar mais velozes, portanto so muito rpidos, enquanto o crebro humano processa na faixa de 500Hz (2 ms), consequentemente muito mais lentos. Tomando-se esses valores como base, um computador cerca de 8 milhes de vezes mais rpido do que o crebro, porm devido ao processamento paralelo o crebro reage muito mais rapidamente 85

86

Redes Neurais Articiais

a um estmulo do que o computador. O neurnio (do grego: clula nervosa) a clula responsvel pelo processamento do sinal cerebral, sendo considerada a clula mais complexa do organismo humano no que tange a estrutura e a funcionalidade. uma clula nervosa que alm de apresentar funcionalidade semelhante a qualquer outra clula, possui a capacidade de processar e transmitir sinais contendo informaes. Dependendo da sua localizao os neurnios podem apresentar vrios tipos morfolgicos distintos: pseudo-unipolar; estrelado; clulas de Purkinje; unipolar; piramidal [144]. Os neurnios operam sempre em grupos formando redes neurais ou redes neuronais biolgicas. Atravs de reaes eltricas e bioqumicas permitem que o crebro execute, de modo paralelo, uma srie de funes particulares ou tarefas de interesse, inclusive a de aprendizado. A Figura 7.1 mostra, de forma bem simplicada, a conexo entre dois neurnios de uma rede neural biolgica.

Figura 7.1: Rede Neural Biolgica (adaptado de [158]) Independentemente do tipo, um neurnio apresenta: um corpo celular, tambm conhecido como Soma, cujo dimetro pode variar de 5 a 100m, contendo uma membrana plasmtica excitvel envolvendo um citoplasma contendo ncleo, mitocndrias e retculo endoplasmtico. Nele est contida quase a totalidade do DNA do neurnio; uma rvore de dendritos, normalmente nica cuja funo oferecer a rea de contato necessria s conexes sinpticas e por onde o neurnio recebe informaes de outros neurnios; e normalmente um nico axnio, tubo lamentar limitado pela membrana da clula, cuja nalidade transmitir pulsos eltricos regenerativos em todo o percurso do sistema nervoso, onde na parte terminal forma um telodendro propiciando um grande nmero de pontos de contato com outras clulas [137]. Para aumentar a velocidade de conduo dos sinais eltricos dos impulsos nervosos no interior do axnio e por questes de isolamento, uma camada

Motivao e Histrico do Mtodo

87

chamada de bainha de mielina recobre o axnio [144]. A sinapse no pode ser considerada apenas uma estrutura de transferncia de sinal de um neurnio para outro. Nela os sinais podem ser amplicados ou atenuados parcial ou plenamente, dando sinapse a caracterstica de um local de deciso no sistema nervoso [136]. De forma geral a rvore de dendritos funciona como um coletor de estmulos dos neurnios adjacentes conduzindo-os para o corpo celular do neurnio na qual so processados gerando um pulso na base do axnio. Esse sinal transmitido pelo axnio at atingir outra clula, passando do axnio do neurnio emissor para o dendrito do neurnio alvo e tendo como ponto de conexo a sinapse. Alm da conexo axnio-dendrito podem ocorrer conexes entre axnio-corpo e entre mltiplos axnios-dendrito. Cada ser humano tem cerca de cem bilhes de neurnios biolgicos (1011 ). Cada neurnio possui entre 10.000 a 100.000 sinapses, totalizando aproximadamente 1016 sinapses. E durante os dois primeiros anos de vida estima-se que 1.000.000 de sinapses sejam formadas por segundo. Redes Neurais Articiais (Articial Neural Networks, ANNs), tambm conhecidas como sistemas conexionistas, so estruturas maciamente paralelas e distribudas, podendo ser implementadas em software e hardware, inspiradas no funcionamento da rede neural biolgica do crebro humano e que tentam reproduzir a dinmica das redes biolgicas. As ANNs tm a capacidade de armazenar certo conhecimento especco disponibilizando-o posteriormente para uso. Uma ANN consiste em um conjunto de elementos processadores ou neurnios articiais dispostos em camadas e interconectados por canais de comunicao unidirecionais denominados de axnios e que terminam em conexes (sinapses) por onde trafegam os sinais entre os neurnios que compem a ANN. Nessas conexes, onde ca armazenado o conhecimento que se deseja que a rede absorva, so normalmente associados pesos. Cada neurnio articial emite um sinal que pode ser distribudo pelas conexes a outros processadores integrantes da ANN. As principais caractersticas das ANNs so: procura paralela e endereamento pelo contedo, imitando o crebro que no possui endereo de memria nem procura uma informao sequencialmente; aprendizado, dotando a rede de capacidade de aprender certo conhecimento por sucessivas apresentaes de padres (experincia) sem necessidade de explicitar os algoritmos para executar uma tarefa; associao, permitindo que a rede possa associar padres diferentes; generalizao, habilitando a rede a lidar com rudo e distores e responder corretamente, por similaridade com outros padres j apresentados, a uma entrada nunca vista; abstrao, dotando a rede da capacidade de abstrair a essncia de um conjunto de entradas; e nalmente,

88

Redes Neurais Articiais

a robustez permitindo, devido ao paralelismo, que mesmo com a perda de elementos processadores, no haja mau funcionamento da rede. A Figura 7.2 mostra a estrutura de uma ANN com mltiplas camadas, onde se torna ntida a diferena entre a camada de entrada, formada por ns de transferncia apenas com a funo de distribuir os sinais de entrada, as demais camadas intermedirias ou escondidas e a camada de sada compostas, integralmente, de neurnios articiais e, portanto, com funcionalidades neurais.

Figura 7.2: Rede Neural Articial (ANN).

Atravs de algoritmos especcos as ANNs aprendem certo conhecimento fase de treinamento pela apresentao sucessiva de exemplos (padres ), armazenando-os nas inmeras conexes sinpticas existentes entre neurnios articiais sob forma de pesos. Nessa fase so extradas as informaes necessrias para representar as informaes contidas nos padres, devidamente mapeados. O conhecimento ca distribudo por toda rede, disponvel para ser usado na fase de execuo em diferentes reas de aplicao.

Descrio do Algoritmo

89

7.2
7.2.1

Descrio do Algoritmo
Modelo do Neurnio Articial

O primeiro modelo matemtico que representa, com detalhes, a gerao e a propagao do potencial de ao de um neurnio deve-se ao trabalho de Hodgkin e Huxley [108]. Atravs de experincia pioneira, envolvendo o axnio de uma lula, os cientistas conseguiram demonstrar a dependncia entre as condutncias dos ons de sdio e potssio e o potencial de membrana [144]. McCulloch e Pitts [169], fazendo uma analogia com o neurnio biolgico, propuseram um modelo que representa o corpo celular por um somatrio (), o axnio por uma funo de ativao (F ), normalmente com limiar que pode ser uma funo degrau, logstica, tangente hiperblica, entre outras, e que restringe a amplitude do sinal de sada OU T do neurnio. As sinapses so representadas por pesos (W ) emulando as sinapses que ponderam as entradas do modelo, podendo ser positivos ou negativos em funo das caractersticas das sinapses serem inibitrias ou excitatrias [105]. Se a funo de ativao apresentar um limiar xo (bias, representado por b), o neurnio dispara quando o total da soma ponderada das entradas pelos respectivos pesos sinpticos (N ET = xW + b) for maior ou igual a 0. O valor de b pode ser positivo ou negativo, aumentando ou diminuindo a entrada lquida da funo de ativao F e pode ser representado diretamente como mais um peso associado a uma entrada xada em 1. Assim para N ET 0, OU T = F (N ET ) = 1, caso contrrio OU T = 0. O modelo simplicado do neurnio articial representado na Figura 7.3.

Figura 7.3: Modelo simplicado do Neurnio Articial de McCulloch e Pitts.

90

Redes Neurais Articiais

7.2.2

Processamento Neural

Uma das caractersticas mais relevantes das ANNs a sua capacidade de adquirir um conhecimento especco atravs da apresentao sucessiva de exemplos, de forma semelhante ao processo de aprendizado que acontece com os seres humanos. O processamento de uma ANN pode ser dividido em duas fases distintas: treinamento e execuo. A utilizao da ANN na soluo de um determinado problema inicia-se, necessariamente, na fase de treinamento, onde a rede extrai informaes relevantes dos padres apresentados, criando uma representao prpria do problema. A fase de treinamento um processo iterativo e contnuo de ajuste dos pesos das conexes entre os neurnios. Nesta etapa realizado o processo de atualizao dos pesos sinpticos e bias. O objetivo principal adquirir a informao e express-la sob a forma de uma matriz de pesos W e bias b. Essa fase a mais demorada e o processo de atualizao dos pesos e bias envolve algoritmos de minimizao de erro que em certas circunstncias, pode ter convergncia lenta, paralisada ou at mesmo oscilar indenidamente. Encontrar a arquitetura ideal, denir o conjunto de parmetros usados no treinamento e estabelecer o mtodo mais adequado pode no ser uma tarefa simples e rpida. Essa tarefa no determinstica e, portanto no existe pelo menos de forma ecaz e eciente, um conjunto de mtricas que permitam constituir esses parmetros. Existem diversas classicaes e tcnicas de treinamento para ANNs, muito bem desenvolvidas na literatura especializada [105]. Parece-nos importante, no momento, detalhar os dois principais paradigmas de treinamento das ANNs, o aprendizado supervisionado, enfoque desse trabalho e o aprendizado no-supervisionado. A aprendizagem supervisionada caracteriza-se pela existncia de um supervisor , que indica rede a resposta desejada para cada padro de entrada apresentado. No incio do processo de treinamento a ANN no tem nenhum conhecimento do ambiente a ser representado. Durante o treinamento os parmetros da rede so ajustados, em funo do estmulo recebido na entrada e do sinal de erro denido pela diferena entre a resposta corrente fornecida pela rede e a resposta desejada, informada pelo processo de superviso. No aprendizado supervisionado a ANN treinada atravs do fornecimento dos valores de entrada e seus respectivos valores de sada desejados, ou simplesmente alvos, formando pares de treinamento. Na verdade esses pares de treinamento denem o mapeamento que se deseja que a ANN aprenda. Assim o processo de treinamento da ANN tenta minimizar ou corrigir o erro entre o sinal de sada e a resposta desejada. Os parmetros so alterados iterativamente at que o erro atinja certo valor mnimo pr-estabelecido. A

Descrio do Algoritmo

91

partir deste instante supe-se que a ANN tenha adquirido o conhecimento transmitido pelo supervisor , encerrando-se o processo de aprendizagem. O treinamento supervisionado usado em vrios tipos de ANNs, dentre elas o Perceptron de Mltiplas Camadas (MLP) [105]. No aprendizado no-supervisionado a reposta desejada no conhecida previamente e no existe a gura do supervisor passando o conhecimento para a ANN. Um bom exemplo a declarao de Hebb para aprendizado no-supervisionado [106] que prope o seguinte: Quando um Axnio de uma clula A est prximo suciente para excitar uma clula B e repetida ou persistentemente participa desta ativao, um processo de crescimento ou de mudana metablica ocorre em uma ou mais clulas, de tal forma que a ecincia de A em ativar B seja aumentada . Para explicar a declarao de Hebb vamos considerar a existncia de dois neurnios conforme a Figura 7.4. O neurnio fonte representado pelo neurnio (i) e apresenta sada OU Ti . O neurnio destino pelo neurnio (j ) e apresenta sada OU Tj . O peso Wij representa o peso sinptico entre o neurnio fonte e o neurnio destino.

Figura 7.4: Conexo entre dois Neurnios Articiais De acordo com a declarao de Hebb se os neurnios fonte e destino forem ativados de maneira sncrona o peso da conexo sinptica crescer proporcional ao produto da sada do neurnio fonte OU Ti pelo neurnio destino OU Tj . Por outro lado se a ativao for feita de forma assncrona a conexo se enfraquecer podendo at mesmo ser suprimida. Assim possvel escrever, de acordo com a declarao de Hebb, a equao Wij (n) = OU Ti OU Ti e que agora toma forma de regra para variao do peso. O parmetro representa uma constante positiva denominada de taxa de aprendizado e (n) representa a iterao atual. Com base na regra de Hebb podemos escrever a equao 7.2.1, que permite atualizar o peso sinptico, iterao a iterao [105, 196]. Wij (n + 1) = Wij (n) + Wij (n) = Wij (n) + OU Ti OU Tj (7.2.1)

Alm do exposto, no aprendizado no supervisionado a rede desenvolve suas prprias representaes de associao. A cada padro apresentado, a rede verica sua semelhana com padres anteriores, de acordo com um critrio pr-estabelecido. Caso o padro apresente certa similaridade com

92

Redes Neurais Articiais

algum dos padres anteriores, este representado de tal forma que a rede responda igualmente a estes padres similares. Caso contrrio, o padro representado em uma nova classe de informao, ainda no existente. Na fase de execuo esto disponveis as matrizes de pesos e bias geradas no treinamento e, portanto no existe mais nenhum processo iterativo a ser realizado. Nessa etapa feito o clculo da sada da ANN dado certo padro de teste de entrada, que normalmente no fez parte do treinamento, objetivando recuperar a informao. Matematicamente, o processo envolve apenas a multiplicao da matriz de pesos W e bias b pelo padro de teste xt , que no fez parte do treinamento e aplicando o resultado, diretamente, na funo de ativao F para obter a resposta da rede OU T = F (xt W + b) tornando-se consequentemente um processo muito rpido.

7.2.3

Perceptron

O primeiro modelo, bem sucedido de aprendizado supervisionado foi proposto por Frank Rosenblatt em 1962 e denominado de Perceptron [198]. O Perceptron a estrutura mais simples de uma ANN usada com sucesso na classicao de padres. O modelo do neurnio articial usado no Perceptron segue o proposto por McCulloch e Pitts e sua topologia composta de uma nica camada contendo um ou vrios neurnios articiais. A Figura 7.5 representa um Perceptron com um neurnio articial j de n entradas Xi (i = 1, . . . , n), ponderadas pelos pesos Wij , agora usando uma funo de ativao do tipo degrau simtrico (bipolar) com maior poder de discriminao e com sada OU Tj . A superviso feita por Tj (resposta desejada) e o sinal de erro correspondente vale Tj OU Tj . O ajuste dos pesos sinpticos dado por Wij = (Tj OU Tj )Xi .

Figura 7.5: Perceptron O Algoritmo de treinamento do Perceptron consiste no seguinte: 1. Inicializar os pesos sinpticos Wij com valores aleatrios; 2. Aplicar um padro de entrada Xi e calcular a sada OU Tj ;

Descrio do Algoritmo

93

3. Se a sada OU Tj = Tj e existir novo padro a ser apresentado, ento voltar a 2, seno ir para 7; 4. Se a sada OU Tj = Tj calcular a variao dos pesos Wij (n) = (Tj OU Tj ) X ; 5. Atualizar os Pesos Sinpticos Wij (n + 1) = Wij (n) + Wij (n); 6. Se existir novo padro a ser apresentado voltar para 2; 7. FIM. A taxa de aprendizado mede o passo adotado pela rede em busca do ponto de convergncia, isto o mnimo global. Sendo assim, dependendo do valor escolhido o treinamento pode paralisar, no caso de muito pequeno ou oscilar para muito elevado. O propsito do Perceptron a classicao de padres. Minsky e Papert [175] demonstraram que o Perceptron no podia ser usado como soluo para qualquer tipo de problema de classicao, como se pensava inicialmente. Ficou provado que o Perceptron no resolvia problemas que apresentassem superfcies linearmente no separveis entre as classes, como o caso de um simples Ou exclusivo. A soluo apresentada para o problema foi construir redes semelhantes ao Perceptron, porm com mltiplas camadas, denominadas de Perceptrons de mltiplas camadas. Entretanto, na poca ainda no se conhecia nenhum algoritmo de aprendizado capaz de treinar redes com mais de uma camada de neurnios articiais, gerando um grande pessimismo com relao ao futuro da rea de ANNs [105]. Com a criao do algoritmo de retropropagao de erro o problema cou devidamente resolvido.

7.2.4

Perceptron de Mltiplas camadas

A nova estrutura uma extenso do Perceptron proposto por Rosenblatt, composta de vrias camadas de neurnios articiais, onde cada neurnio articial de uma camada antecedente se conecta com todos os neurnios articiais de uma camada consequente. Deste modo esta estrutura tambm chamada de Perceptron de Mltiplas Camadas, Multilayer Perceptron (MLP). O nmero de elementos da entrada depende intrinsecamente das caractersticas do problema. A camada de sada contm tantos neurnios articiais quantos forem necessrios modelagem do problema. A estrutura pode apresentar uma ou mais camadas intermedirias de neurnios articiais, tambm conhecidas como camadas escondidas ou ocultas. O nmero de camadas intermedirias e a quantidade de neurnios articiais por camada dependem da complexidade do problema que se deseja representar.

94

Redes Neurais Articiais

A arquitetura do MLP apresentada na Figura 7.6, onde Ni , Nh e No correspondem, respectivamente, ao nmero de elementos da entrada, camada intermediria e camada de sada. Os vetores X , O e T arget representam o estmulo apresentado na entrada, a resposta da ANN quele estmulo e o resultado desejado fornecido pelo supervisor.

Figura 7.6: Arquitetura do Perceptron de Mltiplas Camadas. O algoritmo de treinamento do MLP, chamado de retropropagao, backpropagation (BP) baseia-se no modelo de aprendizado supervisionado, retropropagando os erros da camada de sada para o treinamento dos pesos das camadas intermedirias e foi proposto por Paul Werbos [263] e difundido por Rumelhart et al. [199]. O treinamento da rede MLP dividido em duas fases principais: forward e backward . A primeira consiste na propagao dos estmulos apresentados entrada para a sada. Esses estmulos uem por toda a rede, recebendo a computao neural, camada por camada, at gerarem a sada O. A partir do resultado desejado (T arget), calcula-se o erro na camada de sada. A segunda etapa ocorre em sentido contrrio. O erro calculado ento retropropagado pelas camadas antecessoras (error-back-propagation ), atualizando os pesos das conexes pelo uso de regras especcas. O algoritmo BP [29] baseado no mtodo do gradiente descendente, que computa as derivadas parciais de uma funo de erro E , com relao ao vetor peso W de certo vetor de entrada X . A variao do peso e do bias feita de forma semelhante, Wij = E Wij (7.2.2)

Para os leitores interessados em uma descrio detalhada do algoritmo

Descrio do Algoritmo

95

de retropropagao para o treinamento do MLP recomenda-se a Ref. [104]. O uxograma deste algoritmo apresentado na Figura 7.7.

Figura 7.7: Fluxograma do algoritmo de retropropagao. O algoritmo BP embora aplicado com xito em vrias aplicaes apresenta algumas diculdades: tempo de convergncia longo; paralisia da rede; e mnimo local [262]. Se a taxa de aprendizado e a arquitetura da rede no forem escolhidas adequadamente, ou se o ajuste dos pesos for innitesimal,

96

Redes Neurais Articiais

o tempo de treinamento pode crescer drasticamente. A rede tambm pode operar em uma regio onde a derivada da funo de ativao seja nula ou innitamente pequena, provocando a paralisia da rede. Conforme mostrado na Figura 7.8, se a taxa de aprendizado for muito baixa, ser muito pequena a variao Wij de uma iterao para outra, provocando uma suave trajetria no espao dos pesos. Assim aumentam as chances de a rede car presa em um mnimo local ou, na melhor das hipteses, o treinamento ser muito lento. Por outro lado, conforme mostrado na Figura 7.9, se for grande demais o aprendizado mais rpido devido a uma maior variao de Wij de uma iterao para outra, podendo tornar a rede instvel e provocando oscilaes.

Figura 7.8: Treinamento com baixa taxa de aprendizado. O uso do Coeciente de Momento () tem por objetivo acelerar a convergncia, oferecer mais estabilidade ao algoritmo BP e minimizar problemas causados pelo uso de taxa de aprendizado elevada que podem provocar oscilaes. O momento permite que o ajuste dos pesos, a cada iterao, seja proporcional magnitude do ltimo ajuste, de forma que Wij (n + 1) = f (Wij (n)) (7.2.3)

O termo geralmente escolhido menor que 0, 9. Conforme mencionado, a Figura 7.9 mostra a curva de treinamento para uma situao de taxa de aprendizado elevada na qual cam evidentes, quando no se usa o coeciente de momento, a diculdade convergncia e

Descrio do Algoritmo

97

Figura 7.9: Treinamento com alta taxa de aprendizado.

a acentuada caracterstica oscilatria. Na Figura 7.10 com o uso do Coeciente de Momento, mantendo-se a taxa de aprendizado inalterada, no h oscilao e a convergncia atingida.

Figura 7.10: Treinamento com alta taxa de aprendizado e com Coeciente de


Momento.

98

Redes Neurais Articiais

7.2.5

Mquinas de Comit

As mquinas de comit so tcnicas usadas para resolver problemas encontrados no treinamento supervisionado, especialmente no tocante a generalizao. Baseiam-se na idia de dividir problemas computacionalmente complexos em diversos problemas mais simples computacionalmente, isto dividindo e conquistando. Combinando-se os resultados desses problemas simples, chega-se ao resultado nal [105, 77, 213]. Uma prtica comumente utilizada em ANNs fazer o treinamento de um nmero elevado de redes candidatas, conguradas com parmetros distintos selecionando-se a melhor com base nos resultados do desempenho sobre um conjunto independente de validao e teste, descartando-se o restante. Nesse processo todo o trabalho dedicado s ANNs descartadas perdido. Alm disso, como o conjunto de validao no determinstico, possvel ocorrer o seguinte: A ANN que apresentar o melhor desempenho quando submetida ao conjunto de validao pode no ter o melhor desempenho relativamente ao conjunto de teste. Formando-se um comit de ANNs composto de todas essas redes esse problema pode ser minorado. O resultado combinado do comit, frequentemente, apresenta melhor resultado do que uma rede isolada. O comit de ANNs pode ser basicamente classicado em duas grandes categorias: estruturas estticas e estruturas dinmicas. Na estrutura esttica as sadas das redes especialistas so combinadas sem a participao do sinal de entrada. Essa classe usa principalmente dois mtodos de tratamento do sinal de sada das ANNs especialistas, a saber, a mdia do conjunto e o mtodo do reforo. No mtodo da mdia, Figura 7.11 as entradas x das ANNs especialistas so rigorosamente as mesmas e a sada global R dada pela combinao linear das sadas das ANNs especialistas. So permitidas variaes nas condies iniciais usadas no treinamento e modicaes nos parmetros e algoritmos de minimizao do erro.

Figura 7.11: Diagrama em blocos de uma estrutura esttica de um comit usando


o mtodo da mdia

Descrio do Algoritmo

99

Por outro lado no mtodo de reforo, representado na Figura 7.12, o conjunto de dados de treinamento das ANNs especialistas apresentam distribuies distintas, isto diferentes sinais de entrada. Nesse caso o objetivo principal melhorar qualquer algoritmo de treinamento [105].

Figura 7.12: Diagrama em blocos de uma estrutura esttica de um comit usando


o mtodo do reforo.

Na estrutura dinmica, cujo mtodo mais conhecido a mistura de especialistas, o sinal de entrada e as sadas das ANNs especialistas so aplicados a uma estrutura combinadora no linear. O mecanismo no linear de combinao normalmente outra ANN denominada de rede de passagem, que funciona como um mediador entre as ANNs especialistas. A rede de passagem apresenta apenas uma nica camada com N neurnios, um para cada ANN especialista. A funo de ativao desses neurnios uma generalizao da funo logstica para mltiplas entradas denida pela equao (7.2.4), e representa uma generalizao diferencivel da operao o vencedor leva tudo de escolha do valor mximo e conhecida como softmax [105]. O termo N ETn representa o produto do vetor peso sinptico pelo vetor de entrada do neurnio especialista. O termo N ETj representa o produto do vetor de entrada pelo vetor de pesos sinpticos da rede de passagem. As ANNs especialistas e a rede de passagem so treinadas simultaneamente. gn = exp (N ETn )
n

, n = 1, 2, . . . , N

(7.2.4)

exp (N ETj )
j =1

A sada global R do modelo dada pela equao (7.2.5), onde yk representa a sada da RNA especialista e gn a funo em x no linear da rede de passagem [105, 77],
n

R=
j =1

gn yn

(7.2.5)

100

Redes Neurais Articiais

Se a sada da rede de passagem for gn = 0 (n = 1, 2, . . . , N ) indica que a ANN especialista correspondente no tem inuncia sobre a sada global, enquanto gn = 1 (n = 1, 2, . . . , N ) indica controle total da ANN especialista na sada global. Assim as sadas so combinadas de forma mais inteligente permitindo que apenas as melhores ANNs especialistas contribuam para a sada global de um dado padro. A Figura 7.13 representa o diagrama em blocos de uma estrutura dinmica de um comit usando mistura de especialistas.

Figura 7.13: Diagrama em blocos de uma estrutura dinmica de um comit


usando mistura de especialistas.

7.3

Aplicao ao Problema Inverso de Transferncia Radiativa

aqui considerado o problema inverso de transferncia radiativa em um meio homogneo unidimensional conforme as descries feitas na Subseo 2.2.1 e no Captulo 3. As incgnitas que se deseja determinar so aquelas apresentadas na equao (3.2.1). Como dados experimentais reais no estavam disponveis, foram gerados dados experimentais sintticos conforme descrito na Seo 3.3. A aplicao das ANNs ao problema em estudo possui uma caracterstica importante. Como no se dispunha de dados experimentais sucientes para treinamento das redes, Soeiro et al. [230, 233, 234] utilizaram o modelo matemtico para gerar os padres necessrios para este m. Uma vez treinada, a rede fornece uma estimativa inicial para o mtodo baseado em gradientes (Levenberg-Marquardt, LM) de forma a renar a soluo. Na Tabela 7.1 so apresentados os valores exatos das propriedades radiativas que se deseja

Aplicao ao Problema Inverso de Transferncia Radiativa determinar. Propriedade Radiativa Espessura tica 0 Albedo Reetividade difusa 1 Reetividade difusa 2 Valor Exato 1, 0 0, 5 0, 1 0, 95

101

Tabela 7.1: Valores das propriedades radiativas a serem determinadas. Se utilizarmos o mtodo local diretamente partindo de uma estimativa inicial fora da regio de convergncia do mtodo, a soluo do problema no ser obtida. A Tabela 7.2 apresenta o resultado para uma estimativa inicial 0 0 T 0 0 ruim Z 0 = 0 , 0 , 0 onde 0 = 0, 5; 0 = 0, 95; 0 1 , 2 1 = 0, 95; 2 = 0, 1 . Iterao 0 1 2 3 4 5 . . . 10 0 5, 0 8, 283 11, 863 16, 234 20, 928 17, 418 . . . 0, 0001 0, 95 0, 995 0, 995 0, 995 0, 995 0, 995 . . . 0, 905 1 0, 95 0, 9447 0, 9624 0, 9752 0, 9853 0, 9910 . . . 0, 9461 2 0, 1 0, 0001 0, 0044 0, 0203 0, 0001 0, 0001 . . . 0, 9757

Tabela 7.2: Resultados utilizando o LM. Agora vamos utilizar as redes neurais para ter uma estimativa inicial de boa qualidade. Inicialmente foram gerados dados sem rudo. O software empregado foi a toolbox de redes neurais do Matlab. A rede foi constituda de uma camada escondida de NH = 20 e 40 neurnios e foram empregadas diferentes quantidades de padres visando utilizar o menor esforo computacional (NP = 81, 108, 144 e 192). A Tabela 7.3 apresenta os resultados obtidos com a estratgia hbrida ANN-LM. O problema inverso tambm foi resolvido considerando-se dados experimentais com rudo. Na gerao dos padres tambm foi adicionado rudo nos padres para treinamento da rede, o que levou a uma maior robustez da mesma. As Tabelas 7.4 e 7.5 apresentam os resultados para 2% e 5% de erro nos dados experimentais. As estimativas iniciais geradas pelas ANNs se degradam, mas ainda esto na regio de convergncia do LM. No contexto dos mtodos hbridos, Chalhoub et al. [51] utilizaram as solues geradas por um mtodo de Monte Carlo, com diferente nveis de

102 Estimativa (ANN) 0 1 2 3, 84 0, 75 0, 34 0, 77 3, 55 0, 76 0, 39 0, 75 3, 65 0, 72 0, 40 0, 77 3, 52 0, 76 0, 41 0, 74

Redes Neurais Articiais Resultados (LM) 1 2 0, 52 0, 14 0, 95 0, 52 0, 15 0, 95 0, 52 0, 15 0, 95 0, 54 0, 19 0, 96

NP 192 144 108 81

NH 40 40 20 20

0 0, 99 0, 99 0, 99 0, 96

Tabela 7.3: Uso das ANNs para obteno de estimativa inicial para o LM com
dados sem rudo.
NP 192 144 108 81 NH 40 40 20 20 Estimativa com erro de 2% (ANN) 0 1 2 3, 74 0, 74 0, 29 0, 76 3, 88 0, 69 0, 42 0, 78 3, 71 0, 78 0, 38 0, 74 3, 62 0, 75 0, 50 0, 76 0 0, 99 0, 98 0, 92 0, 86 Resultados (LM) 1 0, 52 0, 14 0, 52 0, 15 0, 67 0, 38 0, 75 0, 53 2 0, 95 0, 95 0, 94 0, 95

Tabela 7.4: Uso das ANNs para obteno de estimativa inicial para o LM com
dados ruidosos (2%).
Estimativa com erro de 5% (ANN) 0 1 2 3, 46 0, 71 0, 37 0, 72 3, 28 0, 73 0, 44 0, 75 3, 89 0, 75 0, 36 0, 78 3, 71 0, 74 0, 37 0, 74 Resultados (LM) 1 0, 55 0, 22 0, 51 0, 14 0, 54 0, 17 0, 58 0, 27

NP 192 144 108 81

NH 40 40 20 20

0 0, 95 0, 99 0, 96 0, 93

2 0, 96 0, 95 0, 96 0, 96

Tabela 7.5: Uso das ANNs para obteno de estimativa inicial para o LM com
dados ruidosos (5%).

preciso, para o treinamento da rede, tornando-a bastante robusta para produzir boas estimativas das incgnitas, mesmo para os casos teste com dados experimentais com rudo. Para o processo de treinamento, 950 padres de parmetros fsicos foram calculados, usando 19 valores de albedo, , na faixa [0, 05; 0, 95], com um intervalo de 0, 05, para cada um dos 50 valores de espessura tica, 0 , na faixa [0, 06; 3, 00], com um intervalo de 0, 06. Para simular vrios experimentos com diferentes nveis de rudo, cinco diferentes casos para o nmero de histrias de ftons foram considerados: 10.000, 50.000, 100.000, 500.000 e 1.000.000. Consideramos tambm o problema j apresentado anteriormente, porm com reetividades difusas nulas nas superfcies internas do meio, isto 1 = 2 = 0. Na Tabela 7.6 so apresentados os quatro casos teste considerados. Seis diferentes redes foram desenvolvidas. Cada uma das cinco primeiras ANNs foi treinada com um conjunto de padres gerado com um nmero

Consideraes Finais Caso 1 2 3 4 0, 1 0, 5 0, 9 0, 9 0 1, 0 2, 0 3, 0 0, 5

103

Tabela 7.6: Valores das propriedades radiativas a serem determinadas.

especco de histrias de ftons: (i) 10.000 (ANN1-10k); (ii) 50.000 (ANN250k); (iii) 100.000 (ANN3-100k); (iv) 500.000(ANN4-500k); e (v) 1.000.000 (ANN5-1M). A sexta rede foi tambm construda, sendo treinada com um conjunto de padres composto por uma combinao de todos os conjuntos previamente descritos (ANN6-1A5). Na Tabela 7.7, so apresentados os resultados obtidos com a combinao MC-ANN para o caso teste 1. Cada linha est relacionada com uma ANN especca, treinada com um conjunto de padres, gerado com um grau de preciso que depende no nmero de histrias de ftons na simulao de MC.
Rudo Incgnita ANN1-10k ANN2-50k ANN3-100k ANN4-500k ANN5-1M ANN6-1A5 0% 0 0, 1025 1, 0227 0, 1030 1, 0012 0, 1025 1, 0118 0, 1005 1, 0081 0, 1006 1, 0049 0, 1005 1, 0053 2, 5% 0 0, 1026 1, 0184 0, 1027 1, 0002 0, 1029 1, 0031 0, 1002 1, 0018 0, 1007 0, 9987 0, 1007 0, 9989 5% 0 0, 1036 1, 0409 0, 1035 1, 0104 0, 1033 1, 0284 0, 0999 1, 0220 0, 0996 1, 0192 0, 1010 1, 0180 10% 0 0, 1014 1, 0134 0, 1035 0, 9820 0, 1029 1, 0078 0, 0966 1, 0178 0, 0975 1, 0011 0, 0995 1, 0139

Tabela 7.7: Estimativas de e 0 para o caso teste 1. Em todas as situaes apresentadas, boas estimativas das incgnitas foram obtidas. O mesmo comportamento foi observado para os casos teste 2 a 4, cujos resultados so apresentados nas Tabelas 7.8 a 7.10, respectivamente.
Rudo Incgnita ANN1-10k ANN2-50k ANN3-100k ANN4-500k ANN5-1M ANN6-1A5 0% 0 0, 5062 2, 0574 0, 5069 2, 0075 0, 5022 2, 0035 0, 5023 2, 0075 0, 5016 2, 0101 0, 5023 2, 0137 2, 5% 0 0, 5053 2, 0789 0, 5057 2, 0093 0, 5018 2, 0151 0, 5003 1, 9953 0, 5020 2, 0125 0, 5015 2, 0167 5% 0 0, 4988 2, 0251 0, 5031 1, 9917 0, 4955 2, 0157 0, 4988 2, 0040 0, 4972 2, 0147 0, 4982 2, 0094 10% 0 0, 5103 2, 2701 0, 5064 1, 8785 0, 5090 1, 9394 0, 5043 2, 0506 0, 5083 1, 9971 0, 5082 2, 0202

Tabela 7.8: Estimativas de e 0 para o caso teste 2.

104
Rudo Incgnita ANN1-10k ANN2-50k ANN3-100k ANN4-500k ANN5-1M ANN6-1A5 0% 0 0, 9047 3, 0680 0, 8992 2, 9561 0, 8999 2, 9074 0, 9017 3, 0364 0, 9001 2, 9870 0, 9012 3, 0099 2, 5% 0 0, 9022 3, 0478 0, 9022 2, 9715 0, 8994 2, 9500 0, 9091 2, 8120 0, 9021 3, 0890 0, 9033 3, 0257

Redes Neurais Articiais


5% 0 0, 9106 3, 0921 0, 9032 3, 1026 0, 9047 2, 9036 0, 9100 3, 0097 0, 8947 3, 0029 0, 9078 3, 0029 10% 0 0, 9109 3, 3401 0, 8668 1, 9503 0, 8947 2, 9729 0, 9099 3, 0481 0, 9163 3, 1206 0, 8930 2, 9116

Tabela 7.9: Estimativas de e 0 para o caso teste 3.


Rudo Incgnita ANN1-10k ANN2-50k ANN3-100k ANN4-500k ANN5-1M ANN6-1A5 0% 0 0, 8830 0, 8894 0, 8730 0, 5412 0, 8964 0, 5090 0, 8977 0, 5015 0, 8977 0, 5079 0, 8968 0, 5048 2, 5% 0 0, 8816 0, 8969 0, 8783 0, 5918 0, 8866 0, 5007 0, 8898 0, 5114 0, 8960 0, 5004 0, 8964 0, 4945 5% 0 0, 8904 0, 8611 0, 8531 0, 6765 0, 9188 0, 4934 0, 9025 0, 5037 0, 9007 0, 5008 0, 8947 0, 4964 10% 0 0, 8368 0, 8622 0, 8801 0, 5413 0, 8773 0, 5258 0, 9184 0, 4646 0, 8844 0, 5341 0, 8910 0, 5178

Tabela 7.10: Estimativas de e 0 para o caso teste 4.

7.4

Consideraes Finais

O uso de redes neurais articiais para se obter uma estimativa inicial para o mtodo local (LM) funcionou bem para o problema de transferncia radiativa em estudo. A combinao RNA-LM uma tcnica promissora principalmente pelo baixo custo computacional envolvido comparado com outras tcnicas de otimizao global apresentadas neste estudo. A combinao do mtodo de Monte Carlo com Redes Neurais Articiais gerou boas estimativas do albedo de espalhamento simples e da espessura tica. As RNAs desenvolvidas mostraram robustez, comportando-se bem mesmo com a presena de rudo nos dados experimentais sintticos.

Captulo 8

Algoritmos Neuro-Nebulosos (Neuro-Fuzzy Algorithms )


Luiz Biondi Neto Jos Demisio Simes da Silva Antnio Jos da Silva Neto

8.1

Motivao e Histrico do Mtodo

Este captulo concentra-se na Lgica Fuzzy (LF), Nebulosa (LN), ou Difusa (LD), e na tipicao dos Sistemas Hbridos (SH) com foco principal no Sistema Neuro-Fuzzy (SNF). Os primeiros estudos sobre a Lgica foram realizados por lsofos gregos, sendo o principal organizador da lgica clssica o grande lsofo Aristteles (384 - 322 a.C). A lgica contempornea pode ser dividida em duas classes principais: Lgica Padro: atribuda aos trabalhos de Boole [33], Frege [89] e Russel [201]. Lgicas No-padro, dentre elas a lgica Fuzzy [273, 135]. Ao longo do tempo vrios sistemas, baseados nos conceitos de Inteligncia Articial foram pesquisados. Os Sistemas Especialistas (SE), que resolvem problemas normalmente solucionados por especialistas humanos foram os que mais prosperaram. Os SE entretanto demandam a representao do conhecimento especialista com a mxima completude e mxima 105

106

Algoritmos Neuro-Nebulosos

preciso possveis, para poder atuar de maneira similar ao humano especialista. Em geral, os SE so sintonizados para domnios de aplicao restritos atravs da especicao e construo de Regras de Produo. Mesmo considerando domnios restritos, os SE baseados em Lgica Clssica carecem de meios para representar caractersticas intrnsecas do conhecimento humano, como a incerteza. Entretanto, a incerteza em SE pode ser manipulada atravs do uso da Lgica Fuzzy (Nebulosa ou Difusa). Portanto, apresenta-se aqui, de forma resumida o embasamento terico da Lgica Fuzzy necessrio para compreenso do uso dessa lgica no desenvolvimento de sistemas especialistas que usam inferncia nebulosa. Um SE necessita de uma vasta base de conhecimento (BC) especca ao domnio do problema e que deve ser preparada adequadamente para ser manipulada por um sistema computacional. Esse conhecimento pode ser apresentado de duas formas distintas: factual e heurstico. O conhecimento factual composto de informaes e fatos aceitos pela comunidade cientca publicado em livros e peridicos, etc. Por outro lado o conhecimento heurstico apresentado sob a forma de regras que resultam da intuio e do bom senso dos especialistas, sem necessariamente serem comprovados cienticamente. Em outras palavras o conhecimento heurstico composto de estratgias diferentes, peculiares aos especialistas humanos, que podem contribuir para diminuir o espao de busca de um problema [195]. Normalmente a BC composta de fatos e de regras. Seu contedo deve ser explorado por mecanismos de raciocnio inferencial, operao lgica pela qual se tira uma concluso de uma ou vrias proposies admitidas como verdadeiras, objetivando aplicar o conhecimento especco guardado na BC ao problema investigado. Isso feito atravs de um conjunto de tcnicas de manipulao de conhecimento denominadas de mecanismos de inferncia [188].

8.2

Descrio do Algoritmo

A Figura 8.1 mostra a arquitetura de um sistema especialista. A BC composta de um banco de fatos e de um banco de regras. Cabe ao engenheiro do conhecimento atravs de entrevistas com o especialista adquirir os conhecimentos especcos do domnio do problema e represent-los de forma adequada para serem manipulados por um computador, montado o banco de fatos e de regras. A Mquina de Inferncia responsvel pelos procedimentos de busca do conhecimento representado na BC, visando obter a soluo do problema. Pode ser realizada atravs de encadeamento para trs ou para frente, gerando no s a soluo imediata do problema, mas tambm incluindo novos

Descrio do Algoritmo

107

Figura 8.1: A arquitetura de um Sistema Especialista fatos na BC. O mecanismo de inferncia que utiliza encadeamento para frente baseado na busca do sucesso de uma regra (concluso verdadeira) atravs da checagem do Antecedente de uma Regra e depois de seu Consequente. No caso do encadeamento para trs a soluo encontrada partindose do Consequente e tentando-se provar o Antecedente [188].

8.2.1

Sistema Fuzzy

A Teoria dos Conjuntos Fuzzy, desenvolvida por Lofti A. Zadeh [273] durante a dcada de 60 executa o tratamento de informaes incertas, imprecisas e vagas comumente encontradas nos problemas cotidianos e fornece a base matemtica que permite o manuseio destas incertezas por intermdio da lingustica e cognio humanas. Quando utilizada em um contexto lgico, como o de sistemas baseados em conhecimento, conhecido como lgica Fuzzy, lgica nebulosa ou lgica difusa [208]. O aspecto mais notvel dessa metodologia a possibilidade de se capturar, em um modelo matemtico, conceitos intuitivos como graus de satisfao, conforto, adequao, etc. uma poderosa ferramenta que obtm solues viveis para problemas de difcil tratamento por tcnicas convencionais, pois tem a capacidade de efetuar a anlise de sistemas de extrema complexidade, cuja modelagem por ferramentas convencionais se mostra extremamente difcil, ou at impossvel [214]. Assim, a Lgica Fuzzy [141, 10] uma lgica multivalorada capaz de absorver informaes vagas, normalmente descritas em uma linguagem natural (lnguas faladas ou escritas) e convert-las para um formato numrico, de fcil manipulao computacional. Procura modelar os modos imprecisos do raciocnio humano auxiliando na habilidade humana de tomar decises. A Lgica Fuzzy, que baseada na habilidade que o ser humano tem em tratar informaes inexatas, imprecisas, incertas, vagas, fornece aos prossionais das mais diferentes reas uma ferramenta poderosa para resolver esse problema.

108

Algoritmos Neuro-Nebulosos

Por outro lado, as linguagens de programao tradicionais, baseadas em Lgica Booleana (binria), so adequadas para resolverem problemas cujo comportamento pode ser representado por modelos matemticos. Todavia quando se necessita imitar o comportamento humano no que tange ao seu mecanismo de deciso esses paradigmas de programao baseados na lgebra de Boole (0 e 1) se mostram pouco ecientes e at mesmo inadequados [188]. Um simples sim ou um no como resposta a estas questes na maioria das vezes, vago, incompleto. A LF manuseia todos os valores entre 0 e 1 (F - falso e V - verdadeiro ). Entre a certeza de ser e a certeza de no ser (lgica binria), existem innitos graus de incerteza (lgica Fuzzy). Essa imperfeio intrnseca informao pode ser representada usando-se a teoria das Probabilidades ou teoria dos conjuntos Fuzzy. Na lgica Fuzzy, o raciocnio exato verdadeiro e falso (V, F) corresponde a um caso limite do raciocnio aproximado, sendo interpretado como um processo de composio Fuzzy [64, 272, 121]. Assim, a Lgica Fuzzy baseada em palavras, no em nmeros, os valores verdades so expressos linguisticamente: quente, frio, verdade, longe, perto, prximo, rpido, vagaroso, mdio, normal, etc. O uso de variveis lingusticas (conjunto Fuzzy + qualicadores) nos deixa mais perto do pensamento humano, simplica a soluo de problemas e consequentemente, proporciona a construo rpida do prottipo dos sistemas. Possui a possibilidade de se representar vrios modicadores de predicado como: muito, mais ou menos, pouco, mdio, etc., alm de um amplo conjunto de quanticadores, como: vrios, em torno de, usualmente, etc. Faz uso das probabilidades lingusticas, como: provvel, improvvel, que so interpretadas como nmeros Fuzzy e manipuladas pela sua aritmtica [64]. A partir do mtodo de inferncia, ou seja, utilizando-se do conhecimento dos especialistas para desenvolver um raciocnio dedutivo, modelam-se as incertezas dentro de um processo para tomada de deciso, fundamentado na existncia de conexes entre causa e efeito, atravs de regras, naturais ou no, como nos SEs, denominadas regras de inferncia . Para compor esse conjunto de regras, so realizadas diversas entrevistas com os especialistas do setor investigado visando transformar o conhecimento prtico desses prossionais em regras de inferncia. A inferncia Fuzzy o processo pelo qual se obtm as sadas do sistema. Assim um vetor de variveis de entrada, aciona as regras (proposies fuzzy ) e denem a situao (forma ) da varivel de sada correspondente, nessa fase ainda sob a forma fuzzycada. Diversos processos de inferncia Fuzzy podem ser usados para se obter

Descrio do Algoritmo

109

a sada do sistema, sendo o mais comumente usado o mtodo MIN-MAX. A funo MIN usada para operar o interior das regras (conectivo E ) e a funo MAX para efetivamente compor os resultados. Assim, para um dado vetor de entrada que alimenta o sistema feita uma avaliao do grau de compatibilidade de cada componente de entrada com os conjuntos Fuzzy correspondentes ao seu domnio. Nesse caso a funo MIN valendo-se dos antecedentes produz um limite de ativao para o consequente da regra em estudo. Usando-se um processo de truncamento no conjunto Fuzzy presente no consequente so produzidas as ponderaes de cada consequente por seu limite de ativao [272]. Aplicando-se a funo MAX (conectivo OU ) no conjunto dos consequentes, devidamente ponderados e agregados, chega-se ao conjunto Fuzzy resultante. Construdos os conjuntos Fuzzy para todas as variveis de entrada e de sada, com seus respectivos adjetivos e domnios, de acordo com informaes prestadas pelos especialistas da rea, e estabelecendo-se as regras de inferncia que denem o problema, obtm-se ento a resposta para um determinado conjunto de variveis que acionam o sistema. Finalmente, como as variveis de entrada foram fuzzycadas , consequentemente as de sada tambm o sero e, portanto necessrio realizar no nal o processo inverso, isto , a defuzzifycao das variveis de sada. Este processo pode ser feito usando-se o mtodo dos mximos, da mdia dos mximos e o mtodo do centride o mais usado [64].

8.2.2

Denies e Terminologia

Conjunto Fuzzy Conjunto de objetos com caractersticas comuns. Esses objetos possuem mais de uma maneira de se relacionar ao conjunto, alm de pertencer ou no a essa coleo. Um Conjunto Fuzzy caracterizado pela Funo de Pertinncia que mapeia os elementos de um domnio X para o intervalo [0, 1]. Usando-se apenas os valores (0 e 1) para representar o grau de pertinncia da varivel na Lgica de Boole, isto = 0, no pertence ao conjunto e = 1 pertence ao conjunto impossvel representar essa varivel, que apresenta graus de pertinncia diversicados dentro do intervalo 0 e 1. Uma varivel que apresenta essas caractersticas uma varivel Fuzzy e pode apresentar valores , tais como: 0, 2; 0, 5; 0, 8; 0, 9, etc., dependendo de seu grau de pertinncia no conjunto. A lgica que trata essas variveis, dotadas de certo grau de incerteza, denominada de Lgica Fuzzy, Lgica

110

Algoritmos Neuro-Nebulosos

nebulosa ou Lgica Difusa. Na Lgica de Boole, quando um elemento pertence a um conjunto ele dito membro do conjunto, caso contrrio no membro do conjunto [194, 28]. Assim, conforme mostrado na Figura 8.2, apenas para exemplicar que uma mudana abrupta em 100o C de temperatura de no alta para alta no mnimo contra o senso comum do pensamento humano e no deve ser tratada dessa forma.

Figura 8.2: Representao da varivel, usando-se lgebra de Boole. Por outro lado, usando-se a representao atravs da Lgica Fuzzy, Figura 8.3, uma temperatura pode pertencer a um ou mais conjuntos Fuzzy com grau de pertinncia diferente e entre 0 e 1, permitindo a representao completa da varivel (lingustica). As variveis lingusticas representam o conhecimento em inferncia Fuzzy sendo variveis para as quais os valores representam conjuntos Fuzzy, fornecendo a caracterizao aproximada do fenmeno (mal entendido, vago, inexato, incerto, etc...).

Figura 8.3: Representao da varivel, usando-se Conjuntos Fuzzy Os conjuntos Fuzzy possuem caractersticas especcas [115], cujas prin-

Descrio do Algoritmo cipais so: Altura - o maior grau de pertinncia da funo de pertinncia;

111

Normalizao - O conjunto Fuzzy est na Forma Normal Mnima se pelo menos um elemento possui (u) = 1. O conjunto Fuzzy est na Forma Normal Mxima se pelo menos um elemento possui (u) = 1 e um elemento (u) = 0; Domnio - o universo total de valores possveis dos elementos do conjunto. Dependendo do contexto, o domnio pode ser aberto ou fechado e cresce monotonicamente da esquerda para direita; Universo do Discurso - o espao Fuzzy completo de variao de uma varivel do modelo. Assim, um conjunto Fuzzy A em um universo U , equao (8.2.1), ento representado por um conjunto de pares ordenados (A(u), u), no qual A(u) chamada de funo de pertinncia (membership function -MF) e u U . A funo de pertinncia mapeia cada elemento do universo U em um valor entre 0 e 1. U representa o universo de discurso. A = {A (u) /u} = {(A (u)) , u|u E } (8.2.1)

A Figura 8.4 representa um conjunto Fuzzy com universo de discurso U discreto [117]. O Universo U {0, 1, 2, 3, 4, 5} representa, por exemplo, o nmero de lhos que um casal decide ter. Ter trs lhos o nmero de lhos com o maior grau pertinncia do conjunto,

Figura 8.4: Conjunto Fuzzy com Universo Discreto.

112

Algoritmos Neuro-Nebulosos

A=
i=1

i /ui

A = {(0; 0, 2) , (1; 0, 4) , (2; 0, 6) , (3; 1, 0) , (4; 0, 5) , (5; 0, 1)} onde i o grau de pertinncia e ui o elemento do conjunto. A Figura 8.5 representa um conjunto Fuzzy com universo de discurso U , equao (8.2.2), contnuo [274] representado pelos nmeros reais de 0 a 100, que indicam a idade de uma pessoa, de 55 anos com o maior grau de pertinncia no conjunto representa uma pessoa de meia idade.

Figura 8.5: Conjunto Fuzzy com Universo contnuo. A=


U

(u) /u
1 55 4 1+( u 10 )

(u ) = Conjunto Suporte

(8.2.2)

o conjunto de elementos no universo U , que representa a faixa efetiva do conjunto Fuzzy que apresenta valores de (u) > 0. Conjunto Singleton um conjunto Fuzzy, cujo suporte denido como um nico ponto u U com pertinncia (u = a) = 1 e conhecido como Conjunto Unitrio Fuzzy (singleton), mostrado na Figura 8.6, onde o grau de pertinncia 1 denido em um ponto (a) de seu domnio e grau 0 nos demais. O conjunto Singleton simplica os clculos para produzir sadas Fuzzy. Alguns autores, por sua peculiariedade, no o classicam como um conjunto Fuzzy.

Descrio do Algoritmo

113

Figura 8.6: Conjunto Singleton Conjunto -CUT a restrio limite imposta ao domnio, baseada no valor de (u) de cada elemento, contendo todos os elementos do domnio que possuam (u) acima de certo valor de . Funes de Pertinncia A Funo de pertinncia, funo verdade ou membership de um conjunto Fuzzy representa as propriedades semnticas do conceito. As principais funes de pertinncia so: linear; curva Z; sigmide; pi; beta; gaussiana; trapezoidal; triangular. Apenas para exemplicar, na Figura 8.7 apresentada a funo Sino-PI que composta por duas sigmides, uma cescente e uma decrescente, Curva 1 = f (x, a, c) = para x 4 Curva 2 = 1 f (x, a, c) (8.2.4) 1 1 + a(xc) (8.2.3)

para x > 4 Nas Figuras 8.8 e 8.9 so apresentadas, respectivamente, as funes SinoBeta e Trapezoidal f (x, a, b, c) = 1 1+
xc 2b a

114

Algoritmos Neuro-Nebulosos

Figura 8.7: Funo de pertinncia Sino-PI.

Figura 8.8: Funo de pertinncia Sino-Beta.

importante salientar que no existe uma regra fechada para o uso das funes de pertinncia, e a escolha destas est vinculada ao problema que se deseja resolver. Norma - T e Norma S (co-Norma T) Norma T ou Norma Triangular um tipo de operao binria usada em lgica multivalorada, especicamente em lgica Fuzzy. uma operao algbrica sobre o intervalo [0, 1]. Representa uma generalizao para lgica Fuzzy da operao conjuno lgica, que postula a verdade simultnea entre duas proposies. usada para construir a interseo de conjuntos Fuzzy, ou como base de agregao de operadores [208].

0, x a xa b a , a x b 1, b x c f (x, a, b, c, d) = x ,c x d d dc 0, d x

Descrio do Algoritmo

115

Figura 8.9: Funo de pertinncia Trapezoidal. Por outro lado a Norma S Dual (na ordem reversa de operao) da Norma T, isto 1 x para x sobre o intervalo [0, 1]. Logo, S (a, b) = 1 T (1 a, 1 b) e que generaliza a lei de De Morgan. uma generalizao para lgica Fuzzy da operao disjuno lgica, que postula a verdade de uma ou de ambas as proposies. usada para construir a unio de conjuntos Fuzzy Fuzzycao Inicialmente todas as variveis de entrada e sada so adjetivadas transformando-se em variveis lingusticas, representando dessa forma o espao Fuzzy de entrada e sada. Os valores da varivel representam sentenas em linguagem natural escritas usando-se predicados, como qualicadores e modicadores. A varivel lingustica envolve: Nome simblico; Valores Lingusticos; Universo de Discurso; Domnio e Sintaxe e regras semnticas que explicam os valores lingusticos. Em lgica Fuzzy trabalha-se sempre com graus de pertinncia, assim necessrio preparar o dado preciso das entradas, normalmente medidas realizadas no sistema que est sendo investigado, transformado-as da forma determinstica (nmero ) para forma Fuzzy (pertinncia ). Esse processo chama-se de Fuzzycao. Vide Figura 8.3. Raciocnio Fuzzy A metodologia de inferncia utilizada para se chegar as concluses denominada de Raciocnio Fuzzy. Um conjunto de regras, do tipo Se ... Ento ..., condicionais ou no, relacionam os antecedentes com os consequentes e so combinadas por operadores. Atravs do mtodo de implicao a varivel de sada modelada. O raciocnio Fuzzy que imita essa caractersticas do ser humano realizado atravs da inferncia, que permite tirar concluses (deduzir, concluir )

116

Algoritmos Neuro-Nebulosos

partindo de fatos conhecidos, realizado por operaes (Min-Max ). Num sistema Fuzzy o conhecimento representado atravs de regras ou proposies. As regras so declaraes que relacionam as variveis do modelo com os conjuntos Fuzzy. As regras envolvem antecedentes e consequentes, nas quais o antecedente composto por uma ou mais clusulas ligadas pelos operadores AND, OR, NOT e o consequente representa a concluso. Regra Antecedente + Consequente Condio + Ao. Apenas a ttulo de exemplo formulada a seguinte regra: [Se a presso arterial de um indivduo alta e o indivduo velho e o indivduo fumante] ento [o custo do plano de sade muito alto]. Assim as regras relacionam os antecedentes com os consequentes e podem ser condicionais e incondicionais. Um ponto importante est relacionado com a ordem de execuo das regras. Para modelos com somente regras condicionais ou incondicionais, a ordem irrelevante. Se o modelo contm ambos a ordem importante dependendo se a regra incondicional aplicada antes ou depois da condicional. O particionamento do espao de entrada indica a forma como as regras esto relacionadas com este espao. Vamos imaginar a existncia de quatro variveis de entrada com trs adjetivos cada, o que envolve um total de 34 = 81 regras. desejvel que qualquer combinao das variveis de entrada deva ativar pelo menos uma regra; que duas ou mais regras com as mesmas entradas devam ter sadas mutuamente exclusivas, caso contrrio as regras so inconsistentes; e que no devem existir regras vizinhas com sadas cujas funes de pertinncia no apresentem interseo. Inferncia A Inferncia Fuzzy o procedimento de avaliao das regras que relacionam as variveis e que levam concluso nal do sistema Fuzzy. AND - Modelado como interseo atravs de norma-T. OR - Modelado como unio atravs de norma-S. Esse procedimento feito em duas fases: Avaliao da implicao de cada regra e a composio das concluses de todas as regras em um valor consolidado. O mtodo de Inferncia Fuzzy, mais comumente usada o Min-Max no qual para o Min - usa-se a Norma -T e para o Max usa-se a Norma - S. Existem vrios modelos de inferncia Fuzzy, cada um apresentando um conjunto distinto de caractersticas. Na Ref. [115] o leitor interessado encontrar um detalhamento dos mesmos.

Descrio do Algoritmo Defuzzycao

117

Para certo conjunto de entradas, a ligao funcional entre a regio Fuzzy da varivel de sada e o valor esperado denominado de mtodo de defuzzycao. Transforma a varivel da forma Fuzzy (pertinncia) em forma precisa (nmero). Supondo-se um universo de discurso discreto, a sada precisa Z dada pelo centro de rea (centride ) do conjunto de consequente obtido pela composio das regras. Nesse caso m indica o nmero de quantizao da sada, Zi representa o valor da varivel de sada para o intervalo de quantizao i e c (zi ) o grau de pertinncia. Supondo-se um universo de discurso discreto, a sada precisa Z dada pelo centro de gravidade do conjunto de consequente c obtido pela composio das regras. Assim, encontra o ponto de equilbrio da regio Fuzzy calculando a mdia ponderada das regies [117],
m

c (zi ) Zi Z=
i=0 m

(8.2.5) c (zi )

i=0

No caso Takagi-Sugeno, quando apenas Singletons so usados como consequentes das regras, combina-se o consequente das regras com o nvel de disparo de cada uma delas, gerando a sada Z , aplicando-se a equao (8.2.5), na qual n o nmero de regras; Zi valor da singleton i e i o nvel de disparo da regra.
m

i Zi Z=
i=0 m

(8.2.6) i

i=0

O diagrama em blocos da Figura 8.10 sintetiza os passos principais da construo de um sistema Fuzzy. Sistema Neuro-Fuzzy No Captulo 4 foi mostrado que um sistema hbrido usa uma ou mais tcnicas inteligentes para a soluo de um problema. Os sistemas Neuro-Fuzzy (SNF) fazem parte de uma classe de hibridizao forte incorporando dois paradigmas: Rede Neural Articial (ANN) e Lgica Fuzzy (LF) [250]. Quando essas tcnicas so usadas separadamente, no obstante de suas conhecidas vantagens individuais, certas desvantagens so evidentes.

118

Algoritmos Neuro-Nebulosos

Figura 8.10: Diagrama em blocos de um Sistema Fuzzy. No tocante s ANNs a informao armazenada de forma distribuda e, portanto no h como interpretar suas funcionalidades, alm disso, o nmero de camadas e o nmero de neurnios por camada no determinado por uma regra especca, tornando o processo, praticamente emprico. Por outro lado os sistemas Fuzzy respondem rigorosamente apenas ao que consta no banco de regras no sendo capazes de generalizar como as ANNs. So altamente dependentes de um especialista para montar, de forma dedigna, o banco de regras. Escolher as funes de pertinncia mais adequadas e determinar todas as regras que envolvem o problema em anlise tarefa rdua e nem sempre remete diretamente a bons resultados. Assim os SNF [93, 94, 124] procuram usar o mximo das propriedades das ANNs (aprendizado) e da LF (interpretao lingustica), minimizando suas limitaes e decincias. Dentre outras caractersticas de menor monta sustenta a caracterstica de aprendizado por exemplos das ANNs e a interpretao da funcionalidade caracterstica da LF. No Captulo 4 foi tambm apresentada uma relao das principais pesquisas envolvendo SNF, embora o foco desse captulo seja o modelo ANFIS Adaptive Network-based Fuzzy Inference System [116, 117]. A Figura 8.11 apresenta uma rede Neuro-Fuzzy, com duas entradas (x e y ) e uma sada Z , usando o modelo Sugeno de 1a ordem, isto , com z = f (x, y ) representado por polinmio de 1a ordem e com duas regras R1 e R2. A funo de pertinncia A(x) usada o sino-beta, equao 8.2.5, e a sada de cada neurnio i da camada j dado por Outj,i . As regras so: R1 = Se x A1 e y B1 ento f1 = p1 x + q1 y + r1 R2 = Se x A2 e y B2 ento f2 = p2 x + q2 y + r2 Camada 1 - Computa o grau de pertinncia com que as entradas precisas x, e y satisfazem os termos lingusticos Ai e Bi , associados a estes ns. um n adaptativo e a sada obedece a equao 8.2.7.

Descrio do Algoritmo

119

Figura 8.11: Rede Neuro- Fuzzy.

Out1,i = Ai (x) , . . . i = 1, 2 Out1,i = Bi2 (y ) , . . . i = 3, 4

(8.2.7)

Camada 2 - Cada n corresponde a uma regra e computa o nvel ou fora de disparo Wi da regra, indicando o grau de pertinncia com que o consequente da regra ser atendido. Normalmente esse processo pode ser realizado usando-se uma funo AND de acordo com a norma T. um n xo e a sada obedece a equao (8.2.8). Out2,i = Wi = Ai (x) Bi (y ) , . . . i = 1, 2 (8.2.8)

Camada 3 - Realiza a Normalizao usada como pr-processamento para defuzzicao. Calcula a relao entre o i-simo nvel de disparo da regra em relao a soma total dos nveis de disparo. um n xo, a sada denominada de nvel de disparo normalizado e obedece a equao 8.2.9. Out3,i = WiN = Wi / (W1 + W2 ) (8.2.9)

Camada 4 - As sadas so calculadas pelo produto entre os nveis de disparo normalizados WiN denidos na camada 3 e o valor do consequente da regra fi cujos parmetros so pi , qi e ri correspondem ao consequentes Sugeno. um n adaptativo e a sada obedece a equao 8.2.10. Out4,i = WiN fi = WiN (pi x + qi y + ri ) (8.2.10)

Camada 5 - um n xo que computa atravs de um somatrio todos os consequentes das regras, indicando a sada total da rede. Essa camada e conhecida como camada defuzzycadora e a sada representada pelsa equao 8.2.11.

120

Algoritmos Neuro-Nebulosos

Wi fi Out5,i =
i

WiN fi =

Wi
i

(8.2.11)

possvel identicar os parmetros do sistema ANFIS usando-se apenas uma tcnica de otimizao como, por exemplo, o mtodo do gradiente descendente. Com o objetivo de aumentar o desempenho do sistema pode-se usar um aprendizado hbrido, combinando o mtodo dos mnimos quadrados com o mtodo do gradiente descendente. Para tal necessrio realizar duas fases: uma direta e uma reversa [117]. Na fase direta o sinal de entrada vai se propagando camada por camada at atingir a camada 4 onde os parmetros dos consequentes da regra so identicados pelo mtodo dos mnimos quadrados. Na fase reversa o sinal de erro retro propagado e os parmetros dos antecedentes so atualizados pelo mtodo do gradiente descendente. Resumidamente, na fase direta xam-se os antecedentes e identicamse os consequentes pelo mtodo dos mnimos quadrados e na fase reversa xam-se os consequentes atualizando os parmetros dos antecedentes pelo mtodo do gradiente. A Figura 8.12 mostra o diagrama em blocos do algoritmo do SNF.

8.3

Aplicao ao Problema Inverso de Transferncia Radiativa

aqui considerado o problema inverso de transferncia radiativa em um meio homognio unidimensional conforme descrito na Subseo 2.2.1 e no Captulo 3. Como dados experimentais reais no estavam disponveis, foram gerados dados experimentais sintticos conforme descrito na Seo 3.3. Conforme apresentado na Tabela 8.1, no experimento numrico realizado foram simulados dados para 3 casos distintos, isto 0 = 0, 8, 0 = 0, 3 e 0 = 0, 5. O Banco de Dados usado no SNF composto de 40 amostras, cada uma com seis intensidades de radiao que emerge do meio. Os parmetros adotados no ANFIS foram: tolerncia mnima de erro = 103 ; quantidade mxima de pocas = 50; quantidade de Funes de Pertinncia = 3 (sino) e consequentemente para as seis intensidades a quantidade de Regras = 36 = 729. Os resultados indicam erros percentuais muito baixos e esto sintetizados na Tabela 8.1. Outro experimento foi realizado tendo como alvo a determinao do albedo de espalhamento simples [93]. Conforme apresentado na Tabela

Consideraes Finais Caso 1 0, 8000 0, 8000 0, 0000 Caso 2 0, 3000 0, 2998 0, 0568 Caso 3 0, 5000 0, 5005 0, 1000

121

Valor esperado PI - ANFIS Erro %

Tabela 8.1: Resultados do SNF para 0 . 8.2, no experimento numrico realizado foram simulados dados para 3 casos distintos, isto = 0, 5, = 0, 8 e = 0, 3. O BD usado no SNF tambm contou com 40 amostras, cada uma com seis intensidades. A nica diferena ocorreu nos parmetros adotados no ANFIS no qual a quantidade mxima de pocas passou de 50 para 100 pocas. Os resultados indicam erros percentuais muito baixos e esto sintetizados na Tabela 8.2. Valor esperado PI - ANFIS Erro % Caso 1 0, 5000 0, 5001 0, 0131 Caso 2 0, 8000 0, 8001 0, 0111 Caso 3 0, 3000 0, 3003 0, 1000

Tabela 8.2: Resultados do SNF para . Procurando avaliar a capacidade de generalizao do SNF foram inseridos rudos aleatrios nos valores das intensidades radiativas dos dados gerados, com variaes de 3%, 5% e 11% e estes dados foram apresentados ao SNF. Os resultados dos valores do albedo de espalhamento determinados atravs do SNF esto apresentados na Tabela 8.3 como tambm, o erro percentual relativo ao valor esperado. Como pode ser constatado da anlise da referida Tabela os bons resultados se mantiveram, especialmente com rudos menores que 5%.

8.4

Consideraes Finais

Devido ao elevado esforo computacional foi realizada a estimativa do albedo de espalhamento simples separadamente. Para a determinao de mais de uma incgnita pode ser usada a estratgia empregada por Knupp et al. [129] segundo a qual uma incgnita estimada enquanto as outras so mantidas xas, e um procedimento iterativo ento empregado at que todas as incgnitas sejam estimadas atendendo um critrio de parada estabelecido a priori.

122

Algoritmos Neuro-Nebulosos

esperado

Caso 1

0, 5000

Caso 2

0, 8000

Caso 3

0, 3000

3% Erro % 0, 4987 0, 2593 0, 4942 1, 1539 0, 4985 0, 3028 0, 4986 0, 2716 0, 4995 0, 1001 0, 4949 1, 0170 0, 8093 1, 1565 0, 7958 0, 5192 0, 7997 0, 0315 0, 7861 1, 7426 0, 7949 0, 6324 0, 7888 1, 4059 0, 3003 0, 1102 0, 3003 0, 1027 0, 3012 0, 3962 0, 3007 0, 2182 0, 2991 0, 2969 0, 2995 0, 1767

Rudo 5% Erro % 0, 4977 0, 4547 0, 5083 1, 6640 0, 5038 0, 7690 0, 5038 1, 8119 0, 5075 1, 4956 0, 5042 0, 8370 0, 8148 1, 8490 0, 7988 0, 1511 0, 7989 0, 1399 0, 8060 0, 7518 0, 8065 0, 8172 0, 7814 2, 3278 0, 3015 0, 5160 0, 3017 0, 5604 0, 2993 0, 2381 0, 2978 0, 7500 0, 2982 0, 6138 0, 3007 0, 2472

11% Erro % 0, 5033 0, 6564 0, 5049 0, 9728 0, 5000 0, 0000 0, 5103 2, 0699 0, 4994 0, 1158 0, 5059 1, 1839 0, 7955 0, 5569 0, 7981 0, 2399 0, 8149 1, 8568 0, 7541 5, 7329 0, 8275 3, 4361 0, 8040 0, 4995 0, 2962 1, 2692 0, 2952 1, 5916 0, 3004 0, 1316 0, 2932 2, 2665 0, 2963 1, 2382 0, 3025 0, 8355

Tabela 8.3: Resultados do SFN para considerando dados ruidosos.

Consideraes Finais

123

Figura 8.12: Diagrama em blocos do algoritmo de treinamento da Rede NeuroFuzzy.

124

Algoritmos Neuro-Nebulosos

Captulo 9

Otimizao por Colnia de Formigas (Ant Colony Optimization )


Jos Carlos Becceneri Stephan Stephany Haroldo Fraga de Campos Velho Antnio Jos da Silva Neto

9.1

Motivao e Histrico do Mtodo

Muitos aspectos do comportamento de um grupo de insetos so estudados pelas teorias de auto-organizao, que tentam explicar como indivduos de comportamento simples podem construir uma sociedade complexa. Por exemplo, sabe-se que em tais sociedades h grupos de trabalhadores especializados e, aparentemente, no h um gerente operacional. Ento, como explicar a complexidade das tarefas realizadas? Como a cooperao acontece? Como escrito em [39], estruturas complexas resultam da iterao de comportamentos surpreendentemente simples executados por indivduos possuindo apenas informao local. Para entender como o mtodo de Otimizao por Colnia de Formigas (Ant Colony Optimization, ACO) foi criado, necessrio se conhecer um pouco sobre o comportamento das formigas. Cada formiga, quando caminha em busca de alimento, deposita no solo uma substncia qumica chamada 125

126

Otimizao por Colnia de Formigas

de feromnio. Na possibilidade de seguir por vrios caminhos, uma formiga pode, para decidir entre eles, considerar a quantidade de feromnio - depositado anteriormente por outras formigas - em cada um dos caminhos. Um caminho com muito feromnio mais atrativo que outro com menos. Com o decorrer do tempo, essa substncia qumica sofre evaporao. O que se nota na natureza que, aps um determinado tempo, a maioria das formigas decide trilhar um caminho mais curto (possivelmente o mais otimizado) entre o seu ninho e a fonte de alimento (caminho em destaque na Figura 9.1).

Figura 9.1: Representao esquemtica de caminhos trilhados por formigas entre seu ninho e uma fonte de alimento. O algoritmo de otimizao por formigas foi proposto por Marco Dorigo, em 1992, em sua tese de doutorado [73]. A ideia bsica de todo o algoritmo baseado em formigas o uso de um mecanismo conhecido como reforo positivo [74], baseado na analogia com o comportamento de certas espcies de formigas que, como j mencionado, depositam nos caminhos por elas trilhados uma substncia qumica chamada de feromnio, possibilitando o reforo dos caminhos mais trilhados, os quais so, possivelmente, os melhores. Um feromnio virtual utilizado para manter as boas solues na memria do computador. Tambm h o conceito de reforo negativo, implementado atravs da analogia com o processo de evaporao que o feromnio sofre na natureza. A combinao do reforo positivo (depsito de feromnio) com o negativo (evaporao), permite que se evite, na maioria dos casos, uma convergncia prematura do algoritmo para solues, possivelmente no ruins, mas talvez, longe da tima. O comportamento cooperativo outro conceito importante aqui: algoritmos de colnia de formigas fazem uso da explorao simultnea de diferentes solues por meio de diferentes formigas. As melhores formigas inuenciam a explorao das demais, atravs das estratgias empregadas para atualizar o feromnio nos caminhos.

Descrio do Algoritmo

127

9.2

Descrio do Algoritmo

Para permitir uma descrio simples do funcionamento do ACO, considerase sua aplicao ao Problema do Caixeiro Viajante (PCV). Nas Subsees 4.1.1 a 4.1.3 feita uma breve descrio do PCV. Cada formiga pode ser considerada um agente que: ao se mover do n i para o n j , pode depositar feromnio no caminho sendo percorrido, dependendo da estratgia de depsito sendo utilizada. Em geral, h duas possibilidades: ou todas as formigas depositam feromnio nos caminhos por elas percorridos, ou apenas a melhor formiga de cada iterao deposita feromnio no caminho percorrido. Para os resultados descritos neste captulo utilizada a estratgia de depositar feromnio apenas no caminho percorrido pela melhor formiga de cada iterao. possui uma tabela com as cidades que pode visitar. Isso necessrio para evitar que uma formiga v para uma cidade por onde ela j passou; para selecionar um n a ser visitado, usa uma funo de probabilidade. Uma formiga k , estando no n i, calcula sua probabilidade de ir para o n j na iterao t atravs da expresso pk ij (t) = onde: fij (t) a quantidade de feromnio entre os ns i e j no instante t; ij o inverso da distncia entre os ns i e j . Esse parmetro chamado de desejabilidade. No caso do PCV, quanto maior a distncia entre os ns, menor o desejo de ir para esse n; quanto menor essa distncia, maior o desejo. os parmetros e controlam o peso relativo da quantidade (intensidade) do feromnio e da desejabilidade, respectivamente. A cada iterao: o feromnio depositado em cada arco sofre uma evaporao. Seu valor reduzido por uma constante de evaporao fe , com 0 fe < 1. Uma possvel equao que pode ser utilizada para realizar essa atualizao : [fij (t)] [ij ]
lk i

[fil (t)] [il ]

(9.2.1)

128

Otimizao por Colnia de Formigas

fij (t) (1 fe ) fij (t) + fe f0

(9.2.2)

Outras estratgias tanto para realizar o depsito, quanto para realizar a evaporao podem ser denidos. Vide [30] para uma discusso ampla sobre esse assunto. A seguir os passos para a implementao do ACO para um problema de otimizao so apresentados. Passo 1. Inicializao do sistema: 1. Calcular a desejabilidade de cada n; 2. Denir a quantidade de feromnio de cada arco; 3. Distribuir as formigas de modo aleatrio entre os ns. Passo 2. Para cada iterao denida: 1. Cada formiga percorre todos os ns do grafo, calculando, em cada n, sua probabilidade de movimento. Passo 3. Vericar qual formiga obteve a melhor rota. Passo 4. Atualizao do feromnio: 1. Incrementar a quantidade de feromnio na melhor rota; 2. Reduzir a quantidade de feromnio nas demais rotas. Considere o PCV descrito de forma sucinta nas Subsees 4.1.1 a 4.1.3. A seguir, so mostrados como os passos acima podem ser executados. Considere uma soluo gulosa iniciando no n A, dada por ABCDA, cujo custo 13, 291. Denamos as variveis Lnn = 13, 291 e nc = 4 (nmero de cidades). denida a matriz de feromnio de dimenso 44, que ser representada por . Cada elemento dessa matriz inicializado com o valor f0 , obtido, segundo sugesto encontrada em [32] atravs da expresso: f0 = 1, 0/ (nc Lnn) = 1/ (4 13, 2913) = 1/53, 1652 = 0, 019 Ento, a matriz de feromnio, , dada por: 0, 000 0, 019 0, 019 0, 019 0, 019 0, 000 0, 019 0, 019 = 0, 019 0, 019 0, 000 0, 019 0, 019 0, 019 0, 019 0, 000 (9.2.3)

(9.2.4)

Descrio do Algoritmo

129

Os loops no so permitidos, por isso, os elementos da diagonal principal so zerados (a probabilidade de se estar em um n e nele permanecer durante uma iterao zero). Mais uma matriz utilizada, conforme mostrado na Tabela 4.2 (matriz de distncias). Dois vetores devem ser denidos: um para armazenar a melhor rota encontrada na iterao corrente (V C ) e um para armazenar a melhor rota encontrada dentre todas as iteraes realizadas (V T ). Esses vetores sero inicializados com algum valor adequado para representar que eles ainda no foram utilizados. Considere nf o nmero de formigas. Esse valor escolhido heuristicamente. Geralmente, se no h nenhuma indicao contrria, nf = nc . Para simplicar os clculos que sero mostrados, utilizaremos nf = 2 ao invs de nf = nc = 4 no exemplo considerado. Identicaremos essas duas formigas por 0 e 1. Essas nf formigas so espalhadas aleatoriamente pelos ns. Suponhamos que as duas formigas sejam colocas no n A e nenhuma nos demais ns. Como critrio de parada, podemos estabelecer um tempo mximo de processamento ou um nmero xo de iteraes. Neste exemplo, ser realizada 1 iterao completa das duas formigas. A formiga 0, consultando a sua tabela de cidades que ainda no visitou (0 = {B, C, D}), ir calcular as seguintes probabilidades na iterao 0: p0 AB (0) = 0, 48 p0 AC (0) = 0, 34 p0 AD (0) = 0, 18 1. Dadas essas trs probabilidades, a formiga 0 deve decidir para qual cidade ela ir. Para isso, utilizada a seguinte estratgia: sorteia-se um nmero entre 0 e 1. Se este nmero for menor ou igual a 0, 48, a cidade B ser a escolhida; se for maior que 0, 48 e menor ou igual a 0, 82, ser a cidade C ; caso contrrio, com 18% de chances, ir para a cidade D. Supe-se que o nmero sorteado seja 0, 5. Ento, a formiga 0 vai para a cidade C . A tabela de cidades que ainda no foram visitadas atualizada: 0 = {B, D}. Estando na cidade C , ela deve decidir entre ir para B ou D. As seguintes probabilidades so calculadas: p0 CB (0) = 0, 41 p0 CD (0) = 0, 59 (9.2.6) (9.2.5)

Repare que a soma das trs probabilidades na equao (9.2.5) acima

130

Otimizao por Colnia de Formigas

Novamente, atravs de um sorteio, a formiga 0 decidir se ir para B ou D. Suponhamos que a cidade sorteada, com 59% de chances, seja a D. Ento temos a seguinte rota at agora: ACD. A partir desse ponto no precisamos mais calcular probabilidades, pois a nica alternativa possvel escolher a cidade B e, em seguida, retornar cidade A. Ento o percurso completo feito pela formiga 0 : ACDBA, cujo custo : 12, 166. Agora a vez da formiga 1 traar a sua rota. A formiga 1 ir calcular as seguintes probabilidades (sempre vericando a tabela de cidades que ainda no foram visitadas): p1 AB (0) = 0, 48 p1 AC (0) = 0, 34 p1 AD (0) = 0, 18 (9.2.7)

Dadas essas trs probabilidades, a formiga 1 deve decidir para qual cidade ela ir. A estratgia para tal deciso a mesma utilizada pela formiga 0. Supe-se que o nmero sorteado seja 0, 1. A formiga 1 vai para a cidade B , que retirada da lista de cidades que ela pode visitar. Estando na cidade B , ela deve decidir entre ir para C ou D. As seguintes probabilidades so calculadas: p1 BC (0) = 0, 38 p1 BD (0) = 0, 62 (9.2.8)

Novamente, atravs de um sorteio, a formiga 1 decidir entre ir para C ou D. Supe-se que a cidade sorteada, com 38% de chances, seja a C . Ento tem-se a seguinte rota at agora: ABC . A partir desse ponto, no preciso mais calcular probabilidades, pois a nica alternativa possvel escolher a cidade D e, em seguida, retornar cidade A. Ento o percurso completo feito pela formiga 1 dado por ABCDA, cujo custo : 13, 291. A melhor rota obtida foi a percorrida pela formiga 0. Essa rota ser armazenada em uma estrutura de dados que indica a melhor soluo encontrada na iterao corrente. O caminho percorrido pela formiga 0 ser reforado com uma quantidade adicional de feromnio. Tambm importante ressaltar que seguimos a estratgia de fazer o reforo de feromnio apenas no caminho percorrido pela formiga vencedora. Porm, existem outras estratgias, como permitir que todas as formigas depositem uma quantidade de feromnio nas suas rotas. Para um estudo detalhado sobre essas possibilidades, consulte [30]. Neste ponto, dois parmetros devem ser utilizados, para: incrementar o caminho percorrido pela formiga vencedora - por exemplo um aumento de 0, 1 (10%) nesse caminho;

Descrio do Algoritmo

131

decrementar os caminhos no trilhados - por exemplo uma diminuio de 0, 10 (10%) nesses caminhos (poderia ser um valor diferente do denido para o incremento). A quantidade de feromnio a ser depositada ou retirada em cada iterao um dos pontos a serem estudados por quem est implementando o algoritmo. Pode ser uma quantidade xa, como no exemplo acima dado, ou dependente de algum fator, como, por exemplo, a qualidade da soluo. Ento, a matriz de feromnio passa a ser: 0, 0000 0, 0209 0, 0209 0, 0171 0, 0209 0, 0000 0, 0171 0, 0209 = (9.2.9) 0, 0209 0, 0171 0, 0000 0, 0209 0, 0171 0, 0209 0, 0209 0, 0000

Agora deve-se armazenar a melhor soluo encontrada na iterao corrente em V C (vetor que armazena a melhor rota da iterao corrente). Para nalizar o processamento de uma iterao, deve-se comparar as solues armazenadas em V C e V T . V T deve conter, sempre, a rota com o melhor custo. Como estamos nalizando a primeira iterao, fazemos V T = V C. Finalizado este ponto, a prxima iterao deve ser iniciada. Agora as formigas 0 e 1 iro realizar novamente os passos indicados acima, porm com uma matriz de feromnio diferente da situao inicial. Quando todas as iteraes tiverem sido feitas, armazenada em V T a melhor rota encontrada durante o processamento. Existem muitas variantes para esse algoritmo, dentre as quais escolhemos uma para explicar sua funcionalidade bsica. Em [30, 32], podem ser encontradas diversas outras variantes. Para aplicar o ACO no PCV, foi feito: a representao do problema na forma de grafo (ns so cidades e arcos so caminhos); a denio da desejabilidade como o inverso da distncia; uma tabela com as cidades j visitadas; uma regra heurstica de atualizao do feromnio, tanto para a evaporao como para o incremento nos caminhos percorridos; a denio de uma funo de probabilidade. A complexidade do ACO dada por O(tmax n2 nf ), onde:

132 tmax o nmero de iteraes; n o nmero de ns; nf o nmero de formigas.

Otimizao por Colnia de Formigas

Para um estudo sobre como expressar a complexidade de um algoritmo, consulte [247]. Para aplicar adequadamente o ACO a um problema devemos: ter uma representao apropriada do problema na forma de grafo; saber denir a desejabilidade; saber como obedecer s restries do problema; ter uma regra de atualizao do feromnio; denir uma regra de transio probabilstica. Essa metaheurstica tem sido muito empregada atualmente. Suas idias conceituais so simples e os resultados encontrados em muitos problemas prticos so muito bons. Veja, por exemplo, as referncias [21, 19, 20, 44, 242, 243]. Nas referncias [19, 20] apresentada uma contribuio terica, que tem mostrado excelentes resultados quando utilizada: o depsito de feromnio em caminhos adjacentes do melhor caminho trilhado por uma formiga.

9.3
9.3.1

Aplicao ao Problema Inverso de Transferncia Radiativa


Problema inverso adotado como exemplo

Exemplica-se a seguir a aplicao do ACO a um problema inverso de transferncia radiativa, conforme [243], no qual deseja-se estimar um conjunto de T propriedades radiativas do meio, expressos pelo vetor Z = {0 , , 1 , 2 } onde as incgnitas correspondem, respectivamente, espessura tica, ao albedo de espalhamento simples e s reetividades difusas em cada uma das superfcies que delimitam o meio. aqui tratado, portanto, o problema inverso de transferncia radiativa em um meio homogneo unidimensional conforme descrito na Subseo 2.2.1 e no Captulo 3. Adotando-se uma metodologia implcita na resoluo deste problema inverso, formula-se o mesmo como um problema de otimizao, no qual a funo objetivo dada segundo

Aplicao ao Problema Inverso de Transferncia Radiativa

133

a equao (9.3.10), sendo calculada a partir da diferena quadrtica entre as intensidades de radiao geradas para a soluo candidata (I mod ) e as intensidades experimentais Y (ambas expressas por vetores de dimenso Nd , onde Nd representa o nmero total de dados experimentais). Assim, para uma dada iterao t, tem-se:
Nd

Q Z (t) =
i=1

Iimod (0 , , 1 , 2 ) Yi

(9.3.10)

A equao (9.3.10) equivalente equao (3.2.4). Como dados experimentais reais no estavam disponveis, foram gerados dados experimentais sintticos com a equao (3.3.6).

9.3.2

Aplicao do ACO ao problema inverso escolhido

O ACO foi concebido para problemas similares ao PCV, que diferem de problemas inversos como o acima exposto. Uma primeira diculdade que no se pode fazer encontrar nestes problemas inversos algo anlogo ao caminho da formiga (correspondente a uma rota possvel do PCV). Assim, na abordagem proposta por Becceneri e Zinober [21], associa-se cada formiga a uma possvel soluo candidata e, da mesma forma que no ACO original, a cada iterao gerada uma nova populao de formigas aleatoriamente e sob inuncia da matriz de feromnio. O ACO pressupe que cada caminho possvel tem uma quantidade de feromnio, que pode variar com o tempo, sendo estes caminhos correspondentes a rotas possveis do PCV. No caso destes problemas inversos, atribui-se o feromnio como uma propriedade no do caminho das formigas, mas como uma propriedade dos valores possveis de cada uma das variveis que compem as solues candidatas. Assim, numa nova iterao/populao, cada formiga gerada aleatoriamente e sob inuncia de uma matriz de feromnio assim denida. Entretanto, nos problemas inversos como o exposto, tenta-se estimar um conjunto de variveis contnuas, enquanto que no PCV as combinaes de arcos entre cidades a serem visitadas formam um conjunto discreto de caminhos possveis, embora seu nmero possa explodir combinatoriamente. Na abordagem proposta, o domnio contnuo de cada varivel a ser estimada ento discretizado em n valores possveis. Por exemplo, no problema em questo, o albedo de espalhamento e as reetividades difusas 1 e 2 variam no intervalo entre 0 e 1, e estas so discretizadas em 127 intervalos correspondentes a 128 valores possveis, isto n = 128, cuja resoluo (diferena entre dois valores) de 0, 007874 ou 1/127. A espessura tica no possui um limite superior, mas para a formulao e soluo do problema inverso considerado um valor limite 0 conforme representado na Figura 9.2.

134

Otimizao por Colnia de Formigas

Ao se gerar uma nova populao de nf formigas, preciso ento escolher 4 valores discretizados para essas propriedades para cada formiga. O espao possvel de solues discretizadas ento n4 = 1284 , ou seja, da ordem de centenas de milhes.

Figura 9.2: Representao esquemtica de trs formigas no problema inverso de


transferncia radiativa.

Pode-se ento denir a matriz de feromnio como tendo quatro linhas, cada uma correspondente a uma varivel e 128 colunas, estas correspondentes aos valores discretizados. Similarmente, adota-se uma estratgia de atualizao do feromnio e, na iterao inicial, atribui-se um valor f0 a todos os 512 elementos desta matriz. Estes elementos sofrem um decrscimo a cada iterao devido evaporao, segundo uma taxa de decaimento fe , expressa pela equao (9.2.2). A cada iterao os quatro elementos da matriz correspondentes soluo candidata melhor avaliada so incrementados de f0 . Ento, a equao (9.3.11), expressa a quantidade de feromnio correspondente varivel i, ao valor discretizado j e iterao t, na qual o termo t1 ij,best o delta de Krnecker associado, que nulo exceto para os valores discretizados escolhidos pela melhor formiga na iterao anterior (t 1),
t1 t1 t fij = (1 fe ) fij + ij,best f0

(9.3.11)

No ACO aplicado ao PCV, os ndices i e j denotavam ns do grafo, isto , cidades a serem visitadas. Na presente abordagem, associa-se i varivel a ser estimada (assumindo valores inteiros no intervalo 1 a 4) e j ao valor discreto de cada varivel (assumindo valores inteiros no intervalo 1 a 128). Neste caso, tmax o nmero total de iteraes, nf o nmero de formigas, n a discretizao adotada e considerando-se 4 variveis discretizadas, a complexidade do ACO adaptada para esse problema inverso dada por O (tmax n nf ).

Aplicao ao Problema Inverso de Transferncia Radiativa

135

A gerao de cada formiga de uma nova populao/iterao feita aleatoriamente, mas inuenciada pela matriz de feromnio, conforme as probabilidades denidas pela equao (9.2.1) na qual os coecientes e ponderavam, respectivamente, a inuncia da quantidade de feromnio fij e da desejabilidade ij . Entretanto, para o problema inverso em questo, fij representa a quantidade de feromnio associada ao valor discreto j da varivel i. Alm disso, no possvel denir-se uma desejabilidade ij , uma vez que, para cada varivel a ser estimada, todos os n valores discretos so equivalentes, ou seja, ij = 1. Assume-se ento = 1 e = 0, ou seja, exclui-se a desejabilidade da equao. A nova equao (9.3.12) assim reescrita permite expressar para cada varivel i, a probabilidade cumulativa (pcij ) de se escolher o elemento j , calculada com base na quantidade de feromnio de cada elemento 1 a j . Note-se que aqui, optou-se por probabilidades cumulativas e no a probabilidade anteriormente denida (equao 9.2.1),
j

fil (t) pcij (t) =


l=1 n

(9.3.12) fil (t)

l=1

Assim como a matriz de feromnio de dimenso 4 128 (o elemento i da linha j expressa a quantidade de feromnio do valor discreto j da varivel i) conveniente denir aqui a matriz de probabilidades cumulativas P C de dimenso 4 128 (o elemento i da linha j expressa a probabilidade cumulativa do valor discreto j da varivel i). Naturalmente, os elementos da ltima coluna da matriz so unitrios, uma vez que a probabilidade cumulativa de cada varivel para j = 128 igual a 1. Nesta abordagem de problema inverso, ambas as matrizes, e P C , so usadas na gerao das formigas (na verdade a usada para calcular a P C ) numa dada iterao/gerao e so atualizadas a cada iterao/gerao com base na melhor soluo candidata obtida, ou seja, na melhor formiga. Entretanto, foi introduzido um esquema adicional na gerao de uma nova formiga, uma nova soluo candidata: para escolha dos quatro valores discretos que a compem, usa-se um esquema de roleta. Dene-se um parmetro q0 com valor real entre 0 e 1. Para cada varivel gera-se um nmero aleatrio e compara-se com esse parmetro com q0 . Caso este nmero seja maior, escolhe-se o valor discreto segundo a matriz P Cij : escolhe-se um j tal que P Cij seja o menor valor maior que o nmero aleatrio gerado. Caso seja menor, toma-se o valor discreto correspondente ao elemento com maior quantidade de feromnio daquela linha da matriz. Consequentemente, o parmetro q0 serve para balancear o nvel de aleatoriedade na escolha do

136

Otimizao por Colnia de Formigas

valor discreto da varivel. Se q0 = 0 segue-se sempre a equao, enquanto que se q0 = 1, escolhe-se sempre o elemento com mais feromnio. O valor de q0 escolhido empiricamente para o problema inverso. Vale lembrar que a matriz de feromnio atualizada a cada iterao/gerao, bem como a matriz de probabilidades cumulativas P Cij . Exemplicando, vamos considerar o albedo de espalhamento simples . Para simplicar, suponhamos que seu domnio, que entre 0 e 1, seja discretizado no em 128 valores, mas em 5 valores (0, 0; 0, 25; 0, 50; 0, 75; 1, 00). Ao cabo de uma iterao genrica, vamos assumir que as quantidades de feromnio sejam (no caso correspondente segunda linha da matriz de feromnio): {0, 05; 0, 10; 0, 20; 0, 05} A somatria das quantidades dessa linha 0, 40 e a linha correspondente na matriz de probabilidades associada seria: {0, 05/0, 40; 0, 10/0, 40; 0, 20/0, 40; 0, 05/0, 40} = {0, 125; 0, 250; 0, 500; 0, 125} e, nalmente, a linha correspondente na matriz de probabilidades cumulativas caria: {0, 125; 0, 375; 0, 875; 1, 000} Se, por exemplo, q0 for 0, 300 e, na gerao do valor discreto do albedo de uma nova soluo candidata (formiga), sorteia-se o nmero aleatrio 0, 753, sendo este ento maior que q0 , tomar-se-ia simplesmente o penltimo valor discreto (0, 75), pois o que tem maior quantidade de feromnio associado. Ao contrrio, caso o nmero sorteado seja, por exemplo, 0, 266, o qual menor que q0 , seleciona-se o valor conforme a equao (9.3.12). Percorrendose ento a segunda linha da matriz de probabilidade cumulativa, tem-se que o menor valor que maior que 0, 266 o segundo (0, 375). Tomar-se-ia ento o segundo valor discreto do albedo de espalhamento simples (0, 25). Como nestes problemas inversos no possvel estabelecer uma estimativa inicial segundo uma heurstica gulosa [32, 44], adota-se assim um valor qualquer, por exemplo,
0 0 Z 0 = 0 , 0 , 0 1 , 2 = {1, 1, 1, 1} T

(9.3.13)

A abordagem acima exposta para aplicao do ACO a problemas inversos de estimao de parmetros contnuos deu bons resultados, no s nas Refs [21, 243] que serviram para exemplic-la, mostrando sua competitividade em relao a outros algoritmos de otimizao. Em relao ao ACO, essa abordagem indita, pois estende sua aplicao ao domnio da otimizao contnua. Como em muitos problemas de otimizao estocstica, e mesmo de otimizao determinstica, a qualidade da soluo depende da escolha conveniente de parmetros de controle do ACO, sendo estes muitas vezes determi-

Aplicao ao Problema Inverso de Transferncia Radiativa

137

nados na base da tentativa-e-erro. Estes parmetros incluem, por exemplo, o nmero de formigas, as constantes relativas estratgia de atualizao de feromnio, o valor de q0 usado no esquema de roleta, a discretizao adotada para as variveis contnuas a serem estimadas, etc. importante ressaltar que o enfoque exposto para uso do ACO em problemas inversos de estimao de variveis contnuas pode incluir variaes relativas gerao de nmeros aleatrios, estratgia de atualizao de feromnio, ao uso da matriz de probabilidades (P ou P C ) e esquema de roleta, entre outras.

9.3.3

Resultados numricos da aplicao do ACO ao exemplo de problema inverso

As Subsees anteriores, 9.2.1 a 9.2.3 mostraram como o ACO foi adaptado para resoluo do problema inverso de interesse [243]. Resta agora descrever os resultados numricos obtidos. Para estimar as quatro propriedades radiativas, todas discretizadas em 128 valores, adotou-se um nmero limite de 200 iteraes, 128 formigas por gerao/iterao e parmetro q0 = 0, 0, ou seja, seleciona-se sempre o valor discretizado de cada varivel segundo a probabilidade cumulativa P C dada pela equao (9.3.12). A taxa de decaimento de feromnio dada por fe = 0, 03 e o incremento da melhor soluo igual f0 = 0, 10. Cada estimao/reconstruo foi repetida 10 vezes, variando-se apenas a semente usada na gerao de nmeros aleatrios para criar novas formigas a cada iterao. Assim, importante considerar o resultado mdio destas repeties, uma vez que h sementes mais ou menos favorveis, mas no h como determin-las a priori. Foi escolhido um caso considerado difcil, no qual os valores das propriedades radiativas a serem estimadas so:
Z = {0 , , 1 , 2 } = {1, 00; 0, 50; 0, 10; 0, 95} T

(9.3.14)

Considerando-se o problema descrito na Subseo 2.2.1 e no Captulo 3, tem-se um meio semi-transparente delimitado por duas superfcies innitas e paralelas. Cada vez que a radiao incide numa dessas superfcies, vinda de fora, ela entra no meio e passa a sofrer interaes de absoro e espalhamento. Analogamente a radiao vinda de dentro do meio e que incide nas superfcies do meio parcialmente reetida para dentro, sendo a parcela no reetida transmitida para fora. Optou-se tambm por ter radiao incidente somente do lado esquerdo (A1 = 1), sendo, portanto, a radiao incidente no lado direito nula (A2 = 0). Em termos do problema inverso de transferncia radiativa, isso diculta a estimao do parmetro 1 , pois a radiao incide na superfcie da

138

Otimizao por Colnia de Formigas

esquerda entra, e interage com o meio. Esta por sua vez reetida parcialmente de volta na superfcie direita segundo o valor de 2 (o restante transmitido para fora do meio), atravessando novamente o meio e sendo reetida mais uma vez pela superfcie da esquerda segundo 1 , sendo que a parcela no reetida transmitida para fora. Outro aspecto importante que, no lugar dos dados experimentais, usaram-se dados sintticos, ou seja, simulados, expressos pelas radincias/ intensidades Y e, para se tentar reproduzir a situao experimental, estes dados foram corrompidos com rudo gaussiano de 2% e 5%. Adotando-se o enfoque descrito anteriormente, a cada iterao criada uma nova gerao de 128 formigas, sendo cada uma delas associada a um conjunto de quatro valores discretos para as propriedades radiativas sendo estimadas, como exemplicado na Figura 9.2. O processamento requerido relativamente alto, pois para cada uma das 200 iteraes/geraes 128 formigas so geradas e cada uma delas avaliada pela funo objetivo, o que requer a resoluo do modelo direto dado pelas equaes (2.2.6). Assim, necessita-se executar o modelo direto 128 200 = 25600 vezes, resultando em alguns minutos de tempo de processamento num microcomputador corrente. preciso ressaltar que se usou uma malha no muito renada para o modelo direto. Caso se tivesse optado por uma malha mais na, i.e., com maior nmero de pontos, o tempo de processamento chegaria a algumas horas. Ento, dependendo do problema, pode ser desejvel a paralelizao do modelo direto, ou do prprio ACO: cada processador avaliaria uma soluo/formiga, executando o correspondente modelo direto. A Tabela 9.1 ilustra os resultados obtidos para os dados de intensidades/radincias Y sem rudo, e tambm com 2% e 5% de rudo gaussiano. Para cada caso, so mostrados os resultados para a mdia das 10 sementes usadas na gerao de nmeros aleatrios, bem como o melhor/pior resultado obtido dentre as 10 sementes. Estas sementes foram tambm geradas aleatoriamente no intervalo [0, 1], multiplicadas por um fator de 100 e arredondadas para o inteiro mais prximo. Nesta tabela, para cada caso, aparecem os valores estimados de cada propriedade bem como a iterao na qual se obteve o melhor resultado, pois no necessariamente acha-se a melhor formiga/soluo na ltima iterao. Alm disso, aparecem tambm, para cada caso, o valor da funo objetivo, correspondente diferena quadrtica entre a radiao medida experimentalmente (real) e a radiao calculada para a soluo encontrada (modelo). Aparece tambm a soma das diferenas quadrticas entre o valor estimado e o valor exato dessas propriedades, dada por:

Aplicao ao Problema Inverso de Transferncia Radiativa

139

d2 =
i=1 0 Dados sem rudo Melhor semente Pior semente Mdia Exato 2% de rudo Melhor semente Pior semente Mdia Exato 5% de rudo Melhor semente Pior semente Mdia Exato

exato estimado Zi Zi

(9.3.15)

Q(Z ) d2 eq. (9.3.10) eq. (9.3.15)

Iter

1, 0000 0, 5000 0, 1016 0, 9531 1, 30E 05 1, 22E 05 98 0, 9531 0, 5547 0, 2891 0, 9609 6, 06E 05 4, 11E 02 122 0, 9813 0, 5273 0, 1922 0, 9547 1, 03E 05 9, 62E 03 127, 3 1, 00 0, 50 0, 10 0, 95 0, 00 1, 0000 0, 5000 0, 1016 0, 9531 1, 49E 05 1, 22E 05 155 0, 9531 0, 5547 0, 2891 0, 9609 6, 16E 05 4, 11E 02 122 0, 9781 0, 5289 0, 1992 0, 9547 1, 19E 05 1, 12E 02 132, 4 1, 00 0, 50 0, 10 0, 95 0, 00 1, 0000 0, 4922 0, 0781 0, 9453 2, 34E 05 5, 62E 04 149 0, 9531 0, 5547 0, 2891 0, 9609 6, 69E 05 4, 11E 02 122 0, 9813 0, 5258 0, 1867 0, 9531 1, 10E 05 8, 55E 03 134, 6 1, 00 0, 50 0, 10 0, 95 0, 00

Tabela 9.1: Resultados obtidos com o mtodo de Otimizao por Colnia de Formigas (ACO) para diferentes sementes de gerao de nmeros aleatrios e usando dados sem rudo, com rudo de 2% e 5% Nota-se que, conforme esperado, o valor mais difcil de estimar o de 1 , pois o valor mdio da estimativa das 10 sementes no est prximo do valor exato, ao contrrio do que ocorre com as outras trs propriedades radiativas. Finalmente, a Figura 9.3 mostra a evoluo da funo objetivo e da soma das diferenas quadrticas, funo objetivo, para um dos casos ilustrados na Tabela 9.1. Pode-se ver que ambos sofrem oscilaes mas diminuem gradativamente at atingir a melhor soluo e depois cam estagnados at o nmero mximo de iteraes denido a priori. Assim, conclui-se que o ACO pode ser aplicado com sucesso a problemas inversos de estimao de parmetros contnuos como demonstrado nesse exemplo e como pode ser encontrado em outras referencias dos autores. possvel tambm melhorar o desempenho do ACO por meio da hibridizao, na qual o ACO (ou outro otimizador estocstico) combinado com outro otimizador que faz uma busca local. Isso ser ilustrado na seo seguinte.

9.3.4

Resultados numricos da aplicao da hibridizao do ACO com o mtodo Levenberg-Marquard ao exemplo de problema inverso

De maneira geral, otimizadores estocsticos como o ACO so ecientes para efetuar uma busca global no espao das solues possveis. O espao de

140

Otimizao por Colnia de Formigas

Figura 9.3: Evoluo do valor da funo objetivo Q(Z (t)) e das somas das diferenas quadrticas entre os valores estimados e os exatos das propriedades radiativas (d2 ) com o nmero de iteraes

solues multidimensional, em funo do nmero de variveis a serem estimadas. Devido a essa complexidade, a busca pode ser difcil, demandando muitas iteraes e um nmero de formigas no to pequeno. Isso implica na necessidade de se fazer muitas avaliaes da funo objetivo. No exemplo do problema inverso da seo anterior, conforme foi citado, foram usadas 200 iteraes/geraes com 128 formigas, ou 25.600 avaliaes. O custo computacional poderia ser alto, dependendo da funo objetivo adotada. Por outro lado, tipicamente, otimizadores determinsticos so muito ecientes para efetuar uma busca local, mas no para a busca global, pois podem encontrar mnimos locais, ou seja, solues sub-timas as quais no conseguem ser melhoradas devido topologia do espao de busca, uma vez que otimizadores determinsticos em geral so guiados pela informao do gradiente da funo objetivo. H tambm algoritmos de busca local baseados em heursticas. Assim, o acoplamento de um otimizador estocstico, como o ACO, com outro otimizador para busca local pode ser conveniente. Denomina-se esta abordagem de hibridizao. Para o problema inverso aqui abordado, na prpria referncia [243] aparecem resultados relativos hibridizao do ACO com o mtodo determinstico Levenberg-Marquardt (LM) [163] e os resultados foram muito bons, seja em termos da qualidade da soluo ou do tempo de processamento. Estes resultados sero apresentados a seguir. Na hibridizao adotada, o ACO empregado por um nmero mais limitado de iteraes, apenas 25, ao invez de 200 iteraes, e com uma populao

Consideraes Finais

141

de formigas menor, de somente 16, em vez de 128 formigas. Adotou-se um valor maior para a taxa de decaimento de feromnio (f e = 0, 30), com base em testes efetuados. Assim, o ACO obtm uma soluo aproximada com apenas 400 avaliaes da funo objetivo. Esta soluo, ilustrada na Tabela 9.2, a qual segue a mesma disposio de colunas da Tabela 9.1. Pode-se observar que praticamente no houve variao dos resultados com o nvel de rudo.
0 dados sem rudo Melhor semente (01) Pior semente (97) Mdia de 10 sementes Resultado exato 2% de rudo Melhor semente (01) Pior semente (97) Mdia de 10 sementes Resultado exato 5% de rudo Melhor semente (01) Pior semente (97) Mdia de 10 sementes Resultado exato 0, 93 0, 70 0, 83 1, 00 0, 93 0, 70 0, 83 1, 00 0, 93 0, 70 0, 83 1, 00 0, 44 0, 68 0, 52 0, 50 0, 44 0, 68 0, 52 0, 50 0, 44 0, 68 0, 52 0, 50 1 0, 02 0, 67 0, 29 0, 10 0, 02 0, 67 0, 29 0, 10 0, 02 0, 67 0, 29 0, 10 2 0, 96 0, 97 0, 96 0, 95 0, 96 0, 97 0, 96 0, 95 0, 96 0, 97 0, 96 0, 95 Q(Z ) d2 Iter. t eq. (9.3.10) eq. (9.3.15) 1, 16E02 1, 92E02 1, 34E02 0,00 1, 16E02 1, 94E02 1, 35E02 4, 55E07 1, 18E02 1, 92E02 1, 36E02 1, 74E06 1, 50E02 4, 48E01 6, 63E02 1, 50E02 4, 48E01 6, 63E02 1, 50E02 4, 48E01 6, 63E02 20 17 19 20 17 19 20 17 19

Tabela 9.2: Resultados obtidos com ACO, com 25 iteraes e 16 formigas, para
diferentes sementes de gerao de nmeros aleatrios e usando dados sem rudo, com rudo de 2% e 5%.

A soluo obtida pelo ACO (Tabela 9.2) ento empregada como chute inicial para o LM e o resultado nal obtido mostrado na Tabela 9.3. Esta ltima tabela mostra, nas duas ltimas colunas, o nmero de iteraes requerido pelo mtodo LM (LM iter.) e o nmero de avaliaes da funo objetivo exigido pelo LM (t-LM). As sementes referem-se quelas usadas no ACO. Observa-se a qualidade signicativamente melhor das solues obtidas em relao ao ACO sem hibridizao, considerando-se as vrias sementes e dados sem rudo e com 2% e 5% de rudo. Os resultados mostrados nas Tabelas 9.1 e 9.3 mostram que ambos esquemas, o ACO usado isoladamente e a hibridizao ACO-LM, mostraram-se robustos, fornecendo boas solues para o problema inverso em questo, mesmo no caso de dados ruidosos. Como esperado, o pior resultado foi observado na estimao de 1 devido aos dados experimentais apresentarem a mais baixa sensibilidade em relao a esta propriedade. A hibridizao ACO-LM forneceu resultados melhores a um custo computacional mais baixo.

142
0 dados sem rudo Melhor semente (01) Pior semente (97) Mdia de 10 sementes Resultado exato 2% de rudo Melhor semente (01) Pior semente (97) Mdia de 10 sementes Resultado exato 5% de rudo Melhor semente (01) Pior semente (97) Mdia de 10 sementes Resultado exato 0,99977 0,99968 0,99972 1,00000 0,99929 0,99941 0,99935 1,00000 0,99944 0,99641 0,99793 1,00000 0,50036 0,50053 0,50045 0,50000 0,50100 0,50082 0,50091 0,50000 0,50239 0,50810 0,50525 0,50000

Otimizao por Colnia de Formigas


1 0,10131 0,10189 0,10160 0,10000 0,10405 0,10341 0,10373 0,10000 0,10776 0,12723 0,11749 0,10000 2 0,95005 0,95007 0,95006 0,95000 0,94998 0,94995 0,94996 0,95000 0,94990 0,95064 0,95027 0,95000 Q(Z ) LM iter t-LM eq. (9.3.10) 9,88E-10 2,47E-09 4,23E-10 0 3,14E-07 3,11E-07 3,12E-07 4,55E-07 1,43E-06 1,81E-06 1,43E-06 1,74E-06 28 35 19 25 29 18 21 34 15 33 44 24 30 46 25 30 50 23

Tabela 9.3: Resultados obtidos pelo mtodo LM a partir dos chutes iniciais gerados pelo ACO (Tabela 9.2), os quais constituem o resultado nal da hibridizao ACO-LM

9.4

Consideraes Finais

O ACO demonstrou ser um otimizador robusto para soluo de problemas inversos de estimao de parmetros contnuos, como exemplicado nas sees anteriores e em outros trabalhos, encontrados na literatura. Uma vez que o ACO um otimizador estocstico, adequado para uma busca global no espao de solues, embora s custas de um nmero grande de iteraes e, consequentemente, de avaliaes da funo objetivo, que requerem a execuo do modelo direto. Entretanto esse inconveniente comum a outros otimizadores estocsticos. De maneira geral, a hibridizao pode ser aplicada com sucesso, combinando-se o ACO com um algoritmo conveniente de busca local, o qual comumente implementa um mtodo determinstico. Assim, possvel efetuar uma busca global mais rpida (e portanto mais aproximada) usando o ACO e empregar a soluo obtida como ponto de partida para o mtodo de busca local, que ir ento renar essa soluo. Obtm-se, conforme demonstrado na seo anterior uma soluo sensivelmente melhor a um custo computacional signicativamente menor. Naturalmente, essa economia de processamento aumenta com o custo computacional do modelo direto.

Captulo 10

Otimizao por Enxame de Partculas (Particle Swarm Optimization )


Eduardo Fvero Pacheco da Luz Jos Carlos Becceneri Stephan Stephany Haroldo Fraga de Campos Velho Antnio Jos da Silva Neto

10.1

Motivao e Histrico do Mtodo

A otimizao por enxame de partculas, ou do original Particle Swarm Optimization (PSO), um mtodo de busca heurstica relativamente recente que inspirado no comportamento colaborativo e de grupo de populaes biolgicas [16]. Este um mtodo adequado para otimizao de funes no-lineares contnuas. A teoria de enxames (swarming theory ), proposta por Kennedy e Eberhart [123] tem inspirao no comportamento de voo de bandos de pssaros e nado de cardumes de peixes. Computacionalmente, tcnicas de vida articial (recentemente denidas como Computao Evolutiva, CE) so usadas para auxiliar a construo desta nova teoria no ambiente virtual [16]. Vrios cientistas, incluindo zologos, se interessaram pelas regras que gerenciam a sincronia de um grande nmero de pssaros em voo, levando 143

144

Otimizao por Enxame de Partculas

em considerao as bruscas mudanas de direo, e caractersticas como disperso e reagrupamento. Deste interesse, modelos foram gerados para uma melhor compreenso do fenmeno. Os modelos gerados se baseiam fortemente na manipulao das distncias inter-individuais, ou seja, a grosso modo, a sincronia do comportamento de bando pode ser caracterizado por uma funo que gerencia o esforo do pssaro em manter uma distncia tima entre seus colegas de bando [122, 123]. A funo bsica desta tcnica promover uma troca de informaes entre os elementos do grupo simulado (as denominadas partculas), levando ao desenvolvimento de um algoritmo de otimizao estocstica eciente, robusto e de simples implementao computacional.

10.1.1

Bases scio-cognitivas

A teoria scio-cognitiva que d o suporte ao modelo de enxame de partculas relativamente simples. O processo de adaptao cultural compreende, teoricamente, um componente de alto-nvel, visto na formao de padres atravs dos indivduos e na habilidade de resolver problemas, e um componente de baixo-nvel, o comportamento dos indivduos, que pode ser resumido em termos de trs princpios, de acordo com [122]: 1. Avaliar; 2. Comparar; 3. Imitar. A tendncia de avaliar estmulos, para classic-los como positivos ou negativos, atrativos ou repulsivos, , talvez, a caracterstica comportamental mais recorrente em diversos organismos vivos. Mesmo bactrias se tornam agitadas quando o ambiente nocivo. O aprendizado no pode ocorrer a menos que o organismo possa avaliar, ou distinguir, caractersticas do ambiente que possam ser atrativas ou repulsivas, ou seja, possam diferenciar o bom do ruim. Deste ponto de vista, o aprendizado pode at mesmo ser denido como mudanas que possibilitem o organismo melhorar a avaliao mdia de seu ambiente e a partir da poder se posicionar e atuar de forma mais adequada. Segundo Kennedy e Eberhart [122], a teoria de comparao social de Festinger, apresentada em 1954, descreve algumas das maneiras com que seres humanos usam outros indivduos como um padro para avaliarem a si mesmos, e como a comparao com outros pode servir como um tipo de motivao a aprender e mudar. A teoria de Festinger na sua forma

Descrio do Algoritmo

145

original no foi determinada de uma maneira que seja facilmente testada ou contestada, e poucas das predies geradas pela teoria foram conrmadas, mas em geral ela serviu como espinha dorsal para teorias scio-psicolgicas subsequentes. Em quase tudo que o ser humano pensa e faz, ele se julga atravs de comparao com outros: a aparncia, a riqueza, o humor, a inteligncia, dentre outros. As escalas de QI (Quociente de Inteligncia) so normalizadas para uma mdia da populao. Em outras palavras, a pontuao de um indivduo diz onde ele est quando comparado a outros pontos (indivduos). Indivduos em enxames de partculas comparam a si mesmos com seus vizinhos (indivduos mais prximos de sua posio, i.e, dentro de um determinado raio) e imitam somente aqueles vizinhos que so superiores. Neste caso, o padro para o comportamento social denido pela comparao com outros. A imitao de fato uma maneira muito efetiva de se aprender a fazer coisas. Apesar disso, conforme demonstrao por diversos experimentos, poucos animais so capazes de imitao real. De fato, alguns especialistas armam que somente humanos e certos pssaros so capazes de imitar. Algumas variaes leves do aprendizado social so encontradas entre outras espcies, mas nenhuma comparada com nossa habilidade de imitar um ao outro. Enquanto macaco v, macaco faz, descreve bem o comportamento imitativo de nossos primos, a imitao humana inclui pegar a perspectiva de outra pessoa, no somente imitar um comportamento, mas entender o seu propsito, executando novamente este comportamento quando necessrio. Como exemplo, o uso individual de um objeto como ferramenta pode chamar a ateno de outro indivduo para o objeto. Este segundo indivduo pode usar o mesmo objeto, mas de uma maneira diferente. A imitao central sociedade humana, e central aquisio e manuteno de certas habilidades mentais. Os trs princpios de avaliao, comparao e imitao podem ser combinados, mesmo em entidades sociais virtuais simplicadas, existentes e criadas para programas de computador, possibilitando aos indivduos se adaptarem a ambientes complexos e desaadores, resolvendo problemas extremamente difceis.

10.2

Descrio do Algoritmo

O algoritmo do PSO (Figura 10.1) busca pelo timo, em geral, no espao de busca n , o espao n -dimensional de nmeros reais. Efetivamente a busca ocorre no espao computvel, e como sero usados computadores com aritmtica nita, portanto, a preocupao relacionada a erros de arredondamento, dentre outras, relevante [122].

146

Otimizao por Enxame de Partculas

Figura 10.1: Fluxograma do mtodo de Otimizao por Enxame de Partculas


(PSO).

O espao de busca multidimensional referido por vrios nomes, dependendo da situao. Suas outras denominaes incluem: espao de estados, espao de fase e hiperespao [122]. Tentativas de usar o PSO para resolver problemas num espao de busca discreto foram feitas [58], porm, os resultados obtidos no satiszeram alguns testes simples, sendo que um estudo mais minucioso para a denio de parmetros, ou ajuste de funes de velocidade e posicionamento, se torna necessrio. Na tcnica original proposta por Kennedy e Eberhart [123], o bando de pssaros representado perante um ambiente bi-dimensional. As posies de cada pssaro (partcula) neste espao so representadas por sua equivalente cartesiana (x, y ), sendo ainda expressa a sua velocidade de deslocamento em cada eixo especco do plano (vx , vy ). No controle da iterao, cada partcula, a menor parte do bando a ser simulado, possui um movimento prprio que corresponde soma de trs termos distintos. O primeiro termo corresponde inrcia da partcula, que simboliza a maneira com que a partcula se move. O segundo termo se relaciona atrao da partcula com relao ao melhor ponto em que j se

Descrio do Algoritmo

147

posicionou. O terceiro termo tambm se relaciona com a atrao ao posicionamento da partcula, porm, agora ligada ao melhor ponto da soluo que todo o grupo j encontrou. Cada um destes termos ser melhor detalhado no decorrer desta seo. A posio de uma partcula i designada pelo vetor algbrico xi . Naturalmente pode haver qualquer nmero de partculas, e cada vetor pode ser de qualquer dimenso. Mudanas na posio de uma partcula podem ser denidas como xi , i.e., uma variao em sua posio anterior. Esta variao denida pela aplicao de uma certa velocidade, vi . A velocidade um vetor que somado s coordenadas de posio com o objetivo de mover a partcula de um passo de tempo para outro: xi (t) = xi (t 1) + vi (t) (10.2.1)

Observe que aqui considerado um passo de tempo unitrio, que representar o intervalo entre uma iterao do algoritmo e a sua subsequente, sendo permitida ento a soma dos dois termos no lado direito da equao 10.2.1. O objetivo denir regras que movam a partcula de uma maneira desejada, de tal forma que tentativas sejam alocadas de forma otimizada enquanto buscamos pelo timo global. O algoritmo de enxame de partculas examina o espao de busca atravs da modicao imposta pelo termo de velocidade (Figura 10.2). Como o sistema dinmico, a cada indivduo presumido um movimento, e isto pode ser denido como mudana a todo instante. Conforme apresentado na Figura 10.2, a nova posio da partcula, xi (t), dada em funo da posio atual, xi (t 1), da velocidade, vi (t), da localizao do melhor sucesso do indivduo, pi , e da melhor posio encontrada por qualquer membro de seu grupo, pg : xi (t) = f (xi (t 1) , vi (t) , pi , pg ) (10.2.2)

A mudana na posio detalhada como sendo uma funo da diferena entre a melhor posio e a posio atual do indivduo e a diferena entre a melhor posio do grupo e a posio atual do indivduo. Logo, a frmula para a denio da velocidade, levando em considerao variveis contnuas, ajusta a velocidade e consequentemente a posio da partcula no n :

vi (t) = vi (t 1) + c1 (pi xi (t 1)) + c2 (pg xi (t 1)) (10.2.3a) xi (t) = xi (t 1) + vi (t) (10.2.3b)

148

Otimizao por Enxame de Partculas

Figura 10.2: Movimentao das partculas no algoritmo do PSO. onde as variveis ci so nmeros aleatrios. O efeito destas equaes que as partculas circulam de forma irregular em torno de um ponto denido como a mdia ponderada das melhores posies, do indivduo e do bando: c1 pi + c2 pg c1 + c2 Por conta do uso de variveis estocsticas, a localizao exata deste ponto muda a cada iterao [187]. Para o atual modelo, tem-se os indivduos tendendo a serem inuenciados pelo melhor sucesso de qualquer indivduo de seu grupo, ou seja, o membro de seu grupo que obteve o melhor resultado at o momento [122, 103]. Indivduos podem ser conectados a outros de acordo com um grande nmero de estratgias. Esta conexo representada pelo ltimo termo na equao (10.2.3a) A grande maioria das implementaes de enxames de partculas usam dois princpios sociomtricos simples. O primeiro, chamado gbest, conecta conceitualmente todos os membros da populao entre si. O efeito disto que cada partcula inuenciada pela melhor performance de qualquer membro da populao total. O segundo, chamado lbest, cria uma vizinhana local para cada indivduo contendo a si mesmo e seus k vizinhos mais prximos. Por exemplo, se k = 2, ento cada indivduo i ser inuenciado pela melhor performance entre a vizinhana constitudo pelas partculas i 1, i e i +1. Diferentes topologias de vizinhana podem resultar em diferentes tipos de efeitos observados [122]. As decises tomadas a cada passo do algoritmo so por si estocsticas, por no haver melhor razo terica devido ao no conhecimento de todas as foras envolvidas. No muito razovel que qualquer deciso esteja baseada

Descrio do Algoritmo

149

somente em fatos isolados e talvez desconhecidos. Uma certa quantidade de aleatoriedade permite a explorao (exploration ) de novas possibilidades, e tambm permite a intensicao local (exploitation ). Assim, pode-se balancear entre estes dois modos de busca pelo ajuste da incerteza das decises [122]. As posies e as velocidades das partculas so comumente inicializadas aleatoriamente. As posies so sempre distribudas de maneira equiprovvel sobre o domnio de cada dimenso. Uma outra questo sempre recorrente no momento da implementao : Quantas partculas devem ser usadas?. No h uma resposta geral a esta questo, mas segundo a literatura a escolha entre 20 e 50 partculas frequentemente parece funcionar bem [122] para uma ampla gama de problemas.

10.2.1

Implementao

Os passos para implementao apresentados a seguir so referentes verso cannica do PSO para a otimizao de problemas preferencialmente nolineares no domnio n , inicialmente apresentada por Kennedy e Eberhart nas referncias [123, 122] como fruto de suas pesquisas envolvendo a minimizao de funes reais atravs da tcnica mais simplicada por eles proposta: Passo 1: Denio das condies iniciais do enxame (bando). Para cada partcula (pssaro), a posio xi e a velocidade vi so geradas aleatoriamente, dentro do espao de busca; Passo 2: Avaliao da funo objetivo f (xi ) para cada partcula do enxame. As posies pi e pg so atualizadas; Passo 3: Atualizao das velocidades de cada partcula do enxame. A velocidade de uma partcula atualizada atravs da equao (10.2.3a(; Passo 4: Atualizao da posio de cada partcula do enxame usando a equao (10.2.3b) com o objetivo de obter a nova posio xi ; Passo 5: Vericar o critrio de parada. Se no atendido, retornar ao Passo 2 para a prxima iterao. Passo 6: Pare. Use pg como a soluo desejada. Quando se considera a otimizao de funes reais, a aplicao das va-

150

Otimizao por Enxame de Partculas

riveis ci se altera consideravelmente. Para c1 regulando a fora de atrao para o melhor ponto de cada partcula, Kennedy e Eberhart [123], assim como Shi e Eberhart [211, 80], denem este como sendo o peso relativo cognio, ou seja, o reforo do conhecimento prprio, dado por pi , i.e., a memria do melhor local j visitado por um indivduo. J para c2 que est relacionado ao conhecimento da melhor posio global, alcanada por um membro do grupo, pg , i.e., a memria do melhor local j visitado pelo grupo, o termo regula o conhecimento social da partcula. De uma forma ampla, esta uma maneira de balancear o peso dado para o conhecimento prprio da partcula com relao ao conhecimento geral do bando. Mantendo a aleatoriedade do movimento com a multiplicao de nmeros aleatrios (rni ) em cada componente, cognitiva e social, temos uma nova equao, baseada na equao (10.2.3a), que controla a velocidade de cada partcula, vi (t) = vi (t 1) + c1 rn1 (pi xi (t 1)) + c2 rn2 (pg xi (t 1)) (10.2.4) com a atualizao de sua posio xi (t) se mantendo inalterada, i.e., empregando a equao (10.2.3b).

10.2.2

Algumas variantes do PSO

Em especco, duas variantes do PSO so abordadas neste livro, sendo que uma delas foi desenvolvida pelo grupo de pesquisadores do Laboratrio Associado de Computao e Matemtica Aplicada (LAC) do Instituto Nacional de Pesquisas Espaciais (INPE) e a outra uma variante proposta por um dos criadores do PSO. PSO com inrcia O conceito de inrcia, proposto por Shi e Eberhart [211] tem como objetivo balancear o peso dado para as buscas do tipo mais global e local, quando as partculas esto varrendo o espao de busca. A insero de um novo parmetro na equao (10.2.4), que tanto pode ser uma constante quanto uma funo no-linear de tempo [211] leva a uma simplicao no algoritmo cannico, pelo motivo de que este novo fator permite a retirada da vericao do atendimento aos limites da rea de busca. No algoritmo, quando se faz necessria a vericao da condio vi (t) (Vmax , +Vmax ), isto faz com que a partcula no ultrapasse as fronteiras

Descrio do Algoritmo

151

do espao de busca. Considerando que este representa um passo a mais para vericao, e que se trabalha com espaos multi-dimensionais, o tempo computacional para se efetuar esta operao acaba sendo relativamente elevado. Com o novo parmetro de inrcia, expresso por w, alm de se eliminar este relativo inconveniente, um maior poder de controle no comportamento de explorao global ou local permitido. A nova equao de velocidade ento dada por,

vi (t) = wvi (t 1) + c1 rn1 (pi xi (t 1)) + c2 rn2 (pg xi (t 1)) (10.2.5) e a equao que dene a nova posio para a partcula, aps a atualizao de sua velocidade continua inalterada, i.e., equao (10.2.3b). Segundo as Refs. [211, 80], o valor dado para a constante de inrcia w inuencia diretamente o controle sobre o tipo de explorao efetuado pelas partculas no seguinte esquema: w < 0, 8: o algoritmo funciona em um modo de busca local, explorando fortemente (exploitation ) fraes do espao de busca; w > 1, 2: o algoritmo trabalha no modo de explorao global (exploration ), agindo sobre uma maior rea do espao, buscando por espaos no explorados previamente; 0, 8 < w < 1, 2: teoricamente o ponto intermedirio para um bom balano entre a busca global e local, e por consequncia aqui se concentram os melhores valores de inrcia para a maioria dos problemas. PSO com turbulncia O conceito original que permeou a construo de algoritmos baseados no comportamento de bandos de pssaros e cardumes de peixes, levou em considerao a interao que os indivduos tem entre si e com o meio. Estes indivduos, computacionalmente identicados como sendo partculas virtuais de um enxame, devem ser inuenciados pelos seus companheiros, assim como por certas variveis ambientais para possibilitar uma maior imitao do mundo real. Inicialmente, Kennedy e Eberhart [123] consideraram somente as interaes sociais destas partculas para a construo do PSO, sendo que outras variveis foram descartadas no processo de aperfeioamento do algoritmo. Algumas destas variveis representavam o ambiente espacial onde estas partculas se encontravam.

152

Otimizao por Enxame de Partculas

Um grupo de pesquisa do LAC/INPE props a insero de uma varivel na teoria do PSO com o objetivo de aproximar o ambiente virtual criado em computador com o ambiente real, fonte de inspirao original do algoritmo [22]. Esta aproximao dada atravs da incorporao de turbulncia atmosfrica no cenrio computacional. Esta nova varivel interfere de maneira independente, aleatria e espordica no caminho que cada partcula efetua durante o seu voo. Para simular esta turbulncia, um novo parmetro, q0 , com valor real atribudo entre 0 e 1 usado por um esquema de roleta para ativar ou no a inuncia da turbulncia nas partculas. Detalhadamente, a cada iterao do algoritmo um nmero aleatrio gerado e comparado a q0 com o objetivo de incluir ou no a turbulncia no voo das partculas. A incluso da turbulncia em cada velocidade relativa a uma dimenso de voo da partcula regida pela equao (10.2.6), que determina a intensidade de aplicao da turbulncia, 1 (10.2.6) T t onde w a constante de inrcia, c1 o componente cognitivo que refora o conhecimento prprio da partcula, c2 o componente social que refora o conhecimento do bando, f (xg ) o ajuste, ou funo de adaptao da posio da melhor partcula para o problema, T o total de iteraes reservado para execuo do algoritmo e t a iterao atual. Aps a determinao da intensidade da turbulncia, iturb , a sua aplicao a cada velocidade relativa dimenso de voo da partcula feita independentemente, iturb = (w + c1 + c2 ) f (xg ) vi (t) = vi (t) iturb rn3 (10.2.7)

Aps a aplicao na velocidade, a atualizao da posio da partcula continua inalterada, sendo regida pela equao (10.2.7). Esta variante foi utilizada para a estimao da localizao e intensidade das fontes de poluio em conjunto com a variante de inrcia.

10.3

Aplicao ao Problema Inverso de Transferncia Radiativa

Os resultados para a aplicao do PSO para a resoluo do problema inverso de transferncia radiativa considerado na Ref. [23] e descrito na Subseo 2.2.1 e no Captulo 3 deste livro so apresentados nesta seo, tendo sido

Consideraes nais

153

feitos testes empregando trs quantidades de partculas e trs conjuntos de parmetros. Em todos os casos apresentados foi usada a variante do PSO com inrcia. Busca-se aqui obter estimativas para o vetor de incgnitas apresentado na equao (3.2.1) de forma a minimizar a funo objetivo
Nd

Q Z =
i=1

[Icalci (0 , , 1 , 2 ) Yi ]

(10.3.8)

que equivalente equao (3.2.4). A Tabela 10.1 apresenta os resultados para o uso de 100 partculas com os parmetros (w, c1 , c2 ) valendo, respectivamente, (0, 2; 0, 2; 2, 0), (0, 5; 0, 5; 0, 5) e (1, 0; 0, 2; 0, 2). A Tabela 10.2 apresenta os mesmos resultados para o uso de 1000 partculas, assim como a Tabela 10.3 que apresenta os resultados para 2000 partculas. Para ambos os casos foram usados dados experimentais sem rudo. E como dados experimentais reais no estavam disponveis, foram gerados dados experimentais sintticos empregando a equao (3.3.6).
0 {0, 2; 0, 2; 2, 0} semente 33 semente 57 semente 99 {0, 5; 0, 5; 0, 5} semente 33 semente 57 semente 99 {1, 0; 0, 2; 0, 2} semente 33 semente 57 semente 99 Exato: 1 2 Q(Z ) eq. (10.3.8) Tempo (s) NAFO 8, 66 22, 40 37, 56 104, 6 304, 84 188, 28 24, 34 25, 72 33, 45 1590 3975 6573 18218 52685 32678 4283 4561 5884

0, 99994 0, 50000 0, 10002 0, 94999 4, 0122E 10 0, 99980 0, 50031 0, 10109 0, 95004 7, 9529E 10 0, 99985 0, 50027 0, 10097 0, 95005 7, 2561E 10 0, 99916 0, 50134 0, 10478 0, 95019 1, 5129E 08 0, 88494 0, 77433 0, 72890 0, 98127 5, 2750E 04 0, 98649 0, 52206 0, 17522 0, 95308 3, 9807E 06 0, 97866 0, 99971 0, 99777 1, 00000 0, 50773 0, 55373 0, 55163 0, 50000 0, 14027 0, 27292 0, 26936 0, 10000 0, 95023 1, 7679E 05 1, 00000 3, 3719E 03 1, 00000 3, 3732E 03 0, 95000 0, 00000

Tabela 10.1: Tabela de resultados para o mtodo de Otimizao por Enxame


de Partculas (PSO) com inrcia e 100 partculas. N AF O signica Nmero de Avaliaes da Funo Objetivo.

A Tabela 10.4 apresenta os resultados para o uso de 25 partculas com 100 iteraes sobre os dados experimentais com 2% e 5% de rudo inserido conforme equao (3.3.6). O conjunto de parmetros usados foi {0, 2; 0, 2; 2, 0} para c1 , c2 e c3 , respectivamente.

10.4

Consideraes nais

O uso do PSO para a resoluo de problemas de otimizao contnua tem apresentado bons resultados para diversos problemas. Em problemas es-

154
0 {0, 2; 0, 2; 2, 0} semente 33 semente 57 semente 99 {0, 5; 0, 5; 0, 5} semente 33 semente 57 semente 99 {1, 0; 0, 2; 0, 2} semente 33 semente 57 semente 99 Exato: 1

Otimizao por Enxame de Partculas


2 Q(Z ) eq. (10.3.8) Tempo (s) NAFO 67, 75 40, 71 54, 05 546, 21 364, 62 226, 49 193, 78 139, 10 85, 09 12736 8036 10260 94069 64249 40023 34583 24762 15729

0, 99991 0, 50016 0, 10057 0, 95004 8, 4289E 10 1, 00000 0, 50018 0, 10053 0, 95001 7, 6907E 10 0, 99994 0, 50022 0, 10071 0, 95003 6, 0570E 10 0, 99984 0, 50027 0, 10093 0, 95003 7, 0006E 10 0, 99983 0, 50032 0, 10112 0, 95004 8, 4499E 10 0, 99991 0, 50027 0, 10090 0, 95004 9, 6085E 10 0, 99962 0, 99725 0, 99872 1, 00000 0, 50696 0, 50736 0, 50272 0, 50000 0, 12024 0, 12311 0, 10801 0, 10000 0, 95130 1, 7008E 06 0, 95180 2, 5660E 06 0, 95053 7, 7596E 07 0, 95000 0, 00000

Tabela 10.2: Tabela de resultados para o mtodo de Otimizao por Enxame


de Partculas (PSO) com inrcia e 1000 partculas. N AF O signica Nmero de Avaliaes da Funo Objetivo.
0 {0, 2; 0, 2; 2, 0} semente 33 semente 57 semente 99 {0, 5; 0, 5; 0, 5} semente 33 semente 57 semente 99 {1, 0; 0, 2; 0, 2} semente 33 semente 57 semente 99 Exato: 1 2 Q(Z ) eq. (10.3.8) Tempo (s) NAFO 106, 56 114, 22 91, 17 215, 93 357, 84 221, 37 444, 55 315, 04 802, 04 20364 21654 17672 39439 63104 40348 78734 56510 141051

0, 99983 0, 50024 0, 10087 0, 95003 5, 2516E 10 0, 99998 0, 50010 0, 10029 0, 94999 5, 4930E 10 0, 99981 0, 50031 0, 10110 0, 95005 8, 8029E 10 0, 99993 0, 50028 0, 10089 0, 95004 9, 3544E 10 0, 99981 0, 50032 0, 10110 0, 95004 9, 9527E 10 0, 99995 0, 50017 0, 10056 0, 95001 6, 5325E 10 0, 99818 0, 99226 0, 99262 1, 00000 0, 50142 0, 51443 0, 50533 0, 50000 0, 10622 0, 14776 0, 12073 0, 10000 0, 95010 1, 6337E 07 0, 95188 2, 0802E 06 0, 95072 2, 0696E 06 0, 95000 0, 00000

Tabela 10.3: Tabela de resultados para o mtodo de Otimizao por Enxame


de Partculas (PSO) com inrcia e 2000 partculas. NAFO signica Nmero de Avaliaes da Funo Objetivo.

peccos, como problemas inversos escritos como problemas de otimizao, o uso do PSO no difere da mdia, sendo que os resultados obtidos so relativamente melhores do que os fornecidos por mtodos determinsticos [159, 161].

Consideraes nais

155

0 2% de rudo semente 33 semente 57 semente 99 5% de rudo semente 33 semente 57 semente 99 Exato:

Q(Z ) NAFO eq. (10.3.8) 2478 2497 2488 2492 2498 2499

0, 99429 0, 49169 0, 08421 0, 95130 4, 7997E05 0, 97720 0, 52056 0, 18239 0, 95496 4, 0501E05 0, 98561 0, 50611 0, 13330 0, 95313 4, 8003E05 0, 98047 0, 94422 0, 94815 1, 00000 0, 50372 0, 54667 0, 53920 0, 50000 0, 13881 0, 28134 0, 25962 0, 10000 0, 95577 2, 8192E04 0, 96119 2, 5335E04 0, 96026 2, 5715E04 0, 95000 0, 0

Tabela 10.4: Tabela de resultados para o mtodo de Otimizao por Enxame de


Partculas (PSO) com inrcia e 25 partculas e 100 iteraes para dados com 2% e 5% de rudo nos dados. O conjunto de parmetros usados foi {0, 2; 0, 2; 2, 0}. NAFO signica Nmero de Avaliaes da Funo Objetivo.

156

Otimizao por Enxame de Partculas

Captulo 11

Otimizao Extrema Generalizada (Generalized Extremal Optimization )


Fabiano Luis de Sousa Francisco Jos da Cunha Pires Soeiro Antnio Jos da Silva Neto

11.1

Motivao e Histrico do Mtodo

O mtodo da Otimizao Extrema Generalizada (Generalized Extremal Optimization, GEO) [237, 235, 238, 239] foi desenvolvido para ser aplicado a problemas de otimizao que apresentem um espao de projeto complexo, onde mtodos tradicionais, como os do tipo gradiente, sejam de difcil aplicao ou levem a solues sub-timas. O GEO foi proposto [237, 235] como uma generalizao do mtodo da otimizao extrema (Extremal Optimization, EO) [31], de forma que o conceito deste pudesse ser aplicado a praticamente qualquer tipo de problema de otimizao. Ambos se inspiraram em um modelo simplicado de evoluo natural, criado por Bak e Sneppen [15], que buscava mostrar que ecossistemas naturais esto em um estado de Criticalidade Auto-Organizada (Self-Organized Criticality, SOC). De fcil implementao, o GEO um mtodo de ordem zero (no utiliza informao das derivadas da funo objetivo ou de suas restries) que pode ser aplicado a problemas com ou sem restries, que apresentem mltiplas 157

158

Otimizao Extrema Generalizada

solues sub-timas ou mesmo um espao de projeto disjunto, com qualquer combinao de variveis, contnuas, inteiras ou discretas. Ele uma meta-heurstica de busca global, como o algoritmo gentico (Genetic Algorithm, GA) e o recozimento simulado (Simulated Annealing, SA), mas com a vantagem a priori sobre estes mtodos de possuir apenas um parmetro livre para ajustar. A importncia desta caracterstica do GEO, deve-se ao fato de que a ecincia no uso de algoritmos do tipo GA, SA e GEO em um dado problema fortemente dependente dos valores atribudos aos seus parmetros livres. De fato, o ajuste destes parmetros pode se tornar um problema em si mesmo, se o custo computacional na avaliao da funo objetivo for alto e o algoritmo tiver muitos parmetros para ajustar. O GEO, assim como o GA, faz parte de uma categoria de algoritmos inspirados na natureza denominados Algoritmos Evolutivos (AE) [81]. Estes algoritmos tiveram origem nas dcadas de 1950 e 1960 [86], mas foi somente a partir do nal da dcada de 1980 que os mesmos passaram a receber grande ateno, tanto do ponto de vista de desenvolvimento de novas implementaes como na sua aplicao aos mais diversos tipos de problemas em cincia e engenharia. Os algoritmos genticos so provavelmente a classe de AE mais conhecida e utilizada, mas outras abordagens tambm so bastante utilizadas como as Estratgias Evolutivas (EE), a Programao Evolutiva (PE) e a Programao Gentica (PG). Apesar de receberem diferentes denominaes, dependendo de sua origem e de como so implementados, os algoritmos evolutivos tm como caractersticas comuns o uso de uma ou mais populaes de indivduos ou espcies (solues candidatas ao problema), e esquemas de seleo e modicao (mutao e/ou recombinao ) que levem a populao a evoluir ao longo das geraes (iteraes) do algoritmo. Em um problema de otimizao, estes esquemas, ou operadores, permitem que uma busca global pela soluo tima seja feita no espao de projeto, em um processo onde, probabilisticamente, solues melhores so identicadas continuamente medida que novas geraes da populao so criadas. Neste Captulo a verso original do GEO apresentada de forma detalhada na Seo 11.2. Na Seo 11.3 apresentada sua aplicao a um problema de transferncia radiativa e na Seo 11.4 so feitas consideraes nais. Cabe ressaltar que o GEO como apresentado na Seo 11.2, ou verses mais recentes do mesmo, vem sendo utilizado ecazmente para resolver diferentes tipos de problemas de projeto timo, inclusive multi-objetivos [5, 46, 66, 238, 241, 236, 178, 189, 246, 256]. Todavia, o objetivo principal deste Captulo apresentar os conceitos bsicos do GEO e como o mesmo pode ser utilizado em problemas de transferncia radiativa. Descries mais detalhadas de verses mais recentes do algoritmo bsico podem ser encon-

Descrio do Algoritmo tradas, por exemplo, em [90, 156].

159

11.2
11.2.1

Descrio do Algoritmo
O Modelo Simplicado de Evoluo de Bak-Sneppen

Como mencionado na Seo 11.1, o GEO inspira-se em um modelo simplicado de evoluo proposto por Bak e Sneppen [15]. Neste modelo espcies esto dispostas em uma cadeia, de forma que as interaes entre as mesmas se d apenas entre espcies de nichos vizinhos. Na Figura 11.1 apresentado um ecossistema em cadeia composto de 8 espcies.

Figura 11.1: Modelo simplicado de Bak-Sneppen de um ecossistema com 8


espcies.

A dinmica de evoluo no modelo muito simples: Inicialmente, a cada espcie atribuda aleatoriamente, com distribuio uniforme, um valor ei real no intervalo [0, 1], representando sua adaptabilidade. Quanto maior o valor de ei mais adaptada est a espcie. Em seguida, identica-se a espcie menos adaptada e a ela atribudo um novo valor de ei , tambm de maneira aleatria e com distribuio uniforme no intervalo [0, 1]. Como espcies vizinhas interagem entre si, a cada iterao do modelo, quelas vizinhas da espcie menos adaptada so atribudos novos valores de ei . Por exemplo, se na Figura 11.1 a espcie e3 fosse identicada como a menos adaptada em uma dada iterao do modelo, ela e suas vizinhas e2 e e4 seriam modicadas (sofreriam mutao), atribuindo s mesmas novos valores para ei aleatoriamente, com distribuio uniforme, no intervalo [0, 1]. Note que no modelo de Bak-Sneppen as espcies nos extremos da cadeia so consideradas vizinhas. Ou seja, na Figura 11.1, e1 vizinha de e8 . Observando-se a evoluo da adaptabilidade das espcies na populao, nota-se que a partir de uma distribuio inicial uniforme, a adaptabilidade mdia da populao vai sistematicamente aumentando e a partir de certo nmero de geraes pode-se denir um patamar crtico em que, eventualmente por vrias geraes, todas as espcies do ecossistema tm adaptabilidade maior que o mesmo. Toda vez que uma ou mais espcies esto abaixo do patamar crtico dene-se a ocor-

160

Otimizao Extrema Generalizada

rncia de uma avalanche. A intensidade de uma avalanche denida como o nmero de espcies que caem abaixo do patamar crtico entre dois instantes onde nenhuma espcie encontra-se abaixo do mesmo. Observa-se que a distribuio da frequncia das avalanches em funo de suas intensidades descrita por uma lei de potncia, onde avalanches com menor intensidade ocorrem frequentemente, mas mesmo avalanches que levem todas as espcies para baixo do patamar crtico podem ocorrer. A dinmica do modelo de Bak-Sneppen onde espcies menos adaptadas so sistematicamente foradas a se modicar, mas ao mesmo tempo espcies bem adaptadas podem ser modicadas quando arrastadas por uma avalanche, inspiraram Boettcher e Percus [31] a propor um novo mtodo evolutivo de otimizao denominado Extremal Optimization (EO). A ideia por trs da EO era de que em uma populao de solues candidatas (espcies) as piores (menos adaptadas) fossem sistematicamente foradas a se modicar, ao mesmo tempo em que a dinmica das avalanches impediria que a populao estacionasse em mnimos locais. Talvez a principal caracterstica que diferencia a EO dos outros algoritmos evolutivos, que na EO como proposta originalmente, a populao composta pelas prprias variveis de projeto enquanto que, por exemplo, nos algoritmos genticos, cada indivduo representa uma soluo completa para o problema. Esta caracterstica da EO implica que a adaptabilidade deve ser atribuda varivel de projeto, ao invs de a uma soluo candidata completa. Como observaram Boettcher e Percus [31], isso pode dicultar ou mesmo impedir sua aplicao a problemas de otimizao onde no se consiga fazer uma associao entre a adaptabilidade da varivel e a qualidade de uma soluo em funo do valor da funo objetivo associado mesma. O GEO foi criado para superar esta diculdade.

11.2.2

O GEO cannico

Analogamente ao modelo evolutivo de Bak-Sneppen, no GEO a populao composta de espcies dispostas em uma cadeia onde cada nicho representa uma espcie, s que no GEO a cadeia formada por bits, como apresentado na Figura 11.2. Em um problema de otimizao, as variveis de projeto so codicadas na cadeia de bits. Por exemplo, na Figura 11.2 a populao composta de 8 espcies (bits) que codicam duas variveis de projeto, cada uma com quatro bits. A adaptabilidade de cada espcie atribuda vericando-se qual o impacto que sua mutao (ou seja, o bit muda de 0 para 1 ou de 1 para 0) gerar no valor da funo objetivo, em relao a um dado valor de referncia.

Descrio do Algoritmo

161

Figura 11.2: Exemplo de uma populao no GEO com oito espcies codicando
duas variveis de projeto.

A seguir os passos para a implementao do GEO cannico para um problema de otimizao so apresentados. Passo 1. Inicialize uma cadeia de N bits que codique as L variveis de projeto do problema. O nmero de bits que representa cada varivel denido pela resoluo mnima que se quer ter em cada uma delas. Passo 2. Para cada bit bi , i = 1, N : 1. Modique seu valor corrente (de 0 para 1 ou de 1 para 0) e calcule o valor da funo objetivo F Obi da cadeia de bits com bi modicado; 2. Calcule o valor da adaptabilidade de bi usando a expresso dada pela equao (11.2.1), onde F Oref um dado valor de referncia; 3. Retorne bi para sua congurao original.

Adapbi = F Obi F Oref

(11.2.1)

Passo 3. Ordene os bits de rankbi = 1 a N , de acordo com suas adaptabilidades Adapbi . O bit menos adaptado recebe rankbi = 1, enquanto o mais adaptado rankbi = N . Em um problema de minimizao o bit menos adaptado ser aquele que tiver o menor valor de Adapbi . J em um problema de maximizao o bit menos adaptado ser aquele que tiver o maior valor de Adapbi . Passo 4. Realize a mutao em uma espcie da populao por meio do seguinte procedimento: 1. Escolha aleatoriamente, com distribuio uniforme, uma espcie bi candidata a sofrer mutao; 2. Calcule o valor da probabilidade de bi sofrer mutao, dada pela expresso:

162

Otimizao Extrema Generalizada

P bi = (rankbi )

(11.2.2)

onde um parmetro de ajuste com valor positivo. Gere um nmero aleatrio RAN , com distribuio uniforme, no intervalo [0, 1]. Se P bi RAN , ento aceite a mutao e passe para o Passo 5. Se no, volte para (1) neste passo e repita este processo at que um bit seja conrmado para sofrer mutao. A atribuio do valor de se reete no grau de aleatoriedade da busca. Para = 0, qualquer espcie escolhida para sofrer mutao ter a mesma conrmada. Por outro lado, quanto maior o valor de , menor a chance de uma espcie, que no a menos adaptada, ter sua mutao conrmada, se for escolhida para tal. Note que a espcie menos adaptada (rankbi = 1), se escolhida para sofrer mutao, sempre ter a mesma conrmada, no importando o valor de . O valor de inuencia tambm na performance da busca. Ou seja, para um dado problema, tipicamente existe um valor para que faz com que a busca seja realizada de maneira mais eciente do que se forem usados outros valores. Tem-se observado que os valores timos para encontram-se no intervalo [0, 75; 5]. Passo 5. Verique se o critrio de parada foi alcanado. Este pode ser, por exemplo, um dado nmero mximo de avaliaes da funo objetivo. Se sim, pare o algoritmo e retorne o melhor valor da funo objetivo encontrado ao longo da busca, e os valores das variveis de projeto associadas ao mesmo. Se no, retorne ao Passo 2 com a nova congurao de bits da populao (mutao realizada no Passo 4). Uma pequena variao do algoritmo apresentado nos Passos 1 a 5, pode ser implementada simplesmente fazendo-se o ordenamento das espcies por varivel de projeto e modicando-se L espcies (uma para cada varivel) a cada iterao do algoritmo. Denominada GEOvar [235, 238], esta implementao mostrou ser mais eciente do que a implementao original para problemas onde existam apenas restries laterais (restries do tipo xmin x xmax , onde x representa o valor da varivel). Restries so levadas em considerao no GEO simplesmente penalizando-se o bit que, se alterado, levar a busca a uma regio invivel do espao de projeto. Note que restries do tipo lateral so incorporadas diretamente ao problema pela codicao binria das variveis. Finalmente, cabe ressaltar que embora na verso original do GEO apresentada acima as variveis estejam codicadas em uma sequncia binria, outros tipos de codicao, ou uma combinao delas, podem ser utilizadas. Por exemplo, em [241] foi utilizada a codicao real em um problema com variveis discretas.

Descrio do Algoritmo

163

Na Subseo 11.2.3 a seguir, o funcionamento do GEO cannico exemplicado, por meio de sua utilizao para identicar o mnimo global de uma funo teste simples.

11.2.3

Um Exemplo Simples da Utilizao do GEO Cannico

Considere o problema de otimizao: Minimize f (x) = x2 seno (x) Sujeito a: x . A primeira tarefa a ser realizada consiste na denio de quantos bits codicaro a varivel x. Considerando que se quer uma preciso mnima p = 0, 1 para variaes no valor de x, o nmero mnimo m de bits necessrios para conseguir esta preciso pode ser obtido por: 2m [( ( )) /0, 1 + 1] = 63, 832 (11.2.4) (11.2.3)

e, portanto, m = 6. Assim, a populao ser composta de 6 espcies. Seguindo o formato apresentado na Figura 11.2, a espcie 1 corresponde ao bit mais signicativo da string (o mais esquerda), enquanto a espcie 6 ao menos signicativo (o mais direita). Note que no nosso exemplo, diferentemente da Figura 11.2, temos apenas uma varivel de projeto. Denido o nmero de bits, o algoritmo inicializado construindo-se uma primeira soluo para o problema aleatoriamente, como descrito no Passo 1, por exemplo: {1, 0, 0, 0, 1, 1}. Essa congurao de bits corresponde ao valor x = 0, 35 e f (x) = 0, 04. Em seguida atribudo o valor das adaptabilidades das espcies conforme descrito no Passo 2. Por exemplo, considerando F Oref = 0, a espcie (bit) 1 ter adaptabilidade Adapb1 = 2, 38, enquanto a espcie 4 Adapb4 = 0, 38. Na Figura 11.3 so apresentadas, no espao de funo objetivo, a posio da congurao inicial de bits, e de como ela se altera quando, por exemplo, o bit 1 ou o bit 4 forem mudados. Note-se que no exemplo que estamos trabalhando, o bit 1 est menos adaptado que o bit 4, pois Adapb1 < Adapb4 . Isso signica que mudar o bit 1 mais vantajoso, do ponto de vista do valor da funo objetivo, do que alterar o bit 4. Depois de denidas as adaptabilidades de cada espcie, feito o ordenamento das mesmas. Como descrito no Passo 3, atribudo valor 1 para a espcie menos adaptada e 6 para a mais adaptada. Na Tabela 11.1 so apresentadas as adaptabilidades de cada bit e sua posio no ordenamento.

164

Otimizao Extrema Generalizada

Figura 11.3: Representao no espao de funo objetivo da soluo inicial e


adaptabilidade de dois bits da populao (congurao) inicial de espcies.

bi 1 2 3 4 5 6

String {0, 0, 0, 0, 1, 1} {1, 1, 0, 0, 1, 1} {1, 0, 1, 0, 1, 1} {1, 0, 0, 1, 1, 1} {1, 0, 0, 0, 0, 1} {1, 0, 0, 0, 1, 0}

xi 2, 84 1, 94 1, 15 0, 75 0, 15 0, 25

f (xi ) 2, 38 3, 52 1, 20 0, 38 0, 00 0, 02

Adapbi 2, 38 3, 52 1, 20 0, 38 0, 00 0, 02

rankbi 1 6 5 4 2 3

Tabela 11.1: Ordenamento das espcies (bits) com a congurao corrente


{1, 0, 0, 0, 1, 1}. Os valores de xi , f (xi ) e Adapbi foram arredondados para a segunda casa decimal. No clculo de Adapbi considerou-se F Oref = 0.

Em seguida ao ordenamento, feita a mutao em uma das espcies da populao de acordo com o Passo 4. Por exemplo, atribuindo um valor para = 1, 75, se a espcie 3 fosse escolhida como candidata a sofrer mutao, ela teria P b3 = 51,75 = 0, 06 (6%) de probabilidade de sofrer mutao. Se fosse escolhida a espcie menos adaptada (b1 ), ela teria P b1 = 11,75 = 1 (100%) de probabilidade de sofrer mutao. Note que mesmo a espcie mais bem adaptada, se escolhida, tem tambm uma probabilidade (P b2 = 61,75 = 0, 04 (4%)) de sofrer mutao. Finalmente, fechando uma gerao (iterao) do GEO, vericado o critrio de parada. Se este for atingido a busca encerrada e o melhor

Aplicao ao Problema Inverso de Transferncia Radiativa

165

valor de x (e f (x)) encontrado ao longo da mesma retornado. Se no, o algoritmo retorna ao Passo 2, agora partindo da congurao corrente de bits, obtida aps a mutao ocorrida no Passo 4.

11.2.4

Algumas Consideraes Sobre Novas Verses do GEO

A partir da ideia bsica do GEO descrita em 11.2.3, novas verses do algoritmo vem sendo propostas de forma a buscar aumento de performance das verses cannicas ou investigar sua utilizao em diferentes tipos de problemas. Por exemplo, em [90] um amplo estudo foi realizado neste sentido, sendo propostas verses que aumentaram signicativamente a performance do GEO cannico. Neste trabalho foi tambm proposta uma primeira verso do algoritmo para aplicao em problemas multiobjetivos (M-GEO), sendo investigadas tambm verses hbridas e para aplicao em sistemas computacionais com processamento paralelo (GEOpar ). J em [156], foi proposta uma verso do algoritmo com codicao real das variveis (GEOreal ) que parece ser superior em performance s cannicas e aquelas propostas em [90], para problemas com variveis contnuas [157].

11.3

Aplicao ao Problema Inverso de Transferncia Radiativa

O problema consiste em determinar-se a espessura tica (0 ), albedo ( ) e as reetividades difusas (1 e 2 ) na fronteira de um meio participante homogneo uni-dimensional, a partir de medidas da radiao emergindo do meio (Yi ). Vide equao (3.2.1). Este problema est discutido na Subseo 2.2.1 e no Captulo 3. Posto como um problema de otimizao, deseja-se minimizar a funo objetivo
Nd

Q Z =
i=1

[Icalci (0 , , 1 , 2 ) Yi ]

(11.3.5)

Sujeita a 0 0 5; 0 , 1 , 2 1. onde Ii (0 , , 1 , 2 ), com i = 1 a 20, representa os valores calculados para a radiao nos mesmos locais onde Yi medida, mas usando-se valores estimados para as propriedades radiativas por meio do GEO.

166

Otimizao Extrema Generalizada

Trs casos foram denidos para estudo, correspondendo a trs conjuntos de propriedades a serem recuperadas pelo algoritmo de otimizao, como apresentado na Tabela 11.2. Para cada caso foi considerada a leitura de Yi sendo feita por um sensor, com e sem rudo. O sinal de Yi foi gerado numericamente utilizando-se, para cada caso, os valores das propriedades apresentados na Tabela 11.2. O rudo foi introduzido em Yi utilizando-se a expresso: Yi = Ii (0 , , 1 , 2 ) + 2, 576 ri (11.3.6)

onde ri um nmero aleatrio gerado com distribuio uniforme no intervalo [1, 1] e o desvio padro do rudo, que recebeu os valores de 0, 005, 0, 002 e 0, 0025 para os casos 1, 2 e 3, respectivamente, correspondendo a rudos com valores mximos da ordem de 5% da intensidade da radiao medida. Propriedade radiativa Espessura tica 0 Albedo Reetividade difusa 1 Reetividade difusa 2 Caso 1 1, 0 0, 5 0, 2 0, 2 Caso 2 2, 0 0, 8 0, 1 0, 8 Caso 3 0, 5 0, 3 0, 1 0, 8

Tabela 11.2: Valores das propriedades radiativas a serem recuperadas. O GEO, na sua implementao GEOvar , foi utilizado para resolver este problema, e seus resultados comparados com os obtidos utilizando-se um SA e um GA [240]. Em um trabalho posterior [91], estes resultados foram comparados com uma verso do GEO desenvolvida por Galski [90], que introduzia elementos caractersticos do SA ao seu funcionamento, denominada GEO+SA. A diferena fundamental entre o GEO cannico e a verso GEO+SA a introduo de um recozimento (annealing ) no parmetro do GEO, similarmente ao que ocorre com a temperatura no SA, de forma a transformar a busca pelo timo global no GEO progressivamente mais determinstica. Entretanto, cabe ressaltar tambm que o GEO+SA, dependendo do ajuste de dois de seus parmetros livres (nmax e q ), pode realizar a busca pelo timo em ciclos de recozimento (annealing ) e reaquecimento (ou seja, tornar a busca mais determinstica progressivamente at um certo ponto e depois novamente aleatria em ciclos). Nas Figuras 11.4 a 11.9 so apresentados, no espao de funo objetivo, os resultados da evoluo da mdia dos melhores valores obtidos em 10 execues independentes de cada algoritmo, em funo do nmero de avaliaes da funo objetivo. No GEO, GEO+SA e GA foram utilizados 10 bits para codicar cada varivel, enquanto no SA foi utilizada codicao real. No

Aplicao ao Problema Inverso de Transferncia Radiativa

167

GEO foi utilizado = 1, 25. Detalhes da implementao do GEO, SA e GA ao problema e do ajuste de seus parmetros livres pode ser encontrado em [240]. A mesma informao relativa ao GEO+SA pode ser encontrada em [91].

Figura 11.4: Mdia dos melhores valores da funo objetivo em dez execues
independentes de cada algoritmo em funo do nmero de avaliaes da funo objetivo, para o Caso 1, sem rudo. Adaptado de [91].

Figura 11.5: Mdia dos melhores valores da funo objetivo em dez execues
independentes de cada algoritmo em funo do nmero de avaliaes da funo objetivo, para o Caso 1, com rudo. Adaptado de [91].

Pelos resultados apresentados nas Figuras 11.4 a 11.9, observa-se que o

168

Otimizao Extrema Generalizada

Figura 11.6: Mdia dos melhores valores da funo objetivo em dez execues
independentes de cada algoritmo em funo do nmero de avaliaes da funo objetivo, para o Caso 2, sem rudo. Adaptado de [91].

Figura 11.7: Mdia dos melhores valores da funo objetivo em dez execues
independentes de cada algoritmo em funo do nmero de avaliaes da funo objetivo, para o Caso 2, com rudo. Adaptado de [91].

SA, para o problema em questo, claramente apresentou uma performance melhor que o GEO cannico o GEO+SA e o GA. Diferentemente do que se esperava [240, 91], a aplicao de uma estratgia de recozimento (annealing ) no parmetro do GEO no resultou em uma melhora signicativa na performance do algoritmo para este problema. Note-se que o GA tambm apresenta uma performance pobre quando comparado com o SA. Talvez

Aplicao ao Problema Inverso de Transferncia Radiativa

169

Figura 11.8: Mdia dos melhores valores da funo objetivo em dez execues
independentes de cada algoritmo em funo do nmero de avaliaes da funo objetivo, para o Caso 3, sem rudo. Adaptado de [91].

Figura 11.9: Mdia dos melhores valores da funo objetivo em dez execues
independentes de cada algoritmo em funo do nmero de avaliaes da funo objetivo, para o Caso 3, com rudo. Adaptado de [91].

esta diferena de performance se deva codicao das variveis. Tanto os GEOs quanto o GA usaram codicao binria, enquanto no SA foi utilizada codicao real. Como observado em [90], a codicao binria pode no ser a melhor representao para o GEO em problemas onde a mesma levar o algoritmo a saltar regies promissoras do espao de projeto devido ao carter discreto dos incrementos no valor das variveis. De fato, a escolha

170

Otimizao Extrema Generalizada

da representao correta a ser usada para codicar as variveis de projeto, um fator importante para se obter uma boa performance de um algoritmo evolutivo [81].

11.4

Consideraes Finais

Finalmente, cabe ressaltar que o GEO um algoritmo em evoluo. A partir da sua implementao cannica descrita na Seo 11.2.2, verses mais sosticadas ou customizadas para determinados tipos de problemas, incluindo hibridizao com outros algoritmos, podem ser desenvolvidas, como j demonstrado em [90] e [156]. Essa continua sendo uma das promissoras reas de pesquisa com o GEO, assim como sua aplicao aos mais variados tipos de problema.

Captulo 12

Algoritmo de Coliso de Partculas (Particle Collision Algorithm )


Wagner Figueiredo Sacco Diego Campos Knupp Eduardo Fvero Pacheco da Luz Antnio Jos da Silva Neto

12.1

Motivao e Histrico do Mtodo

Nas dcadas de 1980 e 1990, a aplicao de mtodos estocsticos em problemas de difcil otimizao, especialmente os combinatrios, tornou-se alvo de um considervel interesse. Essas tcnicas mostraram-se bem mais ecientes que os mtodos determinsticos tradicionais, sendo uma das principais ferramentas empregadas, o algoritmo de minimizao conhecido como recozimento simulado (Simulated Annealing, SA) [126]. A maior vantagem do SA sobre os outros mtodos ento existentes era a sua capacidade de evitar cair em armadilhas do tipo mnimos locais. O algoritmo emprega uma busca aleatria que no aceita somente mudanas que diminuam a funo objetivo Q, mas tambm algumas mudanas que a aumentem, seguindo o paradigma estabelecido por Metropolis [173]. O aumento do valor da funo objetivo aceito com probabilidade 171

172

Algoritmo de Coliso de Partculas

P = e(Q/T )

(12.1.1)

onde Q o aumento de valor da funo objetivo e T um parmetro de controle que, por analogia aplicao original do algoritmo, conhecido como a temperatura do sistema. No Captulo 5 apresentado o mtodo SA. Quando considerado como uma tcnica para solucionar os problemas de otimizao de alta multimodalidade, ou seja, com vrios timos locais, o SA possui algumas caractersticas atraentes: um mtodo fraco, isto , no projetado para um problema especco; um mtodo comparativamente eciente em problemas de alta dimensionalidade; no requer qualquer informao funcional da derivada da funo [34]. No entanto, o SA possui limitaes que dicultam a sua utilizao [43]: vrios parmetros a serem especicados pelo usurio; o algoritmo extremamente sensvel aos valores destes parmetros; tendncia a convergir para um timo local se a taxa de resfriamento no for sucientemente baixa. Avaliando estas limitaes do SA e com a experincia adquirida na sua implementao e utilizao, recentemente foi concebido um algoritmo do tipo Metropolis a partir de uma analogia com a coliso de partculas nucleares [78]. Este algoritmo, denominado algoritmo de coliso de partculas, tem como vantagem o fato de no necessitar da especicao de parmetros alm daqueles que denem o nmero de iteraes. O algoritmo de coliso de partculas (Particle Collision Algorithm, PCA) [202, 203] descrito na seo seguinte.

12.2
12.2.1

Descrio do Algoritmo
A verso cannica

O PCA inspirado no espalhamento de uma partcula nuclear incidente (onde ela espalhada pelo ncleo-alvo) e pela absoro (onde ela absorvida pelo ncleo-alvo). Nesta modelagem, a partcula que atinge um ncleo

Descrio do Algoritmo

173

com baixo valor da funo objetivo absorvida. Em contrapartida, uma partcula que atinge um ncleo com alto valor da funo objetivo espalhada para outra regio. Isso permite que o espao de busca do problema seja amplamente percorrido e que as regies mais promissoras sejam exploradas atravs de eventos sucessivos de espalhamento e absoro. Assim como no SA, primeiramente uma soluo inicial determinada e em seguida esta soluo modicada atravs de uma perturbao estocstica. As qualidades dessas possveis solues so comparadas e ento decidido pela manuteno ou alterao da soluo atual por outra soluo potencial. Se a qualidade da nova soluo melhor do que aquela da soluo antiga, ento a partcula absorvida e ocorre a explorao das vizinhanas para que seja encontrada uma soluo ainda melhor. O Passo 4 no algoritmo descrito a seguir realiza essa busca local, gerando pequenas perturbaes estocsticas na soluo dentro de um processo iterativo. Se a qualidade da nova soluo pior do que aquela da soluo antiga, ento a partcula espalhada. A probabilidade de espalhamento pscattering inversamente proporcional a sua qualidade, i.e. uma partcula de menor qualidade ter maior probabilidade de ser espalhada. O Passo 5 no algoritmo descrito a seguir realiza a operao de espalhamento. Deste modo, o PCA tambm pode ser considerado um algoritmo do tipo Metropolis, i.e. uma soluo pode ser aceita, com certa probabilidade, mesmo sendo sua qualidade menor do que aquela da soluo antiga. Tal exibilidade pode evitar a convergncia para timos locais. A seguir, os passos para a implementao do PCA cannico para um problema de minimizao da funo objetivo so apresentados. O uxograma do PCA representado na Fig. 12.1. Passo 1. Atribua 1 como o valor para a varivel contador; Passo 2. Gere uma soluo inicial aleatria dentro do domnio de busca da soluo. Chame esta soluo de OldConf ig OldConf ig = L + (U L) r (12.2.2)

onde L e U so, respectivamente, o limite inferior e superior do domnio de busca da soluo e r o gerador de um nmero aleatrio entre 0 e 1; Passo 3. Caso contador nP CA encerre o PCA. Caso contrrio, incremente o valor de contador em uma unidade e gere uma nova soluo, N ewConf ig , que calculada a partir de uma perturbao estocstica na soluo OldConf ig da seguinte forma:

174

Algoritmo de Coliso de Partculas

Figura 12.1: Fluxograma do PCA.

N ewConf ig = OldConf ig + [(U OldConf ig ) r (OldConf ig L) (1 r)] N ewConf ig = L, seN ewConf ig < L N ewConf ig = U, seN ewConf ig > U (12.2.3) Se o valor da funo objetivo para N ewConf ig for menor que o valor da funo objetivo para OldConf ig ento OldConf ig recebe o valor de N ewConf ig e v para o Passo 4. Caso contrrio, v para o Passo 5. Obs: Mantenha uma varivel BestConf ig que contm o valor da melhor soluo at o momento. Sempre que uma nova soluo for adotada para OldConf ig deve-se vericar se esta soluo melhor que a BestConf ig e

Descrio do Algoritmo ento, se for o caso, fazer BestConf ig receber o valor de OldConf ig . Passo 4. Faa o seguinte procedimento nExploitation vezes:

175

N ewConf ig = OldConf ig + [(U OldConf ig ) r (OldConf ig L ) (1 r)] N ewConf ig = L, seN ewConf ig < L N ewConf ig = U, seN ewConf ig > U onde : U = (1 + 0, 2r) OldConf ig L = (1 0, 2r) Oldconf ig (12.2.4) Caso o valor da funo objetivo para N ewConf ig seja menor que o valor da funo objetivo para OldConf ig ento OldConf ig recebe o valor de N ewConf ig . Sempre que uma nova soluo for adotada como OldConf ig deve-se vericar se esta soluo melhor que a BestConf ig e ento, se for o caso, fazer BestConf ig receber o valor de OldConf ig . Depois de repetido este procedimento nExploitation vezes, v para Passo 3. Passo 5. Calcule a probabilidade de espalhamento, pscattering , pscattering = 1 F (BestConf ig ) F (N ewConf ig ) (12.2.5)

Gere um nmero aleatrio r. Se pscattering for maior que r, ento OldConf ig recebe o valor de N ewConf ig e v para o Passo 4. Caso contrrio, v para o Passo 2. Ao trmino do PCA, a estimativa do mnimo da funo objetivo dado pela soluo BestConf ig . A verso cannica do PCA descrita acima, apesar da simplicidade, foi bem sucedida em aplicaes reais de engenharia [203, 205], onde superou o algoritmo gentico [110] e variantes, com larga margem.

12.2.2

Consideraes sobre novas verses do PCA

A partir da verso cannica do PCA descrita na seo anterior, novas verses do PCA vm sendo implementadas de modo a buscar um melhor desempenho. A hibridizao de mtodos estocsticos com mtodos determinsticos, na qual o mtodo estocstico desempenha apenas um pequeno nmero de iteraes de modo a encontrar uma estimativa inicial razovel para ser explorada pelo mtodo determinstico tem sido aplicada com sucesso

176

Algoritmo de Coliso de Partculas

[225, 233, 234, 185]. Assim, foi implementada uma verso hbrida do PCA com o conhecido mtodo de Levenberg-Marquardt (LM) [163, 218]. Esta verso hbrida foi capaz de obter resultados melhores com um esforo computacional muito menor [127, 128]. Na Subseo 3.4 feita uma descrio do mtodo LM. Outro objeto de estudo tem sido a tentativa de melhorar o mecanismo de busca local do PCA (Passo 3 do algoritmo descrito na seo 12.2.1), que muito simples [202]. Assim, em [204] o algoritmo determinstico NelderMead Simplex [180] foi utilizado para a busca local do PCA. De modo semelhante, em [128] foi utilizado o mtodo de Levenberg-Marquardt [163, 218], em [131] foi utilizado o Algoritmo de Otimizao por Enxame de Partculas (Particle Swarm Optimization, PSO) [23] e, recentemente, tem sido estudado o uso do algoritmo de busca direta de Hooke-Jeeves [111, 206]. Mais recentemente, em [160] foi implementada uma verso do PCA com processamento paralelo e em [130] foi implementada uma verso baseada em uma anlise de sensibilidade prvia, na qual apenas os dados com maior sensibilidade so utilizados. Algoritmo de coliso de mltiplas partculas A implementao desta nova verso baseada em mltiplas partculas estende o conceito bsico da aplicao de uma nica partcula para a explorao da totalidade do espao de buscas em um dado tempo total de iteraes. Nesta nova verso, utilizado um conjunto de n partculas explorando, de maneira independente, porm relativamente colaborativa, este mesmo espao de busca [160]. O algoritmo proposto para o algoritmo de coliso de mltiplas partculas, ou Multi-Particle Collision Algorithm (M-PCA), , em sua essncia, exatamente o mesmo do PCA cannico. Porm a introduo de n partculas efetuando a busca no mesmo espao de solues leva necessidade da implementao de um mecanismo de comunicao indireta entre as partculas, para que uma coordenao das atividades seja capacitada. Esta coordenao foi viabilizada atravs da implementao de uma tcnica de blackboard, onde o BestF itness, o melhor resultado obtido pela partcula do PCA agora seja atualizado de maneira constante, com a melhor posio dentre todas as partculas envolvidas no processo de busca. Ou seja, as partculas trabalham de maneira independente no processo de busca da soluo, porm no momento em que alguma partcula identica uma nova melhor posio, esta partcula escreve no blackboard do M-PCA para que as outras partculas tomem conhecimento deste novo valor, e ento os seus critrios de busca, tais como a denio de um novo pscattering , varivel em uso na funo de espalhamento e que leva em considerao o melhor tness

Aplicao ao Problema Inverso de Transferncia Radiativa

177

da melhor soluo atual, sejam baseados neste valor, denido como sendo o melhor mnimo atualmente em uso, e de conhecimento disseminado, pelo conjunto de partculas. A reduo de tempo proporcionada pelo M-PCA advm da capacidade de dividir o total de iteraes imposta ao algoritmo pelo nmero de partculas que atuaro de maneira conjunta no espao de busca, ou seja, para uma inicializao do PCA com 105 iteraes, uma instncia do M-PCA com 10 partculas ter o nmero de iteraes reduzidas para 104 , caso 100 partculas sejam usadas, 103 iteraes sero sucientes para um nmero equivalentes de avaliaes no espao de buscas. Quando uma anlise emprica da complexidade relativa execuo do algoritmo PCA cannico feita, pode-se vericar, segundo o trecho principal de seu cdigo fonte, que obtm-se uma complexidade O n2 , dada a existncia de dois laos aninhados. O algoritmo de mltiplas partculas M-PCA fora a insero de um novo lao, em um nvel superior aos laos existentes, o que leva a construo de um novo trecho principal, que possui agora complexidade O n3 . No momento da paralelizao do M-PCA se este lao for distribudo para n processadores, a complexidade do algoritmo retorna para O n2 , garantindo assim a reduo de sua complexidade.

12.3

Aplicao ao Problema Inverso de Transferncia Radiativa

Como no se tinha disponvel dados experimentais reais, dados experimentais sintticos foram gerados, usando Yi = Icalci Zexato + e r (12.3.6)

onde r um nmero aleatrio de uma distribuio gaussiana normal, i.e. com mdia zero e desvio padro unitrio, Zexato o vetor contendo os valores exatos das variveis que sero estimadas e e simula o desvio padro dos erros de medio. Este procedimento est descrito na Subseo 3.3. Para o caso de transferncia radiativa em um meio homogneo unidimensional, o nmero de dados experimentais utilizados em todos os resultados foi Nd = 20. Para o caso de transferncia radiativa em um meio heterogneo unidimensional em duas camadas, Nd = 40, o dobro do primeiro caso citado. Isso se deve presena de detectores internos na interface das duas camadas, para garantir a unicidade da soluo [231]. Para todos os casos apresentados nesta seo as intensidades das fontes de radiao externa foram consideradas como A1 = 1, 0 e A2 = 0, 0. Vide

178

Algoritmo de Coliso de Partculas

Captulos 2 e 3 para a descrio dos problemas diretos e dos problemas inversos considerados nesta seo. Todos os resultados foram gerados em uma mquina equipada com Processador AMD TurionT M 64 X2 Mobile 1, 6 GHz, 1, 37 GB de RAM.

12.3.1

Meio homogneo unidimensional

Conforme descrito no Captulo 3, o problema inverso de transferncia radiativa, tal como descrito na Subseo 2.2.1 e no Captulo 3, pode ser enunciado como: utilizando medidas experimentais Yi = 1, 2, . . . , Nd , deseja-se determinar os elementos do vetor de incgnitas Z denido como Z = {0 , , 1 , 2 }
T

(12.3.7)

onde 0 a espessura ptica do meio, o albedo de espalhamento simples, 1 e 2 as reetividades difusas das paredes internas do meio. Como consideramos o nmero de dados experimentais, Nd , maior que o nmero de incgnitas, Nu , i.e. Nd > Nu , formulamos o problema inverso implicitamente, como um problema de otimizao, no qual se deve minimizar a funo objetivo, dada por
Nd

Q Z =
i=1

Ii Z Yi

(12.3.8)

onde Ii Z representa os valores calculados para a radiao nos mesmos locais onde Yi medida. O objetivo do PCA estimar o vetor de propriedades radiativas, Z , de modo a minimizar a funo objetivo Q(Z ). O problema inverso de transferncia radiativa descrito com um maior nvel de detalhe no Captulo 3. Trs casos foram propositalmente escolhidos por apresentarem propriedades radiativas difceis de serem recuperadas pelo algoritmo de otimizao. Estes casos esto apresentados na Tabela 12.1. Propriedade radiativa Espessura tica, 0 Albedo de espalhamento, Reetividade difusa, 0 Reetividade difusa, 1 Caso 1 1, 0 0, 5 0, 1 0, 1 Caso 2 0, 5 0, 1 0, 1 0, 9 Caso 3 2, 0 0, 9 0, 5 0, 5

Tabela 12.1: Valores das propriedades radiativas a serem recuperadas.

Aplicao ao Problema Inverso de Transferncia Radiativa

179

O desvio padro dos erros de medio, e (vide equao (12.3.6)), recebeu os valores e = 0, 0005, 0, 0004 e 0, 004 para os Casos 1, 2 e 3, respectivamente, de modo que os erros so menores ou iguais a 5, 5%. O PCA foi congurado com MP CA = 200 e nExploitation = 500. Com esta congurao o PCA avalia, em mdia, 40.000 vezes a funo objetivo. Com exceo de 0 , temos um intervalo de busca de [0, 1] para todas as variveis, que representa, de fato, os limites fsicos para essas variveis. Para 0 foi considerado um espao de busca de [0, 3]. Na realidade, a espessura tica pode ser maior que o limite superior considerado, porm para 0 > 3 a radiao transmitida muito pequena, o que afeta a qualidade das estimativas obtidas. Para cada caso da Tabela 12.1 foram realizadas dez execues com o PCA. Nas Tabelas 12.2 ,12.3 e 12.4, a seguir, so apresentadas a melhor e a pior estimativa, Zbest e Zworst , respectivamente, a mdia e o desvio padro das 10 execues, Z e Z , respectivamente, e o valor da funo objetivo no nal da execuo, Q Z . Cada execuo levou, em mdia, 2h40min de tempo de processamento. 0 Zexato PCA 1, 0 1, 003 1, 004 1, 002 0, 006 0, 6% 0, 5 0, 515 0, 507 0, 498 0, 010 1, 9% 1 0, 1 0, 145 0, 116 0, 092 0, 032 34, 6% 2 0, 9 0, 901 0, 902 0, 899 0, 002 0, 3% Q Z eq. (12.3.8) 3, 80E 05 6, 44E 06

Zworst Zbest Z Z Z Z 100%

Tabela 12.2: Resultados obtidos com o PCA para o meio homogneo unidimensional - Caso 1. e = 0, 0005 (5, 5%).

Pode ser observado nas Tabelas 12.2 a 12.4 que o PCA foi capaz de obter boas estimativas para todos os casos considerados. Entretanto, observa-se nos Casos 1 e 2 que o desvio padro para a reetividade difusa 1 foram relativamente altos. Isso indica que, embora a mdia possa estar prxima do valor exato, as estimativas no so precisas. Isso era previsto, uma vez que a anlise de sensibilidade destes casos mostra grande diculdade de se estimar essa incgnita. No Caso 3, os desvios padro para todas as incgnitas, com exceo de 1 , foram maiores que nos Casos 1 e 2. A principal diculdade neste caso o alto valor da espessura tica, 0 , o que traz diculdades quando se quer

180 0 Zexato PCA 0, 5 0, 470 0, 499 0, 485 0, 029 6, 0%

Algoritmo de Coliso de Partculas 1 0, 1 0, 140 0, 124 0, 113 0, 077 47, 7% 2 0, 9 0, 906 0, 899 0, 904 0, 006 0, 7% Q Z eq. (12.3.8) 2, 22E 04 4, 18E 05

Zworst Zbest Z Z Z Z 100%

0, 1 0, 124 0, 115 0, 110 0, 010 9, 4%

Tabela 12.3: Resultados obtidos com o PCA para o meio homogneo unidimensional - Caso 2. e = 0, 0004 (5, 5%).

0 Zexato PCA 2, 0 2, 180 1, 952 2, 114 0, 159 7, 5%

0, 9 0, 920 0, 897 0, 907 0, 012 1, 4%

1 0, 5 0, 549 0, 495 0, 517 0, 032 6, 2%

2 0, 5 0, 440 0, 511 0, 488 0, 029 6, 0%

Zworst Zbest Z Z Z Z 100%

Q Z eq. (12.3.8) 1, 79E 03 2, 97E 04

Tabela 12.4: Resultados obtidos com o PCA para o meio homogneo unidimensional - Caso 3. e = 0, 004 (5, 5%).

considerar informaes da radiao transmitida na soluo do problema inverso.

12.3.2

Meio heterogneo unidimensional em duas camadas

No problema inverso de interesse nesta seo, previamente descrito na Subseo 2.2.2 e Captulo 3, deseja-se determinar os elementos do vetor de incgnitas Z , denido como Z = {s1 , ka1 , s2 , ka2 }
T

(12.3.9)

onde si so os coecientes de espalhamento e kai so os coecientes de absoro para as camadas i = 1, 2. Como consideramos o nmero de dados experimentais, Nd , maior que o nmero de incgnitas, Nz , i.e. Nd > Nz , formulamos o problema inverso

Aplicao ao Problema Inverso de Transferncia Radiativa

181

implicitamente, como um problema de otimizao, no qual se deve minimizar a funo objetivo, dada pela equao (12.3.8), onde Z dado pela equao (12.3.9) e Ii Z representa os valores calculados para a radiao nos mesmos locais onde Yi medida. Como caso teste para esse problema, foi considerado um meio composto por duas camadas diferentes, isto com as propriedades radiativas diferentes. Propriedade L1 (cm) L2 (cm) s1 cm1 ka1 cm1 s2 cm1 ka2 cm1 1 2 3 4
tes.

Valor 0, 8 3, 2 0, 8 0, 5 0, 9 0, 3 0, 1 0, 0 0, 0 0, 6

Tabela 12.5: Propriedades do meio participante contendo duas camadas diferen-

Para este caso, o domnio de busca foi considerado como [0, 1] para todas as propriedades radiativas. Na Tabela 12.6, a seguir, so mostrados os resultados obtidos pelo PCA congurado com nP CA = 100, nExploitation = 100 para sete execues do algoritmo.
nP CA = 100, nExploitation = 100 Exec. 1 2 3 4 5 6 7 100% s1 cm1 0, 860 0, 781 0, 701 0, 841 0, 909 0, 696 0, 762 0, 793 0, 075 9, 4% ka1 cm1 0, 547 0, 481 0, 504 0, 566 0, 524 0, 473 0, 480 0, 511 0, 033 6, 6% s2 cm1 0, 962 0, 917 0, 976 0, 836 0, 886 0, 883 0, 813 0, 896 0, 056 6, 2% ka2 cm1 0, 321 0, 299 0, 307 0, 305 0, 340 0, 281 0, 315 0, 310 0, 017 5, 5% Q Z Tempo eq. (12.3.8) (min) 2, 12E 06 18, 1 5, 41E 07 17, 1 1, 88E 06 19, 2 4, 21E 06 18, 8 1, 17E 06 18, 2 1, 12E 05 18, 4 2, 01E 06 18, 6

Tabela 12.6: Resultados obtidos com o PCA para o meio heterogneo unidimensional em duas camadas. Foram considerados at 5% de erro no dado experimental. Zexato = {0, 8; 0, 5; 0, 9; 0, 3} cm1 .

182

Algoritmo de Coliso de Partculas

Dos resultados apresentados na Tabela 12.6, pode se observar que o PCA foi capaz de obter boas estimativas para as propriedades radiativas tambm para o problema em um meio heterogneo unidimensional em duas camadas. importante ressaltar, mais uma vez, que neste caso detetores internos na interface foram utilizados de modo a garantir a unicidade da soluo [231].

12.4

Consideraes nais

O futuro do PCA parece residir em duas vertentes: na paralelizao, seguindo o trabalho pioneiro em [160] e na hibridizao [128, 127, 131, 204]. No futuro, pode ser testado um esquema paralelo do PCA associado a mecanismos de otimizao determinsticos. Outro possvel melhoramento a introduo de mecanismos de perturbao estocsticas mais inteligentes, talvez com heursticas embutidas para problemas especcos.

Captulo 13

Evoluo Diferencial (Dierential Evolution )


Fran Srgio Lobato Valder Steen Jr. Antnio Jos da Silva Neto

13.1

Motivao e Histrico do Mtodo

O algoritmo de Evoluo Diferencial (Dierential Evolution, DE) foi proposto em 1995 por Storn e Price [245] com o objetivo de estimar os parmetros do Polinmio de Chebychev. A principal motivao para o seu desenvolvimento foi a lenta taxa de convergncia e a diculdade na determinao dos parmetros exibida pelo algoritmo denominado Recozimento Gentico (RG) (Genetic Annealing Algorithm ), proposto por Price em 1994 e publicado no Dr. Dobbs Journal (DDJ). O Recozimento Gentico uma abordagem de otimizao combinatria baseada numa populao inicial e que alia caractersticas dos Algoritmos Genticos (Genetic Algorithms, GA) e do Algoritmo de Recozimento Simulado (Simulated Annealing, SA). Com as diculdades encontradas durante a resoluo do problema de estimativa de parmetros, Storn decidiu modicar o algoritmo de RG para trabalhar com codicao de ponto utuante e com operaes aritmticas. Neste sentido, ele acabou por desenvolver o operador de mutao diferencial, no qual o algoritmo de DE baseado. Da em diante, foi dado um passo a mais at se chegar primeira verso do algoritmo de DE. Posteriormente, Storn sugeriu diferentes conguraes para a determinao de 183

184

Evoluo Diferencial

candidatos em potencial, de tal forma a melhor acomodar a sua arquitetura em mquinas paralelas [192]. Outro aspecto, segundo Price, Storn e Lampinen [192], que motivou o desenvolvimento do algoritmo de DE, foi o tratamento de problemas reais atravs de uma abordagem que fosse conceitualmente simples e eciente ao mesmo tempo. Essa abordagem, segundo aqueles autores, deveria ser capaz de ultrapassar obstculos, tais como: tratamento de funes no diferenciveis, descontnuas ou at mesmo desconhecidas a priori; lidar com funes no lineares com grande potencial de apresentarem multi-modalidade; de trabalhar com variveis de projeto discretas, contnuas, inteiras e/ou binrias ao mesmo tempo, sem ter que reestruturar o problema original conforme ocorre quando mtodos clssicos so utilizados. A apresentao do algoritmo de DE no meio cientco foi realizada no ICEO - International Contest on Evolutionary Optimization, no qual cou demonstrada a sua simplicidade conceitual e o seu desempenho em uma srie de funes matemticas com diferentes graus de diculdade e complexidade. Essa primeira apario foi consolidada com a publicao do artigo intitulado Dierential Evolution - A Simple and Ecient Heuristic for Global Optimization over Continuous Spaces no Journal of Global Optimization, em 1997 [192]. A partir da publicao deste trabalho, a comunidade cientca passou a se interessar pelo algoritmo de DE. Neste sentido, hoje em dia, podese encontrar inmeras aplicaes da tcnica em vrios campos da cincia. Na soluo de problemas inversos encontra-se aplicao na estimativa de parmetros cinticos no processo de fermentao alcolica [259, 150]; na determinao de propriedades radiativas em problemas de transferncia de calor por radiao [155, 154]; na estimativa de parmetros cinticos em um secador rotatrio [149]; na estimativa de parmetros de um ltro adaptativo utilizado como ferramenta para controle de qualidade em linhas de montagem de cmbios automotivos [151]; na estimativa da difusividade trmica de frutas [162]. Na rea de controle timo, pode-se mencionar a determinao do perl timo de alimentao de substrato em um fermentador de batelada alimentada [119] e a resoluo de problemas de controle timo clssicos com restries de desigualdade [152]. Aplicaes em robtica podem ser encontradas no trabalho de Oliveira [184]. No contexto multi-objetivo, destacamse trabalhos como a otimizao estrutural de vigas [147], a determinao do perl timo de alimentao de substrato e dos eventos em um problema de controle timo com ndice utuante [153], a otimizao das condies operacionais de um reator industrial utilizado para a produo de estireno [12] e o uso de tcnicas de meta-modelagem associada ao enfoque multiobjetivo para o tratamento de um problema de interao uido-estrutura

Descrio do Algoritmo

185

[148]. Vrias outras aplicaes do algoritmo de DE podem ser encontradas em [148, 192] e no site: http://www.icsi.berkeley.edu/storn/code/html. As principais vantagens do algoritmo de DE so: sua simplicidade conceitual, facilidade de implementao, robustez e tempo de processamento satisfatrio [11, 12, 192, 259]. Neste sentido, alguns autores [11, 259] acreditam que o desenvolvimento e o aprimoramento do algoritmo de DE logo iro superar os atuais GAs em termos de convergncia, no nmero de avaliaes da funo objetivo e no tempo de processamento. A prxima seo apresenta a fundamentao terica do algoritmo de DE.

13.2

Descrio do Algoritmo

O algoritmo de DE um mtodo heurstico, baseado numa populao de candidatos potenciais, para a resoluo de problemas de otimizao. A principal ideia por trs desta tcnica o esquema proposto para atualizao do vetor de variveis de projeto de uma populao. Basicamente, a diferena ponderada entre dois indivduos adicionada a um terceiro indivduo. O indivduo gerado atravs deste esquema avaliado pela funo objetivo e pode inclusive substituir indivduos mal sucedidos nas geraes seguintes. Desta forma, nenhuma distribuio de probabilidade em separado deve ser usada, o que torna este esquema completamente auto-ajustvel. Em outras palavras, pode-se dizer que o algoritmo de DE baseia-se na realizao de operaes vetoriais para a gerao de candidatos potenciais. Assim, a tcnica de DE reconhecida como uma tcnica puramente estrutural, o que a torna diferente em relao s outras tcnicas evolutivas tratadas neste livro, j que essas tm fundamentao terica inspirada na natureza. De maneira geral, o algoritmo de DE apresenta as seguintes operaes: a inicializao da populao, o operador de mutao, o operador de cruzamento, o operador de seleo e o critrio de parada do algoritmo. A seguir so descritos, com detalhes, cada uma destas operaes.

13.2.1

A Inicializao do Algoritmo de DE

Assim como em outras estratgias evolutivas, o processo de inicializao da populao no algoritmo de DE consiste na gerao de indivduos de forma aleatria. Para tanto, necessita-se conhecer apenas o domnio de cada varivel de projeto. A partir da, geram-se nmeros aleatrios que sero aplicados a esse intervalo, obtendo-se assim um vetor de indivduos da populao, como mostrado a seguir xi,j = xi,L + rand (xi,U xi,L ) (13.2.1)

186

Evoluo Diferencial

onde xi,L e xi,U so os limites inferiores e superiores das j -simas variveis de projeto, respectivamente e rand um gerador de nmeros aleatrios entre 0 e 1. Na literatura so encontrados outros mecanismos para a inicializao da populao, como, por exemplo, o uso de distribuio Gaussiana, onde so gerados indivduos com mdia e desvio padro denidos pelo usurio para essa nalidade [3].

13.2.2

O Operador de Mutao

Uma vez inicializado o processo evolutivo, o algoritmo de DE realiza as operaes de mutao e recombinao para a gerao de uma nova populao com N P indivduos. Em particular, o operador de mutao diferencial adiciona um vetor referncia, escolhido aleatoriamente na populao, a um vetor diferena obtido a partir de outros dois vetores tambm escolhidos aleatoriamente na populao. A equao (13.2.2) mostra como essa combinao realizada para gerar o novo vetor (candidato) vi,g , vi,g = xr0,g + F (xr1,g xr2,g ) (13.2.2)

O escalar F , denominado taxa de perturbao, um nmero real que controla a magnitude do vetor diferena obtido em cada operao aritmtica realizada. O vetor referncia, xr0,g , geralmente escolhido aleatoriamente na populao, apesar de poder ser denido de outras formas, como, por exemplo, usando o melhor indivduo da gerao anterior (veja a Tabela 13.1). De maneira similar, os vetores xr1,g e xr2,g so tambm escolhidos de forma aleatria na populao. A Figura 13.1 mostra como esses trs vetores so empregados para gerar o vetor vi,g , para o caso de um espao de projeto bidimensional. Escolhidos xr1,g e xr2,g , realiza-se a diferena entre esses vetores. Essa diferena ponderada pela taxa de perturbao F , gerando assim um vetor diferena, o qual adicionado ao vetor referncia xr0,g para formar um novo candidato em potencial, vi,g . Como dito anteriormente, o vetor referncia xr0,g pode ser escolhido aleatoriamente na populao ou pode ser denido segundo um outro critrio. A Tabela 13.1 apresenta outros mecanismos propostos por Storn e Price [192]. A conveno utilizada pelos autores DE/x/y/z, onde x representa o vetor que ser perturbado. Por exemplo, optando-se por rand, o vetor que ser perturbado escolhido aleatoriamente na populao. y o nmero de pares de vetores que so considerados durante a perturbao e z o tipo de cruzamento usado para a gerao do candidato, bin no caso binomial e

Descrio do Algoritmo

187

x1
vi ,g = xr 0,g + F( xr 1,g - xr 2,g) xr1,g xr 0,g
F( xr 1,g - xr 2,g)

xr 2,g

x0
Figura 13.1: Mutao Diferencial: o vetor diferencial ponderado por F , F (xr1,g xr2,g ), adicionado ao vetor referncia, xr0,g para gerar um novo candidato em potencial vi,g .
Representao j j xj +1 =xj best + F (x x ) j j +1 j j x =x + F (x x ) j j j j xj +1 =xj old + F (xbest xold ) + F (x x ) j j j j j j +1 x =xbest + F (x x ) + F (x x ) j j j j xj +1 =xj + F (x x ) + F (x x ) j j j j +1 x =xbest + F (x x ) j j xj +1 =xj + F (x x ) j j j j j +1 x =xold + F (xbest xold ) + F (xj x ) j j j j xj +1 =xj + F ( x x ) + F ( x x ) best j j j j xj +1 =xj + F (x x ) + F (x x ) Mecanismo de Mutao DE/best/1/exp DE/rand/1/exp DE/ran-to-best/2/exp DE/best/2/exp DE/rand/2/exp DE/best/1/bin DE/rand/1/bin DE/rand-to-best/2/bin DE/best/2/bin DE/rand/2/bin

1 2 3 4 5 6 7 8 9 10

Tabela 13.1: Representao dos mecanismos de mutao no algoritmo de DE


[192].

exp no caso exponencial. Os subscritos , , , , e so ndices para identicar indivduos escolhidos aleatoriamente na populao. xbest o melhor indivduo da populao na gerao anterior e xold um indivduo, escolhido aleatoriamente da populao, na gerao anterior. Recentemente, novas estratgias para a representao do mecanismo de mutao no algoritmo de DE tm sido propostas. Dentre estas, pode-se citar o trabalho de Fan e Lampinen [83]. Em tal abordagem, fatores de ponderao para cada um dos vetores que sero utilizados para a gerao do novo indivduo so calculados a partir dos indivduos da gerao corrente. Esse mecanismo foi testado com sucesso, em termos de tempo de processamento, quando comparado com os mecanismos originais do algoritmo de DE em problemas inversos [8].

188

Evoluo Diferencial

13.2.3

O Operador de Cruzamento

Para complementar a operao de mutao, o algoritmo de DE emprega o operador de cruzamento. Nesta operao, o vetor vi,g gerado anteriormente pode ou no ser aceito na prxima gerao de acordo com a seguinte relao: ui,g = vi,g xi,g se rand Cr ou j = jrand caso contrrio (13.2.3)

onde Cr denominada probabilidade de cruzamento denida pelo usurio e contida no intervalo [0, 1]. Esse parmetro controla as informaes dos pais que sero transmitidas aos lhos. Para determinar qual a contribuio de um determinado vetor gerado, o cruzamento compara Cr com o gerador de nmeros aleatrios rand. Se o nmero aleatrio gerado menor ou igual a Cr, o vetor vi,g (com posio jrand) aceito, caso contrrio, o vetor xi,g mantido na populao atual. A Figura 13.2 mostra os possveis vetores ui,g e ui,g gerados via cruzamento com os vetores vi,g e xi,g .

x1

u'i ,g vi ,g = ui ,g

xi ,g u''i ,g xr1,g xr 0,g


F (xr 1,g - xr 2,g)

xr 2,g

x0
Figura 13.2: Possveis vetores formados (ui,g , ui,g ) quando xi,g e vi,g so uniformemente cruzados.

13.2.4

O Operador de Seleo

Se o vetor ui,g tem melhor valor de funo objetivo (fobj ) com relao ao vetor xi,g , ele o substitui na prxima gerao, caso contrrio, xi,g mantido na populao por mais uma gerao como mostrado a seguir: xi,g+1 = ui,g xi,g se fobj (ui,g ) fobj (xi,g ) caso contrrio (13.2.4)

Descrio do Algoritmo

189

Uma vez completado o processo de atualizao da populao que ser considerada na prxima gerao, todo o processo descrito acima repetido at que um determinado critrio de parada seja satisfeito.

13.2.5

O Critrio de Parada

O principal critrio de parada utilizado nos mtodos evolutivos o nmero mximo de geraes, denido previamente pelo usurio. Todavia, outros mecanismos podem ser utilizados para nalizar o processo evolutivo, dentre os quais pode-se citar [192]: o tempo de processamento, o nmero de avaliaes da funo objetivo, o uso de um valor de referncia obtido da literatura para essa nalidade e o monitoramento humano. Em qualquer uma destas estratgias procura-se obter convergncia custa de baixo esforo computacional, mensurado pelo nmero de avaliaes da funo objetivo. Apresentados e discutidos os operadores do algoritmo de DE, a Figura 13.3 mostra o uxograma geral do mtodo [192].
Definir os parmetros do algoritmo de ED (tamanho da populao, operador de cruzamento, taxa de perturbao, etc.) Gerar a populao inicial aleatoriamente dentro do domno das variveis de projeto Avaliar a funo objetivo e classificar a populao segundo o esse critrio Aplicar o operador de mutao Aplicar o operador de cruzamento (aps esses dois passos, uma nova populao gerada) Processo de seleo (substituir os piores indivduos da populao em termos do valor da funo objetivo) Critrio de Parada Resultados

Figura 13.3: Fluxograma do algoritmo de Evoluo Diferencial. Com relao escolha dos parmetros do algoritmo de DE, Storn e Price

190

Evoluo Diferencial

[192] aconselham o uso dos seguintes valores: nmero de indivduos da populao como sendo um valor entre 5 e 10 vezes o nmero de variveis de projeto, taxa de perturbao F entre 0, 2 e 2, 0 e probabilidade de cruzamento Cr entre 0, 1 e 1, 0. Com relao escolha da estratgia DE/x/y/z, Angira e Babu [7], Babu e Anbarasu [11] e Babu et al. [12] constataram em seus trabalhos que os melhores resultados, em termos de convergncia e diversidade para os problemas estudados por esses autores, foram obtidos quando se utiliza a estratgia DE/rand/1/bin. Em contrapartida, Oliveira [184] vericou em seu trabalho que a escolha da estratgia pouco inuenciou os resultados dos casos analisados. evidente que uma concluso denitiva sobre a inuncia da escolha da estratgia precisa ser melhor investigada para uma gama de estudos de caso que representem um domnio importante de problemas de interesse. Alm disso, deve ser ressaltado que, para um determinado problema, podem ser escolhidos outros valores para cada um desses parmetros. Uma vez destacada a fundamentao terica do algoritmo de DE e as principais caractersticas dos seus operadores, cabe ressaltar que no site http://www.icsi.berkeley.edu/storn/code/html pode ser feito o download do algoritmo de DE implementado em vrias linguagens de programao, tais como C++, FORTRAN 90, SCILAB , MATLAB e MATHEMATICA , entre outras.

13.3

Aplicao ao Problema Inverso de Transferncia Radiativa

Com o sucesso do algoritmo de DE observado em vrias aplicaes em reas distintas da cincia e da tecnologia, a sua utilizao na resoluo de problemas inversos se deu naturalmente. Neste sentido, esta seo dedicada resoluo do problema inverso de transferncia radiativa usando o algoritmo de DE. So tratados dois estudos de caso: um com um meio participante heterogneo unidimensional em duas camadas [228, 50, 155], e outro considerando um meio participante heterogneo unidimensional em duas camadas [232, 154]. Os problemas diretos e os problemas inversos correspondentes so descritos, respectivamente, nos Captulos 2 e 3. Antes da resoluo propriamente dita dos estudos de caso, deseja-se elucidar alguns pontos referentes a estas aplicaes. Como no so conhecidos os dados experimentais do presente fenmeno, so admitidos valores para as variveis de projeto a serem determinadas a m de resolver o problema direto. Assim, conhecido o perl da intensidade da radiao em alguns pontos do domnio e com o acrscimo de um rudo previamente denido pelo usurio, denem-se os dados experimentais sintticos que sero utilizados neste

Aplicao ao Problema Inverso de Transferncia Radiativa

191

captulo. Esse acrscimo de rudo ao ponto calculado procura reproduzir os erros de medio que so inerentes a qualquer procedimento experimental. Desse modo, tal aspecto ser considerado neste trabalho atravs da seguinte relao: Yi = Iexpi = Icali + li (13.3.5)

onde Ical so os valores calculados para as intensidades da radiao com os valores exatos das incgnitas que se deseja determinar considerados em cada um dos estudos de caso, li um nmero aleatrio entre -1 e 1 e o desvio padro do erro associado ao procedimento experimental, tal como o apresentado na equao (3.3.6). Para a resoluo do problema direto ser considerado, em ambos os estudos de caso, o Mtodo da Colocao Normal com 10 pontos [255, 269]. O termo da integral encontrado do lado direito de cada uma das equaes (2.2.6) e (2.2.9, 2.2.10) sero substitudos pela formula de Quadratura de Gauss-Legendre [269]. Desse modo, o problema integro-diferencial original transformado em um sistema de Equaes Diferenciais Ordinrias (EDOs) atravs do uso de aproximaes polinomiais para as variveis dependentes.

13.3.1

Meio homogneo unidimensional

Este primeiro estudo de caso considera uma placa plana feita de um material espalhador isotrpico, cujas propriedades no dependem do comprimento de onda da radiao, as superfcies no reetem radiao e esto sujeitas a radiao externa isotrpica. O modelo que descreve esse fenmeno foi apresentado na Subseo 2.2.1. A Formulao do Problema Inverso O problema inverso formulado implicitamente como um problema de otimizao no qual se busca minimizar a soma dos resduos quadrados entre os valores calculados e os valores experimentais da intensidade da radiao, conforme representado na equao (3.2.4). A funo objetivo aqui reescrita da seguinte forma:
n 2n

fobj =
i=1,i <0

(Ical (i , 0)Iexp (i , 0))2 +


j =1,k n

(Ical (j , k )Iexp (j , k ))2 +

+
j =1,j >0

(Ical (j , 0 ) Iexp (j , 0 ))2

(13.3.6)

192

Evoluo Diferencial

onde Ical e Iexp so as intensidades calculadas e experimentais nas superfcies de contorno = 0 e = 0 , e nos pontos pertencentes ao conjunto (pontos internos no domnio de ). Assim, o objetivo a que se prope a determinao dos valores de , 0 , A1 e A2 que minimizam o funcional fobj . O vetor de incgnitas corresponde, portanto, quele representado na equao (3.2.2). Para a discretizao da varivel espacial , so utilizados os seguintes valores: {-0,9983 -0,9830 -0,9426 -0,8765 -0,7864 -0,6750 -0,5451 -0,4003 -0,2446 -0,0823 0,0823 0,2446 0,4003 0,5451 0,6750 0,7864 0,8765 0,9426 0,9830 0,9983} [50]. Para se comparar a qualidade da soluo obtida pelo algoritmo de DE ser utilizado o algoritmo de Recozimento Simulado (Simulated Annealing, SA), com os parmetros dados na Tabela 13.2. Parmetro
Nmero de iteraes/geraes Tamanho da populao Probabilidade de cruzamento Taxa de Perturbao Estratgia Nmero de Temperaturas Nmero de iteraes para cada temperatura Temperatura Inicial/Final Estimativa Inicial

SA
100 10

DE
100 10 0,5 0,8 DE/rand/1/bin

50 10 0,5/0,01 [0,25 4,5 0,5 0,5]

aleatria

Tabela 13.2: Parmetros utilizados para a resoluo do estudo de Caso 1. Neste estudo, foram admitidos os seguintes valores para as variveis de projeto para a determinao dos dados experimentais sintticos: = 0, 1; 0 = 5, 0; A1 = 1 e A2 = 0. O espao de projeto para as variveis , 0 , A1 e A2 assim denido: 0< <1, 4< 0 <6, 0< A1 <1,5 e 0< A2 <1. Neste caso, pertence ao conjunto {1 2 3 4}, que so os denominados detetores internos, considerados no trabalho com o objetivo de evitar as diculdades relacionadas no-unicidade de soluo. A Tabela 13.3 apresenta os resultados obtidos pelos algoritmos evolutivos sem rudo ( = 0) e com rudo ( = 0, 005, o que representa um erro menor que 5%), vide equao (13.3.5). Nesta tabela, N F o nmero mdio de avaliaes da funo objetivo e cputime o tempo mdio de execuo do algoritmo em minutos utilizando um microcomputador PENTIUM IV com 3,2 GHz e 2 GB de memria RAM. Deve-se destacar que os algoritmos foram implementados em ambiente MATLAB e que cada um foi executado 10 ve-

Aplicao ao Problema Inverso de Transferncia Radiativa

193

zes para a obteno dos valores mdios apresentados nesta tabela. Tambm so apresentados o melhor (best ) e o pior (worst ) resultados obtidos.
0,1 =0 Pior Mdia Melhor Pior Mdia Melhor Pior =0 Mdia Melhor Pior Mdia Melhor 0,1024 0,1004 0,0998 0,0978 0,0984 0,0983 0,0997 0,0998 0,0994 0,0929 0,0971 0,0987

0
5,0 4,9982 4,9976 5,0036 4,9438 4,9470 4,9494 5,0097 4,9981 4,9956 4,9487 4,9256 4,9390

A1
1,0 0,9988 0,9992 1,0008 0,9844 0,9847 0,9850 1,0026 0,9995 0,9988 0,9789 0,9848 0,9841

A2
0,0 0,0013 0,0000 0,0000 0,0007 0,0008 0,0010 0,0004 0,0003 0,0005 0,0009 0,0005 0,0004

fobj eq. (13.3.6)


6,35E 06 2,61E 06 1,18E 07 8,03E 04 8,03E 04 8,03E 04 8,64E 07 7,72E 07 7,16E 07 9,47E 03 8,09E 03 8,06E 04

DE

=0,005

SA

=0,005

N F =1010, cputime=21,3065 min N F =5348, cputime=57,4895 min

Tabela 13.3: Resultados obtidos para o Caso 1 - meio homogneo unidimensional.


N F o nmero mdio de avaliaes da funo objetivo.

A Figura 13.4 apresenta os valores calculados para a intensidade da radiao usando os melhores resultados obtidos para o problema inverso pelo algoritmo SA e pelo algoritmo DE.

13.3.2

Meio heterogneo unidimensional em duas camadas

O prximo estudo de caso considera um meio participante com duas camadas sujeito radiao externa incidente em ambos os lados conforme descrito na Subseo 2.2.2.

A Formulao do Problema Inverso A funo objetivo a ser minimizada neste caso dada por

194

Evoluo Diferencial

0,045 0,040 0,035 0,030

I( , )

0,025 0,020 0,015 0,010 0,005 0,000 -1,0 -0,8 -0,6 -0,4 -0,2 0,0 0,2 0,4 0,6 0,8 1,0
Experimental ( = 0)

Evoluo Diferencial Recozimento Simulado

Figura 13.4: Intensidade da Radiao para =0,1, 0 =5,0, A1 =1 e A2 =0.

fobj = + +

n i=1,i <0 (Ical (i , 0) 2n j =1,x (Ical (j , x)

Iexp (i , 0))2 + (13.3.7)

Iexp (j , x))2 +

n j =1,j >0 (Ical (j , L1

+ L2 ) Iexp (j , L1 + L2 ))2

onde Ical e Iexp so as intensidades calculadas e experimentais nas superfcies de contorno x = 0 e x = L1 + L2 , e nos pontos pertencentes ao conjunto ({0,4 0,8 1,2 1,6 2 2,4 2,8 3,2 3,6}). O objetivo a determinao dos valores de s1 , ka1 , s2 e ka2 que minimizam o funcional fobj . O vetor de incgnitas neste caso corresponde, portanto, quele representado na equao (3.2.3). No presente estudo, so usados os seguintes parmetros no algoritmo de DE: 10 indivduos, 100 geraes, taxa de perturbao e probabilidade de cruzamento iguais a 0.8 e a estratgia DE/rand/1/bin para a gerao de candidatos em potencial. Para comparar os resultados obtidos via algoritmo de DE sero utilizados os resultados obtidos por Soeiro e Silva Neto [232]. Estes autores usaram as seguintes tcnicas: Recozimento Simulado (SA), o Mtodo de Levenberg-Marquardt (LM) e um hbrido envolvendo o Recozimento Simulado e Levenberg-Marquardt (SA-LM). No algoritmo de SA foram usados os seguintes parmetros: T0 = 5, 0 (temperatura inicial), rt = 0, 75 (taxa de resfriamento), NS = 20 (nmero de temperaturas), Nt = 5 (nmero de vezes que o procedimento repetido antes da tempera-

Consideraes Finais

195

tura ser reduzida), = 106 (tolerncia). Na abordagem hbrida os autores usaram trs ciclos do algoritmo de SA para gerar uma estimativa inicial para o mtodo determinstico (LM). Alm disso, so considerados f1 () = 0, 3 e f2 () = 1, 0 (vide equaes (2.2.9b) e (2.2.10c)). As propriedades consideradas no presente estudo de caso para a resoluo do problema direto so L1 = 0, 8 cm; L2 = 3, 2 cm; s1 = 0, 8 cm1 ; ka1 = 0, 5 cm1 ; s2 = 0, 9 cm1 ; ka2 = 0, 3 cm1 ; 1 = 0, 1; 2 = 0, 0; 3 = 0, 0 e 4 = 0, 6. Esta situao corresponde a duas camadas adjuntas com as seguintes propriedades radiativas adimensionais: 1 = 0, 61, 2 = 0, 75, 01 = 1, 04 e 02 = 3, 84. Neste caso, o seguinte espao de projeto denido: 0, 4 < s1 < 1, 2; 0 < ka1 < 1, 0, 4 < s2 < 1, 5 e 0 < ka2 < 1. Inicializando os algoritmos T = de SA e de LM com a seguinte estimativa inicial {s 1 ; ka1 ; s2 ; ka2 } T {0, 18; 0, 93; 0, 30; 0, 81} , o mtodo de LM no converge, para os dados sem rudo (e = 0) (ver a Tabela 13.4). Por outro lado, o algoritmo SA capaz de estimar os parmetros. J a tcnica hbrida SA-LM e o algoritmo DE conseguem encontrar os valores exatos para os parmetros. Contudo, o algoritmo DE, usando detetores internos (DI), usa um nmero menor de avaliaes da funo objetivo (1010) quando comparado com os algoritmos SA e SA-LM (23601). s1 (cm1 ) 0,8 0,1 0,802 0,799 0,800 ka1 (cm1 ) 0,5 0,1 0,501 0,499 0,499 s2 (cm1 ) 0,9 0,1 0,898 0,900 0,899 ka2 (cm1 ) 0,3 0,1 0,299 0,300 0,300 fobj eq. (13.3.7) 1,12E 01 1,52E 08 5,38E 28 2,03E 09 DI No No No Sim

Exato LM(a) SA(b) SA-LM(c) DE(d)

Tabela 13.4: Caso 2: Dados sem rudo (e = 0). Meio heterogneo unidimensional em duas camadas. DI signica detetores internos. Na Tabela 13.5, quando rudo acrescentado (3% e 5%), o algoritmo LM tambm no converge. Pode-se observar que o hbrido SA-LM consegue obter boas estimativas para erros de 3% nos dados experimentais, mas no converge para erros de 5% sem o uso de detetores internos e de boas estimativas iniciais para os valores dos parmetros. Para ambos os casos com rudo, o algoritmo DE consegue obter bons resultados quando detetores internos so usados. A Figura 13.5 apresenta os resultados para a intensidade da radiao calculada usando os valores das propriedades radiativas obtidas com a soluo do problema inverso para dados experimentais sem rudo.

196 s1 (cm1 ) Exato LM SA-LM DE Exato LM SA-LM SA-LM DE 0,8 2,65 0,842 0,800 0,8 0,0 0,519 0,793 0,794 ka1 (cm1 ) 0,5 1,56 0,526 0,499 0,5 0,0 0,346 0,498 0,497 s2 ka2 (cm1 ) (cm1 ) Rudo (3%) 0,9 0,3 0,1217 0,1187 0,879 0,294 0,898 0,299 Rudo (5%) 0,9 0,3 115,31 115,51 0,995 0,331 0,894 0,297 0,895 0,298

Evoluo Diferencial fobj eq. (13.3.7) 6,46E-02 1,44E-05 3,59E-05 1,40 5,19E-05 8,96E-05 2,15E-04 DI No No Sim No No Sim Sim

Tabela 13.5: Caso 2 - meio heterogneo unidimensional em duas camadas. Dados


experimentais com rudo. DI signica detetores internos.

13.4

Consideraes Finais

Como pode ser observado neste captulo, o algoritmo de DE se congura como uma alternativa bastante interessante para o tratamento de problemas inversos de transferncia radiativa com diferentes graus de complexidade e diculdade. Nas aplicaes apresentadas, o algoritmo de DE se mostrou eciente quando comparado com outras tcnicas clssicas e heursticas, alm de ser vericada uma reduo no nmero de avaliaes da funo objetivo quando comparado com o algoritmo de SA. Esta reduo um fator muito importante, j que esse o critrio mais utilizado pela literatura especializada para fazer comparao entre os inmeros algoritmos heursticos que vm sendo propostos.

Consideraes Finais

197

0,26 0,24 0,22 0,20

x=L
Dados Experimentais Evoluo Diferencial

+L

I (x , )

0,18 0,16 0,14 0,12 0,10 0,08

x=0

-1,0 -0,8 -0,6 -0,4 -0,2

0,0

0,2

0,4

0,6

0,8

1,0

Figura 13.5: Intensidade da radiao para o meio heterogneo unidimensional em


duas camadas. dados experimentais e valores calculados utilizando as estimativas para as propriedades radiativas obtidas com a soluo do problema inverso.

198

Evoluo Diferencial

Captulo 14

Consideraes Finais
Antnio Jos da Silva Neto Jos Carlos Becceneri Ao se concluir a leitura de um livro que relata os resultados obtidos por um conjunto de pesquisadores que vm trabalhando j h algum tempo na aplicao de tcnicas de otimizao a problemas inversos em uma determinada classe de problemas, antecipamos que surja naturalmente para o leitor a pergunta sobre qual seria o melhor mtodo a aplicar. Obviamente no existe um mtodo que seja o melhor para qualquer problema, e nem mesmo para problemas dentro de uma mesma classe. Somente para citar um exemplo, o prprio avano da computao torna atraentes hoje mtodos que anteriormente eram inviveis devido ao elevado esforo computacional requerido. A experincia dos autores tem levado observao de que uma estratgia promissora aquela que emprega uma hibridizao de mtodos, buscando aproveitar as melhores caractersticas de cada mtodo envolvido. Esta seria a nossa melhor aposta. Terminado este trabalho, j estamos buscando testar novas metaheursticas, como por exemplo aquelas que consideram vermes luminosos [140], abelhas [2], dentre muitos outros. a eterna curiosidade humana, que leva sempre busca por algo novo e que potencialmente permita se fazer algo melhor.

199

200

Consideraes Finais

Bibliograa
[1] E. Aarts e J. Korst, Simulated Annealing and Boltzmann Machines, John Wiley and Sons Editors, 1989. [2] H. A. Abbass, MBO: Marriage in Honey Bees Optimization, A Haplometrosis Polygynous Swarming Approach. Proceedings of the IEEE Congress on Evolutionary Computation, (2001),207214. [3] H. A. Abbass, R. Sarker e C. Newton, PDE: A pareto-frontier dierential evolution approach for multi-objective optimization problems. Proceedings of the 2001 Congress on Evolutionary Computational, (2001). [4] M. Abramowitz e I.A. Stegun (Ed.), Handbook of Mathematical Functions, Dover Publications, Nova York, 1970. [5] B. T. Abreu, E. Martins e F. L. de Sousa, Generalized Extremal Optimization: a competitive algorithm for test data generation, Anais do XXI Simpsio Brasileiro de Engenharia de Software, 15-19 de outubro, Joo Pessoa, Brasil, 2007. [6] D. H. Ackley, G. E. Hinton e T. J. Sejnowski, A Learning Algorithm for Boltzmann Machines, Cognitive Science, 9 (1985), 147-169. [7] R. Angira e B. V. Babu, Non-dominated sorting dierential evolution (NSDE): An extension of dierential evolution for multiobjective optimization. Proceedings of the 2nd Indian International Conference on Articial Intelligence. India: IICAI-2005. [8] R. Angira e A. Santosh, Optimization of dynamic systems: a trigonometric dierential evolution approach, Computers and Chemical Engineering, 31 (2007), 1055-1063. 201

202 [9] M. Arenales, V. Armentano, R. Morabito e H. Yanasse, Pesquisa Operacional para cursos de Engenharia. Elsevier Editora Ltda. Ed. 2006. [10] S. Arturo, The Importance of Being Fuzzy and Other Insights from the Border between Math and Computers, Princeton University Press, 1998. [11] B. V. Babu e B. Anbarasu, Muti-objective dierential evolution (MODE): An evolutionary algorithm for multi-objective optimization problems (MOOPS). Proceedings of International Symposium and 58th Annual Session of IIChE. Indian, CHEMCON-2005, 2005 . [12] B. V. Babu, P. G. Chakole e J. H. S. Mubeen, Multiobjective dierential evolution (mode) for optimization of adiabatic styrene reactor, Chemical Engineering Science, 60 (2005), 4822-4837. [13] T. Bck, D. B. Fogel e Z. Michalewicz (eds.), Evolutionary Computation 1: Basic Algorithms and Operators, Institute of Physics Publishing, 2000. [14] T. Bck, D. B. Fogel e Z. Michalewicz (eds.), Evolutionary Computation 2: Advanced Algorithms and Operators, Institute of Physics Publishing, 2000. [15] P. Bak e K. Sneppen, Punctuated equilibrium and criticality in a simple model of evolution, Physical Review Letters, v. 71, 24 (1993), 4083-4086. [16] D. A. C. Barone (org), Sociedades articiais: a nova fronteira da inteligncia nas mquinas, Porto Alegre: Bookman, 2003. [17] A. Battaglia e S. Mantovani, Forward Monte Carlo computations of fully polarized microwave radiation in non-isotropic media, J. Quant. Spectrosc. Radiat. Transfer, 95 (2005), 285-308. [18] M. S. Bazaraa, H. D. Sherali e C. M. Shetty, Nonlinear Programming - Theory and Algorithms, John Wiley and Sons, New York, 1993. [19] J. C. Becceneri e S. Sandri, Function optimization using ant colony systems with pheromone dispersion. Proceedings of thr XI International Conference on Information, Processing and Management of Uncertainty in Knowledge-based Systems (IPMU), Frana, 2006.

Bibliograa

203

[20] J. C. Becceneri, S. Sandri e E. F. P Luz. Using Ant Colony Systems with Pheromone Dispersion in the Traveling Salesman Problem, Proceedings of 11th International Conference of the Catalan Association for Articial Intelligence, Espanha, 2008. [21] J. C. Becceneri e A. Zinober, Extraction of Energy in a Nuclear Reactor. XXXIII Simpsio Brasileiro de Pesquisa Operacional, Campos do Jordo, SP, 2001. Anais do XXXIII Simpsio Brasileiro de Pesquisa Operacional, em CD-ROM. [22] J. C. Becceneri, S. Stephany, H. F. Campos Velho e E. F. P. Luz, Addition of atmosphere turbulence in the particle swarm optimization algorithm, Anais do Congresso Nacional de Matemtica Aplicada e Computacional, 29, 2006, Campinas, Brasil, Campinas: SBMAC, 2006, CD-ROM. [23] J. C. Becceneri, S. Stephany, H. F. Campos Velho e A. J. Silva Neto, Solution of the inverse problem of radiative properties estimation with the particle swarm optimization technique, Proceedings of 14th Inverse Problems in Engineering Seminar, Ames, EUA, 2006. [24] J. V. Beck, Combined parameter and function estimation in heat transfer with application to contact conductance, J. Heat Trans., 110 (1998), 1046-1058. [25] J. V. Beck, B. Blackwell e C. R. St. Clair Jr., Inverse Heat Conduction - Ill-Posed Problems, John Wiley & Sons, Nova York, 1985. [26] R. Bennartz e R. Preusker, Representation of the photon pathlength distribution in a cloudy atmosphere using nite elements, J. Quant. Spectrosc. Radiat. Transfer, 58 (2006), 202-219. [27] L. N. Biondi, Inteligncia Computacional Aplicada a Problemas Inversos de Transferncia Radiativa, Anais do II Workshop de Problemas Inversos e Inteligncia Computacional, (2008), Rio de Janeiro. II Workshop de Problemas Inversos e Inteligncia Computacional, 2008. [28] L. N. Biondi e L. Chiganer, Sistema Especialista Fuzzy no Diagnstico de Falhas em Transformadores, Eletricidade Moderna, 315 (2000), 158-169. [29] C. M. Bishop, Neural Networks for Pattern Recognition, Oxford University Press, Oxford, UK. 1995.

204 [30] C. Blum, Ant colony optimization: Introduction and recent trends. Physics of Life Reviews, 2 (2005), 353-373. [31] S. Boettcher e A. Percus, Optimization With Extremal Dynamics, Physical Review Letters, 86 (2001), 5211-5214. [32] E. Bonabeau, M. Dorigo e G. Theraulaz, From natural to articial swarm intelligence. Oxford University Press, 1999. [33] G. Boole, The Calculus of Logic. Cambridge and Dublin Mathematical Journal, v. III (1848), 183-98. [34] R. P. Brent, Algorithms for Minimization without Derivatives, Prentice-Hall, Englewood Clis, NJ, 1973. [35] D. S. Broomhead e D. G. Lowe, Radial basis functions, multivariable interpolation and adaptive networks, RSRE memo 4148, Royal Signals Radar Est., Malvern, 1988. [36] M. Brown e C. Haris, Neurofuzzy adaptive modelling and control, Prentice Hall, 1994. [37] B. Buckham e C. Lambert, Simulated Annealing Applications, University of Victoria, 1999 [38] B. Bulgarelli e J. P. Doyle, Comparison between numerical models for radiative transfer simulation in the atmosphere-ocean system, J. Quant. Spectrosc. Radiat. Transfer, 86 (2004), 315-334. [39] S. Camazine, J. L. Deneubourg, N. R. Franks, J. Sneyd, G. Theraulaz e E. Bonabeau, Self-organization in Biological Systems. Princeton University Press, 2003. [40] H. F. Campos Velho, Problemas Inversos em Pesquisa Espacial, SBMAC - Sociedade Brasileira de Matemtica Aplicada e Computacional, So Carlos, 2008. [41] R. F. Carita Montero, N. C. Roberty e A. J. Silva Neto, Reconstruction of a combination of absorption and scattering coecients with a discrete ordinates method consistent with the source-detector system, Inverse Prob. Eng., 12 (2004), 103-121. [42] G. A. Carpenter e S. Grossberg, The ART of Adaptive Pattern Recognition by a Self-Organizing Neural Network, Computer, v.21, 3 (1988), 77-88.

Bibliograa

205

[43] J. N. Carter, Genetic Algorithms for Incore Fuel Management and other recent developments in optimization, Advances in Nuclear Science and Technology, Volume 25, Plenum Press, New York, 1997. [44] A. C. Carvalho, H. F. Campos Velho, S. Stephany, R. P. Souto, J. C. Becceneri e S. Sandri, Fuzzy Ant Colony Optimization for Estimating Chlorophyll Concentration Prole in Oshore Sea Water, Proceedings of Inverse Problems, Design and Optimization Symposium, Florida, EUA, 2007. [45] F. N. ayan e N. Seluk, The method of lines solution of Discrete ordinates Method for non-grey media, J. Quant. Spectrosc. Radiat. Transfer, 104 (2007), 228-237. [46] F. R. Centeno e F. H. R. Frana. Application of The Inverse Analysis To The Heat Transfer In Friction Stir Welding, Anais do 12o Brazilian Congress of Thermal Sciences and Engineering, ENCIT 2008, Belo Horizonte, 10-14 November, 2008. [47] E.S. Chalhoub, Discrete-Ordinates solution for radiative transfer problems, J. Quant. Spectrosc. Radiat. Transfer, 76 (2003), 193-206. [48] E.S. Chalhoub, Discrete-Ordinates solution for uncoupled multiwavelenght radiative transfer problems, J. Quant. Spectrosc. Radiat. Transfer, 92 (2005), 335-349. [49] E. S. Chalhoub, H. F. Campos Velho, R. D. M. Garcia e M. T. Vilhena, A comparison of radiances generated by selected methods of solving the radiative-transfer equation, Transport Theor. Stat. Phys., 32 (2003), 473-503. [50] E. S. Chalhoub, H. F. Campos Velho e A. J. Silva Neto, A comparison of the one-dimensional radiative transfer problem solutions obtained with the monte carlo method and three variations of the discrete ordinates method. Procedings of 19th International Congress of Mechanical Engineering - Cobem 2007, Braslia-DF. [51] E. S. Chalhoub, A. J. Silva Neto, F. J. C. P. Soeiro, Estimation of Optical Thickness and Single Scattering Albedo with Articial Neural Network and a Monte Carlo Method, COBEM 2007, Proceedings of 19th International Congress of Mechanical Engineering, November 59, 2007, Brasilia, DF, Brasil. [52] S. Chandrasekhar, On the radiative equilibrium of a stellar atmosphere II, Astrophys. J., 100 (1944), 76-86.

206 [53] S. Chandrasekhar, Radiative Transfer, Oxford University Press, Londres, 1950. [54] E. Charniak e D. McDermott, Introduction to Articial Intelligence, Reading Mass, Addison-Wesley, 1985. [55] Y. Chen e K. N. Liou, A Monte Carlo method for 3D thermal infrared radiative transfer, J. Quant. Spectrosc. Radiat. Transfer, 101 (2006), 166-178. [56] L. D. Chiwiacowsky e Campos Velho, Dierent Approaches for the Solution of a Backward Heat Conduction Problem, Inverse Problems in Engineering, v.11, 3 (2003), 471-494. [57] G. A. G. Cidade, A. J. Silva Neto e N. C. Roberty, Restaurao de Imagens com Aplicaes em Biologia e Engenharia - Problemas Inversos em Nanocincia e Nanotecnologia, SBMAC - Sociedade Brasileira de Matemtica Aplicada e Computacional, So Carlos, 2003. [58] M. Clerc, Discrete particle swarm optimization: ilustrated by the traveling salesman problem, 2000. Disponvel em: http://clerc.maurice.free.fr/pso/pso_tsp/Discrete_PSO_TSP.htm, Acesso em: 24 jan. 2007. [59] W. F. Clocksin e C. S. Mellish, Programming in Prolog, SpringerVerlag Berlin Heidelberg, New York, 1984. [60] A. Colmerauer, H. Kanouietm e V. Caneghem, Prolog, bases thoriques et dveloppements actuels, Technique et science informatiques, Herms, v. 2, 4 (1982). [61] V. A. Constantin, Fuzzy Logic and Neurofuzzy applications explained, Prentice Hall, New Jersey, 1995. [62] A. Corana, M. Marchesi, C. Martini e S. Ridella, Minimizing Multimodal Functions of Continuous Variables with the Simulated Annealing, ACM Transactions on Mathematical Software, 13 (1987), 262-280. [63] J. D. Cowan e S. H. David, The articial intelligence debate: false starts, real foundations, MIT Press, Cambridge, MA, USA, 1989. [64] E. Cox, Fuzzy logic for business and industry. Massachusetts: Charles River Media Inc, 1995.

Bibliograa

207

[65] A. P. C. Cuco, A. J. Silva Neto, H. F. Campos Velho e F. L. de Souza, Solution of an inverse adsortion problem with an Epidemic Genetic Algorithm and the Generalized Extremal Optimization Algorithm, Inverse Problems in Science and Engineering, 17 (2009), 289-302. [66] A. P. C. Cuco, F. L. de Sousa, V. V. Vlassov e A. J. Silva Neto, Multi-Objective Design Optimization of a New Space Radiator, Proceedings of International Conference on Engineering Optimization EngOpt2008, Rio de Janeiro, 01-05 Junho, 2008. [67] C. Darwin, On the origin of Species by Means of Natural Selection, John Murray, Londres, 1859. [68] A. Das e B. K. Chakrabarti (Eds.), Quantum Annealing and Related Optimization Methods, Lecture Note in Physics, v. 679, Springer, Heidelberg, (2005). [69] S. K. Das, C.-W. Chiang e J.-B. Nee, Characteristics of cirrus clouds and its radiative properties based on lidar observation over Chung-Li, Taiwan, Atmospheric Research, (2009), no prelo. [70] L. Davis, Genetic Algorithms and Simulated Annealing, Morgan Kaufmann, 1988. [71] K. A. De Jong, Evolutionary Computation, MIT Press, 1993. [72] L. P. Deutsch, A LISP machine with very compact programs, IJCAI, (1973), 697-703. [73] M. Dorigo Ottimizzazione, Apprendimento Automtico, Ed Algoritmi Basati su Metafora Naturale, Ph. D. Dissertation, Politcnico di Milano, Italy, 1992. [74] M. Dorigo, V. Maniezzo e A. Colorni. Positive Feedback as a Search Strategy. Tech. Rep. No. 91-016, Politecnico di Milano, Italy, 1991. [75] M. Dorigo, V. Maniezzo e A. Colorni, The ant system: optimization by a colony of cooperating agents. IEEE T. on Syst. Man Cy. B, v. 26, 2 (1996), 29-41. [76] D. Driankov, H. Hallendoorn e M. Reinfrank, An introduction to fuzzy control, Springer-Verlag, Berlin, 1993. [77] R. Duda, P. E Hart e D. G. Stork, Pattern classication. New York:Wiley, 2001.

208 [78] J. J. Duderstadt e L. J. Hamilton, Nuclear Reactor Analysis, John Wiley and Sons, New York, 1976. [79] G.S. Dulikravich, T.J. Martin e B.H. Dennis, Multidisciplinary inverse design, Proc. Mini-Symposium on Inverse Problems - State of the Art and Future Trends, Anais do XXIV Congresso Nacional de Matemtica Aplicada e Computacional, Belo Horizonte, 24-33, 2001. [80] R.C. Eberhart e Y. Shi, Particle swarm optimization: developments, applications and resources, Proceedings of Congress on Evolutionary Computation, (2001), Seoul, Korea, Piscataway, NJ: IEEE, 2001, p. 81-86. [81] A. E. Eiben e J.E. Smith, Introduction to Evolutionary Computing, Springer-Verlag, Berlin, 2003. [82] H.W. Engl, M. Hanke e A. Neubauer, Regularization of Inverse Problems, Kluver Academic Publishers, Dordrecht, 1996. [83] H. Y. Fan e J. Lampinen, A trigonometric mutation operation to dierential evolution, Journal of Global Optimization, 27 (2003), 105129. [84] T. Fause, H. Isaka e B. Guillemet, Neural Network retrieval of cloud parameters of inhomogeneous and fractional clouds, Remote Sens. Environ., 77 (2001), 123-128. [85] E. O. Flores, V. Furtado, R. P. F. Pinheiro, F. J. C. P. Soeiro e A. J. Silva Neto, Soluo de um Problema Inverso em Transferncia Radiativa com Programao Matemtica e Mtodos de Otimizao Global, Anais do XVI Congresso Brasileiro de Engenharia Mecnica, Uberlndia, 2001. [86] D. B. Fogel (Editor), Evolutionary Computation, The Fossil Record, IEEE Press, New York, 1998. [87] L. J. Fogel, A. J. Owens e M. J. Walsh, Articial Intelligence through Simulated Evolution, John Wiley, 1966. [88] L. R. Foulds, Combinatorial Optimization for Undergraduates. Springer-Verlag, New York, 1984. [89] F. L. G. Frege, Die Grundlagen der Arithmetik. 1884. Eine logisch mathematische Untersuchung ber den Begri der Zahl, Breslau, 1884.

Bibliograa

209

[90] R. L. Galski, Desenvolvimento de verses aprimoradas, hbridas, paralela e multiobjetivo do mtodo da otimizao extrema generalizada e sua aplicao no projeto de sistemas espaciais, Tese de Doutorado, Curso de Ps-graduao em Computao Aplicada, Instituto Nacional de Pesquisas Espaciais, So Jos dos Campos, 2006. [91] R. L. Galski, F. L. de Sousa, F. M. Ramos e A. J. Silva Neto, Application of a GEO+SA hydrid optimization Algorithm to the Solution of an Inverse Radiative Transfer Problem, Inverse Problems in Science and Engineering, Special Issue: Selected papers of IPDO 2007, v. 17, 3 (2009), 321-334. [92] M. R. Garey e D. S. Johnson, Computers and Intractability: a Guide to the Theory of NP-Completeness, W. H. Freeman, 1979. [93] M. C. C. Gil, A. J. Silva Neto, L. N. Biondi e F. J. C. P. Soeiro, Determinao do Albedo de Espalhamento Simples em Um Meio Participante Homogneo Unidimensional atravs de Redes Neuro-Fuzzy, Anais do V Congresso Nacional de Engenharia Mecnica, Salvador, 2008. [94] M. C. C. Gil, A. J. Silva Neto, L. N. Biondi e F. J. C. P. Soeiro, Determinao da Espessura ptica de Um Meio Participante Homogneo Unidimensional atravs de Redes Neuro-Fuzzy, Anais do XL Simpsio Brasileiro de Pesquisa Operacional, Joo Pessoa, 2008. [95] F. Glover, Tabu Search, part I. ORSA Journal on Computing, v. 1, 3 (1989), 190-206. [96] W. L. Goe, G. D. Ferrier, e J. Rogers, Global Optimization of Statistical Functions with the Simulated Annealing, Journal of Econometrics, 60 (1992), 65-99. [97] D. E. Goldberg, Genetic algorithms for search, optimization, and machine learning, Addison-Wesley, Reading, MA, 1989. [98] S. Goonatilake e S. Khebbal, Intelligent Hybrid Systems, John Willey and Sons, Chichester, 1995. [99] S. Grossberg, Neural networks and natural intelligence, MIT Press, Cambridge, MA, USA , 1988. [100] P. Hajela, Genetic Search - An Approach to the Nonconvex Optimization Problem, AIAA Journal, v. 26, 7 (1990), 1205-1210.

210 [101] N.P. Hanan, Enhanced two-layer radiative transfer scheme for a land surface model with a discontinuous upper canopy, Agr. Forest Meteorol., 109 (2001), 265-281. [102] J.E. Hansen e L.D. Travis, Light scattering in planetary atmospheres, Space Sci. Rev., 16 (1974), 527-610. [103] R. Hassan, B. Cohanim, O. L. de Weck e G. Venter, A comparison of particle swarm optimization and the genetic algorithm, Proceedings of Multidisciplinary Design Optimization Specialist Conference, 1., 2005, Austin, EUA, Austin:AIAA, 2005, p. 1-13. [104] T. Hastie, R. Tibshirani e J. Friedman, The elements of statistical learning, New-Yrok, Springer-Verlag, 2001. [105] S. Haykin, Neural Networks A Comprehensive Foundation , Second Edition, Prentice Hall, 1999. [106] D. O. Hebb, The organizations of Behavior, Wiley Eds., 1949. [107] J. K. Hillier, Shadow-hiding opposition surge for a two-layer surface, Icarus, 128 (2001), 265-281. [108] A. L. Hodgkin e A. F. Huxley, A quantitative description of membrane current and its application to conduction and excitation in nerve, Journal of Physiology, 117 (1952), 500-544. [109] S. Hollander, The Economics of Thomas Robert Malthus, University of Toronto Press, 1997. [110] J. H. Holland, Adaptation in Natural and Articial Systems, University of Michigan Press, Ann Arbor, MI, 1975. [111] R. Hooke e T.A. Jeeves, Direct Search Solution of Numerical and Statistical Problems, Journal of the ACM, 8 (1961), 212-229. [112] J. J. Hopeld, Neural networks and physical systems with emergent collective computational abilities, Proceedings of the National Academy of Sciences, USA, pp. 2554-2558, 1982. [113] E. O. Hovey, The Bicentenary of the Birth of Carolus Linnaeus, New York: New York Academy of Sciences, 1908. [114] P. Jackson, Introduction to Expert Systems, Addison-Wesley, Second Edition, 1990.

Bibliograa

211

[115] J. S. R. Jang, Neuro-Fuzzy Modeling: Architectures, Analyses and Applications, PhD Thesis, University of California, Berkeley, July 1992. [116] J. S. R. Jang, ANFIS: Adaptive-Network-Based Fuzzy Inference System, IEEE Transactions on Systems, Man, and Cybernetics, v.23, 3 (1993), 665-685. [117] J. S. R Jang e C.T. Sun, Neuro-Fuzzy and Soft Computing: A Computational Approach to Learning and Machine Intelligence, Prentice Hall, 1997. [118] K. A. Jensen, J.-F. Ripoll, A. A. Wray, D. Joseph e M. El Ha, On various modeling approaches to radiative heat transfer in pool res, Combust. Flame, 148 (2007), 263-279. [119] M. D. Kapadi e R. D. Gudi, Optimal control of fed-batch fermentation involving multiple feeds using dierential evolution, Process Biochemistry, 39 (2004), 1709-1721. [120] A.T. Kauati, A.J. Silva Neto e N.C. Roberty, A source-detector methodology for the construction and solution of the one-dimensional inverse transport equation, Inverse Prob. Eng., 9 (2001), 45-66. [121] A. Kaufmann e M. M. Gupta, Fuzzy mathematical models in engineering and management science, Amsterdam: Elsevier Science Publishers B, 1988. [122] J. Kennedy e R. C. Eberhart, Swarm Intelligence, New York: Morgan Kaufmann, 2001. [123] J. Kennedy e R. C. Eberhart, Particle swarm optimization, Proceedings of IEEE International Conference on Neural Networks, 1995, Perth, Australia. Piscataway: IEEE, 1995, p. 1942-1948. [124] J. W. Kim, L. S. Ahn e Y. S. Yi, Fuzzy logic for the applications to complex systems, World Scientic Publishing, 1995. [125] H. K. Kim e A. Charette, A sensitivity function-based conjugate gradient method for optical tomography with the frequency domain equation of radiative transfer, J. Quant. Spectrosc. Radiat. Transfer, 104 (2007), 24-39. [126] S. Kirkpatrick, C. D. Gelatt e M. P. Vecchi, Optimization by Simulated Annealing, Science, v. 220, 4598 (1983), 671 - 680.

212 [127] D. C. Knupp, Mtodos Hbridos e Estocsticos para a Determinao de Propriedades Radiativas, Projeto de Graduao em Engenharia Mecnica, Universidade do Estado do Rio de Janeiro, 2008. [128] D. C. Knupp, A.J. Silva Neto e W. F. Sacco, Radiative Properties Estimation with a Combination of the Particle Collision Algorithm and the Levenberg-Marquardt Method, Proceedings of Inverse Problems Symposium, East Lansing, USA, 2007. [129] D. C. Knupp, A. J. Silva Neto e W. F. Sacco, Radiative properties estimation based on a sensitivity analysis, High Temp.-High Press., (2008), no prelo. [130] D. C. Knupp, A.J. Silva Neto e W. F. Sacco, Radiative properties estimation with the Particle Collision Algorithm based on a sensitivity analysis, High Temperatures - High Pressures, (2009), aceito para publicao. [131] D. C. Knupp, A. J. Silva Neto e W. F. Sacco, Estimativa de Propriedades Radiativas com o Algoritmo de Colises de Partculas e o Mtodo de Otimizao por Nuvem de Partculas, Anais do Congresso Nacional de Estudantes de Engenharia Mecnica, CREEM, Uberlndia, 2007. [132] D. E. Knut, The Art of Computer Programming. Addison-Wesly Professional, vol. 1-3 Boxed Set, 2a ed., 1998. [133] T. Kohonen, An adaptive associative memory principle, IEEE Transactions on Computers, v. C-24, 4 (1974), 444-445. [134] T. Kohonen, Self-Organizing Maps, Berlin: Springer, 1997. [135] B. Kosko, Neural Networks and Fuzzy Systems, Englewood Clis: Prentice Hall,1992. [136] Z. L. Kovacs, Redes Neurais Articiais: Fundamentos e Aplicaes. So Paulo: Editora Acadmica, 1996. [137] Z. L. Kovacs, T. L. Johnson e D. S. Sax, Estimation of the distribution of conduction velocities in peripheral nerves. Comput. Biol. Med., 9 (1979), 281-293. [138] J. R. Koza, Genetic Programming: On the Programming of Computers by Means of Natural Selection,MIT Press, 1992.

Bibliograa

213

[139] J. R. Koza, Genetic Programming II: Automatic Discovery of Reusable Programs, MIT Press, 1994. [140] K. N. Krishnanand e D. Ghose, Glowworm swarm optimization for simultaneous capture of multiple local optima of multimodal functions. Swarm Intelligence, (2008). DOI: 10.1007/s11721-008-0021-5. [141] R. Kruse, J. Gebhardt e F. Klawon, Foundations of Fuzzy Systems, Wiley, Chichester, 1994. [142] E. L. Lawler, J. K. Lenstra, A. H. G. R. Kan e D. B. Shmoys, The Traveling Salesman Problem. Chichester. A Wiley Interscience Publication, John Wiley and Sons, 1985. [143] J. Lenoble (Ed.), Standard Procedures to Compute Atmospheric Radiative Transfer in a Scattering Atmosphere , National Center for Atmospheric Research, Boulder, 1977. [144] R. Lent, Cem Bilhes de Neurnios, Conceitos Fundamentais de Neurocincia, Editora Atheneu, 2001. [145] C. Y. Lin e P. Hajela, Genetic Algorithms in Optimization Problems with Discrete and Integer Design Variables, Journal of Engineering Optimization, v. 19, (1992), 309-327. [146] W. Little e M. L. G. Shaw, A statistical theory of short and long term memory, Behavioral, Biology, 14 (1975), 115-133. [147] F. S. Lobato e V. Steen Jr, Engineering system design with multiobjective dierential evolution. Proceedings of 19 International Congress of Mechanical Engineering - Cobem 2007, Braslia-DF. [148] F. S. Lobato, Otimizao Multi-objetivo para o Projeto de Sistemas de Engenharia, Tese de Doutorado, FEMEC, UFU, Universidade Federal de Uberlndia, 2008. [149] F. S. Lobato, E. B. Arruda, M. A. S. Barrozo e V. Steen Jr, V., Estimation of drying parameters in rotary dryers using dierential evolution, Journal of Physics Conference Series, 135 (2008), doi:10.1088/1742-6596/135/1/012063. [150] F. S. Lobato, P. C. S. Borges, E. J. Ribeiro e V. V. Murata, Kinetic models evaluation for fed-batch alcoholic fermentation. Proceedings of 10th International Chemical and Biological Engineering Conference (CHEMPOR 2008), Braga-Portugal, 2008.

214 [151] F. S. Lobato, R. H. Oliveira Filho, M. A. V. Duarte e V. Steen Jr, Estimao de parmetros de um ltro adaptativo utilizado como ferramenta para controle de qualidade em linha de montagem de cmbios automotivos atravs da tcnica de evoluo diferencial. Anais do V Congresso Nacional de Engenharia Mecnica, 2008, Salvador-Ba. [152] F. S. Lobato, L. C. Oliveira-Lopes, V. V. Murata e V. Steen Jr, Solution of multi-objective optimal control problems with index uctuation using dierential evolution. Proceedings of 6th Brazilian Conference on Dynamics, Control and Applications - DINCON, 2007, So Jos do Rio Preto-SP. [153] F. S. Lobato, L. C. Oliveira-Lopes, V. V. Murata e V. Steen Jr., Evoluo diferencial aplicada soluo de problemas de controle timo com restries de desigualdade, Anais do X Encontro de Modelagem Computacional, CD-ROM, Nova Friburgo-RJ, 2007. ISBN 978-8585769-35-2. [154] F. S. Lobato, A. J. Silva Neto e V. Steen Jr, Solution of inverse radiative transfer problems in two-layer participating media with dierential evolution. Proceedings of International Conference on Engineering Optimization - EngOpt 2008, Rio de Janeiro-RJ. [155] F. S. Lobato, V. Steen Jr. e A. J. Silva Neto, Um estudo comparativo usando evoluo diferencial e recozimento simulado aplicado a um problema inverso de transferncia radiativa, Anais do X Encontro de Modelagem Computacional, CD-ROM, Nova Friburgo-RJ, 2007. ISBN 978-85-85769-35-2. [156] I. M. L. Lopes, Controle de Atitude de Satlites Rgido-Flexveis Usando a Otimizao Extrema Generalizada (GEO) com Abordagem Multi-Objetiva, Dissertao de Mestrado, Curso de Ps-graduao em Engenharia e Tecnologia Espacial, Instituto Nacional de Pesquisas Espaciais, So Jos dos Campos, SP, 2008. [157] I. M. L. Lopes, F.L. de Sousa e L.C.G. Souza, The Generalized Extremal Optimization With Real Codication, Proceedings of International Conference on Engineering Optimization - EngOpt2008, Rio de Janeiro, 01-05 June 2008. [158] J. Lupo, Defense application of Neural networks, IEEE Communications magazine, (1989), 82-88.

Bibliograa

215

[159] E. F. P. Luz, Estimao de fonte de poluio atmosfrica usando otimizao por enxame de partculas, Dissertao de Mestrado, So Jos dos Campos: INPE, 2008. [160] E. F. P. Luz, J. C. Becceneri e H. F. Campos Velho, A new multiparticle collision algorithm for optimization in a high-performance environment, Journal of Computational Interdisciplinary Sciences, 1 (2008), 1-7. [161] E. F. P. Luz, H. F. Campos Velho, J. C. Becceneri e D. R. Roberti, Estimating atmospheric area source strength through particle swarm optimization, Proceedings of Inverse Problems, Design and Optimization Symposium, Florida, EUA, 2007. [162] V. C. Mariani, A. G. Lima e L. S. Coelho, Apparent thermal diusivity estimation of the banana during drying using inverse method, Journal of Food Engineering, 85 (2008), 569-579. [163] D. W. Marquardt, An algorithm for least-squares estimation of nonlinear parameters, J. Soc. Industr. Appl. Math., 11 (1963), 431-441. [164] A. Maurente, H. A. Vielmo e F. H. R. Frana, A Monte Carlo implementation to solve radiation heat transfer in non-uniform media with spectrally dependent properties, J. Quant. Spectrosc. Radiat. Transfer, 108 (2007), 295-307. [165] J. McCarthy, Programs with Common Sense. In Mechanisation of Thought Processes, Proceedings of the Symposium of the National Physics Laboratory, 77-84, London, U.K., Her Majestys Stationery Oce, 1959. [166] J. McCarthy, A basis for a mathematical theory of computation, Computer Programming and formal systems. North-Holland, 1963. [167] J. McCarthy, M. Minsky, N. Rochester e C. Shannon, A Proposal for the Dartmouth Summer Research Project on Articial Intelligence, 1955, http://wwwformal.stanford.edu/jmc/history/dartmouth/dartmouth.html, . [168] N. J. McCormick, Inverse radiative transfer problems: A review, Nucl. Sci. Eng., 112 (1992), 185-198. [169] W. S. McCulloch e W. Pitts, A Logical Calculus of Ideas Immanent in Nervous Activity, Bulletin of Mathematical Biophysics, 5 (1943), 115-133.

216 [170] W. S. McCulloch e W. Pitts, On how we know universals: The perception of auditory and visual forms, Bulletin of Mathematical Biophysics, 9 (1947), 127-147. [171] F. L. L. Medeiros, Algortmo Gentico Hbrido com um Esquema de Busca de Estado Estacionrio de Sistemas Dinmicos. Tese de Mestrado m Computao Aplicada (CAP), Instituto Nacional de Pesquisas Espaciais (INPE), So Jos dos Campos (SP), Brasil. 2002. [172] Metaheuristics Network, http://www.metaheuristics.net/index.php? main=1, visitado em 26/11/2007. [173] N. C. Metropolis, A. W. Rosenbluth, M. N. Rosenbluth, A. H. Teller e E. Teller, Equation of state calculations by fast computing machines, Journal of Chemical Physics, v. 21, 6 (1953), 1087-1092. [174] M. Minsky, Heuristic Aspects of the Articial Intelligence Problem, MIT Lincoln Laboratory Report 34-55, December, 1956. [175] M. Minsky e S. Papert, Perceptrons, MIT Press, Cambridge, 1969. [176] S. Mitra e Y. Hayashi, Neuro-fuzzy rule generation: survey in soft computing framework, IEEE Trans. Neural Networks, v. 11, (2000), 748-768. [177] C. D. Mobley, Light and Water - Radiative Transfer in Natural Waters, Academic Press, San Diego, 1994. [178] I. Muraoka, R. L. Galski, F. L. de Sousa e F. M. Ramos. Stochastic Spacecraft Thermal Design With Low Computational Cost. Journal of Spacecraft and Rockets, v. 43, 6 (2006), 1248-1257. [179] D. Nauck e R. Krus, Neuro-Fuzzy Systems for Function Approximation, Proceedings of 4th International Workshop Fuzzy-Neuro Systems, 1997. [180] J.A. Nelder e R. Mead, A Simplex Method for Function Minimization, Computer Journal, 7 (1965), 308-313. [181] A. Newell e S. Herbert, A Human problem solving, Englewood Clis, NJ, USA, Prentice Hall, 1972. [182] A. Newell, J. C. Shaw e H. A. Simon, Chess Playing Programs and the Problem of Complexity. IBM Journal of Research and Development, Vol. 4, No. 2, 320-335. Reprinted (1963) in Computers and Thought (eds. E.A. Feigenbaum and J. Feldman), 39-70, McGraw-Hill, New York, N.Y, 1958.

Bibliograa

217

[183] N. Nilsson, Principles of Articial Intelligence, Tioga Publishing Company, 1980. [184] G. T. S. Oliveira, Estudo e Aplicaes da Evoluo Diferencial, Tese de Mestrado, FEMEC, Universidade Federal de Uberlndia, 2006. [185] A. C. M. Oliveira e L. A. N. Lorena, Hybrid Evolutionary Algoritms and Clustering Search, Studies in Computational Intelligence, v. 75, Springer Verlag, Berlin, 2007. [186] M. N. Ozisik, Radiative Transfer and Iteractions with Conduction and Convection, John Wiley, Nova York, 1973. [187] K.E. Parsopoulos e M.S. Vrahatis, Particle swarm optimization method for constrained optimization problems, Intelligent technologies - theory and application: new trends in intelligent technologies, v. 76 of Frontiers in Artitial Intelligence and Applications, 214-220, IOS Press, 2002. [188] E. L. Passos, Inteligncia Articial e Sistemas Especialistas, Livros Tcnicos e Cientcos - Editora Ltda., 1989. [189] H. Patire Jnior, R. L. Galski, F. L. de Sousa, J. N. Hinckel, P. T. Lacava e F. M. Ramos, Film Cooling Temperature Estimation of a 200N Hydrazine Thruster by an Inverse Problem Approach, Anais do 12o Brazilian Congress of Thermal Sciences and Engineering, ENCIT 2008, Belo Horizonte, 10-14 November, 2008. [190] D. Poole, A. Mackworth e R. Goebel, Computational Intelligence: A Logical Approach, Oxford University Press, 1998. [191] O.V. Postylyakov, Radiative transfer model MCC++ with evaluation of weighting functions in spherical atmosphere for use in retrieval algorithms, Adv. Space Res., 34 (2004), 721-726. [192] K. V. Price, R. M. Storn e J. A. Lampinen, Dierential Evolution - A Practical Approach to Global Optimization, Springer - Natural Computing Series, 2005. [193] V. J. Rayward-Smith, I. H. Osman, C. R. Reeves e G. D. Smith, Modern Heuristic Search Methods. John Wiley and Sons Ltd, Bans Lane, Chichester, West Sussex, England, 1996. [194] A. M. Ribeiro, L. N. Biondi, P. H. G Coelho, L. Chiganer, L. A. Meza e L. H. A. Coutinho, Sistema de Apoio Deciso para Determinao

218 do Preo da Energia, usando-se Lgica Nebulosa, Engevista, v. 06, 2 (2004), 04-14. [195] E. Rich e K. Knight, Articial Intelligence, New York, McGraw Hill, 1992. [196] T. T. Rogers e J. L. McClelland, Semantic Cognition: A Parallel Distributed Processing Approach, Cambridge, MA: MIT Press, 2004. [197] F. Rosenblatt, The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain, Psychological Review, v. 65, 6 (1958), 386-408. [198] F. Rosenblatt, Principles of Neurodynamics, New York, Spartan, 1962. [199] D. E. Rumelhart, G. E. Hinton, e R. J. William, Learning Internal Representation by Error Propagation in Parallel Distributed Processing, D. E. Rumelhart and J. L. McClelland Eds., MIT Press, Cambridge, M. A., 1986. [200] W. A. Russel, Darwinism: An Exposition of the Theory of Natural Selection, with Some of Its Applications (1912 ed.), Macmillan, 1889, http://books.google.com/books. [201] B. Russel e A. N. Whitehead, Principia Mathematica, Cambridge: At the University Press, pp. 1910-1913, 3 vols, 1962. [202] W. F. Sacco e C. R. E. de Oliveira, A New Stochastic Optimization Algorithm based on Particle Collisions, 2005 ANS Annual Meeting, Transactions of the American Nuclear Society, American Nuclear Society, San Diego, CA, 2005. [203] W. F. Sacco, C. R. E. de Oliveira e C. M. N. A. Pereira, Two stochastic optimization algorithms applied to nuclear reactor core design, Progress in Nuclear Energy, 48 (2006), 525-539. [204] W. F. Sacco, H. Alves Filho, N. Henderson e C.R.E. de Oliveira, A Metropolis algorithm combined with Nelder-Mead Simplex applied to nuclear reactor core design, Annals of Nuclear Energy, 35 (2008), 861-867. [205] W. F. Sacco, C. M. F. Lapa, C. M. N. A. Pereira e H. Alves Filho, A Metropolis Algorithm applied to a Nuclear Power Plant Auxiliary Feedwater System Surveilance Tests Policy Optimization, Progress in Nuclear Energy, 50 (2008), 15-21.

Bibliograa

219

[206] W. F. Sacco, A. C. Rios-Coelho, N. Henderson e M. M. Ali, The Particle Collision Algorithm, International Workshop on Stochastic and Applied Global Optimization (SAGO 2008) - Book of Abstracts (M.M. Ali, E.M.T. Hendrix, A.O. Adewumi, eds.), University of Witwatersrand, Johannesburg, 2008. [207] R. Sanchez, N.J. McCormick e H.C. Yi, Iterative inverse radiative transfer method to estimate optical thickness and surface albedo, Transport Theor. Stat., 19 (1990), 357-385. [208] S. Sandri, e C. Correa, Lgica Nebulosa, Anais da V Escola de Redes Neurais. So Jos dos Campos, 073-090, 1999. [209] H. P. Schwefel e G. Rudolph, Contemporary Evolution Strategies, F. Morana, A H. P. Moreno, and P. Chacon (eds.), Advances in Articial Life, Proc. of the 3rd ECAL, Berlim, Springer-Verlag, 893-907, 1995. [210] C. E. Shannon, Programming a Computer for Playing Chess, Philosophical Magazine, s.7, v. 41, 314 (1950). [211] Y. Shi e R. C. Eberhart, A modied particle swarm optimizer, Proceedings of IEEE International Conference on Evolutionary Computation, 1998, Nagoya University, Japan, Piscataway: IEEE, 1998, p. 69-73. [212] R. Siegel e C.M. Spuckler, Refractive index eects on radiation in an absorbing, emitting, and scattering laminated layer, J. Heat Trans., 115 (1993), 194-200. [213] L. A. Silva, Classicao de Ndulos Mamogrcos utilizando um comit de Redes Neurais Articiais, dissertao de mestrado, Escola Politcnica da Universidade de So Paulo, 2005. [214] M. A. Silva, Aplicao de Lgica Nebulosa para Previso do Risco de Escorregamento de Taludes em Solo Residual, Dissertao de Mestrado - Centro de Tecnologia e Cincias Faculdade de Engenharia, PGECIV - Programa de Ps-Graduao em Engenharia Civil, Universidade do Estado do Rio de Janeiro, 2008. [215] A. J. Silva Neto, Problemas inversos: aplicaes em Engenharia e Medicina, em Cpsulas de Cincia (F.D. Moura Neto, Ed.), 57-86. [216] A. J. Silva Neto, Explicit and implicit formulations for inverse radiative transfer problems, Proc. 5th World Congress on Computational Mechanics, Mini-Symposium MS125 -Computational Treatment of Inverse Problems in Mechanics, Viena, Austria, 2002. (Invited Lecture)

220 [217] A. J. Silva Neto e N. J. McCormick, An explicit formulation based on the moments of the exit radiation intensity for the one-dimensional inverse radiative transfer problem, Proc. 4th International Conference on Inverse Problems in Engineering, Angra dos Reis, 2002. [218] A. J. Silva Neto e F. D. Moura Neto, Problemas Inversos - Conceitos Fundamentais e Aplicaes, EdUERJ - Editora da Universidade do Estado do Rio de Janeiro, Rio de Janeiro, 2005. [219] A. J. Silva Neto e M. N. zisik, An inverse problem of simultaneous estimation of radiation phase function, albedo and optical thickness, J. Quant. Spectrosc. Radiat. Transfer, 53 (1995), 397-409. [220] A. J. Silva Neto e N. C. Roberty, A abordagem fonte-detetor na soluo de problemas inversos em meios participantes, Anais do V Congresso de Engenharia Mecnica, Norte-Nordeste, III, 340-347, Fortaleza, 1998. [221] A. J. Silva Neto, N. C. Roberty, R. P. F. Pinheiro e N. I. Alvarez Acevedo, Inverse problems explicit and implicit formulations with applications in engineering, biophysics and biotechnology, Inverse Probl. Sci. Eng., 15 (2007), 373-411. [222] A. J. Silva Neto e F. J. C. P. Soeiro, Inverse Problem of Space Dependent Albedo Estimation Using Hybrid Optimization Methods, Proc. 6th World Congress on Structural and Multidisciplinary Optimization, Rio de Janeiro, Brasil, 2005. [223] A. J. Silva Neto e F. J. C. P. Soeiro, The Solution of an Inverse Radiative Transfer Problem with the Simulated Annealing and LevenbergMarquardt Methods, Boletim da SBMAC, v. VII, 1 (2006), 17-30. [224] A. J. Silva Neto e F. J. C. P. Soeiro, Solution of Implicitly Formulated Inverse Heat Transfer Problems with Hybrid Methods, MiniSymposium Inverse Problems from Thermal/Fluids and Solid Mechanics Applications - Proceedings of 2nd MIT Conference on Computational Fluid and Solid Mechanics, Cambridge, EUA, 2003. [225] A. J. Silva Neto e F. J. C. P. Soeiro, Estimation of Phase Function of Anisotropic Scattering with a Combination of Gradient Based and Stochastic Global Optimization Methods, Proc. 5th World Congress on Computational Mechanics, Viena, ustria, 2002. [226] A. J. Silva Neto e F. J. C. P. Soeiro, A Combination of Gradient Based and Global Optimization Methods for the Solution of Inverse

Bibliograa

221

Heat Transfer Problems, IPES-2001, Proceedings of Inverse Problems in Engineering Symposium, College Station, Texas, 2001. (Resumo) [227] A. J. Silva Neto e F. J. C. P. Soeiro, Solution of Inverse Heat Transfer Problems Using a Combination of Global and Local Optimization Methods, Anais do V Encontro de Modelagem Computacional, 82-92, Nova Friburgo, 2002. ISBN 85-903068-1-X. [228] C. A. Silva Neto e A. J. Silva Neto, Estimation of optical thickness, single scattering albedo and diuse reectivities with a minimization algorithm based on an interior points method. Proceedings of 17th International Congress of Mechanical Engineering, ABCM, So Paulo, Brazil, 2003. [229] G. D. Smith, Numerical Solution of Partial Dierential Equations -Finite Dierence Methods, Clarendon Press, Oxford, 1985. [230] F. J. C. P. Soeiro, H. F. Campos Velho e A. J. Silva Neto, A Combination of Articial Neural Networks and The Levenberg-Marquardt Method for the Solution of Inverse Heat Conduction Problems, Anais do VI Encontro de Modelagem Computacional, CD-ROM, 1-7, Nova Friburgo, 2003. ISBN 85-903068-2-8. [231] F. J. C. P. Soeiro e A. J. Silva Neto, Inverse Radiative Transfer Problem in Two-Layer participating Media, Proceedings of III European Conference on Computational Mechanics Solids, Structures and Coupled Problems in Engineering, C.A. Mota Soares et.al. (eds.), Lisboa, Portugal, 2006. [232] F. J. C. P. Soeiro e A. J. Silva Neto, Inverse radiative transfer problems in two-layer participating media. Proceedings of III European Conference on Computational Mechanics, Solids, Structures and Coupled Problems in Engineering, Lisbon-Portugal, 5-8 June, 2006. [233] F. J. C. P. Soeiro, P. O. Soares, H. F. Campos Velho e A. J. Silva Neto, Using Neural Networks to obtain initial estimates for the solution of inverse heat transfer problems, Proceedings of Inverse Problems, Design an Optimization Symposium, 358-363, Rio de Janeiro, Brazil, 2004. [234] F. J. C. P. Soeiro, P. O. Soares e A. J. Silva Neto, Solution of Inverse Radiative Transfer Problems with Articial Neural Networks and Hybrid Methods, Proceedings of 13th Inverse Problems in Engineering Seminar, 163-169, Cincinnati, EUA, 2004.

222 [235] F. L. de Sousa, Otimizao Extrema Generalizada: Um novo algoritmo estocstico para o projeto timo. Tese de Doutorado, Curso de Ps-graduao em Computao Aplicada, Instituto Nacional de Pesquisas Espaciais, INPE-9564-TDI/836, So Jos dos Campos, 2003. [236] F. L. de Sousa, I. Muraoka e R. L. Galski, On The Optimal Positioning of Electronic Equipment In Space Platforms, Anais do 19th International Congress of Mechanical Engineering - COBEM, 5-9 November, Braslia, Brasil, 2007. [237] F. L de Sousa. e F. M. Ramos, Function optimization using extremal dynamics. Proceedings of 4th International Conference on Inverse Problems in Engineering - ICIPE, Rio de Janeiro, Brazil, May, 2002. [238] F. L. de Sousa, F. M. Ramos, P. Paglione e R. M. Girardi, New Stochastic Algorithm for Design Optimization, AIAA Journal, v. 41, 9 (2003) 1808-1818. [239] F. L. de Sousa, F. M. Ramos, R. L. Galski e I. Muraoka, Generalized Extremal Optimization: A New Meta-heuristic Inspired by a Model of Natural Evolution, Recent Developments in Biologically Inspired Computing (L.N. De Castro e F.J. Von Zuben, eds.), 41-60, Idea Group Inc, London, 2005. [240] F. L. de Sousa, F. J. C. P Soeiro, A. J. Silva Neto e F. M. Ramos, Application of the generalized extremal optimization algorithm to an inverse radiative transfer problem, Inverse Problems in Science and Engineering, v. 15, 7 (2007), 699-714. [241] F. L. de Sousa e W. K. Takahashi, Generalized Extremal Optimization Applied to Three-Dimensional Truss Design, Proceedings of 18th International Congress of Mechanical Engineering (COBEM2005), CDROM, November 6-11, Ouro Preto, Brasil, 2005. [242] R. P. Souto, S. Stephany, J. C. Becceneri, H. F. Campos Velho e A. J. Silva Neto. Reconstruction of Spatial Dependent Scattering Albedo in a Radiative Transfer Problem Using a Hybrid Ant Colony System Implementation and a Pre-Regularization Scheme, Proc. 6th World Congress on Structural and Multidisciplinary Optimization, Rio de Janeiro, Brasil, 2005. [243] R. P. Souto, S. Stephany, J. C. Becceneri, H. F. Campos Velho, A. J. Silva Neto, On the use of the ant colony system for radiative properties estimation . 5th International conference on Inverse Problems

Bibliograa

223

in Engineering - Theory and Practice (V ICIPE), 2005, Cambridge, Inglaterra. Proceedings of the 5th ICIPE. Leeds, Inglaterra : Leeds University Press, 2005. v. 3. p. 1-10. [244] R. Spurr, K. Stamnes, H. Eide, W. Li, K. Zang e J. Stamnes, Simultaneous retrieval of aerosols and ocean properties: A classic inverse modelling approach. I - Analytic Jacobians from the linearized CAODISORT models, J. Quant. Spectrosc. Radiat. Transfer, 104 (2007), 428-449. [245] R. Storn e K. Price, Dierential evolution: a simple and ecient adaptive scheme for global optimization over continuous spaces, Journal of Global Optimization, 12 (1997), 1-16. [246] P. Switalski e F. Seredynsky, Multiprocesor Task Schedule Based On GEO Metaheuristic, Anais do Intelligent Information Systems Conference, IIS2008, pp. 111-120, 2008. [247] J. L. Szwarcter e L. Markenzon, Estruturas de Dados e Seus Algoritmos. Editora LTC, 1994. [248] S. Tano, T. Oyama e T. Arnould, Deep combination of Fuzzy Inference and Neural Network in Fuzzy Inference, Fuzzy Sets and Systems, 82 (1996), 151-160. [249] A. Tarantola, Inverse Problem Theory and Methods for Model Parameter Estimation, SIAM - Society for Industrial and Applied Mathematics, Philadephia, 2005. [250] T. Terano, K. Asia e M. Sugeno, Fuzzy Systems Theory and Its Applications, Academic Press, San Diego, CA, 1991. [251] A. Turing, Computing Machinery and Intelligence, Mind LIX, 1950. [252] A. Turing, Can Automatic Calculating Machines be Said to Think?, Copeland, B. Jack, The Essential Turing: The ideas that gave birth to the computer age, 1952. [253] V. Vapnik, Estimation of Dependences Based on Empirical Data, Springer Series in Statistics, Springer-Verlag New York, Inc., Secaucus, NJ, 1982. [254] W. Verhoef e H. Bach, Simulation of hyperspectral and directional radiance images using coupled biophysical and atmospheric radiative transfer models, Remote Sens. Environ., 87 (2003), 23-41.

224 [255] J. Villadsen e M.L. Michelsen, Solution of Dierential Equation Models by Polynomial Approximation, Prentice - Hall, Englewood Clil, 1978. [256] V. V. Vlassov, F. L. de Sousa e W. K. Takahashi. Comprehensive Optimization of a Heat Pipe Radiator Assembly Filled with Ammonia or Acetone. International Journal of Heat and Mass Transfer, 49 (2006), 4584-4595. [257] C. von der Malsburg, Self-organization of orientation selective cells in the striate cortex, Kybernetik, 14 (1973). [258] P. Vuorimaa, Fuzzy self-organizing map, Fuzzy Sets and Systems, 66 (1994),223-231. [259] F. S. Wang, T. L. Su e H. J. Jang, Hybrid dierential evolution for problems of kinetic parameter estimation and dynamic optimization of an ethanol fermentation process, Industry Engineering Chemical Research, 40 (2001), 2876-2885. [260] P.-Y. Wang, H.-E. Cheng e H.-P. Tan, Transient thermal analysis of semitransparent composite layer with an opaque boundary, Int. J. Heat Mass Trans., 45 (2002), 425-440. [261] P. D. Wasserman, Neural Network Computing, New York, Van Nostrand Reinhold, 1989. [262] P. D. Wasserman Advanced methods in neural computing, Van Nostrand Reinhold, 1993. [263] P. J. Werbos, Beyond regression: New tools for prediction and analysis in the behavioral sciences, PhD. thesis, Harvard University, 1974. [264] G.C. Wick, ber ebene Diusionsproblem, Z. Phys., 120 (1943), 702705. [265] B. Widrow, e S. D. Stearns, Adaptive Signal Processing, New Jersey, Prentice-Hall, Inc., 1985. [266] D. J. Willshaw e C. von der Malsburg, How patterned neural connections can be set up by self-organization, Proceedings of the Royal Society London B, 194 (1976), 431-445. [267] P. H. Winston, Articial Intelligence, Third Edition, AddisonWesley, 1992.

Bibliograa

225

[268] C.-Y. Wu e B.-T. Lu, Radiative transfer in a two-layer slab with Fresnel interfaces, J. Quant. Spectrosc. Radiat. Transfer, 56 (1996), 573589. [269] C. R. Wylie e L. C. Barrett, Advanced Engineering Mathematics, 5th Edition, McGraw-Hill, Singapura, 1985. [270] R. E. Yager e L. A. Zadeh, An Introduction to Fuzzy Logic Applications in Intelligent Systems, Kluwer Academic Publishers, Norwell, MA, 1992. [271] T. Yamakawa, H. Kusanagi, E. Ushino e T. Miki, A new eective learning algorithm for a neuro fuzzy neuron model, Proceedings of Fifth IFSA World Congress, 1993. [272] J. Yen, R. Langari e L. Zadeth, A. Industrial applications of fuzzy logic and intelligent systems, New York, IEEE Press, 1994. [273] L. A. Zadeh, Fuzzy Sets, Information and Control, (1965). [274] L. A. Zadeh e J. Kacprzyk, Fuzzy Logic for the Management of Uncertainty, John Wiley and Sons, New York, 1992. [275] H.-C. Zhou, Y.-B. Hou, D.-L. Chen e C.-G. Zheng, An inverse radiative transfer problem of simultaneously estimating proles of temperature anda radiative parameters from boundary intensity and temperature measurements, J. Quant. Spectrosc. Radiat. Transfer, 74 (2002), 605-620. [276] N. Ziviani, Projeto de Algoritmos com implementaes em Pascal e C. Editora Thomson Pioneira, 2004.

ndice
Boltzmann constante de, 67, 69 equao de, 20, 24, 35 mquina de, 59 probabilidade de, 67 regra de aprendizagem de, 59 Boole, 105 lgebra de, 108, 110 lgica de, 108, 109 contorno condies de, 21, 25, 35, 36 superfcies de, 27, 35, 36, 39, 44, 192, 194 Darwin Charles Robert, 56 teoria de, 77 determinsticos otimizadores, 140 diferena quadrtica, 133, 138, 139 Diferenas Finitas, 33 aproximao por, 27, 30, 32 mtodo de, 25, 28 diviso e conquista, 98 mtodo de, 176 inteligncia computacional, 17, 20 Laplace transformada de, 28 Levenberg-Marquardt mtodo de, 4143, 74, 84, 100, 140, 176, 194 mnimo global, 49, 71, 93, 163 local, 49, 61, 68, 71, 74, 95, 140, 160, 171 Monte Carlo mtodo de, 19, 28, 101, 104 Ordenadas Discretas mtodo das, 28 mtodo de, 19, 25, 28, 33 otimizao combinatria, 45, 59, 67, 183 paralelizao, 138, 177, 182 problemas inversos, 1719, 33, 37, 45, 64, 65, 133, 136, 139, 142, 154, 178, 184, 187, 190, 196

Gauss-Legendre quadratura de, 26, 27, 30, 32, sistemas hbridos, 55, 63, 105 191 hibridizao, 62, 64, 117, 139142, 170, 175, 182 Hooke-Jeeves turbulncia, 152

226

Notas em Matemtica Aplicada


Arquivos em pdf disponveis em http://www.sbmac.org.br/notas.php

1. Restaurao de Imagens com Aplicaes em Biologia e Engenharia Geraldo Cidade, Antnio Silva Neto e Nilson Costa Roberty 2. Fundamentos, Potencialidades e Aplicaes de Algoritmos Evolutivos Leandro dos Santos Coelho 3. Modelos Matemticos e Mtodos Numricos em guas Subterrneas Edson Wendlander 4. Mtodos Numricos para Equaes Diferenciais Parciais Maria Cristina de Castro Cunha e Maria Amlia Novais Schleicher 5. Modelagem em Biomatemtica Joyce da Silva Bevilacqua, Marat Rakov e Cludia de Lello Courtouke Guedes 6. Mtodos de Otimizao Randmica: algoritmos genticos e simulated annealing Sezimria F. Pereira Saramago 7. Matemtica Aplicada Fisiologia e Epidemiologia H.M. Yang, R. Sampaio e A. Sri Ranga 8. Uma Introduo Computao Quntica Renato Portugal, Carlile Campos Lavor, Luiz Mariano Carvalho e Nelson Maculan 9. Aplicaes de Anlise Fatorial de Correspondncias para Anlise de Dados Homero Chaib Filho 227

228 10. Modelos Matemticos baseados em autmatos celulares para Geoprocessamento Marilton Sanchotene de Aguiar, Fbia Amorim da Costa, Graaliz Pereira Dimuro e Antnio Carlos da Rocha Costa 11. Computabilidade: os limites da Computao Regivan H. N. Santiago e Benjamn R. C. Bedregal 12. Modelagem Multiescala em Materiais e Estruturas Fernando Rochinha e Alexandre Madureira 13. Modelagem em Biomatemtica (Coraci Malta ed.) 1 - Modelagem matemtica do comportamento eltrico de neurnios e algumas aplicaes Reynaldo D. Pinto 2 - Redes complexas e aplicaes nas Cincias Jos Carlos M. Mombach 3 - Possveis nveis de complexidade na modelagem de sistemas biolgicos Henrique L. Lenzi, Waldemiro de Souza Romanha e Marcelo Pelajo- Machado 14. A lgica na construo dos argumentos Angela Cruz e Jos Eduardo de Almeida Moura 15. Modelagem Matemtica e Simulao Numrica em Dinmica dos Fluidos Valdemir G. Ferreira, Hlio A. Navarro, Magda K. Kaibara 16. Introduo ao Tratamento da Informao nos Ensinos Fundamental e Mdio Marcilia Andrade Campos, Paulo Figueiredo Lima 17. Teoria dos Conjuntos Fuzzy com Aplicaes Rosana Sueli da Motta Jafelice, Larcio Carvalho de Barros, Rodney Carlos Bassanezi 18. Introduo Construo de Modelos de Otimizao Linear e Inteira Socorro Rangel

229 19. Observar e Pensar, antes de Modelar Flavio Shigeo Yamamoto, Srgio Alves, Edson P. Marques Filho, Amauri P. de Oliveira 20. Fraes Contnuas: Propriedades e Aplicaes Eliana Xavier Linhares de Andrade, Cleonice Ftima Bracciali 21. Uma Introduo Teoria de Cdigos Carlile Campos Lavor, Marcelo Muniz Silva Alves, Rogrio Monteiro de Siqueira, Sueli Irene Rodrigues Costa 22. Anlise e Processamento de Sinais Rubens Sampaio, Edson Cataldo, Alexandre de Souza Brando 23. Introduo aos Mtodos Discretos de Anlise Numrica de EDO e EDP David Soares Pinto Jnior 24. Representaes Computacionais de Grafos Llian Markenzon, Oswaldo Vernet 25. Ondas Ocenicas de Superfcie Leandro Farina 26. Tcnicas de Modelagem de Processos Epidmicos e Evolucionrios Domingos Alves, Henrique Fabrcio Gagliardi 27. Introduo teoria espectral de grafos com aplicaes Nair Maria Maia de Abreu, Renata Raposo Del-Vecchio, Cybele Tavares Maia Vinagre e Dragan Stevanovi 28. Modelagem e convexidade Eduardo Cursi e Rubens Sampaio 29. Modelagem matemtica em nanas quantitativas em tempo discreto Max Oliveira de Souza e Jorge Zubelli 30. Programao no linear em dois nveis: aplicao em Engenharia Mecnica Ana Friedlander e Eduardo Fancello

230 31. Funes simtricas e aplicaes em Combinatria Jos Plinio de Oliveira Santos e Robson da Silva 32. Semigrupos aplicados a sistemas dissipativos em EDP Carlos Raposo da Cunha 33. Introduo Simulao Estocstica para Aturia e Finanas Usando R Hlio Crtes Vieira, Alejandro C. Frery e Luciano Vereda 34. Modelos de Sustentabilidade nas Paisagens Amaznicas Alagveis Maurcio Vieira Kritz, Jaqueline Maria da Silva e Cludia Mazza 35. Uma Introduo Dinmica Estocstica de Populaes Leonardo Paulo Maia 36. Geometria de Algoritmos Numricos Gregorio Malajovich 37. Equaes Diferenciais, Teorema do Resduo e as Transformadas Integrais Edmundo Capelas de Oliveira e Jayme Vaz Jnior

You might also like