You are on page 1of 150

Universidade Estadual de Campinas

Faculdade de Engenharia Eltrica e de Computao

Modelagem de sistemas dinmicos no lineares


utilizando Sistemas Fuzzy, Algoritmos Genticos
e Funes de Base Ortonormal
Autor: Anderson Vincius de Medeiros
Orientador: Prof. Dr. Wagner Caradori do Amaral
Co-orientador: Prof. Dr. Ricardo Jos Gabrielli Barreto
Campello

Dissertao de Mestrado apresentada Faculdade


de Engenharia Eltrica e de Computao como parte
dos requisitos para obteno do ttulo de Mestre
em Engenharia Eltrica.
Automao.

rea de concentrao:

Banca Examinadora
Akebo Yamakami, Dr. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . DT/FEEC/Unicamp
Myriam Regattieri De Biase da Silva Delgado, Dr. . . . . . . . DAINF/CEFET-PR

Campinas, SP
Janeiro/2006

FICHA CATALOGRFICA ELABORADA PELA


BIBLIOTECA DA REA DE ENGENHARIA E ARQUITETURA - BAE - UNICAMP

M468m

Medeiros, Anderson Vincius de


Modelagem de sistemas dinmicos no lineares utilizando
sistemas Fuzzy, algoritmos genticos e funes de base
ortonormal / Anderson Vincius de Medeiros. --Campinas,
SP: [s.n.], 2006.
Orientadores: Wagner Caradori do Amaral, Ricardo Jos
Gabrielli Barreto Campello
Dissertao (Mestrado) - Universidade Estadual de
Campinas, Faculdade de Engenharia Eltrica e de
Computao.
1. Teoria dos sistemas dinmicos. 2. Sistemas difusos. 3.
Algoritmos genticos. 4. Otimizao matemtica. 5.
Identificao de sistemas. 6. Sistemas no-lineares. I.
Amaral, Wagner Caradori do. II. Campello, Ricardo Jos
Gabrielli Barreto. III. Universidade Estadual de Campinas.
Faculdade de Engenharia Eltrica e de Computao. IV.
Ttulo.

Titulo em Ingls: Modeling of nonlinear dynamics systems using fuzzy systems, genetic
algorithms and orthonormal basis functions
Palavras-chave em Ingls: Dynamic systems modeling, Takagi-Sugeno fuzzy model,
Orthonormal basis functions, Optimization of models, genetic
algorithms, Akaike information criterion, Similarity measures
rea de concentrao: Automao
Titulao: Mestre em Engenharia Eltrica
Banca examinadora: Akebo Yamakami e Myriam Regattieri de Biase da Silva Delgado.
Data da defesa: 23/01/2006

ii

Resumo
Esta dissertao apresenta uma metodologia para a gerao e otimizao de modelos fuzzy TakagiSugeno (TS) com Funes de Base Ortonormal (FBO) para sistemas dinmicos no lineares utilizando um algoritmo gentico. Funes de base ortonormal tm sido utilizadas por proporcionarem
aos modelos propriedades como ausncia de recurso da sada e possibilidade de se alcanar uma
razovel capacidade de representao com poucos parmetros. Modelos fuzzy TS agregam a essas
propriedades as caractersticas de interpretabilidade e facilidade de representao do conhecimento.
Enfim, os algoritmos genticos se apresentam como um mtodo bem estabelecido na literatura na
tarefa de sintonia de parmetros de modelos fuzzy TS.
Diante disso, desenvolveu-se um algoritmo gentico para a otimizao de duas arquiteturas, o
modelo fuzzy TS FBO e sua extenso, o modelo fuzzy TS FBO Generalizado. Foram analisados modelos locais lineares e no lineares nos conseqentes das regras fuzzy, assim como a diferena entre a
estimao local e a global (utilizando o estimador de mnimos quadrados) dos parmetros desses modelos locais. No algoritmo gentico, cada arquitetura contou com uma representao cromossmica
especfica. Elaborou-se para ambas uma funo de fitness baseada no critrio de Akaike. Em relao
aos operadores de reproduo, no operador de crossover aritmtico foi introduzida uma alterao
para a manuteno da diversidade da populao e no operador de mutao gaussiana adotou-se uma
distribuio varivel ao longo das geraes e diferenciada para cada gene. Introduziu-se ainda um
mtodo de simplificao de solues atravs de medidas de similaridade para a primeira arquitetura
citada. A metodologia foi avaliada na tarefa de modelagem de dois sistemas dinmicos no lineares:
um processo de polimerizao e um levitador magntico.
Palavras-chave: Modelagem de Sistemas Dinmicos, Modelo Fuzzy Takagi-Sugeno, Funes de
Base Ortonormal, Otimizao de Modelos, Algoritmos Genticos, Critrio de Akaike, Medidas de
Similaridade.

iii

Abstract
This work introduces a methodology for the generation and optimization of Takagi-Sugeno (TS)
fuzzy models with Orthonormal Basis Functions (OBF) for nonlinear dynamic systems based on a
genetic algorithm. Orthonormal basis functions have been used because they provide models with
properties like absence of output feedback and the possibility to reach a reasonable approximation
capability with just a few parameters. TS fuzzy models aggregate to these properties the characteristics of interpretability and easiness to knowledge representation in a linguistic manner. Genetic
algorithms appear as a well-established method for tuning parameters of TS fuzzy models.
In this context, it was developed a genetic algorithm for the optimization of two architectures,
the OBF TS fuzzy model and its extension, the Generalized OBF TS fuzzy model. Local linear
and nonlinear models in the consequent of the fuzzy rules were analyzed, as well as the difference
between local and global estimation (using least squares estimation) of the parameters of these local
models. Each architecture had a specific chromosome representation in the genetic algorithm. It was
developed a fitness function based on the Akaike information criterion. With respect to the genetic
operators, the arithmetic crossover was modified in order to maintain the population diversity and
the Gaussian mutation had its distribution varied along the generations and differentiated for each
gene. Besides, it was used, in the first architecture presented, a method for simplifying the solutions
by using similarity measures. The whole methodology was evaluated in modeling two nonlinear
dynamic systems, a polymerization process and a magnetic levitator.
Keywords: Dynamic Systems Modeling, Takagi-Sugeno Fuzzy Model, Orthonormal Basis Functions, Optimization of Models, Genetic Algorithms, Akaike Information Criterion, Similarity Measures.

iv

minha famlia e minha namorada.

vi

Agradecimentos
Acima de tudo, a Deus.
Ao meu orientador Prof. Wagner Caradori do Amaral pela orientao e compreenso com o ritmo do
trabalho.
Ao meu co-orientador Prof. Ricardo J. G. B. Campello pela grande contribuio para o aprimoramento de toda a pesquisa.
minha namorada Cynthia pela ajuda e companheirismo nas muitas noites, feriados e fins de semana
investidos nesse mestrado.
A meus pais, Beto e Lcia, pelos ensinamentos que formaram a base de toda minha educao.
Ao CNPq pelo apoio financeiro de parte dos trabalhos.

vii

viii

Sumrio
Lista de Figuras

xiii

Lista de Tabelas

xvii

Lista de Siglas e Abreviaes

xix

1 Introduo

2 Modelagem de Sistemas Dinmicos

2.1
2.2

2.3

2.4

2.5

O que um Modelo? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.1.1

Modelos Matemticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Modelos Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.2.1

Funo de Transferncia . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.2.2

Espao de Estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.2.3

Representao Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10

2.2.4

Resposta ao Impulso Finita

. . . . . . . . . . . . . . . . . . . . . . . . . .

10

2.2.5

ARX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

2.2.6

ARMAX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

12

2.2.7

Modelos FBO Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

12

Modelos No Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13

2.3.1

NARX e NARMAX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13

2.3.2

Modelo de Volterra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

14

2.3.3

Redes Neurais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

15

Modelos Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

17

2.4.1

Princpios e Aplicaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

17

2.4.2

Elementos de um Sistema Fuzzy . . . . . . . . . . . . . . . . . . . . . . . .

19

2.4.3

Arquiteturas Fuzzy dos Tipos Mamdani e Takagi-Sugeno . . . . . . . . . . .

21

Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

23

ix

SUMRIO

x
3

Modelo Fuzzy TS FBO

25

3.1

Funes de Base Ortonormal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

25

3.2

Arquiteturas dos Modelos FBO . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

30

3.2.1

Modelo FBO Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

31

3.2.2

Modelo FBO de Volterra . . . . . . . . . . . . . . . . . . . . . . . . . . . .

31

3.2.3

Modelo Fuzzy TS FBO . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

32

3.2.4

Modelo Fuzzy TS FBO Generalizado . . . . . . . . . . . . . . . . . . . . .

34

3.3

Parmetros de Projeto do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . .

35

3.4

Estimao Global Estimao Local . . . . . . . . . . . . . . . . . . . . . . . . .

37

3.5
4

39

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

41

4.1

Princpios Biolgicos dos Algoritmos Evolutivos . . . . . . . . . . . . . . . . . . .

41

4.2

Algoritmo Gentico Bsico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

43

4.2.1

Configurao do Algoritmo Gentico . . . . . . . . . . . . . . . . . . . . .

44

4.2.2

Aplicaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

45

Projeto Automtico de Modelos Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . .

47

4.3.1

Evoluo dos Sistemas Gentico-Fuzzy . . . . . . . . . . . . . . . . . . . .

48

4.3.2

Proposta para Otimizao do Sistema Fuzzy TS FBO . . . . . . . . . . . . .

51

Representao Cromossmica . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

52

4.4.1

Proposta de Representao Cromossmica . . . . . . . . . . . . . . . . . .

53

Avaliao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

58

4.5.1

Critrios para Anlise da Complexidade do Modelo . . . . . . . . . . . . . .

59

4.5.2

Proposta de Funo de Fitness . . . . . . . . . . . . . . . . . . . . . . . . .

61

Operadores de Seleo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

61

4.6.1

Proposta de Operador de Seleo . . . . . . . . . . . . . . . . . . . . . . .

64

Reproduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

65

4.7.1

Proposta de Operadores de Reproduo . . . . . . . . . . . . . . . . . . . .

66

4.8

Condies de Parada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

73

4.9

Medidas de Similaridade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

74

4.9.1

Proposta de Mtodo para Simplificao de Sistemas Fuzzy . . . . . . . . . .

75

4.10 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

76

Resultados de Modelagem

79

5.1

Descrio dos Sistemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

79

5.1.1

79

4.3

4.4
4.5

4.6
4.7

Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Levitador Magntico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

SUMRIO
5.1.2
5.1.3
5.2

5.3

Processo de Polimerizao . . . . . . . . . . . . . . . . . . . . . . . . . . .
Organizao dos Resultados . . . . . . . . . . . . . . . . . . . . . . . . . .

81
81

Modelos para o Levitador Magntico . . . . . . . . . . . . . . . . . . . . . . . . . .


5.2.1 Modelo fuzzy TS FBO com Plo nico . . . . . . . . . . . . . . . . . . . .
5.2.2 Modelo fuzzy TS FBO Generalizado com Estimao Local . . . . . . . . . .

82
84
90

5.2.3 Modelo fuzzy TS FBO Generalizado com Estimao Global . . . . . . . . . 95


5.2.4 Comentrios sobre os Modelos do Levitador Magntico . . . . . . . . . . . 103
Modelos para o Processo de Polimerizao . . . . . . . . . . . . . . . . . . . . . . . 104
5.3.1
5.3.2

5.4

xi

Modelo fuzzy TS FBO com Plo nico - Modelos Locais Lineares . . . . . . 107
Modelo fuzzy TS FBO com Plo nico - Modelos Locais No Lineares . . . 110

5.3.3 Comentrios sobre os Modelos do Processo de Polimerizao . . . . . . . . 114


Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

6 Concluses

117

Referncias bibliogrficas

121

xii

SUMRIO

Lista de Figuras
2.1

Modelo do neurnio de McCulloch e Pitts. . . . . . . . . . . . . . . . . . . . . . . .

16

2.2

Exemplo de arquitetura de uma rede perceptron multicamadas. . . . . . . . . . . . .

16

2.3

Exemplo de funes de pertinncia gaussianas. . . . . . . . . . . . . . . . . . . . .

20

3.1

Diagrama de blocos do modelo NFIR. . . . . . . . . . . . . . . . . . . . . . . . . .

26

3.2

Diagrama de blocos do modelo FBO. . . . . . . . . . . . . . . . . . . . . . . . . . .

28

4.1

Representao cromossmica binria. . . . . . . . . . . . . . . . . . . . . . . . . .

52

4.2

Representao cromossmica mista. . . . . . . . . . . . . . . . . . . . . . . . . . .

52

4.3

Representao cromossmica para o modelo fuzzy TS FBO com plo nico. . . . . .

56

4.4

Representao cromossmica para o modelo fuzzy TS FBO Generalizado. . . . . . .

57

4.5

Exemplo numrico da representao cromossmica para o modelo fuzzy TS FBO Generalizado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

58

4.6

Ilustrao do mtodo da roleta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

62

4.7

Operador de crossover geomtrico. . . . . . . . . . . . . . . . . . . . . . . . . . . .

65

4.8

Operador de mutao por inverso. . . . . . . . . . . . . . . . . . . . . . . . . . . .

66

4.9

Sensibilidade do crossover aritmtico ao parmetro de expanso . . . . . . . . . . .

68

4.10 Resultado do crossover aritmtico modificado em um conjunto de genes. . . . . . . .

69

4.11 Operador de recombinao uniforme. . . . . . . . . . . . . . . . . . . . . . . . . .

71

4.12 Funo para a definio dinmica do limite de similaridade. . . . . . . . . . . . . . .

77

5.1

Levitador magntico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

80

5.2

Sinais normalizados de entrada e sada para treinamento (levitador magntico). . . .

82

5.3

Diversidade da populao para o modelo fuzzy TS FBO com plo nico e modelos
locais lineares (levitador magntico). . . . . . . . . . . . . . . . . . . . . . . . . . .

5.4

87

Limite de similaridade para o modelo fuzzy TS FBO com plo nico e modelos locais
lineares (levitador magntico). . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
xiii

88

LISTA DE FIGURAS

xiv
5.5
5.6
5.7
5.8
5.9

Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO com plo nico
e modelos locais lineares (levitador magntico). . . . . . . . . . . . . . . . . . . . .

88

Funes de pertinncia de entrada para o modelo fuzzy TS FBO com plo nico e
modelos locais lineares (levitador magntico). . . . . . . . . . . . . . . . . . . . . .

89

Sada real e a fornecida pelo modelo fuzzy TS FBO com plo nico e modelos locais
lineares (levitador magntico). . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

90

Diversidade da populao para o modelo fuzzy TS FBO Generalizado com estimao


local e modelos locais lineares (levitador magntico). . . . . . . . . . . . . . . . . .

92

Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO Generalizado


com estimao local e modelos locais lineares (levitador magntico). . . . . . . . . .

92

5.10 Evoluo do EQM do melhor indivduo da populao para o modelo fuzzy TS FBO
Generalizado com estimao local e modelos locais lineares (levitador magntico). .

94

5.11 Dinmica do estado na premissa das regras para o modelo fuzzy TS FBO Generalizado
com estimao local e modelos locais lineares (levitador magntico). . . . . . . . . .

94

5.12 Funes de pertinncia de entrada para o modelo fuzzy TS FBO Generalizado com
estimao local e modelos locais lineares (levitador magntico). . . . . . . . . . . .

95

5.13 Modelos locais para o sistema fuzzy TS FBO Generalizado com estimao local e
modelos locais lineares (levitador magntico). . . . . . . . . . . . . . . . . . . . . .

96

5.14 Sada real e a fornecida pelo modelo fuzzy TS FBO Generalizado com estimao local
e modelos locais lineares (levitador magntico). . . . . . . . . . . . . . . . . . . . .

96

5.15 Diversidade da populao para o modelo fuzzy TS FBO Generalizado com modelos
locais no lineares e estimao global (levitador magntico). . . . . . . . . . . . . .

99

5.16 Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO Generalizado
com modelos locais no lineares e estimao global (levitador magntico). . . . . . .

99

5.17 Evoluo do EQM do melhor indivduo da populao para o modelo fuzzy TS FBO
Generalizado com modelos locais no lineares e estimao global (levitador magntico).100
5.18 Dinmica do estado na premissa das regras para o modelo fuzzy TS FBO Generalizado
com modelos locais no lineares e estimao global (levitador magntico). . . . . . . 101
5.19 Funes de pertinncia de entrada para o modelo fuzzy TS FBO Generalizado com
modelos locais no lineares e estimao global (levitador magntico). . . . . . . . . 101
5.20 Modelos locais para o sistema fuzzy TS FBO Generalizado com modelos locais no
lineares e estimao global (levitador magntico). . . . . . . . . . . . . . . . . . . . 102
5.21 Sada real e a fornecida pelo modelo fuzzy TS FBO Generalizado com modelos locais
no lineares e estimao global (levitador magntico). . . . . . . . . . . . . . . . . . 103

LISTA DE FIGURAS

xv

5.22 Modelos locais anti-simtricos para o sistema fuzzy TS FBO Generalizado com modelos locais no lineares e estimao global (levitador magntico). . . . . . . . . . . . 104
5.23 Sinais normalizados de entrada e sada para treinamento (CSTR). . . . . . . . . . . . 105
5.24 Diversidade da populao para o modelo fuzzy TS FBO com plo nico e modelos
locais lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.25 Limite de similaridade para o modelo fuzzy TS FBO com plo nico e modelos locais
lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
5.26 Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO com plo nico
e modelos locais lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
5.27 Funes de pertinncia de entrada para o modelo fuzzy TS FBO com plo nico e
modelos locais lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
5.28 Sada real e a fornecida pelo modelo fuzzy TS FBO com plo nico e modelos locais
lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
5.29 Diversidade da populao para o modelo fuzzy TS FBO com plo nico e modelos
locais no lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
5.30 Limite de similaridade para o modelo fuzzy TS FBO com plo nico e modelos locais
no lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
5.31 Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO com plo nico
e modelos locais no lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . 113
5.32 Funes de pertinncia de entrada para o modelo fuzzy TS FBO com plo nico e
modelos locais no lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . 114
5.33 Sada real e a fornecida pelo modelo fuzzy TS FBO com plo nico e modelos locais
no lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

xvi

LISTA DE FIGURAS

Lista de Tabelas
5.1

Configurao do AG para o sistema levitador magntico. . . . . . . . . . . . . . . .

5.2

Resumo dos resultados do modelo fuzzy TS FBO com plo nico (levitador magntico). 85

5.3

Resumo dos resultados do modelo fuzzy TS FBO com plo nico sem o parmetro de

5.4
5.5
5.6
5.7

83

expanso (levitador magntico). . . . . . . . . . . . . . . . . . . . . . . . . . . .

85

Melhor resultado (menor EQM) do modelo fuzzy TS FBO com plo nico (levitador
magntico). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

86

Soluo fornecida pelo AG para o modelo fuzzy TS FBO com plo nico e modelos
locais lineares (levitador magntico). . . . . . . . . . . . . . . . . . . . . . . . . . .

89

Resumo dos resultados do modelo fuzzy TS FBO Generalizado com estimao local
(levitador magntico). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

91

Resumo dos resultados do modelo fuzzy TS FBO Generalizado com estimao local
sem o parmetro de expanso (levitador magntico). . . . . . . . . . . . . . . . . .

91

Melhor resultado do modelo fuzzy TS FBO Generalizado com estimao local (levitador magntico). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

93

Soluo fornecida pelo AG para o modelo fuzzy TS FBO Generalizado com modelos
locais lineares e estimao local (levitador magntico). . . . . . . . . . . . . . . . .

93

5.10 Resumo dos resultados do modelo fuzzy TS FBO Generalizado com estimao global
(levitador magntico). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

97

5.8
5.9

5.11 Resumo dos resultados do modelo fuzzy TS FBO Generalizado com estimao global
sem o parmetro de expanso (levitador magntico). . . . . . . . . . . . . . . . . .

97

5.12 Melhor resultado do modelo fuzzy TS FBO Generalizado com estimao global (levitador magntico). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

98

5.13 Soluo fornecida pelo AG para o modelo fuzzy TS FBO Generalizado com modelos
locais no lineares e estimao global (levitador magntico). . . . . . . . . . . . . . 100
5.14 Configurao do AG para o sistema CSTR. . . . . . . . . . . . . . . . . . . . . . . 106
5.15 Resumo dos resultados do modelo fuzzy TS FBO com plo nico (CSTR). . . . . . . 107
xvii

xviii

LISTA DE TABELAS

5.16 Resumo dos resultados do modelo fuzzy TS FBO com plo nico sem o parmetro de
expanso (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
5.17 Melhor resultado do modelo fuzzy TS FBO com plo nico (CSTR). . . . . . . . . . 108
5.18 Soluo fornecida pelo AG para o modelo fuzzy TS FBO com plo nico e modelos
locais lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
5.19 Soluo fornecida pelo AG para o modelo fuzzy TS FBO com plo nico e modelos
locais no lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

Lista de Siglas e Abreviaes


ADN

cido Desoxirribonuclico

AG

Algoritmos Genticos

AIC

Akaike Information Criterion

ARIMAX

Autoregressive Integrated Moving Average with Exogenous Inputs

ARMAX

Autoregressive Moving Average with Exogenous Inputs

ARX

Autoregressive with Exogenous Inputs

CSTR

Continuous Stirred Tank Reactor

EQM

Erro Quadrtico Mdio

FBO

Funes de Base Ortonormal

FIR

Finite Impulse Response

FP

Funo de Pertinncia

GFS

Genetic Fuzzy Systems

MDL

Minimum Description Length

MML

Minimum Message Length

MQ

Mnimos Quadrados

NARMAX

Nonlinear Autoregressive Moving Average with Exogenous Inputs

NARX

Nonlinear Autoregressive with Exogenous Inputs

NEFCON

Neural Fuzzy Controller


xix

LISTA DE SIGLAS E ABREVIAES

xx
NFIR

Nonlinear Finite Impulse Response

PD

Proporcional Derivativo

PI

Proporcional Integral

RNA

Rede Neural Artificial

TS

Takagi-Sugeno

Captulo 1
Introduo
Algoritmos genticos (AG) tm sido aplicados na tarefa de otimizao de sistemas fuzzy desde o
incio da dcada de 90. Sistemas fuzzy do tipo Takagi-Sugeno (TS), Mamdani ou relacional (alm
de redes neuro-fuzzy) foram projetados com fins de modelagem ou controle utilizando variaes do
algoritmo gentico originalmente proposto por Holland no incio dos anos 60. As pesquisas seguiram
a tendncia de otimizar cada vez mais parmetros do sistema fuzzy com cada vez menos interao
humana. Aos poucos foram analisados tambm outros critrios qualitativos para os sistemas obtidos,
tais como interpretabilidade e simplicidade. Assim, no bastava a um modelo representar adequadamente determinado sistema real - era preciso desempenhar essa tarefa de maneira compreensvel e
simples. medida que foram abordados sistemas mais complexos surgiram novas arquiteturas de
otimizao, envolvendo nveis hierrquicos e o conceito de co-evoluo.
Em se tratando da obteno de modelos fuzzy, um aspecto de especial interesse nas pesquisas
recentes refere-se ao compromisso entre capacidade de representao do modelo fuzzy e sua complexidade. Neste sentido, foram definidas mtricas para avaliar quo interpretvel seria um modelo
(em termos de simplicidade da base de regras ou disposio das funes de pertinncia) face sua
capacidade de representao de um determinado sistema real.
O presente trabalho aborda exatamente este compromisso. Incorpora-se aos modelos fuzzy TS
com Funes de Base Ortonormal (FBO), propostos originalmente por Oliveira et al em 1999 [89],
um mtodo automtico de otimizao baseado em algoritmos genticos. Este mtodo permite a
obteno de modelos ao mesmo tempo simples (com um pequeno nmero de parmetros, alm de
interpretvel) e com satisfatria capacidade de representao. Mais especificamente, o algoritmo
gentico desenvolvido possibilita a otimizao de duas arquiteturas, o modelo fuzzy TS FBO e sua
extenso, o modelo fuzzy TS FBO Generalizado, proposto originalmente em [14, 15]. Para a primeira,
composta por uma nica base de funes ortonormais e referenciada no texto como arquitetura de
1

Introduo

plo nico1, otimiza-se um plo real ou um par de plos complexos conjugados (dependendo se
as funes ortonormais utilizadas so de Laguerre ou de Kautz), o nmero de variveis de entrada
do modelo, a quantidade de funes de pertinncia por varivel de entrada e o nmero de funes na
base ortonormal. Para a segunda arquitetura, otimiza-se um plo complexo para cada modelo local,
alm do nmero de funes em cada base ortonormal. Em ambas, a disposio e configurao das
funes de pertinncia do modelo fuzzy tambm foram automaticamente determinadas. Note-se que o
nmero de funes na base ortonormal (ou bases ortonormais) corresponde ao nmero de estados nos
modelos locais do sistema fuzzy, influenciando diretamente a capacidade de representao do modelo.
As principais contribuies desta pesquisa residem na proposta de duas representaes cromossmicas originais, na elaborao de uma funo de fitness baseada no critrio de informao de
Akaike, na alterao do operador de crossover aritmtico, no uso de um operador de mutao gaussiana com distribuies variveis e distintas para cada gene e no uso de medidas de similaridade para
a simplificao de funes de pertinncia redundantes (e conseqente reduo da base de regras de
inferncia).
Esta dissertao est organizada da seguinte forma. Aps esta introduo, o captulo 2 apresenta o
conceito de modelagem de sistemas dinmicos e uma srie de modelos lineares e no lineares. Alguns
so apresentados apenas para contextualizar o trabalho (como as funes de transferncia e as redes
neurais) enquanto outros sero efetivamente utilizados nos captulos posteriores (como os modelos
em espao de estados e os FBO lineares). Em particular, enfoca-se o modelo fuzzy TS, que constitui
o pilar das arquiteturas sujeitas otimizao pelo AG.
Reserva-se o captulo 3 para a apresentao detalhada dos modelos fuzzy TS FBO e fuzzy TS FBO
Generalizado, obtidos com a utilizao de funes de base ortonormal como filtros para a gerao
das variveis lingsticas (estados) do modelo fuzzy TS. As funes de base ortonormal possuem uma
srie de vantagens para a aplicao em modelagem de sistemas dinmicos no lineares, como necessidade de um nmero menor de parmetros para se atingir uma dada capacidade de representao
e ausncia de realimentao da sada do modelo. Neste captulo discriminam-se quais parmetros
dos modelos sero otimizados autonomamente pelo AG. Alm disso, descrevem-se duas variaes do
mtodo de estimao de mnimos quadrados: estimao local e estimao global. A aplicao dessas
duas variaes na estimao dos coeficientes dos conseqentes das regras de inferncia do modelo
fuzzy TS FBO Generalizado gera modelos com comportamentos bem distintos, os quais so analisados no captulo 5. Como na arquitetura com plo nico a mesma base ortonormal est presente em
todas as regras (dinmica comum, diferenciando-se apenas as relaes estticas entre os estados das
diversas regras), aplica-se apenas a estimao global dos parmetros.
1

Essa terminologia (plo nico) dever ser interpretada como uma base nica de funes ortonormais, parametrizada
por um plo real ou por um par de plos complexos conjugados, em contraste com a extenso Generalizada, que ser
parametrizada por um nmero qualquer de plos reais ou complexos conjugados.

3
O captulo 4, o principal da dissertao, dedicado apresentao dos algoritmos genticos,
seus princpios, aplicaes e fuso com sistemas fuzzy, formando os sistemas gentico-fuzzy. Aps
uma reviso da evoluo dos sistemas gentico-fuzzy, o texto detalha cada componente ou etapa do
AG, primeiramente de forma geral e ento a implementao especfica desta dissertao, seguindo a
ordem: representao cromossmica, avaliao dos indivduos que codificam os modelos, operador
de seleo e operadores de reproduo (crossover e mutao). Por ltimo, descreve-se um mtodo
para a eliminao de redundncia de funes de pertinncia no modelo fuzzy TS FBO com plo nico
atravs do uso de medidas de similaridade. Tal mtodo no aplicado na arquitetura Generalizada
pois a representao cromossmica elaborada para esta menos flexvel que aquela elaborada para a
arquitetura com plo nico, conforme ser justificado no captulo 4. No decorrer de todo o captulo
apresentam-se as motivaes e justificativas para o modo como foi projetado cada componente ou
etapa do algoritmo gentico.
Os resultados de modelagem so apresentados e analisados no captulo 5. Aplica-se o mtodo
desenvolvido no captulo 4 na tarefa de modelagem de dois sistemas dinmicos no lineares com
diferentes graus de complexidade: um processo de polimerizao e um levitador magntico. Os
resultados obtidos indicam a eficincia da metodologia proposta, possibilitando o levantamento de
conjecturas sobre a aplicabilidade de cada arquitetura na modelagem de sistemas dinmicos no
lineares.
Finalmente, o captulo 6 traa as concluses sobre a pesquisa realizada e apresenta algumas perspectivas para sua continuao.

Introduo

Captulo 2
Modelagem de Sistemas Dinmicos
O objetivo desse captulo descrever os principais conceitos relacionados ao contexto no qual se
insere a presente dissertao. So apresentadas as bases tericas que sero utilizadas em captulos
posteriores e os principais conceitos envolvidos. Dessa forma, parte-se de definies simples (como
o conceito de sistema e modelo) e prossegue-se at a contextualizao de todo o trabalho. Delega-se
aos captulos subseqentes a tarefa de aprofundamento dos principais temas abordados.

2.1 O que um Modelo?


Para se trabalhar de forma sistemtica e eficiente com problemas que envolvem dependncia
temporal, necessrio que exista uma descrio das entidades ou processos envolvidos. Em uma
definio simplista, tal descrio consiste em um modelo. A caracterstica de dependncia temporal
relaciona-se ao fato de o sistema sendo analisado, definido primariamente como uma combinao de
elementos que juntos desempenham alguma tarefa, ter seu comportamento dependente de variveis
externas que atuaram nele em algum momento no passado. No contexto deste trabalho, um modelo
ser definido como uma representao de um sistema dinmico. Como ser visto na seqncia, um
modelo pode ser definido ou classificado de diversas outras formas.
Alguns dos objetivos para se construir um modelo so aumentar o conhecimento sobre um sistema, projetar um controlador, simular situaes hipotticas ou realizar predies sobre o comportamento futuro do sistema. Aplicaes to diversas vo requerer, conseqentemente, modelos em
formatos diferenciados. Modelos fsicos, como uma maquete, so teis na visualizao de como os
componentes fsicos do sistema interagem entre si. Grficos so outras formas de modelos. Eles
podem apresentar relaes de causa e efeito de maneira concisa e intuitiva. Porm, o tipo de modelo
mais comum o modelo matemtico. Tais modelos podem ser obtidos atravs de mtodos que vo
desde a anlise das leis fsicas atuantes no sistema at uma abordagem puramente numrica, baseada
5

Modelagem de Sistemas Dinmicos

6
em um conjunto de dados experimentais.

A escolha do tipo do modelo depende do propsito definido para o mesmo e do tipo e quantidade
de informao disponvel sobre o sistema. No presente trabalho, como o objetivo a obteno de
modelos que possam ser usados em sistemas de controle, buscar-se- obter modelos matemticos
para os sistemas abordados. A prxima seo apresenta mais detalhes sobre as caractersticas de um
modelo matemtico.

2.1.1 Modelos Matemticos


Muitas so as classificaes para modelos matemticos, no existindo um padro unanimemente
aceito. Descrevem-se na seqncia apenas as classificaes mais relevantes para este trabalho.
Primeiramente, possvel distinguir modelos lineares de modelos no lineares. Seja o seguinte
modelo matemtico:
y = f (u)
(2.1)
Considera-se u a entrada do modelo, y sua sada e f (.) a funo que descreve o comportamento
do sistema. Tpicos sinais de entrada em sistemas seriam a fora aplicada a uma massa, a voltagem
alimentando um circuito eltrico ou a substncia catalisadora de uma reao qumica. Em suma,
so sinais de excitao. Geralmente, as entradas de um sistema so denotadas por u1 (t), u2 (t), . . .,
un (t). J as sadas, denotadas comumente por y1 (t), y2 (t), . . ., yn (t) , so as variveis calculadas ou
medidas, correspondendo ao efeito no sistema da entrada u. So exemplos a velocidade da massa
aps a aplicao da fora, a carga em um capacitor ou a concentrao do substrato da reao qumica.
As notaes exibidas referem-se ao tempo contnuo. No domnio discreto, utiliza-se normalmente o
ndice k (como u(k) e y(k)).
Voltando questo da linearidade, o modelo dito linear se, para uma entrada au1 (t) + bu2 (t) a
sada :
y = f (au1 (t) + bu2 (t)) = af (u1 (t)) + bf (u2 (t)) = ay1 + by2

(2.2)

sendo a e b constantes, u1 (t) e u2 (t) entradas arbitrrias e y1 = f (u1 (t)), y2 = f (u2 (t)).
Qualquer relao ou modelo que no satisfaa (2.2) no linear. Por exemplo, funes logartmicas, trigonomtricas ou potncias tornam um modelo matemtico no linear. A importncia
da linearidade em um modelo reside nas simplificaes obtidas durante sua anlise. Alm disso,
possvel em um modelo linear isolar os efeitos das variveis de entrada e estud-las separadamente.
No entanto, a maioria dos sistemas reais no linear, caso no sejam feitas restries quanto aos
valores de suas entradas. A anlise em determinadas faixas de operao pode vir a fornecer certo grau
de linearidade ao modelo. Porm, dependendo da aplicao, a considerao da natureza no linear
do sistema pode ser essencial nas tarefas sendo realizadas, no podendo ser descartada do modelo.

2.2 Modelos Lineares

Todos os modelos obtidos nesse trabalho so no lineares.


Uma segunda forma de classificar modelos baseada na caracterstica da varivel independente
temporal. Um modelo contnuo aquele no qual as variveis so contnuas no tempo, ou seja,
possvel acompanhar o sistema (e nele atuar) em qualquer instante de tempo. Esses modelos so
geralmente descritos por equaes diferenciais. Em contrapartida, os modelos discretos so aqueles
nos quais as variveis do sistema evoluem de uma forma discretizada em relao ao tempo agora
discretizado. Os instantes de tempo nos quais as variveis podem alterar seus valores podem corresponder ao momento no qual alguma amostragem realizada ou a memria de um computador
lida. Modelos discretos so representados por equaes a diferenas. Em engenharia, o fator
mais sugestivo para o uso de modelos discretos a disponibilidade de um computador digital para
aquisio de dados ou implementao de um controlador. Os modelos abordados nessa dissertao
so discretos.
Finalmente, algumas vezes h incerteza de natureza probabilstica no valor de algum parmetro
do modelo. Se essa incerteza for significativa, um modelo estocstico deve ser usado. Nesse modelo,
algumas variveis so descritas em termos de uma funo de distribuio de probabilidade, envolvendo, por exemplo, suas mdias e varincias. Os modelos determinsticos, por outro lado, no
representam possveis aleatoriedades presentes no sistema real. Assim, a sada em um dado instante
para um modelo determinstico completamente determinada a partir dos dados passados do modelo
e de suas entradas. A caracterstica de determinismo est presente nos modelos desenvolvidos no
presente trabalho, os quais contemplam apenas incertezas de natureza possibilstica (fuzzy).
Alm destas caractersticas principais, pode-se ainda classificar um modelo como sendo a parmetros distribudos ou concentrados, variante ou invariante no tempo, autnomo ou no autnomo,
no paramtrico ou paramtrico e multivarivel ou monovarivel [53]. Essa dissertao caracterizada, em todos os pares anteriores, pelas segundas propriedades.
A partir da prxima seo sero descritos com mais detalhes uma srie de modelos lineares e
no lineares. Como afirmado no incio deste captulo, o objetivo aqui no ser a construo de um
material de referncia sobre os inmeros tipos de modelos existentes mas sim a descrio do contexto
no qual est situada a presente pesquisa.

2.2 Modelos Lineares


Esta seo descreve alguns dos modelos lineares mais usuais. A seo 2.3 apresentar, por sua
vez, modelos no lineares, quando sero explicitados aqueles que serviro como base para os captulos posteriores.

Modelagem de Sistemas Dinmicos

2.2.1 Funo de Transferncia


A funo de transferncia de um sistema linear e invariante no tempo definida como a razo
entre as transformadas de Laplace da sada do sistema e de sua entrada, considerando-se todas as
condies iniciais nulas [27]. A funo de transferncia de um sistema representa a relao entre
as variveis de entrada e sada do sistema, descrevendo a dinmica do mesmo. Logo, no inclui
nenhuma informao a respeito da estrutura e comportamento internos do sistema ou mesmo de sua
estrutura fsica. De fato, as funes de transferncia de sistemas fsicos distintos podem ser idnticas.
Considere-se o sistema linear definido pela equao diferencial (2.3):
(n)

a0 y +a1

(n1)

(m)

y + . . . + an1 y + an y = b0 u +b1

(m1)

+ . . . + bm1 u + bm u, (n m)

(2.3)

(n)

sendo y a sada do sistema e u sua entrada ( y = derivada de ordem n com relao ao tempo t). A
funo de transferncia desse sistema obtida tomando-se a transformada de Laplace de ambos os

lados da equao (2.3), considerando-se todas as condies iniciais nulas, ou seja:


G(s) =

Y (s)
b0 sm + b1 sm1 + . . . + bm1 s + bm
L {y(t)}
=
=
L {u(t)}
U(s)
a0 sn + a1 sn1 + . . . + an1 s + an

(2.4)

Assim, a funo de transferncia uma representao algbrica em s de um sistema dinmico


[86].
Funes de transferncia discretas so obtidas a partir das contnuas atravs de transformaes
baseadas em aproximaes discretas para a derivada. Uma destas aproximaes denominada
mtodo de Tustin, definido como [3]:
2(z 1)
s
(2.5)
Ts (z + 1)
sendo Ts o perodo de amostragem. A notao s z significa que s deve ser substitudo por z. O

mapeamento inverso, isto , do domnio discreto para o contnuo, pode ser realizado diretamente ao
se explicitar z na relao (2.5).

O conceito de funo de transferncia importante na medida em que fornece um modelo matemtico til para utilizao nas fases de anlise e projeto de um controlador.
A funo de transferncia uma propriedade do sistema em si, independente da magnitude e natureza dos sinais de entrada. Assim, caso a funo de transferncia de um sistema seja conhecida,
sua sada pode ser estudada para vrios sinais diferentes de entrada, obtendo-se dessa forma mais
conhecimento sobre a natureza do sistema. Se este no for o caso, possvel obt-la de forma experimental aplicando-se entradas conhecidas no sistema e analisando-se suas respostas. Um dos mtodos
aplicveis nessa tarefa o mtodo de Sundaresan. Esse mtodo permite obter os parmetros de uma

2.2 Modelos Lineares

funo de transferncia de segunda ordem com atraso puro de tempo desde que esteja disponvel a
sada do sistema a uma entrada degrau [3, 27].

2.2.2 Espao de Estados


Uma alternativa s funes de transferncia so os modelos em espao de estados, os quais permitem explicitar as relaes entre as variveis internas do sistema. Para tal, preciso identificar quais
so as variveis de estado do modelo, definidas como o conjunto de variveis necessrias para descrever completamente o comportamento do sistema. Em outras palavras, conhecendo-se os valores
das variveis de estado possvel calcular a sada do sistema para qualquer instante futuro como uma
funo das variveis de estado e dos valores atuais e futuros das entradas.
Considerando-se que as variveis de estado do modelo so x1 , . . ., xn , a dinmica de estados
de um sistema linear invariante no tempo dada pelo seguinte conjunto de equaes diferenciais de
primeira ordem:
x 1 = a11 x1 + . . . + a1n xn + b11 u1 + . . . + b1m um
..
.

(2.6)

x n = an1 x1 + . . . + ann xn + bn1 u1 + . . . + bnm um


e as sadas do sistema so fornecidas pelo sistema de equaes (2.7):
y1 = c11 x1 + . . . + c1n xn + d11 u1 + . . . + d1m um
..
.

(2.7)

yp = cp1 x1 + . . . + cpn xn + dp1 u1 + . . . + dpmum


sendo aij , bij , cij e dij coeficientes constantes.
Em notao matricial tm-se:
x = Ax + Bu
y = Cx + Du

(2.8)

sendo x n o vetor de estados, u m o vetor de entrada e y p o vetor de sadas [27].

Para sistemas discretos possvel usar uma notao semelhante da equao (2.8), bastando
substituir o vetor de estado contnuo x por x(k), a sada y por y(k), a entrada u por u(k) e finalmente
a derivada x por x(k + 1).
preciso notar que a representao em espao de estados de um sistema fsico no nica, mas

Modelagem de Sistemas Dinmicos

10

depende da escolha das variveis de estado. Algumas representaes particularmente interessantes


so a forma de Jordan e as formas cannicas controlvel e observvel. Existem procedimentos para
a converso de uma representao em outra, assim como para obter a funo de transferncia de um
sistema partindo de seu modelo em espao de estados [53].
A representao em espao de estados particularmente conveniente para sistemas multivariveis.
Alm de suas vantagens em termos de clculos computacionais, pode ser usada para adquirir maior
percepo sobre o comportamento do sistema. Seu uso permite o projeto de sistemas de controle
respeitando vrias especificaes de desempenho e ainda considerando as condies iniciais internas
do sistema [87].
Como ser visto no captulo 3, os modelos fuzzy TS FBO Generalizados, que contituem um dos
tpicos principais de interesse no presente trabalho, utilizam o conceito de representao em espao
de estados.

2.2.3 Representao Geral


A equao (2.9) fornece uma representao geral para toda uma classe de modelos lineares discretos [3, 72]. Alguns destes modelos so apresentados nas sees 2.2.4, 2.2.5 e 2.2.6
A(q)y(k) = q nk

C(q)
B(q)
u(k) +
e(k)
F (q)
D(q)

(2.9)

O termo q nk introduzido para explicitar um possvel atraso entre as dinmicas de u e y (q 1 o


operador de atraso, ou seja, q 1 x(k) = x(k 1)). Os outros modelos so derivados deste a partir das
diferentes atribuies dadas aos polinmios A(q), B(q), C(q), D(q) e F (q). Embora o modelo (2.9)
seja muito geral para aplicaes prticas, o desenvolvimento de algoritmos e resultados tericos para
ele imediatamente engloba todos os casos especiais correspondentes a modelos mais realistas.

2.2.4 Resposta ao Impulso Finita


Sabe-se que um sistema linear, causal e invariante no tempo pode ser descrito por sua resposta ao
impulso g( ) da seguinte forma:
y(t) =

=0

g( )u(t )d

(2.10)

Conhecendo-se g( )|
=0 e u(r) para r t possvel calcular a sada y(r), r t, para qualquer
entrada. Assim, a resposta ao impulso caracteriza o sistema.
Ao se considerar o domnio discreto, a representao da resposta ao impulso dada pelo somatrio

2.2 Modelos Lineares

11

de convoluo:
y(k) =

X
i=0

g(i)u(k i)

(2.11)

Caso o sistema seja assintoticamente estvel possvel truncar o somatrio infinito em um nmero
mximo de termos L. Alm disso, normalmente existem distrbios atuando no sistema, como rudo
de medio ou atuao de entradas no controladas. Para considerar de forma geral tais distrbios o
termo e(k), representando rudo branco, includo na equao. Dessa forma, obtm-se o modelo de
resposta ao impulso finita (FIR, do ingls Finite Impulse Response) [72].
y(k) =

L
X
i=0

g(i)u(k i) + e(k)

(2.12)

2.2.5 ARX
Alm da resposta ao impulso finita, outra forma simples de representar uma relao de entradasada em um sistema atravs da seguinte equao a diferenas:
y(k) + a1 y(k 1) + . . . + ana y(k na ) = b1 u(k 1) + . . . + bnb u(k nb ) + e(k)

(2.13)

Como o termo de rudo e(k) aparece na equao a diferenas, esse modelo classificado como
um modelo de erro na equao, ao contrrio do modelo FIR, onde o erro adicionado diretamente
sada y(k).
Ao se introduzir a notao:
A(q) = 1 + a1 q 1 + . . . + ana q na
e
B(q) = b1 q 1 + . . . + bnb q nb
obtm-se o modelo autoregressivo com entradas externas (ou ARX, do ingls AutoRegressive with
eXogenous inputs):
A(q)y(k) = B(q)u(k) + e(k)

(2.14)

O caso especial em que na = 0 resulta no modelo FIR. O modelo ARX especialmente til
pois permite o uso de mtodos simples porm poderosos de estimao dos parmetros do modelo
(regresso linear).
A principal desvantagem dos modelos ARX a falta de liberdade na modelagem da dinmica do

Modelagem de Sistemas Dinmicos

12

termo de rudo e(k). Reescrevendo-se a equao (2.14) da seguinte forma:


y(k) =

1
B(q)
u(k) +
e(k)
A(q)
A(q)

(2.15)

observa-se que o rudo branco filtrado por um filtro com a mesma dinmica do sistema. Quando esta
no for a representao mais fiel do sistema, o modelo ARMAX, descrito na seo seguinte, pode ser
usado.

2.2.6 ARMAX
possvel adicionar flexibilidade ao modelo ARX ao se descrever a dinmica do rudo como
um processo de mdia mvel. A equao a diferenas desse novo modelo pode ser vista na
equao (2.16):
y(k) + a1 y(k 1) + . . . + ana y(k na ) = b1 u(k 1) + . . . + bnb u(k nb ) + e(k)
+ c1 e(k 1) + . . . + cnc e(k nc )

(2.16)

sendo C(q) = 1 + c1 q 1 + ... + cnc q nc . O modelo ARMAX, do ingls AutoRegressive Moving


Average with eXogenous inputs, escrito de forma compacta como:
A(q)y(k) = B(q)u(k) + C(q)e(k)

(2.17)

Assim como o modelo ARX, este um modelo de erro na equao. O modelo ARMAX considerado uma estrutura padro usada em modelagem e controle de sistemas.
Uma variao com um integrador embutido no modelo a representao ARIMAX, onde o I vem
da operao de integrao. O modelo ARIMAX obtido substituindo-se y(k) na equao (2.17) por
y(k) = y(k) y(k 1). Tal variao til na descrio de sistemas com perturbaes lentas [72].

2.2.7 Modelos FBO Lineares


Os modelos baseados em Funes de Base Ortonormal, FBO, sero mais detalhados no captulo 3,
em um contexto no linear. Por hora suficiente afirmar que possvel desenvolver a resposta ao
impulso do sistema g(i), apresentada na equao (2.11), em uma base de funes ortonormais {j },
da seguinte forma [14]:

g(i) =

j=1

j j (i)

(2.18)

2.3 Modelos No Lineares

13

sendo j escalares e j (i) a i-sima funo ortonormal. Ao substituir g(i) da equao (2.18) na
equao (2.11), obtm-se:
y(k) =
=
=

j j (i)u(k
i=0 j=1

X
X
j

j=1

i=0

i)

j (i)u(k i)

j lj (k)

(2.19)

j=1

O sinal lj (k) o resultado da filtragem linear da entrada u(k i) pelo filtro ortonormal carac-

terizado pela funo j . Pode-se truncar o ltimo somatrio da equao (2.19) em um nmero N de
funes ortonormais, obtendo-se assim o modelo linear FBO [14]:
y(k) =

N
X

j lj (k)

(2.20)

j=1

Uma das vantagens deste modelo a possibilidade de se incorporar conhecimento sobre o sistema
na base de funes ortonormais {j }. O efeito imediato a sensvel reduo do nmero de parmetros
do modelo. A seo 3.1 apresentar outras caractersticas e vantagens dos modelos FBO, enquanto a
seo 3.2.3 contextualizar sua aplicao no presente trabalho.

2.3 Modelos No Lineares


Como afirmado na seo 2.1.1, muitas vezes faz-se necessrio trabalhar com modelos no lineares.
Nestas ocasies necessrio considerar caractersticas intrnsecas importantes do sistema, que de
outra forma sofreriam aproximaes (linearizao). Esta seo apresenta uma srie de modelos no
lineares comumente utilizados nas tarefas de modelagem e controle de sistemas dinmicos.

2.3.1 NARX e NARMAX


Os modelos no lineares NARX e NARMAX (com o N inicial vindo do ingls nonlinear) so
extenses de seus equivalentes lineares. O modelo NARX descreve a sada do sistema como uma
funo no linear dos termos passados da entrada e da sada, ou seja:
y(k) = F [y(k 1), . . . , y(k na ), u(k 1), . . . , u(k nb )]

(2.21)

Modelagem de Sistemas Dinmicos

14

O modelo NARMAX inclui ainda os termos da dinmica da perturbao atuando no sistema.


Assim, tem-se:
y(k) = F [y(k 1), . . . , y(k na ), u(k 1), . . . , u(k nb ), e(k), . . . , e(k nc )]

(2.22)

Nestas duas equaes, na , nb e nc representam os maiores atrasos da sada, da entrada e do rudo,


respectivamente, considerados no modelo, e F uma funo no linear.
Algumas realizaes especiais da funo F [.] permitem a obteno de modelos lineares nos
parmetros, mesmo com regressores no lineares. Uma delas a polinomial, que para o modelo
NARX pode ser escrita como [3]:
y(k) =

l X
m nX
a ,nb
X

m=0 p=0 n1 ,nm

cp,mp (n1 , . . . , nm )

p
Y

i=1

y(k ni )

m
Y

i=p+1

u(k ni )

(2.23)

sendo que nessa representao os produtrios so por definio unitrios quando o ndice final
menor que o inicial.
Nesta equao, l o grau de no linearidade da funo F [.], na e nb so os mximos atrasos
considerados da sada e da entrada, respectivamente, e cp,mp so os parmetros escalares que multiplicam os diferentes termos do modelo. Embora esse tipo de representao para a funo F [.]
possibilite o uso de mtodos eficientes de estimao dos parmetros do modelo, persiste um grande
problema que a definio da estrutura do modelo. Nessa tarefa, devero ser estabelecidos os maiores
atrasos na e nb (e nc , em um modelo NARMAX) e o grau de no linearidade l do modelo. A complexidade desta tarefa reside no fato de que para pequenos atrasos e graus de no linearidade o nmero
de parmetros no modelo cresce rapidamente. Este assunto ser abordado na seo 3.1.

2.3.2 Modelo de Volterra


Por se tratar de uma generalizao da resposta ao impulso, que um modelo linear, a srie de
Volterra possibilita o uso dos conceitos e modos de pensar de sistemas lineares em sistemas no
lineares. Isso uma grande vantagem face os grandes avanos tericos conquistados no tratamento
de sistemas lineares tanto no domnio do tempo quanto no da freqncia [33].
No domnio do tempo, um modelo baseado na srie de Volterra, ou simplesmente modelo de
Volterra, dado pela srie infinita:
y(t) = y1 (t) + y2 (t) + . . . + yi (t) + . . .

(2.24)

2.3 Modelos No Lineares

15

sendo o termo y1 (t) definido exatamente como na equao (2.10) e os demais termos:
y2 =
..
.
yi =
..
.

g2 (1 , 2 )u(t 1 )u(t 2 )d1 d2


(2.25)

...

gi (1 , . . . , i )u(t 1 ) . . . u(t i )d1 . . . di

Como o termo yi(t) nessa expanso contm contribuies de ordem i da entrada u(t), o modelo
de Volterra representa uma generalizao no linear de ordem i da integral de convoluo linear que
caracteriza completamente sistemas lineares invariantes no tempo. A equao (2.25) j supe que o
sistema causal (limite inferior das integrais iguais a zero). A funo gi (1 , . . . , i ) denominada
kernel de Volterra de ordem i, sendo i o grau de no linearidade do sistema. Assim, cada kernel gi
corresponde generalizao de dimenso i da resposta ao impulso de um sistema linear.
O modelo discreto de Volterra obtido substituindo-se as integrais de convoluo pelos somatrios de convoluo. Em uma notao mais compacta, tem-se:
y(k) =

j=1 1

...

X
j

gj (1 , . . . , j )

j
Y

i=1

u(k i )

(2.26)

Assim, embora tenha algumas limitaes, o modelo de Volterra discreto representa uma extenso
simples e lgica dos modelos lineares FIR. Alm disso, sua estrutura conveniente para o desenvolvimento de uma srie de estratgias de controle. A principal limitao dos modelos de Volterra
est relacionada ao elevado nmero de parmetros que devem ser estimados, mesmo para modelos de
baixa ordem e pequeno grau de no linearidade. Uma abordagem para o tratamento desse problema
o desenvolvimento dos coeficientes do modelo em termos de funes de base ortonormal, as quais
sero detalhas na seo 3.1. O uso dessa tcnica permite reduzir a dimenso do modelo mantendo a
sua capacidade de representao [28].

2.3.3 Redes Neurais


As Redes Neurais Artificiais (RNA) so sistemas paralelos inspirados na estrutura fsica do crebro humano. So compostos por unidades de processamento simples (ns) que computam determinadas funes matemticas, normalmente no lineares, chamadas funes de ativao. Tais unidades
so dispostas em uma ou mais camadas e interligadas por um grande nmero de conexes, simulando
as ligaes sinpticas no crebro humano. Na maioria dos modelos estas conexes esto associadas a

Modelagem de Sistemas Dinmicos

16

pesos, os quais servem para ponderar a entrada recebida por cada n da rede, codificando o conhecimento embutido no modelo [40].
O primeiro modelo de neurnio artificial foi proposto por McCulloch e Pitts em 1943 [75]. Tratase de uma simplificao do que se sabia a respeito do neurnio biolgico naquela poca. A sua
descrio matemtica resultou em um modelo com n terminais de entrada, x1 , x2 , . . . , xn e apenas
um terminal de sada y. A sada y uma funo do somatrio das entradas ponderadas pelos pesos
correspondentes, tal qual indicado na Figura 2.1.
x1 Pw1
PP
P
x2 hh
w2h PPP P
h
hhh f ( x w )
..
i i
.


wn
xn 


y


Figura 2.1: Modelo do neurnio de McCulloch e Pitts.


A funo no linear f (.) da Figura 2.1 dita se o neurnio foi ativado pelas entradas ou no.
Normalmente uma funo degrau ou sigmoidal [4].
Frank Rosenblatt introduziu o conceito de aprendizado em redes neurais. O modelo proposto
por Rosenblatt, conhecido como perceptron, era composto por uma estrutura de rede em camadas
tendo como unidades bsicas ns do tipo McCulloch e Pitts e uma regra de aprendizado [96].
A capacidade de representao das redes neurais est relacionada sua arquitetura. As redes de
uma camada resolvem apenas problemas linearmente separveis. Para problemas no linearmente
separveis deve-se usar redes com uma ou mais camadas intermedirias (Figura 2.2). Com uma
camada intermediria uma rede neural pode implementar qualquer funo contnua em um domnio
compacto [19, 20].
x1
y

x2
x3
Camada
intermediria

Figura 2.2: Exemplo de arquitetura de uma rede perceptron multicamadas.

2.4 Modelos Fuzzy

17

Como uma rede neural no linear em seus parmetros, algoritmos especiais de treinamento
devem ser usados. O algoritmo de aprendizado mais conhecido para treinamento de uma rede neural
perceptron multicamadas o backpropagation [10]. A maioria dos mtodos de aprendizado para
redes neurais desse tipo utiliza variaes deste algoritmo.
O backpropagation um algoritmo supervisionado que utiliza pares (entrada, sada desejada)
para, atravs de um mecanismo de correo de erros, ajustar os pesos da rede. O treinamento ocorre
em duas fases, forward e backward, onde cada fase percorre a rede em um sentido.
No contexto de modelagem de sistemas dinmicos, foram j estudadas diversas arquiteturas para
uma rede neural. Em particular, possvel estender os modelos FIR, ARX e ARMAX para os modelos
NNFIR, NNARX e NNARMAX, sendo NN o acrnimo em ingls para rede neural (neural network).
Esses modelos traduzem o fato de as entradas da rede neural serem compostas pelos termos regressores dos respectivos modelos lineares [85].

2.4 Modelos Fuzzy


Esta seo, ao contrrio das anteriores, mais longa e detalhada, uma vez que os modelos fuzzy
so um dos pilares deste trabalho.
A seo 2.4.1 apresenta uma introduo a sistemas fuzzy e suas possveis aplicaes. A seo 2.4.2
detalha os conceitos envolvidos em um sistema fuzzy, como variveis lingsticas e base de regras de
inferncia. Finalmente, a seo 2.4.3 introduz as duas arquiteturas mais comuns de modelos fuzzy:
Fuzzy Mamdani [73] e Fuzzy Takagi-Sugeno (Fuzzy TS) [104]. Alm destas duas arquiteturas, existe
ainda o modelo fuzzy relacional [29], no tratado neste trabalho.

2.4.1 Princpios e Aplicaes


De concepo recente, a lgica fuzzy uma das tcnicas da grande rea da Inteligncia Computacional. Seus conceitos foram elaborados por Lofti Zadeh em meados de 1960 na Universidade
de Berkeley, na Califrnia. Est inclusa na classe Cognitiva ou Simblica. Existem ainda a Conexionista e a Evolucionista, cujas maiores representaes so, respectivamente, as Redes Neurais e os
Algoritmos Genticos.
No segue a lgica concebida por Aristteles, filsofo grego (384 - 322 a.C.), que leva a uma
linha de raciocnio lgico baseado em premissas e concluses que devem ser necessariamente ou
verdadeiras ou falsas. Alm disso, dada uma declarao X, ento X e no X cobre todas as
possibilidades. A lgica fuzzy viola estas suposies, admitindo que ao mesmo tempo uma dada
afirmao seja parcialmente verdadeira e parcialmente falsa.

Modelagem de Sistemas Dinmicos

18

O conceito de dualidade, estabelecendo que algo pode e deve coexistir com o seu oposto, faz a
lgica fuzzy parecer natural, at mesmo inevitvel. Muitas das experincias humanas no podem ser
classificadas simplesmente como verdadeiras ou falsas. Entre a certeza de ser e a certeza de no ser,
existem infinitos graus de incerteza. Esta imperfeio intrnseca informao representada numa
linguagem natural foi tratada matematicamente no passado com o uso da teoria das probabilidades.
Pode-se definir a lgica fuzzy descrevendo a motivao para a sua criao. Necessitava-se de uma
ferramenta capaz de capturar informaes vagas, aproximadas, em geral descritas em uma linguagem
natural e express-las de uma maneira sistemtica. O passo seguinte seria convert-las para um formato numrico, manipulvel por um computador. Outra definio a colocaria como uma lgica que
suporta os modos de raciocnio que so aproximados, ao invs de exatos, como estamos naturalmente
acostumados a trabalhar. Para isso, utiliza-se uma abordagem multivalorada.
Um exemplo com essas caractersticas so as tarefas de tomadas de deciso. Muitas variveis no
so definidas em termos exatos. O uso da lgica fuzzy pode significar minimizao de custos por
facilitar a implementao dessas estratgias ou justificar as aes tomadas.
O controle de processos industriais foi a rea pioneira de utilizao da lgica fuzzy. As primeiras
experincias datam de meados da dcada de 70 ([73] e referncias inclusas). Hoje em dia, uma
grande variedade de aplicaes comerciais e industriais est disponvel, destacando-se neste cenrio
o Japo e, mais recentemente, os EUA e a Alemanha. Dentre os exemplos tpicos incluem-se produtos de consumo, tais como geladeiras (Sharp), ar condicionado (Mitsubishi), cmeras de vdeo
(Canon, Panosonic), mquinas de lavar roupa (Sanyo), aspiradores de p, etc. Na indstria automotiva
destacam-se transmisses automticas (Nissam, Lexus), injeo eletrnica, suspenso ativa e freios
antibloqueantes. Sistemas industriais incluem controle de grupo de elevadores (Hitachi, Toshiba),
veculos autoguiados e robs mveis (Nasa, IBM), controle de motores (Hitachi), ventilao de tneis
urbanos (Toshiba), controle de trfego urbano e controle de partida e parada de metrs (Tkio). Estas
citaes so ilustrativas, pois correntemente j foram anunciadas mais de 1000 patentes envolvendo
lgica fuzzy [107].
Apesar do uso e da aplicao no Brasil ser incipiente, vrias indstrias e empresas vm desenvolvendo produtos e servios utilizando de alguma forma os conceitos fuzzy (Villares, IBM, Klockner &
Moeller, Robertshaw, Yokogawa, HI Tecnologia) [77].
Controladores baseados em lgica fuzzy possuem propriedades interessantes de confiabilidade e
robustez. Sistemas convencionais processam equaes complexas em seqncia. Caso ocorra algum
erro em alguma delas, a discrepncia final obtida pode ser significativa. Devido ao processamento
independente de cada regra do controlador fuzzy, o efeito de um problema intermedirio amortecido.
Isso implica que uma falha parcial do sistema no deteriora a performance do controlador como um
todo.

2.4 Modelos Fuzzy

19

A teoria dos conjuntos fuzzy pode ainda ser usada na modelagem de sistemas dinmicos. Uma
srie de arquiteturas fuzzy foram j demonstradas como aproximadores universais [93]. Isto significa
que so capazes de aproximar qualquer funo contnua em um domnio compacto com qualquer
nvel de preciso desejado.
Alm da propriedade interessante de aproximao universal dos modelos fuzzy, estes ainda adicionam uma nova dimenso informao contida no modelo. Trata-se da dimenso lingstica,
fornecendo descries intuitivas sobre o comportamento do sistema modelado ([32]).

2.4.2 Elementos de um Sistema Fuzzy


A lgica fuzzy permite o tratamento de implicaes lgicas seguindo regras naturais de raciocnio,
analisando condies e estipulando conseqncias [100, 106]. baseada na teoria dos conjuntos fuzzy
[117].
Um conjunto fuzzy definido como uma coleo de objetos cujo grau de pertinncia ao conjunto
varia entre zero e um. Formalmente, um conjunto fuzzy caracterizado por uma funo de pertinncia
(FP) que mapeia os elementos do domnio de discurso U no intervalo unitrio [0, 1], ou seja:
A : U [0, 1]

(2.27)

Assim, o valor A(x) indica com que grau o elemento x pertence ao conjunto A [93]. Um grau
de pertinncia 1 equivale ao clssico smbolo de pertinncia enquanto um grau de pertinncia 0

equivale ao clssico smbolo .


/
Um conceito relacionado com conjuntos fuzzy o de varivel lingstica. Entende-se por varivel

um identificador que pode assumir um dentre vrios valores. Deste modo, uma varivel lingstica pode assumir um valor lingstico dentre vrios outros em um conjunto de termos lingsticos.
Cada termo lingstico caracterizado por uma funo de pertinncia. A expresso lingstica das
variveis tratadas se d atravs de predicados mnemnicos, como erro, temperatura ou variao
da presso. permitido ainda o uso de modificadores qualificadores: pequeno positivo, muito
grande negativo ou aproximadamente zero.
Em princpio, as funes de pertinncia podem ser qualquer funo que produza valores entre 0
e 1. Comumente estas so definidas como triangulares, trapezoidais, sigmides ou gaussianas (como
exibido na Figura 2.3). Funes de pertinncia do tipo singleton tambm so usadas. As FP adotadas
neste trabalho so gaussianas1, descritas pela equao (2.28):
(x )2
A(x) = exp
2 2
1

A justificativa para esta escolha ser apresentada na seo 4.4.1.

(2.28)

Modelagem de Sistemas Dinmicos

20
com correspondendo ao centro da FP e sua abertura.
pouco centro
esquerda

esquerda
1

pouco
direita

direita

0.9

0.8

0.7

A(x )

0.6

0.5

0.4

0.3

0.2

0.1

0
5

Posio x

Figura 2.3: Exemplo de funes de pertinncia gaussianas.


A definio satisfatria da quantidade e grau de sobreposio entre as funes de pertinncia no
universo de discurso fundamental quando da aplicao de um sistema fuzzy [100]. Essa discusso
ser retomada nos captulos 3 e 4.
Em um sistema fuzzy (seja um modelo fuzzy de um processo ou um controlador fuzzy) as funes
de pertinncia so responsveis pela converso das grandezas do domnio do mundo real, captadas por
sensores, dispositivos computadorizados ou mesmo provenientes de outros segmentos do processo de
controle, para nmeros fuzzy. Essa converso, conhecida como fuzzificao, essencial para a
atuao da mquina de inferncia fuzzy.
A etapa de inferncia consiste em se avaliar um conjunto de regras (a base de conhecimento) do
tipo se . . . ento . . . que descrevem a dependncia entre as variveis lingsticas de entrada e as
de sada. Essas regras seguem o paradigma modus ponens, um mecanismo de inferncia progressiva
(ao contrrio do modus tollens, regressivo, mais utilizado em sistemas especialistas), para fazer o
mapeamento do conceito de implicao lgica.
A seo seguinte apresenta dois exemplos de bases de regras fuzzy, uma para o modelo fuzzy
Mamdani e outra para o modelo fuzzy TS. Como ser observado, os antecedentes das regras possuem
a mesma estrutura geral, qual seja:
se
..
.

(u1 A1,1 ) e . . . e (un A1,n )


(2.29)

2.4 Modelos Fuzzy

21
se

(u1 Am,1 ) e . . . e (un Am,n )

sendo u1 , . . . , un as entradas do sistema e A1,1 , . . . , Am,n os termos lingsticos dessas variveis,


definidos como funes de pertinncia que cobrem todo o universo de discurso.
A inferncia consiste de dois passos: avaliao da premissa de cada regra (conjuno), atravs
dos operadores t-norma, e em seguida a etapa de agregao, ponderando as diferentes concluses das
regras ativas sob o operador s-norma [100, 106]. Os operadores de t-norma e s-norma so normas
e co-normas triangulares que fornecem mtodos genricos para as operaes de interseco e unio
em conjuntos fuzzy. Alguns exemplos de t-normas so o produto e o operador de mnimo. Para as
s-normas tm-se como exemplos o operador de mximo ou a soma drstica [93].
Um sistema fuzzy contm um conjunto dessas regras, todas ativadas em paralelo. Assim, o sistema
fuzzy raciocina com inferncia associativa paralela. Quando uma entrada fornecida, o controlador
dispara as regras paralelamente, com diferentes graus de ativao, para inferir um resultado ou sada.
Em algumas arquiteturas fuzzy, aps a inferncia da ao a ser tomada, necessita-se de uma
traduo do valor lingstico para a varivel numrica de sada, que pode representar funes como
ajustar a posio de um boto ou acionar uma vlvula. Este passo conhecido como defuzzificao.
Como pode acontecer de sadas distintas serem acionadas num mesmo momento, com diferentes
graus de ativao, deve-se encontrar o valor que melhor corresponda distribuio de possibilidade
da combinao dos conjuntos fuzzy de sada. A seo seguinte fornece um exemplo de um mtodo de
defuzzificao.

2.4.3 Arquiteturas Fuzzy dos Tipos Mamdani e Takagi-Sugeno


A diferena entre os modelos fuzzy Mamdani e Takagi-Sugeno reside nos conseqentes das regras
da base de regras de inferncia. Em um modelo Mamdani, as regras so do tipo:
se
..
.

(u1 A1,1 ) e . . . e (un A1,n ) ento y B1


(2.30)

se (u1 Am,1 ) e . . . e (un Am,n ) ento y Br


sendo B1 , . . . , Br os termos lingsticos para a sada y (neste exemplo, nica) definidos em um
domnio Y por meio de funes de pertinncia.
Cada regra acima define uma regio fuzzy no espao de entrada-sada. O conjunto de todas as

regras particionam esse espao em regies fuzzy sobrepostas.


Esse modelo em particular requer, aps o processo de inferncia fuzzy da sada, a aplicao da
etapa de defuzzificao citada na seo anterior. O mtodo do centro da rea uma possibilidade

Modelagem de Sistemas Dinmicos

22

[100], porm este requer um considervel esforo computacional, pois surge em sua definio o
clculo numrico de integrais.
Uma segunda abordagem para a defuzzificao consiste no centro dos mximos [100]. Trata-se
de calcular a mdia ponderada entre os valores de cada termo da varivel lingstica de sada. Tal
mtodo descrito pela equao (2.31), sendo y a sada final do sistema fuzzy, yi a sada intermediria
de cada uma das r regras e wi o peso da i-sima regra [93].

y =

r
X

wi y i

i=1
r
X

(2.31)
wi

i=1

Como os antecedentes das regras apresentados em (2.31) utilizam o operador de conjuno e,


os pesos wi de cada regra (seus nveis de ativao) so calculados atravs da operao de t-normas.
Para isso, primeiramente computa-se o grau de pertinncia As,j (uj ) de cada entrada uj respectiva
funo de pertinncia As,j . Considerando como exemplo o uso da t-norma do valor mnimo, ento
cada wi calculado segundo a equao (2.32) [38]:
wi = min {As,1 (u1 ), . . . , As,n (un )}

(2.32)

No caso da t-norma produto, o nvel de ativao wi calculado como [93]:


wi =

n
Y

As,j (uj )

(2.33)

j=1

Alm disso, o valor de yi na equao (2.31) escolhido como o valor para o qual Bi (yi ) mximo.
Em funes de pertinncia gaussianas ou triangulares, por exemplo, trata-se do valor modal.
Este mtodo atende um requisito essencial em aplicaes em controle, a continuidade [100]. Isso
significa que uma mudana infinitesimal em uma varivel de entrada no causa uma variao abrupta
em nenhuma das variveis de sada.
No modelo fuzzy TS, a base de regras da forma:
se
..
.

(u1 A1,1 ) e . . . e (un A1,n ) ento y = f1 (u1 , . . . , un )


(2.34)

se (u1 Am,1 ) e . . . e (un Am,n ) ento y = fr (u1 , . . . , un )


Assim, os conseqentes das regras so agora compostos por uma funo qualquer das variveis de

2.5 Resumo

23

entrada. Embora na equao (2.34) apaream nas premissas das regras todas as variveis de entrada,
esta no uma exigncia da arquitetura fuzzy TS. Pode ser usado um nmero menor de variveis nas
premissas, por exemplo com o objetivo de diminuir o tamanho da base de regras. O modelo fuzzy TS
combina uma descrio global baseada em regras com uma aproximao local que, no contexto de
identificao de sistemas, normalmente escolhida como um modelo de regresso linear. No caso de
as funes fi serem funes afins, por exemplo, o conseqente da i-sima regra seria da forma:
y = ai,1 u1 + . . . + ai,n un + ai,n+1

(2.35)

O modelo fuzzy TS resultante fcil de se identificar, pois alm de cada regra descrever uma
regio fuzzy na qual as sadas dependem das entradas de forma linear, os parmetros dos conseqentes
ai,1 , . . . , ai,n+1 podem ser facilmente estimados, por exemplo, via mnimos quadrados2.
Como as sadas das regras no esto definidas atravs de termos lingsticos, a etapa de defuzzificao no necessria aps o processo de inferncia fuzzy. A sada final y calculada da
mesma forma que na equao (2.31), com a diferena que o valor de cada yi o resultado direto do
conseqente da i-sima regra.
Assim como apresentado para as redes neurais da seo anterior, modelos fuzzy dinmicos podem
ser construdos ao se adotar como variveis de entrada nos antecedentes das regras as variveis de
regresso de entrada e/ou de sada do sistema real [32, 81].
Na seo 3.2.4 do captulo 3 ser apresentada uma arquitetura mais geral para sistemas fuzzy,
os modelos fuzzy TS Generalizados, nos quais os conseqentes das regras so modelos dinmicos
completos em espao de estados.

2.5 Resumo
O objetivo deste captulo foi descrever em linhas gerais o contexto de modelagem de sistemas
dinmicos, foco do presente trabalho. Inicialmente apresentaram-se as principais propriedades de
modelos matemticos, apontando-se quais destas propriedades esto presentes nos modelos desenvolvidos nesta dissertao. Em suma, tratar-se- de modelos no lineares, discretos, determinsticos,
a parmetros concentrados, invariantes no tempo, no autnomos, paramtricos e monovariveis.
Foram abordados alguns modelos especficos, tanto lineares quanto no lineares. Os modelos
fuzzy, que constituem a base dos modelos analisados neste trabalho, foram estudados mais detalhadamente. O tema do prximo captulo o modelo fuzzy TS com Funes de Base Ortonormal (FBO).
2

Mesmo no caso de modelos locais no lineares nas entradas o mtodo dos mnimos quadrados pode ser usado pois a
sada do modelo continua linear nos parmetros.

24

Modelagem de Sistemas Dinmicos

Ser descrita a arquitetura cujos parmetros de projeto estaro sujeitos otimizao pelo algoritmo
gentico apresentado no captulo 4.

Captulo 3
Modelo Fuzzy TS FBO
O captulo anterior discorreu sobre conceitos bsicos de modelagem de sistemas dinmicos,
apresentando uma srie de modelos lineares e no lineares, com maior nfase nos modelos fuzzy. O
presente captulo analisa com maior profundidade o conceito de Funes de Base Ortonormal (FBO),
introduzido na seo 2.2.7, e apresenta alguns exemplos de modelos baseados neste conceito. dada
maior ateno ao modelo fuzzy TS FBO, proposto originalmente em [89] e foco deste trabalho, resultado da incorporao de Funes de Base Ortonormal nos modelos fuzzy TS. A seo 3.3 explicita
quais parmetros desta arquitetura sero otimizados pelo algoritmo gentico descrito no captulo 4.
Por fim, analisam-se dois modos de estimao dos coeficientes dos conseqentes das regras dos modelos fuzzy TS FBO.

3.1 Funes de Base Ortonormal


A seo 2.2.7 introduziu os conceitos do modelo linear FBO. Trata-se do desenvolvimento da
resposta ao impulso do sistema em uma base de funes ortonormais. A presente seo analisa os
modelos no lineares FBO. A base para sua derivao ser o modelo NARX, reproduzido aqui na
equao (3.1) para facilitar referncias.
y(k) = F [y(k 1), . . . , y(k na ), u(k 1), . . . , u(k nb )]

(3.1)

Embora seja possvel o uso de mtodos eficientes de estimao para realizaes particulares do
operador F , este modelo possui a desvantagem de apresentar recurso da sada, alm de uma definio
adequada da estrutura do modelo ser crtica. As funes de base ortonormal, como ser explicado
nesta seo, servem como ferramenta para resolver estes problemas, alm de agregar outras vantagens
na modelagem de sistemas dinmicos.
25

Modelo Fuzzy TS FBO

26

possvel reescrever a equao (3.1) conforme a equao (3.2), na qual os termos da sada foram
substitudos ao se utilizar a prpria equao (3.1) de forma recursiva.
y(k) = G[u()]k1
=

(3.2)

Para sistemas com memria finita1 , possvel truncar a representao (3.2) em um nmero de
termos, obtendo [89]:
y(k) = G[u(k 1), . . . , u(k )]
(3.3)
A representao (3.3) uma extenso no linear da resposta ao impulso finita descrita na
seo 2.2.4. Trata-se do desenvolvimento do sinal de entrada u(k) em uma base de funes de transferncia no operador de deslocamento no tempo q 1 , base essa dada pelo conjunto de funes de
transferncia pulsadas definido pela equao (3.4):
NFIR,i (q 1 ) = q i , i = 1, . . . ,

(3.4)

Assim, a i-sima entrada para o operador G na equao (3.3) dada por:


NFIR,i (q 1 )u(k) = q i u(k) = u(k i)

(3.5)

Note-se que as funes de transferncia pulsadas da base (3.4) podem ser escritas de forma
recursiva, ou seja, NFIR,i+1 (q 1 ) = q 1 NFIR,i (q 1 ). O diagrama de blocos do modelo NFIR,
considerando-se a recurso das funes de transferncia de sua base, exibido na Figura 3.1.
u(k) - 1 u(k 1) - 1 u(k 2) - 1 u(k )
q
q
q
..
.
-

y(k)-

Figura 3.1: Diagrama de blocos do modelo NFIR.


Uma vantagem do modelo NFIR no possuir recurso dos termos da sada. Dessa forma, no
h realimentao de erros de predio no modelo, o que permite uma melhor performance nas tarefas
de predio ao se considerar horizontes longos. Recurso da sada ainda eventualmente associada a
problemas de convergncia nos algoritmos de identificao. Em contrapartida, a representao NFIR
1

Um sistema possui memria finita se o valor de entrada u(k ), para suficientemente grande, no influencia
significativamente a sada y(k) [33].

3.1 Funes de Base Ortonormal

27

em (3.3) requer um nmero muito maior de termos de regresso () do que aquele requerido pela
representao NARX original em (3.1) para uma mesma preciso, especialmente na representao de
sistemas lentos.
No lugar de utilizar a base dada pelas funes da equao (3.4), possvel adotar as funes de
base ortonormal, as quais tratam os problemas mencionados atravs da incorporao de conhecimento
a priori sobre as dinmicas do sistema na base de funes de transferncia. O efeito imediato a
considervel diminuio do nmero de parmetros no modelo para se alcanar uma dada capacidade
de representao, alm de ser uma arquitetura sem recurso da sada.
As bases de funes ortonormais so completas no espao L2 [0, ) das funes contnuas quadra-

ticamente integrveis em [0, ). Dessa forma, qualquer funo neste espao pode ser representada
com preciso arbitrria por uma combinao linear das funes desta base. Considerando o caso
discreto, isto significa que existe um inteiro positivo n tal que para qualquer > 0 tem-se:

k=0

f (k)

n
X
i=1

i i (k)

!2

<

(3.6)

sendo f (k) uma funo quadraticamente somvel, n o nmero de funes na base ortonormal, i
escalares e i a i-sima funo ortonormal. A aproximao da funo f (k) ser to boa quanto
maior for o nmero de funes ortonormais utilizado, sendo exata para um nmero infinito de funes.
Embora em princpio sistemas com integradores no pertenam ao espao L2 [0, ), uma mudana de
variveis (anlise da variao da sada do sistema, no lugar da sada instantnea) elimina o problema,
permitindo tambm o tratamento desses sistemas.
Assim, da mesma forma que a base (3.4) usada para gerar as entradas do operador no linear
G no modelo NFIR (3.3), as funes de base ortonormal com funes de transferncia FBO,i (q 1 )
geram os sinais [89]:
li (k) = FBO,i(q 1 )u(k)

(3.7)

os quais, atravs de um mapeamento no linear H, fornecem a representao no linear FBO, Funes

de Base Ortonormal, doravante denominada apenas modelo FBO:


y(k) = H[l1 (k), . . . , ln (k)]

(3.8)

Cada sinal li corresponde convoluo entre a entrada u e a i-sima funo da base ortonormal
i . Visto de outra forma, resultado da filtragem da entrada u pelo filtro ortonormal FBO,i [14]. A
Figura 3.2 exibe o diagrama de blocos para o modelo FBO.
As funes de base ortonormal tm sido aplicadas com sucesso nas tarefas de modelagem e controle de sistemas dinmicos ([14, 16, 83, 89, 108, 113] e referncias inclusas). O modelo dinmico

Modelo Fuzzy TS FBO

28

u(k)

- FBO,1

l1 (k) -

- FBO,2

l2 (k) -

..
.
- FBO,n

y(k)
-

ln (k) -

Figura 3.2: Diagrama de blocos do modelo FBO.


baseado em funes de base ortonormal, ou apenas modelo FBO, possui uma srie de caractersticas
positivas [14]:
Como exposto no incio desta seo, modelos FBO requerem um menor nmero de parmetros
para representar satisfatoriamente um sistema dinmico, em comparao com modelos NFIR
ou NARX;
No h necessidade de se conhecer previamente a estrutura exata do vetor de regresso (ordens
e atrasos de transporte);
Se necessrio, possvel aumentar a capacidade de representao do modelo aumentando o
nmero de funes ortonormais usadas;
Assim como o modelo NFIR, o modelo FBO no possui recurso de termos da sada, evitando
a realimentao no modelo de erros de predio. A ausncia de realimentao da sada tambm
implica em caractersticas estatsticas desejveis para a estimao numrica dos parmetros do
modelo [13], a ser tratada na seo 3.4;
Desacoplamento natural das sadas em sistemas multivariveis;
Tolerncia a dinmicas no modeladas;

3.1 Funes de Base Ortonormal

29

Capacidade para tratar atrasos de transporte.


As bases ortonormais mais tradicionais so a de Laguerre e a de Kautz [14, 55]. A diferena entre elas que as funes ortonormais da base de Laguerre so parametrizadas por um nico plo
real, enquanto as da base de Kautz por um par de plos complexos conjugados. A base de Kautz
mais indicada para sistemas com dinmicas dominantes pouco amortecidas, precisando de menos
parmetros que a base de Laguerre para alcanar determinado desempenho. Ambas as bases so
realizaes especiais das bases ortonormais generalizadas, nas quais as funes ortonormais podem
ser parametrizadas por qualquer quantidade de plos reais e complexos [55, 108]. Estas ltimas,
no entanto, necessitam de um maior conhecimento sobre as dinmicas dominantes do sistema, e so
aplicadas em sistemas complexos de alto grau de no linearidade [55]. Este trabalho concentra-se
nas bases de Laguerre e de Kautz. Ser apresentado na seo 3.2.4 o modelo fuzzy TS FBO Generalizado [14, 15]. Porm, como ser visto, as bases utilizadas so tambm de Laguerre e de Kautz,
sendo o termo Generalizado justificado pelo fato de ser possvel o uso de diferentes plos (reais ou
complexos) em cada modelo local.
O conjunto das funes que formam a base de Laguerre pode ser escrito em funo do plo real
estvel p segundo a equao (3.9) [112]:
Lag,n (q 1 ) =

n1

1 p2

q 1 (q 1 p)
(1 pq 1 )n

n = 1, . . . ,

(3.9)

J as funes da base de Kautz so parametrizadas pelo plo complexo = j segundo a


equao (3.10) [113]:

cz 2 + b(c 1)z + 1
1 c2 (z b)
Kau,n (z) = 2
z + b(c 1)z c z 2 + b(c 1)z c
q

"

(1 c2 )(1 b2 ) cz 2 + b(c 1)z + 1


Kau,n (z) = 2
z + b(c 1)z c z 2 + b(c 1)z c
"

#n1

, para n mpar

#n1

para n par

(3.10)

sendo b = ( + )/(1 + ) e c = .
Modelos baseados em funes ortonormais admitem a seguinte representao em espao de estados [16, 89]:
l(k + 1) = A l(k) + b u(k)
y(k) = H(l(k))

(3.11)

sendo l(k) = [l1 (k) . . . ln (k)]T o vetor de estados ortonormais2. possvel incorporar ainda ao mo2

Como afirmado anteriormente, os termos li (k) so na verdade o resultado da filtragem da entrada u pelo filtro

Modelo Fuzzy TS FBO

30

delo FBO da equao (3.11) qualquer informao a priori sobre o atraso de transporte do sistema,
substituindo nesta equao u(k) por u(k ), sendo o atraso conhecido [14]. Assim, possvel

reduzir ainda mais o nmero de parmetros no modelo atravs da respectiva reduo do nmero de
funes ortonormais necessrias para determinada preciso.

A matriz A e o vetor b da equao (3.11) dependem unicamente da base de funes ortonormais


adotada. Para o caso da base de Laguerre, utilizando-se (3.9) de forma recursiva obtm-se [14]:

A =

b =

p
1 p2

(p)(1 p2 )
..
.

0
p
1 p2
..
.

0 ... 0

0 ... 0

p ...
.. . .
.
.

(p)n2 (1 p2 ) (p)n3 (1 p2 )

1 p2

1 p (p)2 . . . (p)n1

0
..
.

... p
i

(3.12)

(3.13)

sendo p o plo de Laguerre. Para a representao em espao de estados da base de Kautz, consultar
[113].
Escolhida a base de funes ortonormais, os tipos diferentes de modelos FBO so determinados
pelo operador H da equao (3.11). A seo seguinte apresenta possveis escolhas para este operador,

sendo as duas ltimas as mais exploradas no presente trabalho.

3.2 Arquiteturas dos Modelos FBO


So apresentados na seqncia os modelos FBO linear e de Volterra, os quais sero posteriormente
utilizados nos modelos locais da arquitetura fuzzy TS FBO. Todos estes modelos possuem a desejvel
caracterstica de serem lineares em seus parmetros. Dessa forma, o operador genrico H pode ser
escrito como [13]:
H(l(k)) = (k)T

(3.14)

sendo o vetor de parmetros livres a ser estimado e (k) um vetor de dados funo dos estados ortonormais l(k), comumente denominado vetor de regressores [3]. Os parmetros destes modelos podem ser estimados eficientemente atravs do mtodo de mnimos quadrados, detalhado na
seo 3.4.
ortonormal FBO,i . Assim, esta a interpretao correta para a expresso estado ortonormal usada no decorrer de todo
o texto.

3.2 Arquiteturas dos Modelos FBO

31

3.2.1 Modelo FBO Linear


Este modelo advm da implementao do operador H como uma combinao linear dos estados
ortonormais, tal qual apresentado na seo 2.2.7. Na prtica, adiciona-se combinao linear um
termo constante, obtendo-se assim um modelo afim, capaz de modelar um eventual nvel constante
na sada do sistema. Para esse modelo, o vetor de dados (k) da equao (3.14) consiste no prprio
vetor de estados ortonormais concatenado com um elemento unitrio, ou seja:
T

(k) =

"

l(k)

1 l1 (k) . . . ln (k)

iT

(3.15)

O vetor de parmetros possui ento dimenso igual ordem do modelo mais um, n + 1.

3.2.2 Modelo FBO de Volterra


Conforme afirmado na seo 2.3.2, modelos de Volterra de ordem elevada apresentam o inconveniente de induzirem um grande nmero de parmetros livres. Na prtica, utilizam-se modelos de
segunda ordem. Porm, mesmo neste caso, sistemas com dinmicas dominantes lentas requerem um
nmero elevado de parmetros do modelo. As funes de base ortonormais so usadas para resolver
este problema, alm de acrescentar as vantagens descritas na seo 3.1.
O modelo FBO de Volterra obtido ao se desenvolver cada um dos ncleos de ordem i da
equao (2.26) em termos de funes ortonormais. Considera-se aqui apenas os ncleos de at
segunda ordem, de modo a evitar o nmero elevado de parmetros das ordens superiores. O desenvolvimento do ncleo de primeira ordem, que corresponde exatamente resposta ao impulso do
sistema, j foi apresentado na seo 2.2.7 ao se tratar dos modelos lineares FBO. O desenvolvimento
do ncleo de segunda ordem anlogo ao apresentado naquela seo [14]. Dessa forma, o modelo
FBO de Volterra de segunda ordem dado por:
y(k) = 0 +

n
X

j=1

j lj (k) +

j
n X
X

j,ilj (k)li (k)

(3.16)

j=1 i=1

sendo j e i,j os coeficientes de desenvolvimento de primeira e de segunda ordem, respectivamente,


e 0 um termo constante includo pela razo apresentada na seo anterior. Considerando por simplicidade que os termos de primeira e segunda ordem possuem o mesmo nmero n de estados ortonormais, alm de assumir a simetria existente entre os ncleos de Volterra [14] (o que permitiu limitar
superiormente o ltimo somatrio da equao (3.16) em j), obtm-se o vetor de dados como:

Modelo Fuzzy TS FBO

32

(k) = [ 1 l1 (k) . . . ln (k) l1 (k)2 l2 (k)l1 (k) l2 (k)2 . . .


ln (k)l1 (k) ln (k)l2 (k) ln (k)2 ]T

(3.17)

O nmero de parmetros livres para esta arquitetura igual a (n2 + 3n + 2)/2.

3.2.3 Modelo Fuzzy TS FBO


Os modelos apresentados nesta seo e na prxima so baseados no trabalho inicialmente proposto em [89].
O modelo fuzzy TS FBO obtido ao se implementar o operador H segundo o sistema de inferncia

fuzzy apresentado na seo 2.4.3. Mais especificamente, adotam-se como variveis de entrada do sistema fuzzy TS os prprios estados ortonormais li (k). Dessa forma, a base de regras da equao (2.34)
reescrita como:
se
..
.

(l1 A1,1 ) e . . . e (ln A1,n ) ento y = f1 (l1 , . . . , ln )


(3.18)

se (l1 Am,1 ) e . . . e (ln Am,n ) ento y = fr (l1 , . . . , ln )


e a sada do modelo calculada segundo a equao (3.19), sendo o peso wi da i-sima regra calculado
agora em funo dos estados l(k), e no mais diretamente a partir das entradas ui, ou seja:

y(k) =

r
X

wi (l(k))yi

i=1
r
X

(3.19)
wi (l(k))

i=1

O vetor de dados (k) para este modelo depende da escolha para as funes fi (.) de cada modelo
local. Como exemplo, caso sejam adotadas funes afins do tipo:
y = ai,1 l1 + . . . + ai,n ln + ai,n+1

(3.20)

ento, a partir das equaes (3.14), (3.19) e (3.20), tem-se:


(k) = (k) [ w1 (l(k)) w1 (l(k))l1 (k) . . . w1 (l(k))ln (k) . . .
wr (l(k)) wr (l(k))l1 (k) . . . wr (l(k))ln (k) ]T
sendo (k) = 1/

Pr

i=1

(3.21)

wi (l(k)) o termo de normalizao presente na equao (3.19). O vetor de

3.2 Arquiteturas dos Modelos FBO

33

parmetros consiste nos coeficientes ai,j das funes afins nos conseqentes das regras (3.20):
= [a1,1 a1,2 . . . a1,n+1 . . . ar,1 . . . ar,n+1 ]T

(3.22)

Os modelos locais afins, a menos da constante ai,n+1 , so lineares. possvel utilizar tambm
modelos locais no lineares, como os modelos de Volterra de segunda ordem. Neste caso, basta
utilizar a expresso (3.16) nos modelos locais.
O nmero de parmetros livres a serem estimados por mnimos quadrados para o modelo fuzzy
TS FBO calculado como a soma da quantidade de parmetros de cada modelo local. A frmula
para modelos afins a mesma da seo 3.2.1 e para modelos de Volterra de segunda ordem a da
seo 3.2.2. O nmero total de regras r calculado considerando uma base de regras completa, isto
, que contm tantas regras quantas so as combinaes entre as funes de pertinncia de todas as
variveis de entrada do modelo. Assim, caso a i-sima varivel de entrada possua mi funes de
pertinncia associadas a ela, o nmero total de regras do modelo, considerando uma base de regras
completa, :
r=

n
Y

mi

(3.23)

i=1

Modelos fuzzy TS FBO foram aplicados com sucesso nas tarefas de modelagem [13] e controle
[14] de sistemas dinmicos, fornecendo resultados melhores (em termos de melhor aproximao com
menor nmero de parmetros) que modelos lineares FBO ou Volterra FBO. No entanto, nestes trabalhos a seleo da estrutura dos modelos e de alguns parmetros livres foi realizada de modo emprico,
sem a aplicao de mtodos de otimizao bem consolidados na literatura. A distribuio das funes
de pertinncia no universo de discurso, por exemplo, era feita de forma homognea, com centros
igualmente espaados e larguras iguais s distncias entre centros consecutivos [16, 39]. Alm disso,
determinava-se o plo de Laguerre atravs da observao da resposta do sistema a uma entrada em
geral do tipo degrau. Aps se avaliar qual seria aproximadamente a dinmica dominante do sistema,
realizava-se uma busca iterativa discreta em torno desta regio.
Tais metodologias, apesar de fornecerem solues que demonstraram a superioridade das arquiteturas e mtodos propostos, ainda eram passveis de uma maior otimizao, com o acrscimo de algum
esforo computacional [13, 15, 16]. O presente trabalho foca essa otimizao dos modelos fuzzy TS
FBO. Os parmetros do modelo que sero otimizados so apresentados na seo 3.3 e o mtodo de
otimizao proposto descrito no captulo 4. No captulo 5 realiza-se uma anlise comparativa entre
essas metodologias no automticas e a abordagem aqui proposta.

Modelo Fuzzy TS FBO

34

3.2.4 Modelo Fuzzy TS FBO Generalizado


Conforme a seo 3.1, as bases de Laguerre e de Kautz so parametrizadas apenas por um plo,
respectivamente real e complexo. Embora tenha sido afirmado que os modelos com estas bases so
capazes de aproximar sistemas dinmicos com qualquer preciso desejada (aumentando-se o nmero
de estados no modelo), quando o sistema sendo tratado apresenta mais de um modo dominante, o
nmero de parmetros no modelo pode crescer sensivelmente. Para tratar desses casos, foram propostas bases de funes ortonormais generalizadas [9, 84, 108]. Estas bases possuem a caracterstica
de poderem ser parametrizadas em qualquer nmero de plos reais e/ou complexos. Em geral, so
construdas de forma a englobar as bases de Laguerre e de Kautz como casos especiais.
A idia do modelo fuzzy TS FBO Generalizado possibilitar a incorporao de informaes
sobre diversas dinmicas presentes no sistema utilizando ainda as bases de Laguerre e de Kautz.
Para alcanar este objetivo, adota-se em cada modelo local das regras de inferncia um modelo em
espao de estados da forma (3.11) parametrizado em um plo distinto (real ou complexo). Dessa
forma, os estados de cada modelo local podem refletir uma dinmica dominante diferente do sistema,
diferentemente do modelo fuzzy TS FBO apresentado na seo 3.2.3, no qual a diferena entre os
modelos locais residia apenas nas relaes estticas entre os estados ortonormais e a sada. Assim,
para o modelo fuzzy TS FBO Generalizado, os prprios estados presentes nas premissas das regras
no so os mesmos de cada modelo local, mas sim obtidos atravs do processo de inferncia fuzzy
TS. Em suma, cada uma das r regras do sistema fuzzy passa agora a ter a forma [15, 16]:
Ri : se ( 1 (k) Ai,1 ) e . . . e ( n (k) Ai,n )

ento

(3.24)

li (k + 1) = Ai li (k) + bi u(k)
yi (k)
= fi (li (k))

sendo Ai e bi parametrizados por um plo pi , fornecendo o vetor de estados li (k), fi (li (k)) o i-simo
mapeamento esttico que gera i-sima sada yi (k) do respectivo modelo local e 1 (k), . . . , n (k) as
variveis das premissas das regras, obtidas segundo a equao (3.25).

(k + 1) =

r
X

wi ((k))li (k + 1)

i=1

r
X

(3.25)
wi ((k))

i=1

sendo (k) = [ 1 (k) . . . n (k) ]T . Os pesos wi ((k)) correspondem ao nvel de ativao da i-sima
regra, computados atravs da aplicao da t-norma adotada (ver seo 2.4.3). Seguindo o mesmo

3.3 Parmetros de Projeto do Modelo

35

mecanismo de inferncia, a sada do modelo fuzzy TS FBO Generalizado dada por:

y(k) =

r
X

wi ((k))yi (k)

i=1

r
X

(3.26)
wi ((k))

i=1

Assim como no modelo fuzzy TS FBO, caso os modelos locais fi (li (k)) de cada regra em (3.24)
sejam lineares nos parmetros, ento o modelo Generalizado tambm o ser, e novamente mtodos
eficientes de estimao podero ser aplicados.
Para demonstrar que o modelo fuzzy TS FBO Generalizado realmente uma generalizao do
modelo fuzzy TS FBO apresentado na seo 3.2.3, basta fazer com que os plos pi de cada modelo
em espao de estados em (3.24) sejam iguais. Dessa forma, a partir da equao (3.25), (k) = li (k),
para i = 1, . . . , m. Assim, os modelos locais passam a compartilhar o mesmo vetor de estados
ortonormais, e a sada final do modelo (3.26) recai no caso do modelo fuzzy TS FBO (3.19).

Foi demonstrado em [14, 15, 16] que os modelos fuzzy TS FBO so capazes de aproximar com
preciso arbitrria sistemas dinmicos no lineares discretos que sejam causais, invariantes no tempo,
sem descontinuidades, com memria finita e entrada limitada em um intervalo fechado. A demonstrao est baseada na capacidade de aproximao universal dos modelos fuzzy e de modelos de
Volterra.
Esta dissertao est focada nos dois ltimos modelos, fuzzy TS FBO e fuzzy TS FBO Generalizado. Trata-se da incorporao de um mtodo de otimizao na etapa de definio da estrutura
destes modelos. A prxima seo define o escopo do mtodo proposto.

3.3 Parmetros de Projeto do Modelo


Os modelos apresentados nas sees 3.2.3 e 3.2.4 possuem uma srie de parmetros livres de
projeto. Esta seo indica quais destes parmetros sero definidos autonomamente pela metodologia
proposta no presente trabalho, a qual baseada nos Algoritmos Genticos (AG), mtodos de otimizao no lineares, descritos em detalhes no captulo 4. A seo 4.3 daquele captulo apresentar uma
reviso sobre a aplicao de algoritmos genticos na otimizao de sistemas fuzzy, quando ento ser
possvel visualizar melhor as contribuies dessa dissertao.
Para o modelo fuzzy TS FBO com plo nico, praticamente todos os parmetros livres so definidos e otimizados pelo AG. Mais especificamente, os seguintes parmetros so incorporados no
mtodo automtico, no precisando ento de nenhuma interveno humana para sua definio:

Modelo Fuzzy TS FBO

36

Plo real ou complexo da base de funes ortonormais, o qual gera a matriz A, o vetor b e
assim o vetor de estados ortonormais l(k);
Nmero n de estados nos modelos locais. Como os estados so definidos por uma mesma base
de funes ortonormais, este nmero mantido fixo para todos os modelos locais;
Nmero de estados nas premissas das regras (nmero de variveis de entrada). Embora nos
desenvolvimentos anteriores tenha ficado implcito que este nmero seria igual ao nmero de
estados nos modelos locais, como afirmado na seo 2.4.3 pode ser usado um nmero menor
de estados nas premissas das regras;
ndice dos estados nas premissas das regras. Alm de definir quantas variveis de entrada
existiro no sistema, o mtodo escolhe quais seriam as mais adequadas dentro do conjunto de
estados;
Nmero de funes de pertinncia por varivel de entrada. Neste caso, possvel determinar
nmeros distintos de funes de pertinncia para variveis de entrada distintas;
Configurao de cada funo de pertinncia. Como ser justificado na seo 4.4.1 do captulo 4,
as funes de pertinncia adotadas para os modelos fuzzy so gaussianas, parametrizadas em
dois parmetros: sua abertura e centro. Ambos so definidos automaticamente pelo AG.
Como est sendo suposto o uso de uma base de regras completa, o nmero de regras do modelo
fuzzy ser dado pela equao (3.23), considerando o nmero de estados nas premissas das regras e o
nmero de funes de pertinncia em cada estado definidos pelo AG.
Para o modelo fuzzy TS FBO Generalizado, os seguintes parmetros so definidos pelo AG:
Plos reais ou complexos de cada modelo local;
Nmero de estados nos modelos locais. Como agora os modelos locais so parametrizados em
plos distintos, o nmero de estados de cada modelo local otimizado de forma independente;
ndice dos estados nas premissas das regras. Embora o nmero de estados nas premissas das
regras seja uma entrada do AG, o mtodo fornece o conjunto de estados mais adequados;
Configurao de cada funo de pertinncia, tambm gaussiana.
A seo 4.4.1 apresentar as justificativas para a otimizao de menos parmetros livres no modelo
fuzzy TS FBO Generalizado. Em suma, os argumentos sero baseados na complexidade da tarefa de
se otimizar toda a arquitetura deste modelo, alm de ser possvel o uso de alguma informao a

3.4 Estimao Global Estimao Local

37

priori sobre as caractersticas do sistema sendo modelado (como o nmero de regies de operao
esperado).
Alm destes parmetros otimizados pelo AG, restam ainda todos os coeficientes dos modelos
locais. Como afirmado anteriormente, estes parmetros podem ser estimados usando o mtodo dos
mnimos quadrados. A seo seguinte apresenta tal mtodo e analisa duas opes possveis de sua
aplicao. A primeira, estimao global, ser usada em ambas arquiteturas propostas. J a segunda,
estimao local, ser aplicada apenas no modelo fuzzy TS FBO Generalizado.

3.4 Estimao Global Estimao Local


Conforme afirmado nas sees anteriores, a adoo de modelos FBO lineares e FBO de Volterra
nos conseqentes das regras dos modelos fuzzy TS FBO mantm a caracterstica de linearidade nos
parmetros, seguindo a estrutura da equao (3.14). Sendo assim, o estimador de mnimos quadrados
pode desempenhar de forma tima a tarefa de estimao dos parmetros [3].
O desenvolvimento do estimador de mnimos quadrados (MQ) baseado na equao (3.27),
obtida a partir das equaes (3.11) e (3.14) ao se supor que cometido um erro de aproximao

em relao sada real y(k) a partir do vetor estimado de parmetros :


+
y(k) = (k)T

(3.27)

Para tal, supe-se que seja feito um conjunto de N medidas da sada y(k), fornecendo o vetor y,
correspondentes a N vetores (k), agrupados na matriz = [1 (k) 2 (k) . . . N (k)]T . Assim:
+
y =

(3.28)

so obtidos a partir de (3.28) ao se minimizar uma funo de custo baseada em


Os parmetros
uma norma quadrtica do erro de aproximao , funo essa da forma [3]:
J=

N
X
i=1

(i)2 = kk2

(3.29)

Substituindo da equao (3.28) em (3.29) e minimizando esta equao, chega-se seguinte


equao, que caracteriza o estimador de mnimos quadrados [3]:
= [T ]1 T y

(3.30)

Modelo Fuzzy TS FBO

38

O estimador de mnimos quadrados apresenta as seguintes propriedades [13, 72]3 :


No polarizado, ou seja, o valor esperado (mdia) do erro de estimao nulo;
Melhor estimador linear no polarizado, implicando que ele minimiza a varincia do erro de
estimao;
Consistente, o que significa que a varincia do erro de estimao tende a zero na medida em
que o nmero N de medies tende a infinito.
O estimador de MQ tal qual foi apresentado acima consiste na estimao global dos parmetros
dos modelos fuzzy TS FBO, pois cada vetor (k) compondo a matriz contm informaes sobre todas as regras e, conseqentemente, sobre todos os modelos locais. Logicamente, o vetor de
tambm abrange os coeficientes dos conseqentes de todas as regras, como ilustrado na
parmetros
equao (3.22). Assim, em apenas um passo (uma aplicao da equao (3.30)), todos os parmetros
livres dos modelos locais so estimados.
Dessa forma, os modelos locais no sero necessariamente aproximaes locais do sistema no
linear sendo modelado, o que acontece com a estimao local, explicada a seguir [2, 51, 81]. Esta
caracterstica de interpretao local importante em algumas aplicaes, como em controladores de
ganho adaptativo, nos quais os modelos locais so usados para se projetar controladores locais, alm
de ser til para a anlise e validao do modelo [51]. No entanto, normalmente a estimao global
dos parmetros fornece uma melhor aproximao do sistema como um todo, sendo adequada para as
tarefas de predio no linear ou controle baseado em modelos [2, 23, 32, 51].
Na estimao local, aqui aplicada apenas no modelo fuzzy TS FBO Generalizado, os parmetros
de cada modelo local so estimados de forma independente dos outros modelos locais. No lugar de
apenas uma execuo do algoritmo de mnimos quadrados, realizam-se r execues, cada uma estimando os parmetros livres dos conseqentes de uma regra. Assim, agora tanto o vetor de parmetros
i quanto a matriz i dizem respeito a uma regra i especfica. O estimador local de mnimos quadra
dos ser ento dado por [52, 72]:
i = [T i i ]1 T i y

i
i

(3.31)

Os vetores i (k) que formam a matriz i so definidos ligeiramente diferentes para a estimao
local, j que agora cada modelo local possui um conjunto especfico de estados ortonormais. Considerando modelos locais lineares para manter a simplicidade na anlise, para a i-sima regra tm-se:
i (k) = [1 lTi ] = [1 li1 (k) li2 (k) . . . lin (k)]
3

Desde que o erro de aproximao e a sada y(k) sejam estatisticamente independentes.

(3.32)

3.5 Resumo

39

sendo li o conjunto de estados ortonormais da respectiva regra.


A matriz de ponderao i da equao (3.31) definida como uma matriz diagonal dada por:
i = diag[1 2 . . . N ]
sendo j calculado como:

wj
j = X
m
wi

(3.33)

(3.34)

i=1

e os termos wj correspondendo ao peso da j-sima regra, calculados de acordo com a t-norma adotada.
Alm das diferenas entre estimao global e local discutidas anteriormente, outro aspecto relevante a complexidade dos clculos das matrizes inversas nas equaes (3.30) e (3.31). No primeiro
caso, tm-se um problema de complexidade O([r(n + 1)]3 ) enquanto a estimao local representa
uma complexidade menor, O(r(n + 1)3 ) [11, 52, 36]. Para modelos fuzzy TS FBO Generalizados
com um nmero de regras (modelos locais) r elevado, a estimao global pode demandar um elevado
esforo computacional.
O captulo 5 apresenta os resultados obtidos utilizando-se tanto a estimao local quanto a global
na tarefa de modelagem de um sistema levitador magntico. Naquela ocasio ser discutido o desempenho de cada um dos mtodos dentro da arquitetura proposta neste trabalho.

3.5 Resumo
Este captulo primeiramente detalhou o conceito de Funes de Base Ortonormal, explicitando
o conjunto de vantagens ao se utilizar essa metodologia em modelagem de sistemas dinmicos. Em
particular, foram apresentadas as bases de Laguerre e de Kautz.
Em seguida discutiu-se brevemente os modelos FBO Linear e de Volterra, e mais apuradamente os
modelos fuzzy TS FBO e fuzzy TS FBO Generalizado, os quais constituem o foco do presente trabalho.
Para estes modelos, foram listados os parmetros de projeto que sero definidos e otimizados de forma
autnoma.
Por ltimo, descreveram-se duas formas de estimao dos coeficientes dos conseqentes das regras dos modelos fuzzy: estimao global, mais adequada nas tarefas que envolvem predio, por
permitir em geral uma melhor aproximao da funo desejada; e local, que permite interpretao
local dos modelos locais, sendo til tambm na anlise e validao dos modelos.
O prximo captulo detalha o mtodo usado para a otimizao dos parmetros livres de projeto da
arquitetura apresentada neste captulo.

40

Modelo Fuzzy TS FBO

Captulo 4
Projeto de Sistemas Fuzzy TS FBO utilizando
Algoritmos Genticos
A computao evolutiva constituda pelos mtodos computacionais inspirados na teoria da
evoluo natural das espcies. Tais mtodos so baseados em uma populao de indivduos sujeitos
a avaliao, modificaes e seleo. As instncias dos algoritmos fundamentados em princpios evolutivos so chamadas de algoritmos evolutivos. Historicamente, os algoritmos evolutivos incluem as
tcnicas de estratgias evolutivas, programao gentica e algoritmos genticos.
Os algoritmos genticos foram desenvolvidos por Holland no incio dos anos 60 [45]. Originalmente, foram projetados como um sistema formal para adaptao, e no otimizao. Suas caractersticas bsicas eram a forte nfase em recombinao (crossover), uso de um operador de seleo probabilstico e a interpretao da mutao como um operador secundrio. Embora em sua forma original
os algoritmos genticos representassem solues atravs de cadeias binrias, um grande nmero de
variantes foi desenvolvido para ampliar o mbito de aplicaes do algoritmo.
Este captulo descreve a tcnica dos algoritmos genticos e a arquitetura elaborada para o projeto automtico do sistema Fuzzy TS FBO. Em cada seo, a partir da seo 4.4, detalha-se uma
caracterstica ou componente dos algoritmos genticos de um modo geral e ento a sua configurao
especfica na metodologia ora proposta.

4.1 Princpios Biolgicos dos Algoritmos Evolutivos


Baseados nas teorias da Evoluo Darwiniana (Charles R. Darwin, 1809-1882) e da Seleo Natural (Gregor Mendel, 1822-1884), os algoritmos evolutivos tm por objetivo encontrar o indivduo
timo de uma populao geneticamente refinada. Este modelo faz uma analogia computacional com
os critrios probabilsticos de seleo e evoluo naturais, por meio de simulaes de geraes que se
41

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

42

sucedem, formando uma populao final mais adequada, ou adaptada, ao ambiente em questo.
At meados do sculo XIX, os naturalistas acreditavam que cada espcie havia sido criada separadamente por um ser supremo ou atravs de gerao espontnea. O trabalho do naturalista Carolus
Linnaeus sobre a classificao biolgica de organismos despertou o interesse pela similaridade entre
certas espcies, levando a acreditar na existncia de uma certa relao entre elas. Outros trabalhos influenciaram os naturalistas a favor da teoria da seleo natural, tais como os de Jean Baptiste
Lamark, que sugeriu uma teoria evolucionria baseada no uso e desuso de rgos; e de Thomas
Robert Malthus, que props que fatores ambientais tais como epidemias e carncia de alimentos
limitavam o crescimento de uma populao.
Depois de mais de 20 anos de observaes e experimentos, Charles Darwin apresentou em 1858
sua teoria de evoluo atravs de seleo natural, simultaneamente ao naturalista ingls Alfred Russel
Wallace. No ano seguinte, Darwin publicou o seu On the Origin of Species by Means of Natural
Selection com a sua teoria completa [21].
Este trabalho influenciou no apenas as reas de Biologia, Botnica e Zoologia, mas tambm teve
grande impacto sobre o pensamento religioso, filosfico, poltico e econmico da poca. A teoria
da evoluo e a computao nasceram praticamente na mesma poca: Charles Babbage, um dos
fundadores da computao moderna e amigo pessoal de Darwin desenvolveu sua mquina analtica
em 1833.
Por volta de 1900, o trabalho de Gregor Mendel, desenvolvido em 1865, sobre os princpios
bsicos de herana gentica, foi redescoberto pelos cientistas e tambm influenciou as pesquisas
relacionadas evoluo. A moderna teoria da evoluo combina os fundamentos da gentica de
Mendel com as idias de Darwin e Wallace sobre a seleo natural, criando o princpio bsico de
Gentica Populacional: a variabilidade entre indivduos em uma populao de organismos que se
reproduzem sexualmente produzida pela mutao e pela recombinao gentica.
Os princpios de Darwin procuram explicar a biodiversidade a partir de uma proposta inicial para
sobrevivncia de genes - a formao de indivduos ou fentipos - e um processo de mudanas graduais
que adaptam e transformam os indivduos de acordo com as exigncias ambientais. O modelo ressalta
o fato de que os indivduos mais aptos iro, provavelmente, sobreviver por um perodo de tempo mais
longo e deixaro uma herana gentica mais intensa na populao. A evoluo dita darwiniana
um modelo de aproximao gradual para evoluo - no permite saltos evolucionrios ou macromutaes. No paradigma darwiniano o principal mecanismo operacional da transferncia gentica
a reproduo sexuada.
A reproduo sexuada uma estratgia de constituio de novos indivduos com, pelo menos,
dois indivduos compartilhando seus genes na formao da descendncia. Esse tipo de reproduo
ocorre em dois contextos:

4.2 Algoritmo Gentico Bsico

43

O contexto da interao ambiente indivduo, envolvendo a sobrevivncia fsica do indivduo


at a idade reprodutiva e os mecanismos de seleo do(s) parceiro(s) de reproduo.
O contexto das clulas reprodutivas, envolvendo, na maioria dos casos, uma competio entre
as clulas masculinas de um ou mais indivduos.
Enquanto a seleo do parceiro reprodutivo ocorre em um universo macroscpico, cruzamentos e
mutaes na cadeia ADN (em ingls, DNA, DeoxyriboNucleic Acid) ocorrem no contexto da clula
embrio, ou seja, da microbiologia. A configurao do cdigo ADN metaforicamente associada,
nos algoritmos evolutivos, a uma configurao do problema que se deseja resolver.
A busca pela soluo tima de um problema atravs de um algoritmo evolutivo associada
busca do indivduo mais adaptado ao ambiente. A abordagem computacional resume as diferentes
instncias de deciso do fenmeno biolgico em uma s etapa e simula o compartilhamento de ADN
atravs da manipulao direta do cromossomo. O processo, portanto, modelado por uma abordagem
pseudoevolutiva que permite uma implementao computacional eficiente [68].
Todas as instncias dos algoritmos evolutivos compartilham esses fundamentos biolgicos. A
tcnica dos algoritmos genticos, explorada na presente pesquisa, detalhada na seqncia. Bons
pontos de partida para o aprofundamento nos demais mtodos so os trabalhos de Bck et al. [6, 7].

4.2 Algoritmo Gentico Bsico


O algoritmo gentico bsico apresentado nesta seo pode, com algumas modificaes, descrever o funcionamento da maioria dos algoritmos evolutivos. As principais diferenas residiro na
representao da populao e na ordem e forma de atuao dos operadores de seleo e reproduo.
Primeiramente, uma populao de indivduos gerada, geralmente de forma aleatria. Um requisito para essa etapa a representatividade adequada do espao de busca por parte dos indivduos
criados. O passo seguinte a avaliao de cada indivduo da populao. Uma funo de fitness
usada para aferir a aptido de cada elemento para a soluo do problema que est sendo tratado.
Baseado nesse clculo, um operador de seleo atua escolhendo de forma privilegiada os melhores
indivduos da populao. Estes so ento submetidos a operadores genticos de recombinao e
mutao para a composio da populao que pertencer gerao seguinte. Essa nova populao
, como a original, submetida avaliao. O processo se repete at que uma condio de parada
especificada seja atendida. Algumas possibilidades de condies de parada so:
A n-sima gerao corresponde quantidade mxima de geraes estabelecida na inicializao
do algoritmo gentico, sem que se tenha conseguido descobrir pelo menos um indivduo que
satisfaa a soluo do problema;

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

44

A n-sima gerao possui pelo menos um indivduo que seguramente satisfaa a soluo do
problema, sendo n um nmero menor que a quantidade mxima de geraes fixada para o
algoritmo gentico;
O melhor indivduo da populao se repete por um nmero pr-estabelecido de vezes. Esta
situao caracteriza o encerramento do algoritmo por estagnao do melhor indivduo;
A mdia da adaptabilidade da populao no se altera por um determinado nmero de geraes.
Este caso chamado de encerramento por estagnao da evoluo da populao;
A diversidade da populao atinge um limite inferior indicando convergncia.
A prxima subseo discute a importncia da definio adequada dos diversos parmetros envolvidos durante a aplicao de algoritmos genticos. A seguinte cita alguns exemplos de aplicaes
promissoras ou j bem-sucedidas dessa tcnica.

4.2.1 Configurao do Algoritmo Gentico


Ao se utilizar algoritmos genticos para solucionar um problema, deve-se analisar a influncia dos
parmetros de ajuste dessa ferramenta. Uma determinada configurao pode ter um desempenho melhor que outra em um problema especfico e no existe uma metodologia para a determinao tima
desse conjunto de parmetros [10].
A primeira deciso relaciona-se representao cromossmica dos indivduos. Alm da arquitetura escolhida, preciso determinar qual ser a preciso desejada. Pode-se, por exemplo, utilizar
a representao binria para variveis que na realidade so nmeros reais. Assim, um conjunto de
genes necessrio para o mapeamento de cada um desses valores. Uma preciso maior implica num
maior nmero de genes, aumentando o tamanho do cromossomo, seu espao ocupado na memria e
acarretando perda de performance do algoritmo. Pelo contrrio, uma representao com baixa preciso pode mesmo impossibilitar a determinao de uma soluo adequada do problema. Para evitar
esses problemas, adota-se neste trabalho uma representao utilizando nmeros reais e inteiros, como
ser apresentado na seo 4.4.1.
Outro parmetro relaciona-se ao tamanho da populao. O desempenho global e a eficincia dos
algoritmos genticos so diretamente afetados por esse nmero. Com uma populao pequena o
desempenho pode ser ruim, pois neste caso a populao fornece uma pequena cobertura do espao
de busca do problema. Uma populao grande geralmente fornece uma cobertura representativa
do domnio do problema, alm de prevenir convergncias prematuras para solues locais ao invs
de globais. No entanto, para se trabalhar com grandes populaes, so necessrios maiores recursos
computacionais, sob pena de o algoritmo consumir um perodo de tempo muito maior que o desejvel.

4.2 Algoritmo Gentico Bsico

45

Arquiteturas paralelas e/ou distribudas so necessrias para aumentar a eficincia computacional


neste contexto.
Mais um fator relacionado populao a parcela de indivduos que ser selecionada para formar
a gerao seguinte. Com um valor baixo, a maior parte da populao ser substituda, podendo ocorrer
a perda de indivduos de alta adaptabilidade. Com um valor alto, o algoritmo pode tornar-se muito
lento.
Em relao taxa de ocorrncia da mutao, como ser ressaltado na seo 4.7, normalmente um
valor baixo adotado. A definio adequada da taxa de recombinao tambm imprescindvel para o
funcionamento adequado do algoritmo gentico. Quanto maior for esta taxa, mais rapidamente novas
estruturas sero introduzidas na populao. Mas se for demasiadamente elevada, elementos com boas
adaptabilidades podero ser retirados mais rapidamente do que so gerados melhores indivduos.
Com um valor baixo, a evoluo da populao pode estagnar, convergindo para um mnimo local.
As metodologias adotadas para a definio desses parmetros normalmente so empricas, ou
seja, baseadas na experincia prvia do projetista. Mtodos automticos de sintonizao desses parmetros, denominados meta-algoritmos, tm sido propostos na literatura. Um deles, por exemplo, explora a utilizao de um sistema fuzzy para controlar dinamicamente a configurao de um algoritmo
gentico [64]. A base de conhecimento utilizada neste sistema fuzzy poderia ser obtida diretamente de
um projetista de algoritmos genticos experiente ou automaticamente. A seo 4.3 apresenta outras
referncias teis na definio automtica dos parmetros dos algoritmos genticos.

4.2.2 Aplicaes
Solues adaptativas so normalmente requeridas em sistemas que atuam em um ambiente dinmico. Sistemas adaptativos, ou evolutivos, tentam resolver problemas acumulando conhecimento
sobre eles e utilizando estas informaes para gerar solues razoveis. reas comuns de aplicao
so: configurao de sistemas complexos, alocao de tarefas, seleo de rotas e outros problemas de
otimizao.
Para a definio inequvoca do escopo de aplicao dos algoritmos evolutivos necessria a introduo dos conceitos de mtodos fortes e mtodos fracos [79]. Os mtodos fortes so aqueles
concebidos para resolverem problemas genricos mas desenvolvidos para atuarem em um ambiente
especfico, bem determinado, onde esto presentes caractersticas como linearidade, estacionariedade,
diferenciabilidade e/ou continuidade. Uma classe ainda mais restrita so os mtodos especficos, elaborados para resolverem problemas especficos em ambientes tambm especficos.
Por outro lado, os mtodos fracos so concebidos para serem aplicados a problemas genricos em
ambientes tambm genricos, ou seja, no requisitando as caractersticas existentes para os mtodos
fortes. Embora no garantam a obteno da soluo tima do problema sendo abordado, geralmente

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

46

fornecem uma boa aproximao para essa soluo, em tempo de execuo computacional compatvel
com a necessidade do problema.
Os mtodos fracos, que englobam as tcnicas evolutivas, devem ser aplicados apenas quando no
existem mtodos fortes ou especficos efetivos para o problema em questo. A tarefa do projeto
automtico de um sistema fuzzy, que representa o enfoque central do presente trabalho, uma rea
potencial de aplicao para os mtodos fracos, em especial para os algoritmos evolutivos, o que
corroborado pelo volume de pesquisa nessa rea (ver seo 4.3.1).
Segue uma listagem de algumas aplicaes dos algoritmos genticos:
Controle de sistemas dinmicos [62, 54, 118];
Sntese de circuitos analgicos: para determinadas entradas e sadas, o algoritmo gentico gera
a topologia , o tipo e o valor dos componentes do circuito [60];
Sntese de protocolos de comunicao: determinao de quais funes do protocolo devem ser
implementadas em hardware e quais devem ser implementadas em software para que o melhor
desempenho seja alcanado [69];
Gerenciamento de redes: superviso do trfego nos links e das filas nos buffers de roteadores
para descobrir rotas timas e para reconfigurar as rotas existentes no caso de falha de algum
link [42];
Otimizao evolutiva multi-critrio: otimizao de funes com mltiplos objetivos que sejam
conflitantes [25];
Problemas de otimizao complexos. Casos tpicos so problemas de alocao, localizao,
roteamento de veculos e o problema do caixeiro viajante, todos com grande potencial de aplicao na rea de logstica [8, 63].
Cincias biolgicas: modelagem de processos biolgicos para o entendimento do comportamento de estruturas genticas [59];
Definio da arquitetura de redes neurais [49, 101, 110].
Determinao e otimizao dos componentes de sistemas fuzzy (ver referncias na seo 4.3.1);
Como foi afirmado na seo 3.3 do captulo 3, o tema desta dissertao relaciona-se (porm no
restrito) ao ltimo item da listagem anterior, considerando no entanto sistemas fuzzy TS baseados
em funes de bases ortonormais. A seo seguinte dedicada a uma descrio mais detalhada dessa
rea de pesquisa.

4.3 Projeto Automtico de Modelos Fuzzy

47

4.3 Projeto Automtico de Modelos Fuzzy


As pesquisas recentes tm mostrado que sistemas inteligentes hbridos fornecem mtodos eficientes para aplicaes prticas. Ao se compensar as deficincias de uma tcnica com os benefcios
de outra, criam-se estruturas de enorme potencial [18, 48, 97].
Desde a ltima metade da dcada de 80 tm sido realizadas intensas pesquisas nos campos das
redes neurais, sistemas fuzzy e algoritmos genticos. O grande nmero de publicaes nessa rea
indica que estudos combinando essas diferentes ferramentas tm aumentado significativamente. Em
particular, combinaes de redes neurais e sistemas fuzzy j foram incorporadas em diversos produtos
[48, 106].
Cada metodologia tem suas vantagens. Por exemplo, os algoritmos genticos e as redes neurais
possuem a desejvel caracterstica de adaptabilidade. Sistemas fuzzy e redes neurais podem aproximar
funes no lineares. Sistemas fuzzy podem ainda incorporar o conhecimento especializado de um ser
humano de forma transparente. J as redes neurais podem tratar dessas informaes implicitamente,
alm da caracterstica de aprendizagem. Os algoritmos genticos caracterizam-se pelas propriedades
de busca local e global.
Um exemplo de problema que motivaria a aplicao de um sistema inteligente hbrido relaciona-se
definio adequada dos parmetros de um algoritmo gentico. As taxas de ocorrncia dos operadores de reproduo, o tamanho da populao, a preciso na representao dos indivduos, podem,
por exemplo, ser automaticamente calculadas utilizando-se um sistema fuzzy [64, 43, 103].
Normalmente a configurao oposta mais comumente pesquisada, qual seja, a utilizao de
algoritmos genticos para a determinao dos parmetros timos de um sistema fuzzy, ou mesmo de
um sistema neuro-fuzzy.
Para este ltimo caso, relata-se por exemplo o uso de algoritmos genticos na definio adequada
das funes de pertinncia para um sistema fuzzy cujas regras de controle so aprendidas atravs
do treinamento no supervisionado de uma rede neural, a qual tambm implementa as operaes de
inferncia e defuzzyficao [102]. Uma peculiaridade desse estudo o uso de uma taxa de ocorrncia variante para o operador de mutao. Estipula-se que resultados melhores so encontrados ao
decrescer essa taxa conforme o algoritmo aproxima-se da soluo tima [35].
Outro trabalho nesse sentido foca o uso de um modelo chamado NEFCON, NEural Fuzzy
CONtroller [5]. O algoritmo de aprendizagem utilizado baseado em reforo. Novamente, um algoritmo gentico empregado para otimizar os parmetros do sistema neurofuzzy, aplicado ao controle
de plantas no lineares e com retardo.
No caso do uso de algoritmos evolutivos em sistemas fuzzy, a meta geralmente estabelecida
a definio de um conjunto de funes de pertinncia (de entrada e/ou de sada) alm da gerao
automtica da base de regras de inferncia [65, 31, 24, 94, 78]. A prxima seo apresenta uma

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

48

reviso sucinta da evoluo das pesquisas envolvendo os chamados Genetic Fuzzy Systems - GFS
[17, 18].

4.3.1 Evoluo dos Sistemas Gentico-Fuzzy


No incio da dcada de 90 so encontrados na literatura cientfica os primeiros artigos descrevendo
o uso de algoritmos genticos (AG) para o projeto de sistemas fuzzy. Desde ento, tm sido propostas
arquiteturas cada vez mais sofisticadas: definido automaticamente um maior nmero de parmetros,
viabilizada uma maior flexibilidade durante o projeto, so considerados mltiplos objetivos,
realizada a integrao com outros mtodos de otimizao e finalmente foram realizadas aplicaes
complexas em reas antes inexploradas. Segue uma breve reviso que ilustra a evoluo da pesquisa
nessa rea.
Lee e Takagi propuseram em 1993 [65] um mtodo para projetar automaticamente uma srie de
elementos de um sistema de controle fuzzy. Neste trabalho so referenciados outros desde o ano de
1989, que no consideravam todos os componentes do sistema fuzzy simultaneamente. A proposta
de Lee e Takagi determinava, utilizando algoritmos genticos, as funes de pertinncia (FP) para
um nmero pr-determinado de variveis de entrada, o nmero de regras e os parmetros dos conseqentes das regras de um sistema do tipo Takagi-Sugeno-Kang. A aplicao consistiu no controle de
um pndulo invertido.
Em 1994, Liska e Melsheimer [71] propuseram um AG para o projeto de um sistema fuzzy, englobando:
Nmero de regras e suas estruturas;
Parmetros das funes de pertinncia;
Uso do mtodo do gradiente conjugado para melhorar o resultado final.
A aplicao inicial foi a modelagem de um sistema dinmico no linear, utilizando um modelo
fuzzy do tipo Mamdani.
Controladores fuzzy PI e PD foram abordados por Ng e Li em 1994 [82]. Um algoritmo gentico
foi aplicado para otimizar as funes de pertinncia exponenciais parametrizadas pelas constantes ,
e , conforme a equao (4.1).
|x |
(x) = exp

(4.1)

Alm disso, a base de regras completa do sistema do tipo Mamdani e os ganhos proporcional
e integral dos controladores foram tambm obtidos com o algoritmo gentico. A aplicao foi um

4.3 Projeto Automtico de Modelos Fuzzy

49

sistema de controle de nvel em um tanque.


Ainda em 1994, Park et al. [91] abordaram o modelo fuzzy relacional. Um AG obtm simultaneamente a matriz fuzzy relacional e os parmetros das funes de pertinncia triangulares, de quantidade
fixa. Efetua-se uma aplicao no controle de um motor DC.
Homaifar e McCormick, em 1995 [47], projetaram um sistema de controle fuzzy do tipo Mamdani,
com uma base de regras completa. Um AG foi usado para calcular simultaneamente as FP triangulares de 2 variveis de entrada e a base de regras. Esta metodologia foi utilizada para o controle de
posicionamento de um carro (Cart Controller) e de um caminho (Truck-backing).
Um modelo hierrquico distribudo para um AG foi proposto em 1996 por Kim e Zeigler [56]. Na
arquitetura proposta divide-se o problema em duas etapas. Na primeira, so analisados grandes clusters com pouco detalhamento. Na segunda, explora-se com maior preciso os clusters mais promissores, em nveis maiores de detalhamento. Aplica-se o mtodo a um controlador fuzzy Mamdani em
uma simulao da produo de oxignio para a atmosfera marciana. A arquitetura otimiza o tipo e
quantidade das FP. A base de regras completa e simtrica (fixa, no otimizada). So implementadas
restries para impedir o crescimento exponencial da base de regras.
Linkens e Nyongesa compilaram em 1996 [70] trabalhos sobre o uso de tcnicas inteligentes de
controle. dada nfase em lgica fuzzy, redes neurais e algoritmos genticos, bem como em suas
combinaes. Dentre as referncias inclusas nesse trabalho, citam-se as seguintes arquiteturas: base
de regras fixa, com otimizao das FP; FP fixas com otimizao da base de regras; projeto simultneo
dos dois itens anteriores; e aplicaes em sistemas gentico-fuzzy em tempo real (controle robtico e
schedule).
Em 1997 Jikai et al. [50] elaboraram um sistema para otimizao on-line de um controlador
neuro-fuzzy com um AG. Este, em um primeiro momento, codificava os pesos sinpticos da rede
neuro-fuzzy e procedia com a otimizao. Em seguida as FP gaussianas tambm eram otimizadas. A
aplicao concentrou-se no controle em tempo real de um forno eltrico.
Marco Russo, em 1998 [98], desenvolveu um sistema para aplicao em classificao e modelagem, que tambm englobava os trs componentes maiores da inteligncia computacional: sistemas
fuzzy, algoritmos genticos e redes neurais. Dentre as caractersticas do sistema projetado, citase uma codificao de comprimento proporcional (e no exponencial) ao nmero de parmetros e
um mtodo de simplificao de base de regras (atravs da incluso de um termo de penalizao na
funo de fitness). O mtodo de busca local hill-climbing implementado para acelerar o processo de
aprendizagem. Nesta implementao, o mtodo converte um determinado indivduo para uma rede
neuro-fuzzy, treina-a e ento retorna codificao cromossmica no AG, com um valor de adaptao
(fitness) maior.
Em 1999 Kumar e Wu [57] elaboraram um sistema para obteno de modelos para sries tempo-

50

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

rais usando AG e teorias de sistemas fuzzy. Testa-se o sistema em um conjunto de dados simulados e
na previso do comportamento dos mercados de aes de Taiwan e da Malsia. Em ambos os casos,
os resultados obtidos so melhores que aqueles fornecidos por um modelo ARIMA.
Semelhantemente ao trabalho de Homaifar e McCormick [47], Wu e Liu desenvolveram em 2000
[116] um AG que otimiza as FP triangulares de entrada e a base de regras completa de um controlador fuzzy do tipo Mamdani. As melhorias no mtodo referem-se a uma maior flexibilidade no
desenvolvimento do sistema fuzzy, atravs da incluso de um nmero maior de parmetros de projeto
no algoritmo gentico. Outras caractersticas so uma codificao com nmeros reais, o uso do operador de crossover convexo, de mutao no-uniforme e seleo por rank. A aplicao tambm em
um sistema de controle de posicionamento.
Delgado et al. introduziram um sistema gentico-fuzzy hierrquico em 2001 [22]. A arquitetura conta com o uso do mtodo dos mnimos quadrados para a estimao (local ou global) dos
conseqentes no lineares de modelos TS, alm de um procedimento de poda para a eliminao de
redundncia nas regras. Testa-se o sistema em problemas de classificao e aproximao de funes.
Em 2002, Delgado et al. deram continuidade ao trabalho [25]. Um sistema gentico-fuzzy gera autonomamente todo um sistema classificador, desde a forma e quantidade de funes de pertinncia
das variveis de entrada at a base de regras. Uma arquitetura hierrquica usada, formada por um
conjunto de populaes sujeitas a um processo de co-evoluo. Implementa-se uma otimizao multicritrio (considerando acurcia, interpretabilidade, simplicidade e autonomia) baseada em algoritmos
genticos.
Em 2004 foi publicado um artigo por Cordn et al. [18] retratando o estado da arte da pesquisa
em sistemas gentico-fuzzy. So descritas as principais arquiteturas j propostas, as aplicaes j realizadas e as novas tendncias nessa rea. Uma anlise crtica da importncia dos algoritmos genticos
durante o projeto de sistemas fuzzy efetuada, levantando aspectos como as diferentes abordagens
possveis (com maior ou menor grau de autonomia no projeto), as poucas alternativas existentes e a
necessidade de formalizao de um mtodo de avaliao de desempenho de um GFS. Em seguida so
apresentadas algumas questes que ainda permanecem em aberto, incitando a pesquisa contnua para
a melhoria do desempenho das arquiteturas atuais bem como para a criao de outras novas.
Algumas publicaes recentes esto focadas na aplicao de sistemas gentico-fuzzy dentro de um
contexto maior, no sendo estes os destaques maiores da pesquisa cientfica. Dessa forma, relata-se a
aplicao de diversas configuraes dos GFS como parte de sistemas complexos, os quais abordam,
por exemplo, pr-processamento de dados em sistemas de potncia [58] ou controle multi-agente de
manipuladores robticos [30]. Neste ltimo caso, um sistema de controle fuzzy do tipo Mamdani
operado por 3 agentes independentes. Trata-se do controle de um rob com a tarefa de interagir com
um humano. So ponderados para a avaliao do desempenho do controlador o tempo de atuao, o

4.3 Projeto Automtico de Modelos Fuzzy

51

erro em termos da distncia a uma trajetria pr-estabelecida e a energia de operao. Um algoritmo


gentico aplicado na otimizao das FP de entrada e sada dos trs controladores. No h critrio
de interpretabilidade do resultado, podendo ser obtidas, por exemplo, FP sobrepostas (o que de fato
ocorre nos resultados registrados).
Leung et al. trabalharam em 2004 com um controlador fuzzy para sistemas no lineares sujeitos
a incertezas em seus parmetros [66]. O enfoque maior da pesquisa o desenvolvimento de fundamentos tericos para a garantia de estabilidade do sistema. Um AG usado na identificao de um
ganho de controle e na soluo da equao para a estabilidade. Em seguida, novo AG usado na
otimizao das FP do controlador. Aplica-se o mtodo estabilizao de um manipulador robtico
com dois braos.
A seo seguinte apresenta o resumo da proposta desse trabalho. Trata-se de uma combinao entre o uso de procedimentos bem estabelecidos, a extenso de metodologias proeminentes e a sugesto
de uma nova arquitetura de representao.

4.3.2 Proposta para Otimizao do Sistema Fuzzy TS FBO


A principal contribuio cientfica do trabalho descrito nessa dissertao a proposta de uma arquitetura para o projeto automtico de sistemas fuzzy TS FBO e sistemas fuzzy TS FBO Generalizado
utilizando algoritmos genticos.
A arquitetura proposta baseia-se em um nvel nico de representao, ou seja, um cromossomo
codifica toda a soluo do problema. Dada a complexidade da tarefa de se projetar automaticamente
todo um sistema fuzzy, algumas abordagens envolvendo co-evoluo adotam nveis hierrquicos de
codificao [24, 94], com vrias populaes representando elementos distintos dos sistemas fuzzy. Segundo essa metodologia, indivduos de uma populao so formados pela combinao de indivduos
de outras populaes. A avaliao do fitness de um elemento funo do fitness de seus subcomponentes. As abordagens co-evolutivas apresentam uma estrutura que facilita uma implementao
paralela.
O presente trabalho se prope a mostrar que possvel a obteno de bons resultados utilizando
apenas um nvel de representao, desde que os operadores genticos utilizados levem em conta a
codificao elaborada, considerando as diferentes semnticas em diferentes sees do cromossomo.
Dessa forma, por exemplo, o operador de mutao por inverso (ver seo 4.7) est imediatamente
descartado, uma vez que pode alocar a um gene um alelo incompatvel com a semntica daquela
posio.
Alm disso, so aplicados critrios especiais para a obteno de sistemas parcimoniosos, porm
com bom desempenho na tarefa de modelagem (critrio de Akaike, ver seo 4.5.1), e para a manuteno da interpretabilidade caracterstica de um sistema de aproximao do raciocnio humano

52

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

(medidas de similaridade, ver seo 4.9).


Os parmetros de projeto includos no algoritmo gentico foram apresentados na seo 3.3 do
captulo 3. A partir da prxima seo so detalhados os vrios componentes e processos que integram um algoritmo gentico e apresentadas as propostas especficas dessa dissertao para o projeto
automtico dos modelos fuzzy TS FBO e fuzzy TS FBO Generalizado.

4.4 Representao Cromossmica


O primeiro passo para a utilizao dos algoritmos genticos a definio da representao cromossmica dos indivduos da populao. Os cromossomos so compostos por genes, dgitos alfanumricos, que sero, tal como na biologia, alterados quando da reproduo. Segundo a abordagem
Pittsburgh, cada elemento uma possvel soluo do problema (ao contrrio da abordagem Michigan,
na qual a populao como um todo a soluo) [94]. O conjunto de todas as configuraes que o cromossomo pode assumir forma o espao de busca do algoritmo gentico. Assim, caso o cromossomo
represente n parmetros de uma funo, o espao de busca resultante um espao de n dimenses.
Tradicionalmente, os indivduos so representados por um vetor binrio [46], como ilustrado na
Figura 4.1, onde cada elemento do vetor (gene) denota a presena (1) ou ausncia (0) de uma determinada caracterstica: o seu gentipo. Os elementos podem ser combinados formando as caractersticas
reais do indivduo, ou seja, o seu fentipo. Teoricamente, esta representao independente do problema. Uma vez encontrada a representao em vetores binrios, as operaes padro de reproduo
podem ser utilizadas.
1 1

0 1

0 0

Figura 4.1: Representao cromossmica binria.


Dependendo do problema a ser tratado, outras representaes podem ser mais eficientes e, portanto, adotadas. Pode-se pensar em se utilizar nmeros naturais, caracteres, ou mesmo uma combinao dos dois. Um exemplo seria a representao de uma soluo do problema de roteamento de
veculos. A Figura 4.2 exibe um cromossomo identificando trs tipos de veculos (A, B e C) atendendo um conjunto de localidades, rotuladas como 4, 9 e 12 (veculo A), 5 e 2 (veculo B) e 7 e 1
(veculo C).
A

4 9

12 B

5 2

Figura 4.2: Representao cromossmica mista.

4.4 Representao Cromossmica

53

Relata-se ainda o uso de representaes com valores reais, atravs de permutaes ou por meio
de rvores hierrquicas [6]. Mesmo a representao binria apresenta a variante de se adotar o cdigo
Gray [6]. A escolha pela representao a ser utilizada dependente da natureza do problema em
estudo. Alm disso, os operadores genticos, abordados na seo 4.7, tambm esto intrinsecamente
conectados ao tipo de representao adotada.
A primeira populao de indivduos normalmente criada de maneira aleatria. recomendado
apenas o cuidado para que seus indivduos tenham uma ampla representatividade no domnio do
problema em estudo. Em caso contrrio, corre-se o risco do processo de busca paralisar em um
ponto de mximo local, em um problema de maximizao, ou mnimo local, em um problema de
minimizao, fornecendo assim um resultado indesejvel para a soluo global do problema.
Um importante fator a ser considerado durante a elaborao da representao cromossmica
a manuteno da validade dos indivduos durante o processo evolutivo. Idealmente, aps a criao
da populao, todos os operadores genticos devem manter a validade de um indivduo, no sentido
de que este continue representando uma soluo factvel do problema. Caso tal factibilidade possa
vir a ser violada, algum procedimento deve ser executado para corrigir, ou eliminar, o indivduo
problemtico. Uma primeira opo aplicar um mtodo de verificao e correo em cada indivduo
aps a atuao dos operadores de reproduo. Obviamente, a etapa corretiva pode demandar alto custo
computacional, devendo ser postergada o mximo possvel. A segunda opo a implementao de
uma funo de penalizao dos indivduos que representam solues infactveis. Tal funo deve
ser cuidadosamente elaborada para que no faa com que o algoritmo gentico fornea, ao final do
processo evolutivo, solues simplesmente factveis, sem a otimizao do critrio de desempenho
(ver seo 4.5).

4.4.1 Proposta de Representao Cromossmica


Duas representaes cromossmicas foram elaboradas, uma para a arquitetura fuzzy TS FBO com
plo nico1 e outra para a fuzzy TS FBO Generalizado. Em ambas as representaes, diferentes
elementos do sistema so codificados no mesmo cromossomo, com os seguintes objetivos em mente:
1. A representao seja simples, transparente;
2. Os operadores genticos sejam aplicados entre elementos com a mesma semntica. Por exemplo, durante um crossover no so combinados genes representando um plo do modelo com
genes representando o centro de uma funo de pertinncia;
1

Quando o contexto no for suficiente para distinguir as duas arquiteturas, falar-se- em fuzzy TS FBO com plo
nico referindo-se arquitetura descrita na seo 3.2.3 para diferenci-la da arquitetura fuzzy TS FBO Generalizado,
descrita na seo 3.2.4.

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

54

3. Parmetros que no tenham uma quantidade fixa pr-determinada (como o nmero de estados nas premissas das regras) possuem certo grau de liberdade para aumentar ou diminuir seu
nmero;
4. Restries de integridade sejam automaticamente preservadas, ou facilmente passveis de correo, durante a aplicao dos operadores genticos;
5. A representao no seja esparsa.
Em ambas as representaes descritas a seguir, preciso representar plos complexos que definem
a dinmica de estados de um modelo. Adota-se uma representao em coordenadas cartesianas, para
se atender ao primeiro requisito anteriormente definido e dispensar a converso entre coordenadas
(polar para cartesiana) em cada avaliao de fitness. No entanto, na populao inicial os plos so gerados em coordenadas polares e so garantidamente estveis ( contidos no interior do crculo unitrio).
Seus valores em coordenadas cartesianas so ento trivialmente obtidos.
As funes de pertinncia dos termos lingsticos so escolhidas como gaussianas, parametrizadas
por dois valores: seu centro e sua abertura. Essa escolha no crtica uma vez que tem sido confirmado que a maior importncia na definio das parties das variveis de entrada de sistemas fuzzy
reside na disposio e grau de sobreposio das funes de pertinncia2 , e no propriamente em seu
formato (se gaussiana, triangular ou trapezoidal) [93]. Espinosa et al. exibem um estudo no qual
concluem que modelos fuzzy TS com funes de pertinncia gaussianas geram interpolaes no lineares das vizinhanas dos modelos locais [32]. Esses modelos apresentam melhores resultados em
uma srie de exemplos de aproximao de funes, comparados a modelos utilizando funes de pertinncia triangulares ou polinomiais. De fato, a maioria dos resultados de aproximao universal em
sistemas fuzzy assume o uso de funes de pertinncia gaussianas [14, 39, 61, 115].
A arquitetura aqui proposta permite ainda duas interpretaes para a codificao das funes de
pertinncia. Na primeira, os valores de seus centros so absolutos. Na segunda, as posies de seus
centros so relativas. Apenas o valor do centro da primeira funo de pertinncia absoluto. A partir
da segunda, o valor real do centro obtido somando-se seu valor de centro a todos os anteriores, ou
seja, o parmetro centro define a distncia entre os centros de funes de pertinncia vizinhas. Essa
implementao possibilita o controle do grau mnimo ou mximo de sobreposio entre as funes de
pertinncia de forma trivial, bastando para isso impor esses limites diretamente aos respectivos genes
do cromossomo. Claramente, o controle das aberturas (ou larguras) das funes de pertinncia pode
ser feito independentemente da interpretao dada a seus centros.
2

Esta tarefa pode ser associada definio de uma moldura cognitiva, a qual composta por vrios conjuntos fuzzy
normais usados como pontos de referncia para o processamento de informaes fuzzy [93]. As propriedades mais importantes relativas s molduras cognitivas, como especificidade e foco de ateno, no fazem meno ao tipo de funo
de pertinncia utilizada.

4.4 Representao Cromossmica

55

Esta segunda interpretao (posio relativa dos centros) uma opo natural da arquitetura proposta, porm a tcnica das medidas de similaridades, descrita na seo 4.9, alm de um mtodo
eficiente no controle da sobreposio entre funes de pertinncia, um mecanismo de simplificao
de modelos fuzzy. Sendo assim, a primeira interpretao apresentada ser adotada neste trabalho.
A inicializao de todos os parmetros codificados na populao feita segundo uma distribuio
uniforme, j que em princpio no h informaes sobre regies do espao de busca probabilisticamente mais promissoras, onde se poderia, por exemplo, centrar Gaussianas (ver seo 4.7.1).
Uma varivel aleatria com distribuio uniforme em um intervalo [a, b] tal que todo nmero
nesse intervalo possui a mesma probabilidade de ocorrncia. Dessa forma espera-se que a inicializao da populao seja representativa de todo o espao de busca, desde que, para cada parmetro
sendo otimizado, sejam estipulados os limites a e b de seus universos. Esta etapa depende do problema sendo tratado e do conhecimento sobre as ordens de grandeza dos parmetros codificados no
algoritmo gentico. Como exemplo, a deciso pela inicializao das partes real e imaginria dos plos dos modelos fuzzy TS FBO estabelece o intervalo [0, 1]. Para a parte real do plo, a justificativa
para se trabalhar apenas no semiplano direito do crculo unitrio3 que no existe sistema equivalente contnuo para sistemas discretos (como o caso) com plos no semiplano esquerdo do plano
complexo z. Em relao parte imaginria do plo, como este sempre complexo conjugado (base
de Kautz) basta representar o semiplano superior, pois o semi plano inferior um espelho [41].
Descreve-se a seguir a representao para o modelo fuzzy TS FBO com plo nico e em seguida
para o modelo Generalizado.
Representao para o modelo fuzzy TS FBO com plo nico
Para essa arquitetura, os modelos locais so parametrizados no mesmo plo complexo, ou seja,
possuem a mesma dinmica de estados. O que diferencia cada modelo local so as relaes estticas
desses estados. A arquitetura proposta mais flexvel que no caso do sistema fuzzy TS FBO Generalizado, descrito adiante nesta seo, no sentido de que permite maior autonomia no projeto do modelo
fuzzy. Primeiramente no necessria a informao a priori da quantidade de modelos locais a ser
obtida. Em adio, permitido ao algoritmo variar o nmero de funes de pertinncia por varivel
de entrada, alm de variar o prprio nmero de variveis de entrada (estados). O nmero de estados
presentes nos conseqentes das regras tambm otimizado. A representao matricial elaborada
facilmente interpretvel.
A Figura 4.3 ilustra o cromossomo elaborado para a representao em questo. Trata-se de uma
matriz com valores reais e inteiros. As nicas informaes que devem ser previamente fornecidas
ao algoritmo gentico so os nmeros mximos de variveis de entrada (estados) e de funes de
3

Os plos so inicializados dentro do crculo unitrio para a garantia de sua estabilidade.

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

56

pertinncia por varivel, dados respectivamente por maxvl e maxtl .

11
12
13
..
.

11
12
13
..
.

21
22
23
..
.

21
22
23
..
.

..
.

maxvl 1
maxvl 2
maxvl 3
..
.

maxvl 1
maxvl 2
maxvl 3
..
.

1maxtl

1maxtl

2maxtl

2maxtl

maxvl maxtl

maxvl maxtl

Figura 4.3: Representao cromossmica para o modelo fuzzy TS FBO com plo nico.
Na Figura 4.3, o plo de Kautz representado pelos parmetros e (coordenadas cartesianas,
da forma j), na primeira coluna da matriz. Na seqncia das colunas, cada par representa o
conjunto de funes de pertinncia associadas respectiva varivel de entrada. Dessa forma, a segunda e terceira colunas codificam as funes de pertinncia da primeira varivel de entrada, sendo
as aberturas determinadas pelos parmetros ij e os centros por ij , com os ndices i e j referenciando
a varivel de entrada e o termo lingstico, respectivamente. Os limites mximos para essas quantidades so, respectivamente, maxvl e maxtl . O nmero de estados nos conseqentes das regras
determinado pelo parmetro k (nmero comum de estados em todos os modelos locais).
Nesta representao cromossmica deve-se observar alguns aspectos. Primeiramente, uma varivel deve possuir ao menos dois termos lingsticos (funes de pertinncia) para que sua existncia
seja justificada. Assim, caso em algum momento do processo de otimizao reste apenas um termo
lingstico para determinada varivel, este termo deve ser excludo, assim como a respectiva varivel.
Esta ao tomada pois uma varivel com um nico termo lingstico pode ser tida como o prprio
universo de discurso, no representando uma partio significativa. Outra condio que deve ser
satisfeita que o nmero k de estados nos conseqentes das regras no seja inferior quantidade de
variveis (estados) nas premissas das regras. Embora sejam permitidas at maxvl variveis de entrada,
um cromossomo pode exibir um nmero menor (as duplas de colunas correspondentes s variveis
inexistentes so nulas). O parmetro k, que tambm define a dimenso do vetor de estados da base
ortonormal, deve ento sempre ser maior ou igual ao nmero efetivo de variveis nas premissas das
regras. Finalmente, os operadores de recombinao (crossover) implementados devem respeitar a
semntica dos elementos no cromossomo, bem como suas restries de valorao.
Computacionalmente, a populao de indivduos com esta representao uma matriz de dimenso N(maxtl (2maxvl + 2)), sendo N o nmero de indivduos na populao. Diferentemente da
representao apresentada na prxima seo, alguns loci de um cromossomo podem vir a ter valores
nulos. Esta condio ocorre quando uma varivel lingstica no utiliza todos os termos lingsticos
possveis, ou o nmero mximo de variveis no alcanado. Em termos de eficincia computacional, esta uma desvantagem dessa representao. A aplicao das medidas de similaridade para

4.4 Representao Cromossmica

57

simplificao do sistema fuzzy (ver seo 4.9) tende a criar ainda mais lacunas. Uma alternativa seria
o uso de uma estrutura de dados mais sofisticada, como uma lista duplamente encadeada. No entanto,
a representao matricial extremamente simples e transparente, agilizando consideravelmente a
aplicao dos operadores genticos, justificando assim sua adoo.
Representao para o modelo fuzzy TS FBO Generalizado
Nesta implementao, cada modelo local parametrizado em um plo complexo (base de Kautz).
O nmero de modelos locais deve ser fornecido por um especialista humano no processo sendo modelado, ou seja, uma entrada do algoritmo. Essa restrio justificada devido ao alto grau de complexidade na elaborao de uma arquitetura algortmica e computacional ao mesmo tempo flexvel e
eficiente para a otimizao tambm do nmero de modelos locais do sistema fuzzy. Na arquitetura
ora proposta o nmero de modelos locais corresponde ao nmero de regras do sistema fuzzy, nmero
este dado pela combinao de todos os termos lingsticos das variveis lingsticas de entrada (base
de regras completa).
Assim, considerando o conhecimento do nmero r de modelos locais esperados para o modelo
fuzzy, os parmetros livres de projeto, otimizados pelo algoritmo gentico, so: os r plos, compostos
pelo par abcissa e ordenada (valores reais); um conjunto de m funes de pertinncia gaussianas para
cada um dos n estados nas premissas das regras4 , compostas por um valor de centro e um de abertura
(valores reais); r nmeros indicando as quantidades de estados nos conseqentes das regras (valores
inteiros); e n inteiros especificando quais estados estaro presente nas premissas das regras. Adota-se
uma representao para o cromossomo na forma de um vetor, conforme ilustrado na Figura 4.4.
1

. . . r

. . . nm

11
nm

11
k1

...

1m

1m

. . . kr

L1

...

n1

n1

...

. . . Ln

Figura 4.4: Representao cromossmica para o modelo fuzzy TS FBO Generalizado.


Nessa figura, os plos dos r modelos locais so parametrizados em coordenadas cartesianas, na
forma i ji ; as aberturas das m funes de pertinncia das n variveis de entrada correspondem
aos parmetros ij e os centros aos ij ; os nmeros de estados nos conseqentes das r regras so
codificados por ki ; e os ndices dos n estados nas premissas por Li . Assim, para uma base de regras

completa, existem r = mn regras.


Nessa representao, o cromossomo possui tamanho fixo. Cada locus (posio) ocupado por um
alelo significativo (ao contrrio da representao anterior, que permite loci vazios). A populao
4

Por simplicidade o nmero m fixo e igual para todos os estados.

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

58

formada por uma matriz na qual cada linha representa um indivduo codificado na forma da Figura 4.4.
A Figura 4.5 apresenta um exemplo numrico de um cromossomo e o respectivo modelo codificado.
Trata-se de um modelo com duas regras (logo, dois plos, uma varivel de entrada e duas funes de
pertinncia).
0,27 0,44 0,13 0,56

1,12 -0,47 1,70 1,08

5 3

R1 : se ( 2 (k) A1,2 )
(
l1 (k + 1) = A1 l1 (k) + b1 u(k)
ento
y1 (k)
= f1 (l1 (k))
R2 : se ( 2 (k) A2,2 )
ento

l2 (k + 1) = A2 l2 (k) + b2 u(k)
y2 (k)
= f2 (l2 (k))

Figura 4.5: Exemplo numrico da representao cromossmica para o modelo fuzzy TS FBO Generalizado.
Os parmetros A1 e b1 do modelo local da regra R1 , bem como o vetor de estados l1 (k) com 5
estados, so obtidos a partir do primeiro plo codificado no cromossomo, 0,27 j 0,44. Os respectivos parmetros da segunda regra so obtidos a partir do segundo plo, 0,13 j 0,56. O segundo
modelo local possui 3 estados no vetor de estados l2 (k). As duas funes de pertinncia presentes
na premissa das regras (A1,2 e A2,2 ), cuja varivel de entrada o resultado da inferncia fuzzy sobre
o segundo estado ortonormal dos modelos locais, possuem aberturas iguais a 1,12 e 1,70 e centros
iguais a -0,47 e 1,08, respectivamente.

4.5 Avaliao
Aps a definio da representao cromossmica, necessrio elaborar uma estratgia de avaliao dos indivduos da populao. Esta funo de avaliao depende do problema sendo tratado.
Uma propriedade que ela deve possuir explicitar quais cromossomos representam as melhores configuraes para a soluo do problema em questo, assim como apontar aqueles que geram elementos
insatisfatrios. Convenciona-se que essa funo, tambm chamada funo de fitness, deve atribuir
valores mais altos aos indivduos melhores, mais aptos a resolver o problema de otimizao, e valores
menores s solues pobres. Alm disso, so comumente usadas funes no negativas.

4.5 Avaliao

59

Usualmente, para se calcular o fitness (valor da funo de avaliao) de um indivduo, simula-se


a sua atuao no ambiente do problema sendo tratado. Na maioria dos casos necessrio decodificar
o cromossomo e obter a proposta de soluo. Assim, caso os cromossomos representem sistemas
classificadores, por exemplo, sua avaliao consiste em se testar sua capacidade de classificao sobre
um conjunto de padres de teste. Quanto maior o nmero de padres corretamente classificados,
maior ser seu fitness. Se os indivduos representam os parmetros de um controlador, durante a
avaliao pode-se medir o desempenho deste em malha fechada frente uma trajetria de referncia
pr-estabelecida. Neste caso, quanto menor a medida do erro quadrtico mdio entre o sinal de
referncia e a sada da planta, maior ser o valor do fitness. Em um problema de roteamento de
veculos, os indivduos que codificam as rotas com menor custo apresentaro tambm valores de
fitness maiores.
A funo de fitness pode ainda incorporar outras informaes no relacionadas estritamente ao
desempenho do indivduo codificado. Medidas de penalizao, por exemplo, podem ser includas.
Tais penalizaes podem se referir infactibilidade de uma soluo, violao de restries mais
brandas ou ao nmero excessivo de parmetros em uma soluo (diretamente relacionado complexidade da soluo). Em problemas de otimizao multi-critrio, durante a otimizao de funes com
mltiplos objetivos que sejam conflitantes, a definio da funo de fitness exige ainda mais ateno,
tornando-se necessrio um tratamento analtico cuidadoso.
Dentro do contexto dessa dissertao, a avaliao realizada comparando-se a resposta dos modelos obtida em srie sinttica (simulao do modelo sem a utilizao da sada do sistema real como
entrada do modelo) com o comportamento real dos sistemas sendo modelados, ambos sujeitos a um
mesmo sinal de excitao. nessa etapa que o mtodo dos mnimos quadrados estima o vetor dos
coeficientes dos conseqentes das regras, completando assim o modelo para sua avaliao. A funo
de fitness desenvolvida considera tanto o desempenho do modelo quanto sua complexidade.

4.5.1 Critrios para Anlise da Complexidade do Modelo


A funo de fitness desenvolvida inclui um termo de penalizao pela complexidade do modelo,
alm de considerar o desempenho da soluo codificada. Vrios critrios de penalizao j foram
propostos, a maioria baseada em mtodos estatsticos do desempenho do modelo [7].
O critrio de mnimo comprimento de descrio (MDL, Minimum-Description-Length) baseado
em um compromisso entre o erro residual do modelo e sua complexidade. Um modelo que minimiza
o critrio MDL timo no sentido de ser uma estimao consistente do nmero de parmetros e
ao mesmo tempo alcanar um erro mnimo. Formalmente, supondo que zi seja uma seqncia de
observaes de uma varivel aleatria Z, caracterizada pela funo densidade de probabilidade pZ (),

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

60
o critrio MDL tem a forma:

+ k log N
MDL(k) = log p(z|)
2

(4.2)

a funo de
sendo a estimativa de mxima verossimilhana do vetor de parmetros , p(z|)
densidade de probabilidade condicional de pZ (), k o nmero de parmetros no modelo e N o
nmero de observaes. O primeiro termo da equao (4.2) pode ser interpretado como o nmero
de bits necessrio para codificar as observaes, enquanto o segundo termo como o nmero de bits
necessrio para codificar os parmetros do modelo [105].
Uma proposta semelhante, chamada mnimo comprimento de mensagem (MML, Minimum Message Length), possui tambm dois termos. O primeiro analisa a estimativa dos parmetros desconhecidos do modelo e o segundo uma funo das observaes, a qual utiliza uma codificao tima
baseada na distribuio de probabilidade dos dados obtida pela estimativa dos parmetros. O critrio
MML difere do MDL basicamente em sua implementao e na viso probabilstica de seus idealizadores [114].
Um terceiro critrio o critrio de informao de Akaike (AIC, Akaike information criterion),
cuja idia essencial estabelecer quantos parmetros incluir no modelo minimizando o erro de modelagem. definido como [3]:
2
AIC(n ) = N ln[erro
(n )] + 2n

(4.3)

2
sendo N o nmero de observaes, erro
(n ) a varincia do erro de modelagem (erro de predio de
o nmero de parmetros no modelo.
um passo frente ou resduo) e n = dim[]

Nesse critrio, medida que so includos termos no modelo, o nmero de graus de liberdade
2
aumenta permitindo um melhor ajuste aos dados. Dessa forma, erro
(n ) diminui quando n aumenta.
A partir de um determinado momento, a diminuio da varincia dos resduos devido incluso de
um novo termo no modelo insignificante, no sendo justificada a incluso deste termo. Assim,
a primeira parcela da equao (4.3) quantifica a diminuio na varincia dos resduos resultante da
incluso de um termo, enquanto a segunda parcela penaliza a incluso de cada termo. A ponderao
originalmente estipulada para a incluso de um termo 2. Outros critrios de informao semelhantes
ao AIC so citados na literatura modificando-se as ponderaes entre os dois termos da equao (4.3)
[3].
As vantagens e desvantagens de cada uma das abordagens supracitadas no esto bem definidas
na literatura, ainda sendo motivos de debate [6]. Neste trabalho adota-se o critrio de informao
de Akaike como base para o clculo do fitness de um indivduo, como descrito a seguir. A escolha
justificada principalmente pela maior facilidade de clculo, j que no necessita, por exemplo, estimar

4.6 Operadores de Seleo

61

funes densidade de probabilidade condicional como na equao (4.2).

4.5.2 Proposta de Funo de Fitness


O fitness do i-simo indivduo da populao calculado no presente trabalho como:
fitness(i) =

1
1 + AIC(i)

(4.4)

sendo AIC(i) a normalizao do critrio de Akaike no intervalo [0, 1], calculado para o i-simo
indivduo segundo a equao (4.3). Tal normalizao necessria pois, como pode ser visto na
2
equao (4.3), quando a varincia do erro de modelagem erro
(n ) muito baixa ( o que natural nas
ltimas geraes do algoritmo gentico), o valor de AIC(n ) pode se tornar negativo. Tal normalizao, no entanto, no interfere no processo evolutivo uma vez que, para o operador de seleo adotado
(ver seo 4.6), o importante a ordem relativa de grandeza entre os valores de fitness dos indivduos
da populao.
O valor de n presente na equao (4.3) calculado computando-se a quantidade de parmetros
do modelo como um todo. Para o sistema fuzzy TS FBO com plo nico, so 2 parmetros devido
ao plo complexo ou 1 se o plo for real, 2 parmetros para cada funo de pertinncia, mais o total
de parmetros nos conseqentes das regras, calculados utilizando o estimador de mnimos quadrados. Para a arquitetura fuzzy TS FBO Generalizado, contabilizam-se 2 parmetros para cada par de
plos complexos conjugados (no caso geral, duas vezes o nmero de modelos locais identificados), 2
parmetros para cada funo de pertinncia nas premissas das regras, mais o nmero de parmetros
dos conseqentes nos modelos locais (que neste caso podem ser distintos), estimados utilizando o
algoritmo dos mnimos quadrados.
O nmero de parmetros dos conseqentes de cada regra depende do tipo de modelo local adotado. No caso de modelos lineares com n estados tem-se n + 1 parmetros para cada regra. Para os
modelos locais no lineares de Volterra de segunda ordem o nmero de parmetros para n estados
[(n + 1)(n + 2)]/2 em cada regra.

4.6 Operadores de Seleo


Uma vez que os indivduos da populao foram avaliados, o prximo passo a utilizao de um
critrio de seleo. A maioria dos mtodos de seleo projetada para escolher preferencialmente
indivduos com maiores notas de aptido (valores de fitness), embora no exclusivamente, para manter
a diversidade da populao. Basicamente, existem trs tipos de seleo: determinstica, estocstica e
hbrida.

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

62

O critrio de seleo determinstica contempla somente os indivduos que atendem a determinadas caractersticas previamente estabelecidas como desejveis. Os indivduos que no atenderem o
critrio de escolha sero eliminados sumariamente. Dessa forma, no h chance de um indivduo que
no satisfaa os requisitos vir a ser escolhido para fazer parte da prxima gerao.
Na seleo estocstica os indivduos que apresentarem maior adaptabilidade tero mais chance de
serem escolhidos. Os de menor adaptabilidade tero menos chance, mas podero eventualmente ser
selecionados.
Na seleo hbrida o processo de seleo intercala os critrios de escolha determinsticos e estocsticos. Dessa forma, h a garantia de escolha de parte dos melhores indivduos da populao,
porm mantendo a possibilidade de seleo tambm dentro de todo o espao de solues.
Um mtodo de seleo muito utilizado o Mtodo da Roleta. um processo eminentemente
estocstico, portanto probabilstico e variante com as geraes.
A Figura 4.6 exemplifica uma roleta para uma determinada gerao de uma populao com 6
indivduos.
Indiv. 6
Indiv. 1

Indiv. 5

Indiv. 2

Indiv. 4

Fitness
0.65 (1)
0.95 (2)
0.20 (3)
0.80 (4)
0.40 (5)
0.50 (6)

Indiv. 3

Figura 4.6: Ilustrao do mtodo da roleta.


Neste mtodo, cada indivduo da populao representado na roleta proporcionalmente ao seu
ndice de aptido. Assim, os indivduos com alta adaptabilidade tm uma poro maior da roleta,
enquanto aos menos aptos dada uma poro relativamente menor. Finalmente, a roleta girada um
determinado nmero de vezes, dependendo do tamanho da populao, e aqueles sorteados na roleta
so submetidos atuao dos operadores de reproduo, se for o caso, ou copiados diretamente para
a populao da gerao seguinte.
O mtodo da roleta, assim como todos os mtodos de seleo proporcionais ao fitness, possui

4.6 Operadores de Seleo

63

dois problemas inerentes. Se a populao contm uma soluo de fitness significativamente maior
que as demais solues na populao, esta ir ocupar a maior parte da roleta. Assim, a maioria das
rodadas da roleta sortear essa mesma soluo. Isto far com que a populao perca sua diversidade
e provocar a convergncia prematura do algoritmo para uma soluo sub-tima.
O segundo problema pode ocorrer aps vrias geraes, quando a maioria dos membros da populao possui aproximadamente o mesmo fitness. Neste caso, as fatias da roleta possuem praticamente o mesmo tamanho e as solues possuem aproximadamente as mesmas probabilidades de
serem escolhidas. Obviamente, trata-se de uma busca quase aleatria.
O operador de seleo baseado em rank semelhante ao mtodo da roleta, porm as fatias so
atribudas aos indivduos de acordo com sua posio aps a ordenao (ascendente ou descendente)
pelo valor do fitness. Assim, em uma populao de tamanho , ao indivduo com menor valor de
fitness ser atribudo o rank zero e ao com o maior valor, o rank 1. A seleo por rank no
apresenta nenhuma das duas desvantagens citadas para o mtodo da roleta.

Aps a ordenao, podem ser utilizados mapeamentos lineares ou no lineares para a determinao da probabilidade de seleo de cada indivduo. Supondo que o rank do i-simo indivduo
dado por rank(i), ento, para um mapeamento linear, tem-se que sua probabilidade de seleo dada
por [6]:

p(i) =

rank(i)
(
(1)

(4.5)

sendo e so as quantidades esperadas de filhos dos indivduos com menor e maior fitness, respectivamente.
Um exemplo de mapeamento no linear :
p(i) = (1 )1rank(i)

(4.6)

com (0, 1). Esta distribuio est relacionada a uma distribuio de Bernoulli [6].
Outro mecanismo de seleo o operador de Boltzmann, o qual altera o valor do fitness de cada
indivduo segundo a funo densidade de probabilidade de Boltzmann, equao (4.7), fornecendo sua
probabilidade de seleo i :
i =

1
1 + exp(Fi /T )

(4.7)

sendo T um parmetro anlogo ao termo de temperatura na distribuio de Boltzmann e Fi o fitness


do i-simo indivduo. Este termo T reduzido de uma maneira pr-determinada em iteraes sucessivas. Como um valor inicial grande de T utilizado, as solues iniciais no possuem grandes

64

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

discrepncias em seu grau de probabilidade de seleo. No entanto, com o progresso do algoritmo


gentico, o parmetro T diminui e as melhores solues so mais evidenciadas.
Um quarto operador de seleo o torneio. Em um torneio de k indivduos, um determinado indivduo selecionado para pertencer nova gerao determinstica ou probabilisticamente, de acordo
com seu valor de fitness. Aps o torneio, h duas opes: ou todos os participantes so colocados de
volta na populao (podendo vir a participar em outros torneios) ou no o so at que um determinado
nmero de torneios ocorra. Em sua forma mais simples, duas solues so sorteadas e a melhor delas
escolhida. A presso seletiva do mtodo controlada pelo nmero de elementos que participam
em cada torneio. Quanto maior esse nmero, maior ser a presso seletiva. Quanto maior a presso
seletiva, maior ser a taxa de convergncia do algoritmo [6].
O torneio tambm elimina os dois problemas do mtodo da roleta. Alm disso, pode ser aplicado
tanto a problemas de maximizao quanto de minimizao, enquanto o mtodo da roleta supe o
objetivo de maximizao, sendo necessria a adaptao da funo de fitness para problemas de minimizao. Outro cuidado extra quando do uso do mecanismo da roleta a impossibilidade de uso de
valores de fitness negativos, o que no consiste em um problema para o mtodo de torneio.
A implementao do mtodo do torneio simples e eficiente, no requerendo o ordenamento da
populao (como no mtodo de rank). Como no so necessrias computaes globais (como no
mtodo da roleta), o mtodo do torneio mostra-se mais adequado para uma implementao paralela.
Tendo em vista as vantagens do mtodo do torneio (simplicidade e eficincia) este foi adotado no
presente trabalho.

4.6.1 Proposta de Operador de Seleo


Neste trabalho foi adotado como operador de seleo o torneio, conforme justificativas na seo
anterior. Na configurao estabelecida, um total de cinco por cento da populao escolhido aleatoriamente para participar do torneio. Deterministicamente selecionado o indivduo com o maior valor
de fitness. O mtodo implementado com reposio, ou seja, todos os indivduos participantes do
torneio so recolocados na populao, inclusive o selecionado. Foi implementado tambm elitismo,
o qual consiste em selecionar o indivduo com o maior fitness de uma gerao e inclu-lo na gerao
seguinte.
Como exposto por Bck et al. [6], a escolha do operador de seleo deve ser feita em conjunto
com as definies dos outros parmetros do algoritmo gentico, principalmente os operadores de
reproduo. Dessa forma, ao se aliar um operador de seleo de presso seletiva moderada, como o
caso, a operadores de recombinao e mutao com alto poder de perturbao (ver seo 4.7.1), uma
implementao eficiente obtida.

4.7 Reproduo

65

4.7 Reproduo
A reproduo a fase do algoritmo gentico em que os indivduos filhos so gerados com o objetivo de compor a nova populao. Consiste na ao de operadores genticos, os quais so aplicados
sobre os indivduos pais, gerando os filhos. A literatura prope uma quantidade muito grande de
operadores genticos. A definio dos operadores de reproduo est intrinsecamente ligada ao tipo
de representao adotada, a qual, por sua vez, depende da classe de problemas que se estuda. Como
exemplo, ao se trabalhar com o problema do caixeiro viajante, os operadores genticos devem garantir a validade do indivduo aps sua atuao, considerando que um determinado alelo deve ocorrer
obrigatoriamente uma nica vez em um cromossomo [63].
So dois os operadores genticos bsicos utilizados durante a fase de reproduo nos algoritmos
genticos: Recombinao e Mutao.
O operador de recombinao (ou crossover) envolve a participao de dois indivduos pais. A
tcnica da recombinao consiste na troca de material gentico entre os pais, gerando dois candidatos
a filhos. escolhido aleatoriamente um conjunto de pontos que delimita a regio de troca dos genes.
As variaes desse mtodo referem-se determinao do nmero de pontos e sua distribuio dentro
do cromossomo, assim como no modo como os genes so trocados. Independentemente de como se
processa a recombinao, ela sempre gerar dois filhos. Em algumas abordagens, destes dois filhos
apenas um sobrevive. A escolha do filho sobrevivente, o qual se tornar um indivduo na prxima
gerao, pode ser feita de diversas formas. Em uma delas, simplesmente realizado um sorteio entre
os dois candidatos a filho. Outra opo a seleo elitista - a escolha recai sobre o candidato de maior
adaptabilidade.
O operador de crossover geomtrico [80] um exemplo utilizado para codificao real, isto ,
uma na qual os genes assumem valores reais. Dados dois pais, ele gera um nico filho conforme
ilustrado na Figura 4.7. Este operador atribui a cada gene do filho a raiz quadrada do produto entre
os respectivos genes dos pais. Esta operao tende a preservar as caractersticas de pais semelhantes
e fazer uma combinao daqueles mais diferentes.
x1

Pai 1
x2 ... xn

y1

x1 y1

Filho
x2 y2 ...

Pai 2
y2 ... yn

xn yn

Figura 4.7: Operador de crossover geomtrico.


Aps a recombinao podem ocorrer mudanas aleatrias nos genes do indivduo. No contexto
biolgico, estas alteraes, genericamente denominadas de mutao, so causadas devido a erros

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

66

durante a replicao do material gentico dos cromossomos envolvidos em um crossover. Uma mutao pode ser caracterizada pela eliminao, duplicao, inverso ou deslocamento de um conjunto
de genes [6].
Nos algoritmos genticos, o operador gentico de mutao envolve a participao de apenas um
indivduo. Esta tcnica consiste, em analogia Biologia Gentica, na alterao de um ou mais genes
de um indivduo aps o crossover. O novo indivduo gerado para a prxima gerao pode assim
possuir alguma caracterstica adicional que lhe fornea melhor adaptao que seu gerador. Os pontos
que identificaro as posies dos genes que sofrero as transformaes so escolhidos aleatoriamente.
A motivao para a existncia do operador de mutao, alm da coerncia biolgica, a introduo
de diversidade na populao. Desta forma, a mutao assegura que a probabilidade de se chegar a
qualquer ponto do espao de busca nunca ser nula. Alm disso, contorna o problema dos timos
locais atravs da leve alterao da direo da busca.
Um exemplo de operador de mutao a mutao por inverso. Aps a escolha aleatria de
dois pontos no cromossomo, o operador inverte os genes entre estes pontos. A Figura 4.8 ilustra
o comportamento desse operador ao se sortear o primeiro e o ltimo gene do cromossomo para a
delimitao da inverso.
Cromossomo original
0.55 0.23 1.70 3.01 0.84 -1.22

Cromossomo aps mutao


0.55 -1.22 0.84 3.01 1.70 0.23 6
Figura 4.8: Operador de mutao por inverso.
Cada operador gentico tem associado a si uma taxa de ocorrncia, tal qual nas cincias biolgicas. Os operadores de recombinao possuem altas taxas de ocorrncia. Os de mutao, baixa, sob a
pena da degenerao do algoritmo em uma busca aleatria.
Uma reviso bibliogrfica ampla sobre os diversos operadores genticos utilizados em algoritmos
evolutivos est disponvel em [6, 7, 111].

4.7.1 Proposta de Operadores de Reproduo


Crossover
So propostos dois operadores de crossover para a arquitetura elaborada. Ambos satisfazem as
condies estabelecidas na seo 4.4.1. Consistem em adaptaes dos operadores de crossover uniforme e crossover aritmtico, descritos na seqncia.

4.7 Reproduo

67

Dado que a representao proposta real (em contrapartida representao binria), o uso do
crossover aritmtico imprescindvel. Os operadores de crossover tradicionais de um ponto ou de
n-pontos, mesmo em codificaes binrias, apresentam o problema de no serem capazes de realizar
um explorao eficaz do espao de busca. Para codificaes reais, o nico meio de se alcanar essa
explorao permitindo que os indivduos filhos possuam genes que no esto presentes em nenhum
de seus pais [6].
O operador de crossover aritmtico descrito em [79] atua sobre os genes xi e yi de dois indivduos
pais x e y criando o indivduo filho z segundo a mdia ponderada:
zi = xi + (1 )yi
sendo um nmero aleatrio no intervalo [0, 1] e i = 1, ..., L os loci do cromossomo de comprimento
L.
A modificao implementada aqui consiste em ampliar o intervalo de para [; 1 + ]. O
parmetro de expanso percentual permite a extrapolao dos limites estabelecidos por xi e yi .
O efeito imediato dessa alterao permitir ao operador uma explorao mais efetiva do espao
de busca, dado que em sua verso original o valor de determinado gene de um indivduo filho
limitado pelos valores dos respectivos genes dos indivduos pais. Alm disso, opera-se com um valor
distinto de para cada elemento, ou seja, i . Esta medida, aliada a uma alta taxa de ocorrncia de
crossover, contribui para a manuteno da diversidade da populao durante sua evoluo. Como a
seleo realizada com reposio (um mesmo indivduo pode ser selecionado mais de uma vez para
reproduo), para a gerao de dois indivduos iguais uma srie pouco provvel de eventos deveria
ocorrer: a seleo do mesmo par de pais e para cada poro considerada do cromossomo os mesmo
nmeros i deveriam ser sorteados.
No captulo 5 apresentar-se- uma comparao dos resultados obtidos com essa modificao no
crossover aritmtico e sem a mesma. Em suma, essa modificao permitiu ao algoritmo gentico
manter de fato a diversidade da populao por um nmero maior de geraes, fornecendo resultados
mdios melhores.
O valor do parmetro de expanso percentual no deve ser muito grande, sob pena de degenerao do algoritmo gentico em uma busca aleatria. Este valor deve ser tal que permita a explorao
mais efetiva do espao de busca em torno dos dois genes sendo combinados (e no apenas entre
eles), porm deve tambm respeitar a propriedade inerente aos operadores de crossover de manter
nos indivduos filhos caractersticas presentes em seus pais. Para ilustrar a sensibilidade do algoritmo gentico a mudanas nesse parmetro, considere o seguinte cenrio hipottipo. Os genes sendo
combinados pelo crossover aritmtico residem no intervalo [0, 1], obtidos por uma distribuio uni-

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

68

forme. Um cromossomo possui um nmero de genes n elevado, digamos 10.0005 . Seja a seguinte
norma para medida de diferena entre um filho f e seus pais p1 e p2 :
d=

2 X
n
1X
|fj pij |
n i=1 j=1

(4.8)

sendo j o ndice do gene no cromossomo. A Figura 4.9 exibe o clculo da norma (4.8) para o
crossover entre dois pais sorteados aleatoriamente gerando um filho e para diferentes valores do
parmetro . Para = 0 tem-se o crossover aritmtico original descrito em [79]. Observa-se que

0.65

0.6

Diferena

0.55

0.5

0.45

0.4

0.35

0.2

0.4

0.6

0.8

Parmetro de expanso ()

Figura 4.9: Sensibilidade do crossover aritmtico ao parmetro de expanso .


para valores de at aproximadamente 0, 2 (correspondendo a uma expanso de 20%) a medida de
diferena aproximadamente igual ao caso original, ou seja, o filho gerado herda caractersticas de
ambos os pais. No entanto, conforme pode ser observado na Figura 4.10, alguns filhos (representados
pelos asteriscos) esto fora do intervalo entre os dois pais, porm prximos a um deles. Esta a
justificativa para a alterao introduzida no crossover aritmtico tradicional. A Figura 4.10 foi obtida
para = 0, 2. O captulo 5 apresenta uma srie de comparaes de simulaes com e sem o parmetro
de expanso , evidenciando a eficincia dessa modificao.
Para o modelo fuzzy TS FBO Generalizado, o crossover aritmtico aplicado entre todos os genes,
observando-se apenas que as ltimas posies do cromossomo so nmero inteiros, sendo necessrio
ento o arredondamento dos valores finais obtidos para o inteiro mais prximo.
5

Este valor elevado utilizado para explicitar a sensibilidade aos valores do parmetro .

4.7 Reproduo

69
1.2

0.8

0.6

0.4

0.2

Pai 1
Pai 2
Filho

0.2

10

12

14

16

18

20

Genes

Figura 4.10: Resultado do crossover aritmtico modificado em um conjunto de genes.


Para o modelo fuzzy TS FBO com plo nico, cuja representao mostrada na Figura 4.3, o
crossover aritmtico opera da seguinte maneira.
1. Os plos so combinados da mesma forma que para o modelo anterior;
2. Para cada varivel de entrada faz-se:
Para cada termo lingstico (funo de pertinncia) faz-se:
(a) Se os dois indivduos possuem o termo lingstico, aplica-se o crossover s suas funes
de pertinncia, combinando os respectivos parmetros (aberturas e centros);
(b) Se apenas um indivduo possui o termo lingstico, copia-se tal termo para o respectivo
indivduo filho;
3. Aplica-se o crossover aritmtico ao nmero de estados nos conseqentes das regras, realizandose o devido arredondamento.
Duas verificaes de validade simples so necessrias em ambas arquiteturas aps a aplicao
desse operador: estabilidade do plo e abertura mnima das funes de pertinncia. Caso o plo
resultante seja instvel, gerado aleatoriamente um novo plo estvel. No caso de a abertura da
funo de pertinncia resultante ser menor que o limite especificado, ento atribui-se abertura este

70

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

valor mnimo. Alm dessas duas verificaes, existe outra opcional, relativa ao uso da segunda representao para as funes de pertinncia explicada na seo 4.4.1, isto , posio relativa (e no
absoluta) dos centros. Como os parmetros representam a distncia entre dois centros consecutivos das funes gaussianas, seu valor deve ser maior que o mnimo estabelecido pelo projetista,
garantindo um grau mximo de sobreposio das funes de pertinncia. Se o valor resultante for
menor que o permitido, atribui-se este mnimo ao respectivo gene do indivduo.
No modelo fuzzy TS FBO Generalizado, outra verificao trivial necessria consiste em garantir
que os ndices dos estados nas premissas sejam vlidos, ou seja, valores menores ou iguais ao menor
dos parmetros indicando a quantidade de estados dos modelos locais. Caso esta condio no seja
satisfeita, sorteiam-se novos valores vlidos para estes ndices.
Uma anlise semelhante tambm prevista para o modelo fuzzy TS FBO com plo nico. O
nmero de estados nos conseqentes deve ser igual ou maior ao nmero de estados (variveis lingsticas) dos antecedentes. Esta verificao necessria pois o nmero de estados nos modelos FBO
locais (ordem dos modelos) dado pelo nmero de estados nos conseqentes das regras. Caso este
nmero fosse inferior ao nmero de estados dos antecedentes, uma regra iria referenciar em sua
premissa uma varivel inexistente. Assim como no modelo Generalizado, a correo do indivduo
consiste no sorteio de um valor vlido para o parmetro em questo. vlido esclarecer que, mesmo
que o mtodo dos mnimos quadrados atribua a um estado dos conseqentes um coeficiente nulo, este
estado em si possui uma dinmica prpria, podendo assim estar presente nas premissas das regras.
Da mesma forma, pode acontecer de um estado no estar presente nas premissas das regras, e sim
apenas nos conseqentes. Neste caso, embora tal estado no atue na etapa de seleo das regras que
sero ativadas, ele contribue com sua dinmica para a representao do sistema como um todo.
O operador de crossover uniforme agora descrito. Ele no utiliza pontos de cruzamento propriamente ditos. Em seu lugar, determina, por meio de uma mscara binria, que genes de cada pai sero
herdados pelos filhos. A Figura 4.11 ilustra a atuao desse operador. Caso o i-simo elemento da
mscara seja 1, ento o valor do i-simo gene do filho 1 ser igual ao gene correspondente do pai 1.
Se tal elemento da mscara for 0, o valor do i-simo gene do filho 1 ser igual ao gene correspondente
do pai 2. A atribuio dos genes do filho 2 segue o processo inverso.
O operador de crossover uniforme aplicado no modelo fuzzy TS FBO Generalizado diretamente
como descrito anteriormente, verificando-se apenas os requisitos relativos estabilidade do plo e
ndice dos estados nas premissas das regras.
Para sua aplicao no modelo fuzzy TS FBO com plo nico, preciso se estipular o que ser
considerado como unidade bsica para intercmbio entre os cromossomos, dado o sorteio da mscara
binria. Tais unidades sero compostas por um conjunto de genes com uma semntica bem definida.
So consideradas como unidades para o crossover uniforme:

4.7 Reproduo

71

0 0

Mscara
1 0 1 1 0

4 2

Pai 1
6 1 3 5 6

Pai 2
1 4 3 6 1

0 1

Filho 1
6 3 3 5 5

Filho 2
4 2 4 1 6

1 6

Figura 4.11: Operador de recombinao uniforme.


Os dois genes que compem o plo complexo;
Os dois genes que definem uma funo de pertinncia gaussiana;
O gene determinando a quantidade de estados nos conseqentes das regras.
Dessa forma, garante-se um tratamento a essa representao matricial equivalente ao dado aos
cromossomos tradicionais na forma de um vetor. Para cada varivel de entrada dos dois indivduos
pais, as unidades correspondentes s suas funes de pertinncia so trocadas de acordo com a mscara binria sorteada, a qual tambm pode ser tida agora como matricial.
A verificao de validade necessria para os indivduos filhos se restringe ao nmero de estados
nos conseqentes das regras. A anlise das distncias entre os centros das funes de pertinncia
tambm deve ser realizada, em ambas arquiteturas, caso a abordagem para controle de sobreposio
seja utilizada.
Ainda considerando o modelo fuzzy TS FBO com plo nico, o operador de crossover uniforme
responsvel pelo possvel aumento do nmero de funes de pertinncia bem como do nmero de
variveis de entrada para determinado indivduo. Esta uma funo importante deste operador, j
que os operadores de crossover aritmtico e de mutao (descritos na prxima seo) no so capazes
de incluir novos termos lingsticos em um indivduo e as medidas de similaridade (descritas na
seo 4.9), pelo contrrio, eliminam funes de pertinncia redundantes. Para aumentar o nmero de
funes de pertinncia, basta que a mscara binria sorteada atribua a um dos indivduos filhos uma
funo de pertinncia do outro pai, funo esta originalmente inexistente. Para a incluso de uma
nova varivel de entrada, a mscara deve ser tal que atribua ao menos duas funes de pertinncia
uma varivel que inicialmente no possuia nenhuma.
Cada vez que uma operao de crossover deve ser efetuada, realiza-se um sorteio entre eles,
sendo que o crossover aritmtico tem probabilidade de ocorrncia igual a 70%, e o uniforme, 30%.
Estes valores so justificados pela maior capacidade do operador de crossover aritmtico de manter a
diversidade da populao (uma vez que tende a gerar indivduos filhos distintos dos pais).

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

72
Mutao

O operador de mutao tradicional em representaes com nmeros reais atua sobre um gene yi
gerando um elemento yi segundo a equao (4.9):
yi = yi + M

(4.9)

sendo M uma realizao de uma varivel aleatria. As diferentes verses de mutao so dadas pelas
diferentes distribuies da varivel aleatria M. O operador de mutao implementado nesse trabalho
baseado em uma distribuio Gaussiana.
A funo densidade de probabilidade para uma varivel aleatria com distribuio Gaussiana
dada pela equao (4.10):
(x )2
1
g(x) = exp
2 2
2

(4.10)

sendo o valor mdio da distribuio e 2 sua varincia. conveno fazer = 0 durante a aplicao do operador de mutao Gaussiana, o que tambm implementado no presente trabalho. Assim, o controle sobre a atuao do operador de mutao, em termos de quo diferentes de seus pais
os indivduos filhos podem ser gerados, concentra-se em um nico parmetro, a varincia 2 , ou,
equivalentemente, no desvio padro . So descritas na literatura muitas abordagens nas quais este
parmetro varivel, sendo funo da taxa de convergncia do algoritmo gentico (diversidade da
populao), da efetividade de mutaes anteriores ou do nmero de geraes j processadas. Alm
disso, outras funes de densidade de probabilidade j foram propostas, tais como a distribuio de
Cauchy e a de Laplace [6]. Neste trabalho, a varincia , alm de varivel, tambm diferenciada para
componentes distintos do cromossomo sendo mutado.
Embora a distribuio inicial (e possivelmente em todas geraes) da populao no seja Gaussiana (ver seo 4.4.1), o desvio padro dos genes de um indivduo uma medida da diversidade da
populao e por isso adequado como parmetro para ajustar o nvel de perturbao do operador de
mutao. Uma srie de estudos corroboram a idia de que o nvel de perturbao do operador de
mutao deve diminuir com o tempo, seguindo de alguma forma a tendncia da prpria diversidade
da populao, tornando a busca mais acurada medida que o algoritmo gentico tende a convergir
[6, 34, 35, 44].
Aps essa pequena introduo possvel detalhar como o operador de mutao pode ser implementado nas arquiteturas propostas. Como as representaes agrupam num mesmo cromossomo
elementos de domnios diferentes, um tratamento diferenciado dado a cada um deles.
Primeiramente, calculado o desvio padro i de cada gene i na populao. Para a arquitetura
fuzzy TS FBO com plo nico, preciso desconsiderar os eventuais genes nulos para determinados

4.8 Condies de Parada

73

parmetros. Por exemplo, algumas funes de pertinncia podem no estar presentes em determinado
indivduo. O valor zero no cromosso, que indica a ausncia de uma funo de pertinncia, no
considerado no clculo do desvio padro para aquela funo de pertinncia em particular. Para o
modelo fuzzy TS FBO Generalizado, o clculo do desvio padro dos genes resume-se ao desvio
padro de cada coluna da matriz numrica que codifica a populao. Em seguida, para os parmetros
com codificao real, a mutao consiste na adio da realizao de uma varivel aleatria Gaussiana
com mdia zero e desvio padro i . Para os parmetros com codificao inteira, apenas efetua-se o
arredondamento da perturbao para o inteiro mais prximo antes de esta ser adicionada ao gene em
questo.
As mesmas verificaes de validade descritas para o crossover aritmtico so realizadas aps uma
mutao, para ambas as arquiteturas.

4.8 Condies de Parada


Para encerrar a descrio dos componentes do algoritmo gentico resta explicitar a condio de
parada adotada. O algoritmo procede a evoluo at que uma das duas condies seguintes seja
atendida:
Um nmero mximo de geraes definido pelo usurio atingido;
A diversidade da populao, calculada em termos do desvio padro dos valores codificados nos
cromossomos (soma dos desvios padro de cada gene), torna-se menor que um limite inferior
pr-estabelecido.
Uma alternativa simples para a definio do limite inferior descrito na segunda condio anterior
seria simplesmente arbritar um valor pequeno comparado diversidade inicial da populao. No
entanto, este valor poderia ter impactos diferentes para as duas arquiteturas propostas aqui. Em
outras palavras, um mesmo valor poderia significar uma diversidade relativa muito menor em uma
representao cromossmica do que em outra.
Dessa forma, o limite inferior de diversidade deve ter uma magnitude tal que considere a arquitetura especfica utilizada. Uma forma eficiente de alcanar esse objetivo estipular uma percentagem
da diversidade inicial da populao como o limite inferior para se considerar a convergncia da polulao. Assim, considera-se ainda a eventual diferena nas diferentes inicializaes das populaes
em execues distintas do algoritmo gentico para uma mesma arquitetura.
Finalizando esse captulo, a seo seguinte descreve um mtodo para a simplificao dos modelos
fuzzy TS FBO baseado em medidas de similaridade.

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

74

4.9 Medidas de Similaridade


Mtodos automatizados para a gerao de funes de pertinncia em um sistema fuzzy, tais como
redes neurais, algoritmos genticos e mtodos de agrupamento, podem produzir funes de pertinncia redundantes, ou seja, funes de pertinncia que englobem pores semelhantes no universo de
discurso, como acontece nos trabalhos [30, 65, 71, 91, 98]. Um nmero de funes de pertinncia
maior que o necessrio implica em aumento da complexidade do sistema fuzzy sem a correspondente
melhoria de desempenho. Um dos modos de se detectar estas redundncias o uso de medidas de
similaridade.
Uma medida de similaridade uma funo que determina a similaridade entre dois conjuntos
fuzzy, de modo a indicar o quo similar ou iguais eles so. Nesse contexto, o termo similar ou igual
no deve ser entendido como igualdade de forma, e sim como o grau de sobreposio entre as funes
de pertinncia de dois conjuntos fuzzy.
Para ser usada em um mecanismo automtico de simplificao de funes de pertinncia uma
medida de similaridade deve possuir as seguintes caractersticas [99]:
1. Dois conjuntos fuzzy que no apresentem qualquer sobreposio possuem grau de similaridade
nulo;
2. Dois conjuntos fuzzy que se sobrepem possuem um grau de similaridade maior que zero;
3. Somente conjuntos fuzzy iguais (em termos de sobreposio) devem ter o grau de similaridade
mximo, no caso 1;
4. O grau de similaridade no deve ser influenciado por fatores de escala ou de deslocamento no
domnio em que os conjuntos esto definidos.
As medidas de similaridade podem ser divididas em:
Medidas de Similaridade Geomtricas: So mais adequadas na determinao da medida de
similaridade entre conjuntos fuzzy distintos;
Medidas de Similaridade baseadas na Teoria de Conjuntos: So mais adequadas para capturar
a similaridade entre conjuntos fuzzy que se sobrepem. Baseiam-se em operaes sobre conjuntos, como a unio e a interseo.
Um exemplo de uma medida de similaridade baseada nas operaes de unio e interseo dado
pela equao (4.11):
S(A, B) =

|AB |
|AB |

(4.11)

4.9 Medidas de Similaridade

75

onde S indica a similaridade entre os dois conjuntos fuzzy A e B, | . | indica a cardinalidade de um


conjunto, e e representam a interseo e a unio, respectivamente. A equao acima em termos

de funo de pertinncia pode ser escrita na seguinte forma:


Pm

j=1 [A (xj )

B (xj )]
j=1 [A (xj ) B (xj )]

S(A, B) = Pm

(4.12)

definida em um universo discreto X = {xj | j = 1, 2, ..., m}. e so os operadores mnimo e


mximo, respectivamente, e Z (xi ) o grau de pertinncia do valor xi ao conjunto Z. Quando da
implementao computacional, domnios contnuos devem ser discretizados.
Uma vez medida a similaridade entre os conjuntos fuzzy A e B e detectado que seu valor est acima
de um limite pr-estabelecido, pode-se substituir A e B por A, por B ou criar um novo conjunto fuzzy
C a partir de A e B. Desse modo, efetua-se a simplificao da base de regras do sistema fuzzy atravs
da eliminao da redundncia nas funes de pertinncia de suas variveis lingsticas.

4.9.1 Proposta de Mtodo para Simplificao de Sistemas Fuzzy


Prope-se a aplicao das medidas de similaridade durante a execuo do algoritmo gentico
como mtodo para a simplificao dos sistemas fuzzy TS FBO com plo nico. Ao final de cada
gerao, aps a aplicao dos operadores genticos de reproduo, calculada a similaridade entre
cada par de funes de pertinncia de uma mesma varivel lingstica. Ento, caso o valor da medida
de similaridade seja superior a um limite, as operaes de simplificao devem ser efetuadas.
Duas atitudes so tomadas para a simplificao de um sistema fuzzy. Primeiramente, caso haja
mais de duas funes de pertinncia para a varivel lingstica em questo, realizada a fuso das
duas funes de pertinncia com maior grau de similaridade acima do limite estabelecido. As duas
funes de pertinncia so substitudas por uma com a seguinte configurao: o centro da nova funo
de pertinncia a mdia aritmtica dos centros das duas originais e a abertura tambm a mdia
das duas aberturas originais. Essa estratgia faz com que a nova funo de pertinncia preserve ao
mximo a forma e disposio das funes originais.
Caso existam apenas duas funes de pertinncia para a varivel lingstica sendo analisada,
com grau de similaridade acima do limite, a prpria varivel lingstica eliminada do sistema.
Caso fosse efetuada a fuso, restaria apenas uma funo de pertinncia. Assim como afirmado na
seo 4.4.1, esta varivel desnecessria ao sistema, podendo ser removida sem prejuzo performance do modelo.
Um aspecto crucial a definio do limite de similaridade para se incorrer em simplificao. Um
valor elevado implica em poucas simplificaes, podendo ainda existir ao final do processo evolutivo
funes redundantes. Um valor demasiadamente baixo faz com que muitas fuses/eliminaes sejam

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

76

efetuadas, diminuindo a diversidade da populao e acelerando a convergncia do algoritmo provavelmente em direo a um timo local. Com essas preocupaes em mente, elaborou-se uma equao
para se tornar dinmico o valor desse limite. Nas geraes iniciais o valor prximo ao mximo,
1. medida que a diversidade da populao cai, o limite de similaridade tambm cai, porm bem
mais lentamente. Este comportamento requerido para evitar que a realizao de muitas fuses e/ou
eliminaes nas geraes iniciais do algoritmo gentico incorra em decrscimo ainda mais acentuado
da diversidade da populao.
A equao (4.13) mostra como o limite L calculado em funo da diversidade da populao na
i-sima gerao, i , da diversidade inicial da populao, 0 e do limite mnimo de similaridade :
L = + (1 )(1 (1 min(1, i /0 )) )

(4.13)

sendo uma potncia par e min(.) o operador de mnimo (retorna o menor de seus argumentos). Este
operador de mnimo usado para limitar superiormente em 1 o valor resultante desta equao na
eventualidade da diversidade da populao em uma gerao intermediria (i ) se tornar maior do que
a diversidade inicial (0 ).
A Figura 4.12 ilustra a atuao dessa funo. Os dados da diversidade da populao foram simulados como uma funo exponencial decrescente. A curva em azul no grfico j o resultado da
normalizao i /0 . As curvas em vermelho so o resultado do uso de diferentes potncias , de 2 at
10. A seta indica o sentido crescente de , ou seja, se inicia em = 2 e aponta para = 10. O limite
mnimo de similaridade nestas curvas = 0, 2. Valores desse limite acima de aproximadamente
0, 8 implicam em poucas fuses de funes de pertinncia (a menos que estas sejam extremamente
semelhantes). Valores abaixo de 0, 3 se mostram mais adequados nas ltimas geraes do algoritmo
gentico, concluindo a simplificao do conjunto de funes de pertinncia. Sendo assim, conclui-se
que os valores mais adequados para a potncia na equao (4.13) so = 8 ou = 10. No entanto,
estes valores no so crticos, no sentido que sua escolha afeta pouco o desempenho do algoritmo
gentico, j que as vrias curvas definindo o limite L, para valores de elevados, so semelhantes
entre si e apresentam o comportamento desejado.

4.10 Resumo
Este captulo detalhou como um algoritmo gentico aplicado na tarefa de otimizao de modelos
fuzzy TS FBO com plo nico e fuzzy TS FBO Generalizado. Aps uma breve introduo sobre o
tema, levantando os princpios biolgicos motivadores dos algoritmos genticos, sua estrutura bsica
e reas de aplicao, alm de uma reviso sobre os chamados Sistemas Gentico-Fuzzy, descrevem-se

4.10 Resumo

77

i /0

0.9

Limite

0.8
0.7
0.6
0.5
0.4
0.3

0.2
0.1
0

20

40

60

80

100

Geraes

Figura 4.12: Funo para a definio dinmica do limite de similaridade.


os vrios componentes e processos que integram um AG.
As principais contribuies deste captulo so a proposta de uma representao cromossmica
para modelos fuzzy TS FBO (seo 4.4.1), a extenso do operador de crossover aritmtico atravs
da introduo de um coeficiente de expanso (seo 4.7.1) e a proposta de uma metodologia para se
aplicar medidas de similaridade com um limite dinmico na tarefa de simplificao das funes de
pertinncia da arquitetura fuzzy TS FBO com plo nico (seo 4.9.1).
Uma perspectiva para continuidade do presente trabalho a automao da determinao do nmero de modelos locais na arquitetura fuzzy TS FBO Generalizado. Um ponto de partida seria o trabalho
[81], no qual so descritas vrias abordagens de modelagem que tratam de mltiplos modelos locais,
nas quais so propostos mtodos como clusterizao, estados funcionais e cadeias de Markov.
Para finalizar este captulo apresenta-se a seguir um pseudocdigo para o algoritmo gentico descrito, com as referncias s sees nas quais cada etapa abordada. Os dois operadores de crossover
descritos so utilizados nos experimentos apresentados no prximo captulo, seguindo a proporo
apresentada na seo 4.7.1.

78

Projeto de Sistemas Fuzzy TS FBO utilizando Algoritmos Genticos

Algoritmo 4.1 Pseudocdigo para o Algoritmo Gentico


g = 0;
cria populao P(g);
(seo 4.4.1)
calcula diversidade da populao inicial;
faa
avalia fitness de P(g);
(seo 4.5.2)
seleciona indivduos para reproduo;
(seo 4.6.1)
operadores de crossover, gerando P(g);
(seo 4.7.1)
operador de mutao Gaussiana, gerando P(g+1);
(seo 4.7.1)
medida de similaridade em P(g+1);
(seo 4.9.1)
calcula diversidade da populao P(g+1);
g = g + 1;
enquanto (g < Mximo de Geraes) E (diversidade da populao P(g) > Diversidade Mnima)
mostrar resultados;

Captulo 5
Resultados de Modelagem
Este captulo apresenta os resultados obtidos ao se aplicar o mtodo descrito no captulo 4 para a
modelagem de sistemas dinmicos no lineares. Foram abordados dois sistemas: um levitador magntico e um processo bioqumico de polimerizao. A anlise qualitativa dos modelos encontrados
baseia-se principalmente em seu desempenho (considerando o erro quadrtico mdio calculado em
srie sinttica) e em sua complexidade.
A prxima seo descreve em mais detalhes os sistemas fsicos abordados. As sees seguintes
apresentam os resultados de modelagem.

5.1 Descrio dos Sistemas


5.1.1 Levitador Magntico
O sistema, ilustrado na Figura 5.1, composto por duas bobinas, uma inferior e outra superior,
que geram campos magnticos pela passagem de correntes eltricas. Essas bobinas interagem atravs
do campo com discos magnticos que se deslocam em uma barra de vidro que serve como guia.
Variando-se a magnitude da corrente na bobina inferior, pode-se controlar a posio do magneto inferior, fazendo-o levitar atravs de uma fora magntica repulsiva. Similarmente, o magneto superior
posicionado atravs de uma fora magntica de atrao, gerada atravs de um valor adequado de
corrente na bobina superior. Com a proximidade dos discos surge tambm interao magntica (fora
de repulso) entre os dois magnetos. Dois sensores ticos baseados em feixes de laser so utilizados
para medir a posio dos magnetos.
Considerando o movimento do disco magntico inferior (disco 1), sendo m1 a massa do disco,
y1 a altura do disco 1, c1 o coeficiente de atrito entre o disco e a barra de vidro e g a acelerao da
79

Resultados de Modelagem

80

Bobina 2
y2

Disco 2

y1

Disco 1
Bobina 1
Figura 5.1: Levitador magntico.

gravidade, a equao que descreve o movimento do disco :


m1 y1 + c1 y 1 + Fm12 = Fu11 Fu21 m1 g

(5.1)

sendo:
Fm12 : fora de interao magntica entre os discos.
Fu11 : fora de interao magntica entre a bobina 1 e o disco 1,
Fu21 : fora de interao magntica entre a bobina 2 e o disco 1,
Estas foras so descritas pelo seguinte conjunto de equaes [95]:
c
(yc + y2 y1 + d)4
i1
=
a(100y1 + b)4
i2
=
a(yc + 100y1 + b)4

Fm12 =
Fu11
Fu21

sendo i1 a corrente aplicada bobina 1, i2 a corrente aplicada bobina 2, y2 a altura do disco 2, yc a


distncia entre as bobinas 1 e 2 e a, b, c, e d coeficiente reais.
As simulaes foram realizadas mantendo-se uma corrente eltrica constante na bobina inferior
e aplicando-se degraus de amplitudes variveis de corrente na bobina 2. Assume-se ento como
varivel controlada a posio y1 do disco 1 e como varivel de controle a corrente na bobina 2, i2 . A
no linearidade do modelo devida aos termos proporcionais inversa da quarta potncia da varivel

5.1 Descrio dos Sistemas

81

controlada, y1 , no conjunto de equaes anterior [92].

5.1.2 Processo de Polimerizao


Trata-se de um processo de polimerizao do tipo Continuous Stirred Tank Reactor, CSTR, descrito em detalhes em [74]. A varivel controlada nesse processo o nmero mdio do peso molecular
do polmero resultante da reao, y(t), cuja unidade Kg/kmol. A varivel de controle a taxa de
influxo de uma substncia iniciadora, u(t), dada em m3 /h. O modelo em espao de estados desse
processo [15]:
q

x 1 (t) = 60 x1 (t)(2, 4568 x2 (t) + 10)


x 2 (t) = 80u(t) 10, 1022x2(t)
q

x 3 (t) = 0, 002412x1(t) x2 (t) + 0, 11218x2(t) 10x3 (t)

(5.2)

x 4 (t) = 245, 9811x1(t) x2 (t) 10x4 (t)


y(t) = x4 (t)/x3 (t)

5.1.3 Organizao dos Resultados


Existem basicamente duas arquiteturas para a obteno de modelos de sistemas dinmicos neste
trabalho, descritas no captulo 3: aquela com plo nico e a Generalizada. Esta ltima permite duas
sub-classes de modelos, dependendo do modo de estimao dos parmetros dos conseqentes das
regras, se local ou global. Sendo assim, existem trs abordagem possveis. Todas foram aplicadas
na modelagem do levitador magntico, porm apenas a arquitetura com plo nico foi utilizada no
processo de polimerizao, uma vez que este ltimo possui uma dinmica menos complexa. Para cada
uma dessas arquiteturas, consideram-se aqui modelos locais lineares e no lineares nos conseqentes
das regras. Os modelos no lineares so modelos de Volterra de segunda ordem.
Antes da exibio dos resultados propriamente ditos, apresenta-se a atribuio dada aos parmetros do algoritmo gentico. As configuraes exibidas foram obtidas considerando-se o conhecimento prvio sobre os sistemas (como a definio de dois modelos locais no modelo Generalizado
para o levitador magntico), o nmero de parmetros sendo otimizado (influenciando o tamanho da
populao, por exemplo) alm de ajustes empricos direcionados por prticas comumente aplicadas
no uso de algoritmos genticos (como o uso de uma pequena taxa de ocorrncia do operador de
mutao) [6, 7, 79].
Em particular, os limites mnimo e mximo das aberturas das funes de pertinncia gaussianas
so apenas valores extremos dos cromossomos codificados na populao e no restries que possam

Resultados de Modelagem

82

vir a direcionar o processo de busca em determinado sentido. Alm disso, os dados de entrada/sada
de todos os sitemas analisados, e portanto seus universos de discurso, esto normalizados. Se este
no fosse o caso, ento de fato os valores apresentados para os limites das funes de pertinncia
representariam grandezas distintas em cada problema.
O valor do parmetro de expanso percentual do operador de crossover aritmtico foi escolhido
baseado nos argumentos formulados na seo 4.7.1.
Finalmente, os resultados apresentados foram obtidos ao se executar o algoritmo gentico em um
R
computador com processador dual Intel Pentium
4 de 3,4 GHz e 1 GB de memria RAM.

5.2 Modelos para o Levitador Magntico


Os dados de treinamento para o algoritmo gentico foram obtidos excitando-se o sistema real em
laboratrio com um sinal peridico da forma mostrada na Figura 5.2.
1

Sada
Entrada

0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

10

12

14

16

18

20

Tempo (s)

Figura 5.2: Sinais normalizados de entrada e sada para treinamento (levitador magntico).
O sinal de entrada foi projetado de forma a atender aos requisitos de ser persistentemente excitante, tornando possvel a tarefa de se extrair dos dados de entrada/sada informaes sobre as
dinmicas dominantes do sistema [3]. Trata-se de um sinal pseudo-aleatrio composto por uma srie
de degraus de amplitudes diferentes. Quando o objetivo obter modelos no lineares de sistemas
dinmicos, importante que os sinais de entrada, alm de possuir uma grande faixa de freqncia,
devem tambm ter excurses em diferentes amplitudes, o que leva o sistema a atingir diferentes pon-

5.2 Modelos para o Levitador Magntico

83

tos de operao [3]. De fato, observam-se na Figura 5.2 dois comportamentos distintos no sistema,
um mais oscilatrio que o outro, dependendo se a variao do sinal de entrada foi positiva ou negativa.
Esta informao foi utilizada no momento de se definir como 2 a quantidade de modelos locais na
arquitetura fuzzy TS FBO Generalizado. Isso implica que o modelo deve possuir apenas um estado
(varivel de entrada) na premissa das regras e duas funes de pertinncia (ver seo 3.2.4).
Como os algoritmos genticos so mtodos no determinsticos de otimizao, para avaliar seu
desempenho na tarefa de sintonia de modelos fuzzy TS FBO no adequado analisar apenas uma
simulao em particular. Os resultados apresentados na seqncia foram coletados aps a execuo
do AG por um nmero de rodadas igual a 35. Os grficos exibidos correspondem a uma rodada
cujos resultados esto prximos queles da mdia de todas as rodadas. Para o levitador magntico, a
configurao do AG em todas as rodadas foi a exibida na tabela 5.1
Parmetros de Execuo
TS FBO Plo nico
Tamanho da populao
100
Nmero mximo de geraes
80
Taxa de crossover
0,85
Taxa de mutao
0,20
Expanso percentual mxima
do operador de crossover ()
0,20
Percentual da diversidade
inicial para convergncia
3
Controle de sobreposio
no
Abertura mnima das
FP gaussianas
0,3
Abertura mxima das
FP gaussianas
3
Nmero mximo de estados nos
conseqentes das regras
7
Nmero mximo de
variveis de entrada (maxvl )
4
Nmero mximo de FP por
varivel de entrada (maxtl )
3
Limite inferior para aplicao
das medidas de similaridade ()
0,2
Potncia para uso na equao
do limite de similaridade ()
8

TS FBO Generalizado
100
80
0,85
0,20
0,20
3
no
0,3
3
7
-

Tabela 5.1: Configurao do AG para o sistema levitador magntico.

O Tamanho da populao o nmero de indivduos (cromossomos) presente em cada gerao. O

Resultados de Modelagem

84

processo evolutivo continua at que o nmero de geraes alcance o Nmero mximo de geraes
ou a diversidade da populao atinja o Percentual da diversidade inicial para convergncia. Cada
indivduo deve respeitar os limites Nmero mximo de estados nos conseqentes das regras, Nmero
mximo de variveis de entrada e Nmero mximo de FP por varivel de entrada. Alm disso, as aberturas das funes de pertinncia so restritas ao intervalo entre Abertura mxima das FP gaussianas
e Abertura mnima das FP gaussianas. Finalmente, as probabilidades de ocorrncia das operaes de
crossover (que utiliza o valor Expanso percentual mxima do operador de crossover para o crossover
aritmtico) e mutao so dadas pelos parmetros Taxa de crossover e Taxa de mutao, respectivamente. Como o operador de crossover aritmtico possui maior capacidade de manter a diversidade da
populao (pois tende a gerar indivduos filhos distintos dos pais) este aplicado com probabilidade
de ocorrncia maior que o operador de crossover uniforme. Cada vez que uma operao de crossover
deve ser efetuada, realiza-se um sorteio entre o operador aritmtico, com probabilidade de ocorrncia
de 70%, e o operador uniforme, com probabilidade de 30%. A opo de controle de sobreposio
no foi usada uma vez que a interpretao adotada em todas as simulaes para a representao cromossmica foi a com distncias absolutas entre os centros das funes de pertinncia, e no a com
distncias relativas. Esta ltima opo seria uma perspectiva para trabalhos futuros.
Seguindo a ordem de apresentao das representaes cromossmicas do captulo 4, sero primeiramente exibidos os resultados para a arquitetura fuzzy TS FBO com plo nico e em seguida a
Generalizada.

5.2.1 Modelo fuzzy TS FBO com Plo nico


A tabela 5.2 resume os resultados obtidos aps 35 rodadas do algoritmo gentico. As informaes
mostradas na tabela referem-se principalmente ao compromisso entre a qualidade do modelo (valor
pequeno para o EQM, Erro Quadrtico Mdio) e sua complexidade (nmero de parmetros). Alm
do valor do EQM, tambm mostrado o valor calculado do critrio de Akaike (AIC) segundo a
equao (4.3). As duas ltimas colunas da tabela apresentam os resultados com o uso de modelos
locais respectivamente lineares e no lineares nos conseqentes das regras1 .
A fim de ilustrar a vantagem da modificao implementada no operador de crossover aritmtico,
a tabela 5.3 exibe um resumo dos resultados obtidos em um conjunto de simulaes com a mesma
configurao apresentada na tabela 5.1 com a nica modificao de se zerar o parmetro de expanso
. A tabela apresenta os resultados correspondentes a modelos locais lineares nos conseqentes das
regras, para os quais ser apresentado na seqncia um exemplo de resultado.
1

Na seqncia do texto, para a simplicidade da escrita, ser usada a notao de modelo linear e modelo no linear
quando o mais apropriado seria respectivamente modelo local linear nos conseqentes das regras e modelo local no
linear nos conseqentes das regras.

5.2 Modelos para o Levitador Magntico

EQM mdio
Nmero mdio de parmetros
AIC mdio
Menor EQM
Nmero de parmetros do menor EQM
AIC do menor EQM
Maior EQM
Nmero de parmetros do maior EQM
AIC do maior EQM
Desvio padro do EQM
Desvio padro do AIC
Nmero mdio de geraes
Tempo mdio de processamento
por rodada (min)

85
Linear No Linear
0,0016962 0,00093761
52,54
111,43
-3996,40
-4201,63
0,0005747
0,0005061
213
154
-4228,85
-4416,22
0,0074675
0,0035242
23
94
-2994,77
-3318,51
0,0015281
0,0006193
326,04
298,16
46,00
35,11
26,05

51,38

Tabela 5.2: Resumo dos resultados do modelo fuzzy TS FBO com plo nico (levitador magntico).

EQM mdio
Nmero mdio de parmetros
AIC mdio
Nmero mdio de geraes

Linear
0,0019517
50,43
-3954,78
32,83

Tabela 5.3: Resumo dos resultados do modelo fuzzy TS FBO com plo nico sem o parmetro de
expanso (levitador magntico).

Observa-se que o algoritmo gentico forneceu, com o parmetro de expanso, um EQM mdio
menor ao caso sem tal parmetro. Visto de outra forma, os resultados sem o parmetro de expanso
(crossover aritmtico original) possuam em mdia 4% menos parmetros, porm fornecendo um
EQM mdio 15% maior. O valor do AIC mdio confirma as comparaes anteriores, uma vez o
valor menor foi obtido com o parmetro de expanso (lembrando que um menor AIC corresponde a
um melhor resultado). Alm disso, o nmero mdio de geraes com o parmetro de expanso foi
sensivelmente maior que sem o mesmo, corroborando a afirmao da seo 4.7.1 da manuteno da
diversidade da populao.
A tabela 5.4 apresenta os resultados do melhor indivduo de todas as rodadas, considerando-se
o menor EQM. Ao contrrio do que ser observado nos resultados para a arquitetura fuzzy TS FBO
Generalizado, aqui ambos os modelos linear e no linear apresentaram valores prximos um do outro
para o melhor EQM de todas as rodadas.
Os valores de EQM apresentados na tabela 5.4 so consideravelmente menores que aqueles obti-

Resultados de Modelagem

86

Erro quadrtico mdio


AIC
Nmero de regras
Nmero de parmetros nos conseqentes
Plos
Nmero de parmetros do modelo

Linear
No Linear
0,0005747
0,0005061
-4228,85
-4416,22
24
4
8
36
0,85702 j 0,31570 0,80883 j 0,23776
213
154

Tabela 5.4: Melhor resultado (menor EQM) do modelo fuzzy TS FBO com plo nico (levitador
magntico).

dos para a arquitetura Generalizada apresentada na prxima seo. No entanto, deve ser notado
que a quantidade de parmetros dos modelos com plo nico bem superior. Por se tratar de uma
arquitetura mais flexvel, durante o processo evolutivo surgem indivduos que codificam modelos
com elevado nmero de parmetros. A funo de fitness implementada e as medidas de similaridade impedem que o nmero de parmetros de todos os indivduos aumente arbitrariamente. Assim,
embora os melhores indivduos2 de todas as rodadas de fato apresentem uma grande quantidade de
parmetros, os indivduos com EQM prximo mdia da tabela 5.2 apresentam consideravelmente
um menor nmero de parmetros. Na verdade, considerando os parmetros definidos na tabela 5.1,
a arquitetura fuzzy TS FBO com plo nico teria em princpio liberdade para gerar modelos com at
675 parmetros, no caso de modelos locais lineares, e at 2943 parmetros, para modelos locais no
lineares.
Como ilustrao, exibem-se na seqncia os resultados detalhados de uma rodada cujo EQM se
aproximou da mdia dos resultados apresentados na tabela 5.2. Em particular, considera-se o uso
de modelos locais lineares nos conseqentes das regras. Estes modelos so escolhidos pois o valor
mdio do EQM similar aos encontrados com a arquitetura Generalizada, de forma que seja possvel
comparar o desempenho de cada proposta. Ao se escolher modelos com valores prximos de EQM (e
aceitveis), o julgamento pelo melhor ser baseado na complexidade de cada um, a qual avaliada em
termos do seu nmero de parmetros. Em suma, o melhor modelo dentre um conjunto com valores
prximos de EQM ser aquele com o menor nmero de parmetros.
Na simulao ora apresentada, o AG consumiu 43 geraes, fornecendo ao final do processo
evolutivo um valor de diversidade da populao igual a 0,31 (a diversidade inicial foi 25,34). A
Figura 5.3 exibe a curva da diversidade da populao ao longo das geraes, com um decaimento
caracterstico.
O limite para atuao das medidas de similaridade, como exposto na seo 4.9, toma como base
2

A no ser que seja explicitado o contrrio, o termo melhor indivduo referir-se- ao indivduo que representa o
modelo mais preciso, ou seja, com o menor EQM.

5.2 Modelos para o Levitador Magntico

87

25

Diversidade

20

15

10

10

15

20

25

30

35

40

Geraes

Figura 5.3: Diversidade da populao para o modelo fuzzy TS FBO com plo nico e modelos locais
lineares (levitador magntico).
de clculo o valor da diversidade corrente da populao. Utilizando os parmetros definidos na
tabela 5.1, o AG realizou simplificaes nas funes de pertinncia respeitando o limite de
similaridade mostrado na Figura 5.4.
O comportamento do limite de similaridade exibido na Figura 5.4 semelhante ao da Figura 4.12,
obtida de forma analtica. O resultado exatamente o esperado, poucas simplificaes de funes
de pertinncia nas primeiras geraes do AG e um progressivo aumento medida que o AG tende a
convergir.
A convergncia da populao, indicada pela Figura 5.3, faz com que o valor do critrio de Akaike
mdio da populao, base para o clculo do fitness, tambm tenda a se estabilizar, o que confirmado
pelo grfico da Figura 5.5.
Ao final da rodada, o AG forneceu a soluo apresentada na tabela 5.5. Tal soluo codifica um
modelo com um total de 23 parmetros. Para fins de comparao, note-se que a melhor soluo de
todas as rodadas possuia aproximadamente 9 vezes mais parmetros, porm reduzindo o valor do
EQM em apenas 3 vezes.
A Figura 5.6 exibe as funes de pertinncia para os termos lingsticos de entrada, completando
a soluo fornecida pelo AG. O algoritmo gentico selecionou como varivel nica de entrada o
primeiro estado ortonormal3. Desse modo, com uma varivel de entrada e dois termos lingsticos
3

Na verdade, no lugar de primeiro estado ortonormal seria mais correto falar varivel resultante da inferncia fuzzy
TS aplicada aos sinais obtidos na filtragem da entrada pela primeira funo da base ortonormal, porm a expresso

Resultados de Modelagem

88

1
0.9
0.8
0.7

Limite

0.6
0.5
0.4
0.3
0.2
0.1
0

10

15

20

25

30

35

40

Geraes

Figura 5.4: Limite de similaridade para o modelo fuzzy TS FBO com plo nico e modelos locais
lineares (levitador magntico).

14000
12000
10000

AIC Mdio

8000
6000
4000
2000
0
2000
4000

10

15

20

25

30

35

40

Geraes

Figura 5.5: Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO com plo nico e
modelos locais lineares (levitador magntico).

5.2 Modelos para o Levitador Magntico

89

Plo
0,79924 j 0,26822
Nmero de regras
2
Nmero de parmetros nos conseqentes
8
EQM
0,0019020
Tabela 5.5: Soluo fornecida pelo AG para o modelo fuzzy TS FBO com plo nico e modelos locais
lineares (levitador magntico).

forma-se uma base com duas regras.


L2

L1

0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
4

Figura 5.6: Funes de pertinncia de entrada para o modelo fuzzy TS FBO com plo nico e modelos
locais lineares (levitador magntico).
Finalmente, a Figura 5.7 exibe o resultado final obtido. So comparados os dados de sada do
sistema real com os fornecidos pelo modelo fuzzy TS FBO com plo nico, para um conjunto de
dados de validao diferente do utilizado na estimao dos parmetros dos modelos locais. Para essa
simulao o valor do EQM foi de 0,0019020.
Para fins de comparao, ao se adotar a metodologia tradicional de distribuio homognea
das funes de pertinncia no universo de discurso proposta em [39] e aplicada em [16], e considerando um modelo com a mesma estrutura do exemplificado anteriormente (nmero de regras,
estados ortonormais, etc.), obtm-se um EQM de 0,0025306, ou seja, 33% maior que a soluo
fornecida pelo algoritmo gentico.
estado ortonormal ser utilizada por convenincia de escrita.

Resultados de Modelagem

90

Sada real
Sada estimada

1.2

0.8

0.6

0.4

0.2

10

12

Tempo (s)

Figura 5.7: Sada real e a fornecida pelo modelo fuzzy TS FBO com plo nico e modelos locais
lineares (levitador magntico).

5.2.2 Modelo fuzzy TS FBO Generalizado com Estimao Local


Esta seo e a seguinte apresentam os resultados obtidos com a arquitetura Generalizada,
variando-se o modo de estimao dos parmetros dos modelos locais nos conseqentes das regras.
A tabela 5.6 resume os resultados obtidos aps 35 rodadas do algoritmo gentico, considerando-se
estimao local.
Assim como para o caso da arquitetura com plo nico, a tabela 5.7 exibe um resumo dos resultados obtidos em um conjunto de simulaes sem o parmetro de expanso no operador de crossover
aritmtico. Apresentam-se somente os resultados correspondentes a modelos locais lineares nos conseqentes das regras, que sero exemplificados a seguir.
Embora nesse caso o nmero mdio de geraes tenha sido aproximadamente o mesmo nos dois
conjuntos de simulaes, aquele utilizando o parmetro de expanso no crossover aritmtico forneceu
tanto um EQM mdio quanto um nmero mdio de parmetros menores ao caso sem o parmetro de
expanso, resultando em um AIC mdio tambm melhor.
A tabela 5.8 apresenta os resultados do melhor indivduo de todas as rodadas, considerando-se o
menor EQM. Embora o modelo no linear tenha fornecido o menor EQM, deve-se observar que este
possui um nmero de parmetros mais de trs vezes maior que o modelo linear.
Exibem-se na seqncia os resultados detalhados de uma rodada cujo desempenho se aproximou
da mdia dos resultados apresentados na tabela 5.6. Em particular, considera-se o uso de modelos

5.2 Modelos para o Levitador Magntico

EQM mdio
Nmero mdio de parmetros
AIC mdio
Menor EQM
Nmero de parmetros do menor EQM
AIC do menor EQM
Maior EQM
Nmero de parmetros do maior EQM
AIC do maior EQM
Desvio padro do EQM
Desvio padro do AIC
Nmero mdio de geraes
Tempo mdio de processamento
por rodada (min)

91
Linear No Linear
0,0017423
0,0011960
25,86
61,26
-3901,70
-4128,91
0,0015965
0,0005823
26
83
-3952,70
-4465,75
0,0024847
0,0019559
24
45
-3676,50
-3782,26
0,0002055
0,0005619
65,05
286,72
36,20
34,17
9,28

17,15

Tabela 5.6: Resumo dos resultados do modelo fuzzy TS FBO Generalizado com estimao local
(levitador magntico).

EQM mdio
Nmero mdio de parmetros
AIC mdio
Nmero mdio de geraes

Linear
0,0021789
26,20
-3769,00
37,29

Tabela 5.7: Resumo dos resultados do modelo fuzzy TS FBO Generalizado com estimao local sem
o parmetro de expanso (levitador magntico).

locais lineares nos conseqentes das regras.


Na simulao ora apresentada, o AG consumiu 29 geraes, fornecendo ao final do processo
evolutivo um valor de diversidade da populao igual a 0,20 (a diversidade inicial foi 11,26). A
Figura 5.8 exibe a curva da diversidade da populao ao longo das geraes, com um decaimento
caracterstico.
A convergncia da populao, indicada pela Figura 5.8, faz com que o valor do critrio de Akaike
mdio da populao, base para o clculo do fitness, tambm tenda a se estabilizar, o que confirmado
pelo grfico da Figura 5.9.
Com o progresso da evoluo, o erro quadrtico mdio do melhor indivduo da populao tende a
diminuir, conforme pode ser observado na Figura 5.10.
Ao final da rodada, o AG forneceu a soluo apresentada na tabela 5.9. Tal soluo codifica um
modelo com um total de 25 parmetros.

Resultados de Modelagem

92

12

10

Diversidade

10

15

20

25

Geraes

Figura 5.8: Diversidade da populao para o modelo fuzzy TS FBO Generalizado com estimao
local e modelos locais lineares (levitador magntico).

2800

3000

AIC Mdio

3200

3400

3600

3800

4000

10

15

20

25

Geraes

Figura 5.9: Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO Generalizado com
estimao local e modelos locais lineares (levitador magntico).

5.2 Modelos para o Levitador Magntico

Erro Quadrtico Mdio


AIC
Nmero de Regras
Plos
Nmero de Parmetros do modelo
Nmero de Estados no 1 modelo local
Nmero de Estados no 2 modelo local

93
Linear
No Linear
0,0015965
0,0005823
-3952,70
-4465,75
2
2
0,82869 j 0,27907 0,82271 j 0,27665
0,80999 j 0,26396 0,80093 j 0,24151
26
83
6
7
7
7

Tabela 5.8: Melhor resultado do modelo fuzzy TS FBO Generalizado com estimao local (levitador
magntico).
Primeiro plo
0,89091 j 0,16241
Segundo plo
0,82444 j 0,26901
Nmero de estados no 1 modelo
5
Nmero de estados no 2 modelo
7
ndice do estado nas premissas
2
EQM
0,0017220
Tabela 5.9: Soluo fornecida pelo AG para o modelo fuzzy TS FBO Generalizado com modelos
locais lineares e estimao local (levitador magntico).

Antes de apresentar o conjunto das funes de pertinncia para os termos lingsticos de entrada,
a Figura 5.11 exibe a dinmica da varivel de estado resultante da inferncia fuzzy TS (equao (2.31)
do captulo 2) envolvendo o segundo estado da base de funes ortonormais de cada modelo local.
Observam-se duas regies de operao bem distintas: uma em torno de zero e outra entre um
e dois. As funes de pertinncia encontradas pelo AG, mostradas na Figura 5.12, so capazes de
classificar corretamente tais regies de operao. Note-se que a FP L2 praticamente nula em
torno de zero, ocorrendo o mesmo para a FP L1 aps aproximadamente o valor 1.
A capacidade do AG de realizar otimizao com mltiplos objetivos evidente nestes resultados.
Como explicitado na seo 4.3.2, desde que os operadores reprodutivos e a funo de fitness levem em
conta a diversidade semntica codificada em um mesmo cromossomo, durante o processo evolutivo
os parmetros se adequam uns aos outros, e de forma tima. Esta busca multidimensional eficiente
permite a obteno de resultados indicativos da grande viabilidade da metodologia ora proposta.
No caso presente, estes resultados podem ser resumidos nas figuras 5.13 e 5.14. A Figura 5.13
exibe as sadas dos dois modelos locais juntamente com a sada da planta. Ao se analisar esta figura
juntamente com as Figuras 5.11 e 5.12 conclui-se que cada modelo local de fato representa o sistema
em uma regio de operao bem determinada. A base de regras do modelo fuzzy TS FBO Gene-

Resultados de Modelagem

94

x 10

Erro Quadrtico Mdio

10

15

20

25

Geraes

Figura 5.10: Evoluo do EQM do melhor indivduo da populao para o modelo fuzzy TS FBO
Generalizado com estimao local e modelos locais lineares (levitador magntico).

2.5

1.5

0.5

0.5

10

12

Tempo (s)

Figura 5.11: Dinmica do estado na premissa das regras para o modelo fuzzy TS FBO Generalizado
com estimao local e modelos locais lineares (levitador magntico).

5.2 Modelos para o Levitador Magntico

95
L2

L1

1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
4

Figura 5.12: Funes de pertinncia de entrada para o modelo fuzzy TS FBO Generalizado com
estimao local e modelos locais lineares (levitador magntico).
ralizado tem como funo selecionar cada modelo local tomando como base o valor do estado nas
premissas das regras e as configuraes das funes de pertinncia fornecidos pelo AG.
Finalmente, a Figura 5.14 exibe o resultado final obtido. So comparados os dados de sada do
sistema real com os fornecidos pelo modelo fuzzy TS FBO Generalizado com estimao local dos
conseqentes das regras. Para essa simulao o valor do EQM foi de 0,0017220. Observa-se que o
modelo obtido consiste nas melhores aproximaes de cada um dos modelos locais lineares. Por outro
lado, o mtodo no otimizado de distribuio homognea das funes de pertinncia no universo de
discurso fornece, para um modelo com a mesma estrutura do descrito acima, um EQM de 0,0028360,
65% maior que a soluo fornecida pelo algoritmo gentico.

5.2.3 Modelo fuzzy TS FBO Generalizado com Estimao Global


A tabela 5.10 anloga tabela 5.6, porm obtida utilizando estimao global dos parmetros dos
modelos locais.
Para fins de comparao, a tabela 5.11 exibe um resumo dos resultados obtidos em um conjunto
de simulaes sem o parmetro de expanso no operador de crossover aritmtico. Apresentam-se
somente os resultados correspondentes a modelos locais no lineares nos conseqentes das regras, os
quais sero exemplificados na seqncia.
Assim como no caso do modelo Generalizado com estimao local, o nmero mdio de geraes

Resultados de Modelagem

96

Modelo 1
Modelo 2
Sada real

1.2
1

0.8
0.6
0.4

0.2

0
0.2

10

12

Tempo (s)

Figura 5.13: Modelos locais para o sistema fuzzy TS FBO Generalizado com estimao local e modelos locais lineares (levitador magntico).

Sada real
Sada estimada

1.2
1

0.8
0.6
0.4

0.2

0
0.2

10

12

Tempo (s)

Figura 5.14: Sada real e a fornecida pelo modelo fuzzy TS FBO Generalizado com estimao local e
modelos locais lineares (levitador magntico).

5.2 Modelos para o Levitador Magntico

97

Linear No Linear
EQM mdio
0,0083562
0,0018611
Nmero mdio de parmetros
20,71
43,03
AIC mdio
-3178,80
-3879,90
Menor EQM
0,0055663
0,0015395
Nmero de parmetros do menor EQM
22
45
AIC do menor EQM
-3237,60
-3941,30
Maior EQM
0,0141410
0,0027026
Nmero de parmetros do maior EQM
20
36
AIC do maior EQM
-3200,40
-3808,60
Desvio padro do EQM
0,00218605
0,0002675
Desvio padro do AIC
81,17
45,00
Nmero mdio de geraes
25,94
22,29
Tempo mdio de processamento
por rodada (min)
5,21
6,30
Tabela 5.10: Resumo dos resultados do modelo fuzzy TS FBO Generalizado com estimao global
(levitador magntico).

EQM mdio
Nmero mdio de parmetros
AIC mdio
Nmero mdio de geraes

Linear
0,0019060
44,89
-3893,40
21,54

Tabela 5.11: Resumo dos resultados do modelo fuzzy TS FBO Generalizado com estimao global
sem o parmetro de expanso (levitador magntico).

com ou sem o parmetro de expanso no crossover aritmtico foi aproximadamente o mesmo. No


entanto o uso do parmetro de expanso forneceu ao mesmo tempo resultados mdios melhores em
termos de um menor EQM mdio e um menor nmero mdio de parmetros, embora com o valor do
AIC mdio ligeiramente maior.
A tabela 5.12 apresenta os resultados do melhor indivduo de todas as rodadas, considerando-se
o menor EQM. Embora novamente o modelo no linear tenha fornecido o menor EQM, o nmero
de parmetros deste aproximadamente o dobro do modelo linear, e no trs vezes, como no caso
de estimao local. Ou seja, uma menor diferena no nmero de parmetros dos modelos causou
uma maior diferena entre os menores EQMs. Em outras palavras, o modelo com estimao global
melhora mais rapidamente seu desempenho com a incluso de mais parmetros do que o modelo com
estimao local. No entanto, ao se analisar a tabela 5.12 juntamente com a tabela 5.8, observa-se
que o modelo Generalizado linear com estimao local fornece aproximadamente o mesmo EQM do

Resultados de Modelagem

98

modelo Generalizado no linear com estimao global, possuindo pouco mais da metade do nmero
total de parmetros deste ltimo.

Erro Quadrtico Mdio


AIC
Nmero de Regras
Plos
Nmero de Parmetros do modelo
Nmero de Estados no 1 modelo local
Nmero de Estados no 2 modelo local

Linear
No Linear
0,0055663
0,0015395
-3237,60
-3941,30
2
2
0,79327 j 0,25582 0,84744 j 0,25934
0,16555 j 0,03512 0,42894 j 0,72567
22
45
4
6
5
2

Tabela 5.12: Melhor resultado do modelo fuzzy TS FBO Generalizado com estimao global (levitador magntico).

Para facilitar a comparao do desempenho dos diferentes modelos abordados neste trabalho,
exibem-se na seqncia os resultados detalhados de uma rodada cujo desempenho se aproximou da
mdia dos resultados apresentados na tabela 5.10, considerando-se o uso de modelos locais no lineares nos conseqentes das regras, os quais apresentaram um EQM mdio prximo ao detalhado
anteriormente para o modelo com estimao local.
Na simulao ora apresentada, o AG consumiu 18 geraes, fornecendo ao final do processo
evolutivo um valor de diversidade da populao igual a 0,31 (a diversidade inicial foi 10,26). A
Figura 5.15 exibe a curva da diversidade da populao ao longo das geraes. A estabilizao do
valor do critrio de Akaike mdio da populao, exibido na Figura 5.16, confirma a convergncia da
populao.
A Figura 5.17 apresenta a evoluo do erro quadrtico mdio do melhor indivduo da populao.
Neste ponto deve ser notado que, embora a estratgia de elitismo esteja sendo utilizada, pode acontecer de o melhor indivduo de uma gerao apresentar um EQM maior que o melhor da gerao
anterior. A explicao para tal evento simples: como est sendo utilizado um critrio de avaliao
que, alm do desempenho (em termos de um baixo erro) considera tambm a complexidade do modelo, um certo indivduo, por codificar um modelo com menos parmetros, pode possuir um valor de
fitness mais elevado, mesmo com um EQM maior. Tal comportamento ocorre nessa simulao em
particular, conforme pode ser observado na Figura 5.17.
Ao final da rodada, o AG forneceu a soluo apresentada na tabela 5.13, a qual codifica um
modelo com um total de 36 parmetros.
Ao se proceder com a estimao global dos parmetros dos modelos locais de cada regra, no
esperado que ao se analisar cada um destes modelos locais isoladamente seja observada alguma

5.2 Modelos para o Levitador Magntico

99

12

10

Diversidade

10

12

14

16

18

Geraes

Figura 5.15: Diversidade da populao para o modelo fuzzy TS FBO Generalizado com modelos
locais no lineares e estimao global (levitador magntico).

8000

6000

AIC Mdio

4000

2000

2000

4000

10

12

14

16

18

Geraes

Figura 5.16: Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO Generalizado com
modelos locais no lineares e estimao global (levitador magntico).

Resultados de Modelagem

100
3

x 10

Erro Quadrtico Mdio

8
7
6
5
4
3
2
1

10

12

14

16

18

Geraes

Figura 5.17: Evoluo do EQM do melhor indivduo da populao para o modelo fuzzy TS FBO
Generalizado com modelos locais no lineares e estimao global (levitador magntico).
Primeiro plo
0,90461 j 0,19269
Segundo plo
0,84671 j 0,32033
Nmero de estados no 1 modelo
3
Nmero de estados no 2 modelo
4
ndice do estado nas premissas
1
EQM
0,0018657
Tabela 5.13: Soluo fornecida pelo AG para o modelo fuzzy TS FBO Generalizado com modelos
locais no lineares e estimao global (levitador magntico).

dinmica particular do sistema real, como evidente no caso de estimao local analisado na seo
anterior. Os plos de cada modelo local exibidos na tabela 5.13 no caracterizam nica e completamente uma regio de operao especfica do sistema real (ver Figura 5.20), e apenas aps a interpolao dos modelos locais, atravs da inferncia fuzzy TS, obtm-se um modelo representativo do
sistema real.
Dessa forma, embora o comportamento da varivel lingstica de entrada, exibido na Figura 5.18,
seja semelhante ao observado no modelo com estimao local, as funes de pertinncia encontradas
pelo AG no particionam o universo de discurso do mesmo modo anterior. Ao contrrio, so praticamente sobrepostas (Figura 5.19).
Esta sobreposio quase completa das funes de pertinncia indica que mais razovel aplicar

5.2 Modelos para o Levitador Magntico

101

1.5

0.5

0.5

10

12

Tempo (s)

Figura 5.18: Dinmica do estado na premissa das regras para o modelo fuzzy TS FBO Generalizado
com modelos locais no lineares e estimao global (levitador magntico).

L2

L1

0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
4

Figura 5.19: Funes de pertinncia de entrada para o modelo fuzzy TS FBO Generalizado com
modelos locais no lineares e estimao global (levitador magntico).

Resultados de Modelagem

102

a arquitetura fuzzy TS FBO Generalizada com a estimao local dos parmetros dos modelos locais,
tendo em vista sua motivao e definio originais descritas na seo 3.2.4. O efeito da sobreposio
a incapacidade de o processo de inferncia fuzzy TS de diferenciar as regies de operao distintas
do sistema modeladas individualmente por cada regra, uma vez que praticamente o mesmo grau de
ativao ser atribudo a cada uma destas regras.
A Figura 5.20 corrobora os comentrios anteriores, ao exibir as sadas dos dois modelos locais
juntamente com a sada da planta. Observa-se que no h correlao direta entre cada modelo local e
alguma regio de operao especfica do sistema real.
2
Modelo 1
Modelo 2
Sada real
1.5

0.5

0.5

10

12

Tempo (s)

Figura 5.20: Modelos locais para o sistema fuzzy TS FBO Generalizado com modelos locais no
lineares e estimao global (levitador magntico).
Por fim, a Figura 5.21 exibe o modelo final obtido. O valor do EQM para esse modelo com 36
parmetros foi de 0,0018657. Para fins de comparao, os resultados exibidos anteriormente para
o modelo Generalizado com estimao local foram um EQM de 0,0017220 para um modelo com
25 parmetros, ou seja, um menor EQM com um modelo mais simples. Ainda mais, considerando o
mtodo no otimizado de distribuio homognea das funes de pertinncia no universo de discurso,
o modelo apresenta um EQM de 0,0064353, 245% maior que a soluo fornecida pelo algoritmo
gentico para o modelo fuzzy TS FBO Generalizado com modelos locais no lineares e estimao
global.
Com fins ilustrativos, a Figura 5.22 apresenta os modelos locais obtidos em outra rodada do
AG cujo EQM para um modelo tambm com 36 parmetros foi de 0,0018440, prximo ao obtido
no modelo previamente descrito. Observa-se que os modelos locais obtidos so praticamente anti-

5.2 Modelos para o Levitador Magntico

103

Sada real
Sada estimada

1.2

0.8
0.6

0.4

0.2
0

0.2

10

12

Tempo (s)

Figura 5.21: Sada real e a fornecida pelo modelo fuzzy TS FBO Generalizado com modelos locais
no lineares e estimao global (levitador magntico).
simtricos. Como as funes de pertinncia para este caso tambm estavam sobrepostas, ocorre uma
interpolao dos modelos locais obtidos, resultando em uma estimativa global razovel.

5.2.4 Comentrios sobre os Modelos do Levitador Magntico


O desempenho do modelo fuzzy TS FBO Generalizado com estimao local foi superior ao caso
com estimao global, para a arquitetura elaborada no presente trabalho. Embora este resultado no
seja em princpio o esperado4 , a estimao local deve facilitar a busca evolutiva direcionando melhor
o algoritmo gentico para a seleo dos demais parmetros do modelo (funes de pertinncia, plos,
etc.). Em outras palavras, como a estimao local tende separar os modelos locais nas diferentes
regies de operao do sistema, o AG acaba tendo maior facilidade em otimizar os parmetros desses
modelos independentemente, fornecendo uma soluo final com melhor capacidade de representao.
As figuras das funes de pertinncia e estados das premissas, para o modelo local, evidenciam a
eficincia da abordagem. Os plos encontrados modelam o sistema em duas regies de operao
distintas (como pr-suposto). O algoritmo gentico encontra os valores adequados para os dois plos,
seleciona o estado para as premissas que identifica as duas regies de operao e distribui as funes
4

Na verdade, a estimao global deve em teoria fornecer um modelo com melhor capacidade de representao em
relao aquele obtido com estimao local caso ambos os modelos sejam idnticos [2, 3, 51]. Porm este no o caso
aqui, uma vez que como os modelos estavam em populaes distintas do AG possuam estruturas distintas (nmero de
estados, plos, etc.).

Resultados de Modelagem

104

4
Modelo 1
Modelo 2
Sada real

10

12

Tempo (s)

Figura 5.22: Modelos locais anti-simtricos para o sistema fuzzy TS FBO Generalizado com modelos
locais no lineares e estimao global (levitador magntico).
de pertinncia de entrada no universo de discurso de modo que cada modelo local atue eficazmente
na tarefa de representao do comportamento do sistema.
Alm de apresentar um resultado final melhor, a estimao local mais vantajosa em termos
de clculos numricos. A estimao dos parmetros dos modelos locais feita de forma separada,
ou seja, so calculadas duas matrizes pseudo-inversas5 de dimenso menor que aquela presente na
estimao global dos parmetros. As conseqencias so, para a estimao local, um menor tempo
de processamento para o clculo das matrizes pseudo-inversas, as quais so ainda, em mdia, melhor
condicionadas.
No algoritmo gentico todas estas caractersticas acabam por favorecer a obteno de melhores
solues (melhores modelos) ao se utilizar a estimao local.

5.3 Modelos para o Processo de Polimerizao


Tomando-se como base os mesmos argumentos apresentados para o sistema levitador magntico,
os dados de treinamento utilizados no sistema CSTR foram obtidos a partir de um sinal de entrada
pseudo-aleatrio tal qual o exibido na Figura 5.23.
A Figura 5.23 mostra que este sistema apresenta uma dinmica menos complexa que a do sistema
5

No caso geral, sero calculadas tantas matrizes pseudo-inversas quantos forem os modelos locais.

5.3 Modelos para o Processo de Polimerizao

105

1
Sada
Entrada

0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0

10

12

Tempo (h)

Figura 5.23: Sinais normalizados de entrada e sada para treinamento (CSTR).


levitador magntico, podendo inclusive ser aproximada por um filtro discreto de primeira ordem [14],
exceto pelo ganho, que altamente no linear. Esta a razo para no se aplicar o modelo fuzzy TS
FBO Generalizado na tarefa de modelagem deste processo de polimerizao.
Diferentemente do sistema levitador magntico, observa-se que o sistema CSTR apresenta uma
resposta temporal sobreamortecida, sem oscilaes. Portanto, um plo real mais adequado para
modelar esta dinmica que um par de plos complexos conjugados. Para se trabalhar com um plo
real na arquitetura fuzzy FS TBO com plo nico basta fazer com que o AG desconsidere a primeira
posio da segunda linha da matriz que representa um indivduo da populao (ver Figura 4.3 da
seo 4.4.1), posio essa correspondente parte imaginria do plo.
Novamente, os resultados apresentados foram obtidos aps a execuo do AG por um nmero de
rodadas igual a 35. Para o sistema CSTR, a configurao do AG em todas as rodadas foi a mesma
que para o levitador magntico, reproduzida aqui na tabela 5.14
A tabela 5.15 anloga tabela 5.2, resumindo os resultados obtidos aps 35 rodadas do algoritmo
gentico. Observa-se que neste caso o algoritmo gentico obteve solues mais simples (modelos com
um nmero menor de parmetros) e mais rapidamente (menor tempo de processamento por rodada)
se comparado ao sistema levitador magntico. Isto decorrncia do que foi afirmado anteriormente,
isto , o sistema CSTR mais simples que o letivador magntico. Logo, existe uma dependncia
direta entre a complexidade do sistema sendo modelado e a complexidade e demanda computacional
para a obteno de seu modelo.
Para analisar a influncia da modificao no operador de crossover aritmtico, a tabela 5.16 exibe

Resultados de Modelagem

106

Parmetros de Execuo
TS FBO Plo nico
Tamanho da populao
100
Nmero mximo de geraes
80
Taxa de crossover
0,85
Taxa de mutao
0,20
Expanso percentual mxima
do operador de crossover ()
0,20
Percentual da diversidade
inicial para convergncia
3
Controle de sobreposio
no
Abertura mnima das
FP gaussianas
0,3
Abertura mxima das
FP gaussianas
3
Nmero mximo de estados nos
conseqentes das regras
7
Nmero mximo de
variveis de entrada (maxvl )
4
Nmero mximo de FP por
varivel de entrada (maxtl )
3
Limite inferior para aplicao
das medidas de similaridade ()
0,2
Potncia para uso na equao
do limite de similaridade ()
8
Tabela 5.14: Configurao do AG para o sistema CSTR.

um resumo dos resultados obtidos em um conjunto de simulaes sem o parmetro de expanso .


Observa-se que o uso do parmetro de expanso no crossover aritmtico permitiu que o algoritmo
gentico mantivesse a diversidade da populao por um nmero maior de geraes, fornecendo ao
final solues melhores (comparar o AIC mdio das tabelas 5.15 e 5.16).
A tabela 5.17 apresenta os resultados do melhor indivduo de todas as rodadas, considerando-se
novamente o menor EQM, para modelos locais lineares e no lineares.
A anlise apenas do melhor indivduo pode levar a concluso errnea de que um modelo para
este sistema necessita de um grande nmero de parmetros. No entanto, assim como para o sistema
levitador magntico, embora o melhor indivduo de todas as rodadas de fato apresente uma grande
quantidade de parmetros, os indivduos com EQM prximo mdia da tabela 5.15 apresentam consideravelmente menos parmetros. Mais ainda, dentre todas as rodadas possvel encontrar solues
com EQM menor que a mdia e ao mesmo tempo um nmero de parmetros tambm inferior mdia

5.3 Modelos para o Processo de Polimerizao

107

EQM mdio
Nmero mdio de parmetros
AIC mdio
Menor EQM
Nmero de parmetros do menor EQM
AIC do menor EQM
Maior EQM
Nmero de parmetros do maior EQM
AIC do maior EQM
Desvio padro do EQM
Desvio padro do AIC
Nmero mdio de geraes
Tempo mdio de processamento
por rodada (min)

Linear No Linear
0,0009744
0,0005689
48,11
60,69
-2779,64
-2857,39
0,0000766
0,0000752
78
138
-3491,90
-3398,80
0,0054286
0,0026339
22
78
-2032,20
-2130,30
0,0012133
0,0004744
339,18
262,45
41,49
56,69
12,41

21,49

Tabela 5.15: Resumo dos resultados do modelo fuzzy TS FBO com plo nico (CSTR).

EQM mdio
Nmero mdio de parmetros
AIC mdio
Nmero mdio de geraes

Linear No Linear
0,0021007
0,0005885
37,83
62,31
-2747,16
-2847,70
38,34
44,17

Tabela 5.16: Resumo dos resultados do modelo fuzzy TS FBO com plo nico sem o parmetro de
expanso (CSTR).

de todas as solues.
As duas prximas sees apresentam resultados de modelagem para o sistema CSTR que ilustram
a afirmao anterior, para modelos locais lineares e no lineares, respectivamente.

5.3.1 Modelo fuzzy TS FBO com Plo nico - Modelos Locais Lineares
Como exemplo, exibem-se na seqncia os resultados detalhados de uma rodada cujo EQM foi
aproximadamente metade da mdia dos resultados apresentados na tabela 5.15, ou seja, da mesma
ordem de grandeza dos resultados obtidos com modelos locais no lineares. Assim, considerando
dois modelos com desempenhos semelhantes em termos de suas capacidades de representao,
possvel classificar como melhor aquele que seja menos complexo (menor nmero de parmetros).
Nesta rodada em particular, o AG consumiu 55 geraes, interrompendo sua execuo pela convergncia da populao. O valor da diversidade ao final do processo evolutivo foi igual a 0,91 (a

Resultados de Modelagem

108

Erro quadrtico mdio


AIC
Nmero de regras
Nmero de parmetros nos conseqentes
Plos
Nmero de parmetros do modelo

Linear No Linear
0,0000766
0,0000752
-3491,90
-3398,80
8
6
8
21
0,72843
0,74245
78
138

Tabela 5.17: Melhor resultado do modelo fuzzy TS FBO com plo nico (CSTR).

diversidade inicial foi 31,55). A Figura 5.24 exibe a curva da diversidade da populao ao longo das
geraes.
35

30

Diversidade

25

20

15

10

10

15

20

25

30

35

40

45

50

55

Geraes

Figura 5.24: Diversidade da populao para o modelo fuzzy TS FBO com plo nico e modelos locais
lineares (CSTR).
O limite de similaridade calculado em funo da diversidade da populao est exibido na
Figura 5.25. Nesta simulao, as fuses e eliminaes de variveis redundantes foram efetuadas
com maior fora nas dez ltimas geraes.
Assim como a diversidade, a curva do critrio de Akaike mdio da populao tambm tende a se
estabilizar, como mostrado na Figura 5.26.
Ao final desta rodada, o AG forneceu a soluo apresentada na tabela 5.18. Para este caso,
o nmero de parmetros do modelo foi 22, enquanto a mdia das solues foi 48,11. O modelo
obtido adotando-se a abordagem da distribuio homognea das funes de pertinncia (mtodo sem

5.3 Modelos para o Processo de Polimerizao

109

1
0.9
0.8
0.7

Limite

0.6
0.5
0.4
0.3
0.2
0.1
0

10

15

20

25

30

35

40

45

50

55

Geraes

Figura 5.25: Limite de similaridade para o modelo fuzzy TS FBO com plo nico e modelos locais
lineares (CSTR).

6000
5000
4000

AIC Mdio

3000
2000
1000
0
1000
2000
3000

10

15

20

25

30

35

40

45

50

55

Geraes

Figura 5.26: Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO com plo nico e
modelos locais lineares (CSTR).

Resultados de Modelagem

110

otimizao) apresentou um EQM de 0,0019952, quase 300% maior que aquele obtido com o algoritmo gentico proposto.
Plo
0,91911
Nmero de regras
2
Nmero de parmetros nos conseqentes
8
EQM
0,0005068
Tabela 5.18: Soluo fornecida pelo AG para o modelo fuzzy TS FBO com plo nico e modelos
locais lineares (CSTR).

A Figura 5.27 exibe as funes de pertinncia para os termos lingsticos de entrada, completando
a soluo fornecida pelo AG. O algoritmo gentico selecionou como varivel de entrada o primeiro
estado ortonormal.
L1

L2

1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
8

Figura 5.27: Funes de pertinncia de entrada para o modelo fuzzy TS FBO com plo nico e
modelos locais lineares (CSTR).
A Figura 5.28 exibe o resultado final obtido, comparando os dados de sada do sistema real com
os fornecidos pelo modelo fuzzy TS FBO com plo nico e modelos locais lineares.

5.3.2 Modelo fuzzy TS FBO com Plo nico - Modelos Locais No Lineares
Para a soluo ora apresentada, o AG no convergiu antes de executar o limite mximo de 80
geraes. Porm, como pode ser observado na Figura 5.29, a diversidade da populao de fato se

5.3 Modelos para o Processo de Polimerizao

111

Sada real
Sada estimada

1.2

0.8

0.6

0.4

0.2

0
0

10

12

Tempo (h)

Figura 5.28: Sada real e a fornecida pelo modelo fuzzy TS FBO com plo nico e modelos locais
lineares (CSTR).
estabilizou em torno de 2,5, apenas no alcanou um valor inferior a 3% da diversidade inicial, a
qual foi igual a 31,68. Assim, a interrupo do AG, neste caso, no implicou em uma interrupo do
processo evolutivo, pois a populao no apresentava melhorias significativas nas ltimas geraes.
O limite para atuao das medidas de similaridade teve um comportamento semelhante ao da diversidade, no variando consideravelmente quando esta ltima tambm se estabilizou. A Figura 5.30
exibe o comportamento desse limite. Como a curva apresentada no se aproximou do limite mnimo
estipulado na tabela 5.14, o AG permitiu a existncia de funes de pertinncia mais sobrepostas que
no caso anterior, como ser observado na Figura 5.32.
O valor do critrio de Akaike mdio da populao nesta rodada apresentou uma dinmica um
tanto ruidosa, porm seguindo o objetivo de minimizao. Atribui-se este comportamento ao fato
de a populao manter um certo nvel de diversidade acima do limite mnimo pr-estabelecido. Esta
diversidade permite a contnua renovao de uma parcela da populao, atravs da atuao dos operadores genticos. Dessa forma, ora a mdia do critrio de Akaike pode aumentar e ora diminuir,
oscilando em torno de um nvel que pode ser tido como o timo para essa rodada em particular. O
grfico da Figura 5.31 exibe tal comportamento para o critrio de Akaike mdio da populao.
Aps as 80 geraes, o AG foi interrompido e forneceu a soluo apresentada na tabela 5.19, a
qual codifica um modelo com um total de 26 parmetros. Para este modelo em particular a soluo
fornecida pelo AG aproxima-se daquela obtida quando da distribuio homognea das funes de
pertinncia no universo de entrada. Sendo assim, neste caso ambas as estratgias forneceram modelos

Resultados de Modelagem

112

35

30

Diversidade

25

20

15

10

10

20

30

40

50

60

70

80

Geraes

Figura 5.29: Diversidade da populao para o modelo fuzzy TS FBO com plo nico e modelos locais
no lineares (CSTR).

1
0.9
0.8
0.7

Limite

0.6
0.5
0.4
0.3
0.2
0.1
0

10

20

30

40

50

60

70

80

Geraes

Figura 5.30: Limite de similaridade para o modelo fuzzy TS FBO com plo nico e modelos locais
no lineares (CSTR).

5.3 Modelos para o Processo de Polimerizao

113

10000

8000

AIC Mdio

6000

4000

2000

2000

4000

10

20

30

40

50

60

70

80

Geraes

Figura 5.31: Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO com plo nico e
modelos locais no lineares (CSTR).
equivalentes. Vale ressaltar, no entanto, que este um caso especial, uma vez que em todas as simulaes apresentadas anteriormente, tanto para o CSTR quanto para o levitador magntico, nas duas
arquiteturas analisadas (plo nico e Generalizada), os resultados obtidos com o mtodo automtico
baseado em algoritmos genticos aqui proposto foram sensivelmente melhores.
Plo
0.76593
Nmero de regras
2
Nmero de parmetros nos conseqentes
10
EQM
0.0004894
Tabela 5.19: Soluo fornecida pelo AG para o modelo fuzzy TS FBO com plo nico e modelos
locais no lineares (CSTR).

A Figura 5.32 exibe as funes de pertinncia da soluo final. Assim como no caso de modelos
locais lineares, aqui o algoritmo gentico selecionou como varivel de entrada o primeiro estado
ortonormal. Note-se que as funes de pertinncia esto mais sobrepostas que as apresentadas na
Figura 5.27.
A Figura 5.33 apresenta os dados de sada do sistema real e os fornecidos pelo modelo fuzzy TS
FBO com plo nico e modelos locais no lineares. Este resultado ligeiramente melhor que o obtido
com modelos locais lineares, porm, como afirmado anteriormente, este modelo possui um total de
26 parmetros, contra 22 daquele com modelos locais lineares. Analisando de outra forma, o modelo

Resultados de Modelagem

114
L2

L1

0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
8

Figura 5.32: Funes de pertinncia de entrada para o modelo fuzzy TS FBO com plo nico e
modelos locais no lineares (CSTR).

atual apresenta um EQM 4% menor que aquele com modelos locais lineares porm com 15% a mais
de parmetros. Logo, este acrscimo de parmetros no justificado, sendo ento mais adequado o
modelo fuzzy TS FBO com plo nico e modelos locais lineares para a modelagem do sistema CSTR.

5.3.3 Comentrios sobre os Modelos do Processo de Polimerizao


Os dois modelos obtidos com o AG, apresentados nas sees anteriores, confirmam a corretude
da escolha apenas da arquitetura fuzzy TS FBO com plo nico para a modelagem do processo de
polimerizao CSTR, uma vez que os resultados apresentados demonstram que tais modelos foram
capazes de aproximar com grande preciso o sistema real. Em ambos os casos, foram obtidos modelos
com EQM da ordem de 5.104 com um nmero reduzido de parmetros.
Ao se comparar as duas opes com modelos locais lineares e no lineares, conforme argumentos
da ltima seo, modelos locais lineares se mostram mais interessantes para o CSTR. Por se tratar de
um sistema relativamente simples, o modelo fuzzy TS FBO com plo nico e modelos locais lineares
nos conseqentes das regras encontra o melhor compromisso entre capacidade de representao e
complexidade do modelo. Alm disso, esta arquitetura demanda em mdia menos processamento
computacional at a obteno de uma soluo (ver tabela 5.15).

5.4 Resumo

115

Sada real
Sada estimada

1.2

0.8

0.6

0.4

0.2

0
0

10

12

Tempo (h)

Figura 5.33: Sada real e a fornecida pelo modelo fuzzy TS FBO com plo nico e modelos locais
no lineares (CSTR).

5.4 Resumo
Este captulo apresentou os resultados de modelagem para dois sistemas dinmicos no lineares,
um levitador magntico e um processo de polimerizao. Exemplificaram-se todas as arquiteturas
propostas no presente trabalho, quais sejam, modelo fuzzy TS FBO com plo nico, fuzzy TS FBO
Generalizado com estimao local e fuzzy TS FBO Generalizado com estimao global. Para estas
arquiteturas, utilizaram-se tanto modelos locais lineares quanto no lineares nos conseqentes das
regras. Por sua menor complexidade, analisou-se para o processo de polimerizao apenas o modelo
fuzzy TS FBO com plo nico.
Os resultados de modelagem obtidos para ambos os sistemas indicam a eficincia do mtodo
proposto. Um conjunto de simulaes utilizando a abordagem no automtica de distribuio homognea das funes de pertinncia no universo de discurso forneceu a base comparativa para a
concluso sobre a eficincia do mtodo baseado em algoritmos genticos. Outro conjunto de simulaes indicou a inferioridade dos resultados ao se utilizar o operador de crossover aritmtico original,
sem o parametro de expanso.
Em particular, para o processo de polimerizao, o modelo fuzzy TS FBO com modelos locais
lineares forneceu os melhores resultados. Para o levitador magntico ambas as arquiteturas tiverem
desempenhos compatveis em termos da minimizao do critrio de Akaike (base do clculo do fitness
das solues), sendo que o modelo com plo nico apresenta em mdia valores menores do erro

116

Resultados de Modelagem

quadrtico mdio, porm com um nmero maior de parmetros. Alm disso, os modelos obtidos com
essa arquitetura apresentavam em mdia um nmero maior de funes ortonormais (estados), capazes
de representar bem qualquer dos dois modos dominantes do sistema (que no so muito distintos) com
um nico par intermedirio de plos complexos conjugados. A arquitetura com plo nico tambm
demandou maior tempo de processamento computacional, o que pode ser explicado pelo fato de sua
representao cromossmica ser muito mais flexvel.
Considerando-se apenas a arquitetura Generalizada para o levitador magntico, o mtodo de estimao que forneceu melhor desempenho foi a estimao local dos parmetros dos conseqentes das
regras. Este resultado merece ateno especial pois concilia os dois objetivos em princpio conflitantes quando da estimao de parmetros. Como afirmado na seo 3.4, a estimao local permite
uma interpretao local do modelo, sendo por exemplo til nas etapas de anlise e validao dos
modelos (ferramenta essencial neste captulo). Naquela seo foi tambm afirmado que em geral
a estimao global que fornece a melhor aproximao do sistema, em termos de um EQM menor.
No entanto, para a arquitetura proposta, o algoritmo gentico forneceu modelos ao mesmo tempo
interpretveis localmente e com capacidade de representao do sistema melhor que a obtida com
estimao global dos parmetros dos conseqntes das regras (resultado semelhante foi obtido em
[51]).
Outra observao interessante foi a obteno de melhores resultados com modelos locais lineares
nos conseqentes das regras, para os dois sistemas analisados. Conjectura-se que modelos locais
no lineares (Volterra de segunda ordem) produzem modelos com um maior nmero de parmetros
sem no entanto introduzir sensveis melhorias na capacidade de representao devido aos termos no
lineares, sofrendo assim maior penalizao pelo critrio de Akaike.

Captulo 6
Concluses
De concepo recente, os sistemas fuzzy TS FBO vm demonstrando sua eficcia na modelagem e
controle de sistemas dinmicos no lineares [89, 13, 14, 16]. Os modelos obtidos com essa arquitetura
apresentam uma srie de vantagens se comparados a outras possveis abordagens (ver seo 3.1).
As arquiteturas fuzzy TS FBO e fuzzy TS FBO Generalizado (apresentadas em detalhe no captulo 3) so baseadas nos modelos em espao de estados, linear FBO, de Volterra e fuzzy TS descritos
no captulo 2. Em suma, os modelos baseados em funes de base ortonormal possuem as desejveis
caractersticas de ausncia de realimentao da sada (e eventuais erros de predio), necessidade
de um menor nmero de parmetros para alcanar uma dada preciso (atravs da incorporao de
conhecimento sobre a dinmica do sistema nos plos que definem as funes da base ortonormal) e
tolerncia a dinmicas no modeladas ou a pequenas diferenas na ordem dos vetores de regresso.
Modelos fuzzy TS baseados em funes de base ortonormais, alm das caractersticas acima, agregam
as propriedades de interpretabilidade [32] e facilidade de representao do conhecimento dos sistemas
fuzzy. No entanto, os resultados promissores j obtidos com essa arquitetura no utilizavam nenhum
mtodo computacional inteligente para sua otimizao automtica.
O objetivo da presente dissertao foi indicar uma possvel direo para a realizao desta ltima
tarefa, ou mais especificamente, para a definio e otimizao da estrutura de modelos fuzzy TS FBO
e fuzzy TS FBO Generalizado.
A soluo adotada foi um algoritmo gentico, mtodo de otimizao bem consolidado na literatura
acadmica e com uma vasta gama de aplicaes prticas. Foi possvel obter modelos de sistemas
dinmicos no lineares (um processo de polimerizao e um levitador magntico) com grande grau
de autonomia ao se utilizar a metodologia proposta neste trabalho, confirmando sua eficincia.
No captulo 3 foram explicitados os parmetros dos modelos fuzzy TS FBO otimizados pelo AG
descrito no captulo 4. A otimizao de alguns parmetros dos modelos fuzzy TS j foi abordada
em outros trabalhos na literatura acadmica (ver referncias da seo 4.3.1), incluindo a forma e
117

Concluses

118

localizao das funes de pertinncia [76] e a base de regras de inferncia. Trabalhos mais recentes
tambm determinavam de forma automtica quantas e quais variveis de entrada seriam usadas no
sistema, bem como quantas funes de pertinncia estariam associadas a cada uma delas [26, 94].
As contribuies deste trabalho no contexto acima so:
Elaborao de uma representao cromossmica para o modelo fuzzy TS FBO com plo nico
e outra para o modelo fuzzy TS FBO Generalizado;
Incluso de um coeficiente de expanso no operador de crossover aritmtico para a manuteno
da diversidade da populao e obteno de melhores solues;
Uso de um operador de mutao gaussiana com desvio padro varivel e distinto para cada
gene;
Para a arquitetura fuzzy TS FBO com plo nico, otimiza-se:
O plo complexo que caracteriza a base de funes ortonormais;
O nmero de variveis de entrada do modelo;
A quantidade de funes de pertinncia para cada varivel de entrada;
Nmero de funes na base ortonormal;
Alm desses parmetros, ainda inclui-se uma etapa de simplificao das funes de pertinncia atravs das medidas de similaridade;
Para a arquitetura fuzzy TS FBO Generalizado, otimiza-se:
Um plo complexo para cada modelo local;
Nmero de funes em cada base ortonormal;
Quais funes da base ortonormal estaro presentes nas premissas das regras (variveis
de entrada);
A disposio e configurao das funes de pertinncia em ambas as arquiteturas tambm foi
otimizada.
A arquitetura fuzzy TS FBO Generalizado, por sua maior complexidade, teve menos parmetros
otimizados. No entanto, mesmo nesse caso, o grau de autonomia na definio da estrutura do modelo
era alto, bastando basicamente ser definido por um especialista o nmero de modelos locais esperado
para o sistema. Ainda para o modelo Generalizado, foram analisadas duas formas de estimao dos
coeficientes das regras: estimao local e global. Verificou-se para o sistema levitador magntico que

119
a estimao local seria mais adequada, uma vez que ao mesmo tempo permite uma interpretao clara
do modelo, em termos da correta classificao das diferentes regies de operao do sistema, alm
de possibilitar uma melhor representao do mesmo (menor erro de aproximao em srie sinttica)
com um modelo menos complexo (menor nmero de parmetros). Este resultado particularmente
interessante pois em princpio a estimao global dos parmetros deveria fornecer um modelo com
melhor capacidade de representao, mesmo a custa de uma perda em sua interpretabilidade (ver
seo 5.2.4). Para ambos os sistemas estudados o uso de modelos locais lineares apresentou melhores
resultados em comparao aos modelos locais no lineares de Volterra de segunda ordem. Logo, para
as arquiteturas propostas neste trabalho, os termos no lineares nos modelos locais so mais penalizados pelo critrio de Akaike sem resultar em melhorias significativas na capacidade de representao
do modelo como um todo.
Estas concluses foram obtidas com a anlise das simulaes documentadas no captulo 5. Todas
as possveis combinaes das arquiteturas propostas foram avaliadas de forma estatstica, apresentando-se no os melhores resultados obtidos (que poderiam de certa forma polarizar sua interpretao), mas sim aqueles que se aproximaram da mdia de todas as simulaes. Em todos os casos,
a corretude das implementaes computacionais foi comprovada pela verificao do comportamento
esperado do algoritmo gentico (como a queda da diversidade da populao bem como do valor
mdio do critrio de Akaike com o passar das geraes) e pela obteno de modelos satisfatrios
para os sistemas estudados, resultado este que confirma ainda a eficincia da metodologia aqui proposta. A qualidade dos modelos foi avaliada tanto pela forma e disposio das funes de pertinncia
obtidas quanto pela comparao das respostas (sadas) fornecidas pelos modelos com aquelas do
sistema real, ambos sujeitos a um mesmo sinal de entrada (diferente do utilizado na etapa de otimizao). Alm disso, foram realizadas vrias simulaes para comparao de resultados com estratgias
sem otimizao automtica (distribuio homognea de funes de pertinncia) e com o operador
de crossover aritmtico original. Todos os resultados comparativos, tambm relatados no captulo 5,
indicam a relevncia do presente trabalho.
A principal direo para continuidade deste trabalho a investigao de um mtodo automtico
para a definio do nmero de modelos locais na arquitetura fuzzy TS FBO Generalizado. Atualmente
esta uma entrada do algoritmo, porm mtodos de agrupamento baseados em um conjunto de dados
de treinamento, por exemplo, podem ser aplicados nessa tarefa [81]. Outra possibilidade seria a
elaborao de uma representao cromossmica flexvel, que permitisse o aumento e diminuio do
nmero de modelos locais, alterando o conjunto de funes de pertinncia de tal forma que a base de
regras completa fosse composta por tantas regras quantos fossem os modelos locais. Seria possvel
tambm investigar o uso de base de regras no completas.
Ainda para o modelo fuzzy TS FBO Generalizado, podem ser implementados ao mesmo tempo

120

Concluses

modelos locais lineares e no lineares, modelando diferentes regies de operao do sistema real [32].
Logo, caso o sistema real possua regies de operao distintas, algumas podendo ser modeladas por
modelos lineares e as demais por no lineares, ento tal implementao da arquitetura fuzzy TS FBO
Generalizado seria adequada, uma vez que os modelos fuzzy permitem a transio suave entre seus
modelos locais [93].
Alm dessas possveis continuaes na pesquisa da modelagem de sistemas dinmicos utilizando
a arquitetura proposta, outra perspectiva se refere sua aplicao em controladores baseados em
modelos, os controladores preditivos [1, 12, 32, 67, 81, 109].

Referncias Bibliogrficas
[1] Abonyi, J. (2003). Fuzzy Model Identification for Control. Birkhuser.
[2] Abonyi, J. e Babuska, R. (2000). Local and global identification and interpretation of parameters in Takagi-Sugeno fuzzy models. Ninth IEEE International Conference on Fuzzy Systems,
San Antonio, TX, USA, Vol. 2, 835-840.
[3] Aguirre, L. A. (2004). Introduo a Identificao de Sistemas, 2 Edio, Editora UFMG.
[4] Anderson, J. A. (1995). An introduction to neural networks. MIT Press.
[5] Amaral, J. F. M., Vellasco, M. M., Tanscheit, R. e Pacheco, M. A. C. (2001). A Neuro-FuzzyGenetic System for Automatic Setting of Control Strategies. Genetic Fuzzy Systems: New
Developments, IFSA/NAFIPS Conference, Vancouver, Canada, 1553-1558.
[6] Bck, T., Fogel, D. B. e Michalewicz, Z. (2000). Evolutionary Computation 1, Basic Algorithms and Operators. Institute of Physics Publishing, Bristol and Philadelphia.
[7] Bck, T., Fogel, D. B. e Michalewicz, Z. (2000). Evolutionary Computation 2, Advanced Algorithms and Operators. Institute of Physics Publishing, Bristol and Philadelphia.
[8] Blanton, J. L. Jr. e Wainwright, R. L. (1993) Multiple Vehicle Routing with Time and Capacity
Constraints Using Genetic Algorithms. Proceedings of the 5th International Conference on
Genetic Algorithms, San Francisco, CA, USA, 452-459.
[9] Bodin, P., Silva, T. O. E. e Wahlberg, B. (1996). On the construction of orthonormal basis
functions for system identification. Proceedings of the IFAC World Congress, San Francisco,
CA, USA, Vol. 1, 369-374.
[10] Braga, A. P., Ludermir, T. B. e Carvalho, A. C. P. L. F. (2000). Redes Neurais Artificiais. LTC
- Livros Tcnicos e Cientficos Editora.
[11] Brassard, G. e Bratley, P. (1996) Fundamentals of algorithmics. Prentice-Hall.
121

REFERNCIAS BIBLIOGRFICAS

122

[12] Camacho, E. F. e Bordons, C. (2004). Model Predictive Control, 2nd Edition. Springer.
[13] Campello, R. J. G. B., Meleiro, L. A. C., Amaral, W. C. e Maciel Filho, R. (2001). Identification of a bioprocess using Laguerre function based models. Proceedings of the Sixth World
Congress of Chemical Engineering, Melbourne, Australia, p. CD.
[14] Campello, R. J. G. B. (2002). Arquiteturas e Metodologias para Modelagem e Controle
de Sistemas Complexos Utilizando Ferramentas Clssicas e Modernas. Tese de Doutorado,
DCA/FEEC/UNICAMP, Campinas, SP, Brasil.
[15] Campello, R. J. G. B. e Amaral, W. C. (2002). Takagi-Sugeno Fuzzy Models within Orthonormal Basis Function Framework and their Application to Process Control. Proceedings of the
11th IEEE Int. Conference on Fuzzy Systems, 1399-1404.
[16] Campello, R. J. G. B., Meleiro, L. A. C. e Amaral, W. C. (2004). Control of a Bioprocess using
Orthonormal Basis Function Fuzzy Models. Proceedings of the IEEE International Conference
on Fuzzy Systems, Budapest, Hungary, Vol. 2, 801-806.
[17] Cordn, O. (2001). Genetic fuzzy systems : evolutionary tuning and learning of fuzzy knowledge bases. World Scientific.
[18] Cordn, O., Gomide, F., Herrera, F., Hoffmann, F. e Magdalena, L. (2004). Ten years of genetic
fuzzy systems: current framework and new trends. Fuzzy Set and Systems, Vol. 141, 5-31.
[19] Cybenko, G. (1988). Continuous Valued Neural Network with two Hidden Layers are Sufficient. Technical Report, Department of Computer Science, Tufts University.
[20] Cybenko, G. (1989). Approximation by Superpositons of a Sigmoid Function. Mathematics of
Control, Signals and Systems, Vol. 2, 303-314.
[21] Darwin, C. (1859). The origin of species by means of natural selection, or the preservation of
favoured races in the struggle for life. John Murray, London, United Kingdom.
[22] Delgado, M. R., Von Zuben, F. e Gomide, F. (2001). Hierarchical genetic fuzzy systems. Information Sciences, Vol. 136, 29-52.
[23] Delgado, M. R., Von Zuben, F. e Gomide, F. (2001). Local and global estimation of TakagiSugeno consequent parameters in genetic fuzzy systems. Joint 9th IFSA World Congress and
20th NAFIPS International Conference, Vancouver, BC, Canada, Vol. 3, 1247-1252.

REFERNCIAS BIBLIOGRFICAS

123

[24] Delgado, M. R. B. S. (2002). Projeto Automtico de Sistemas Nebulosos: Uma Abordagem


Co-Evolutiva. Tese de Doutorado, DCA/FEEC /UNICAMP, Campinas, SP, Brasil.
[25] Delgado, M. R., Von Zuben, F. e Gomide, F. (2002). Multi-Objective Decision Making: Towards Improvement of Accuracy, Interpretability and Design Autonomy in Hierarchical Genetic Fuzzy Systems. Proceedings of the IEEE International Conference on Fuzzy Systems,
Honolulu, HI, USA. Vol. 2, 1222-1227.
[26] Delgado, M. R., Von Zuben, F. e Gomide, F. (2004). Coevolutionary genetic fuzzy systems: a
hierarchical collaborative approach. Fuzzy Sets and Systems, Vol. 141, Issue 1, 89-106.
[27] Dorf, R. C. e Bishop, R.H. (1995). Modern Control Systems, 7th Edition. Addison-Wesley.
[28] Doyle III, F. J., Pearson, R. K. e Ogunnaike, B. A. (2002). Identification and Control using
Volterra models. Springer.
[29] DuBois, D. e Prade. H. (2000). Fundamentals of Fuzzy Sets. Kluwer Academic Publishers.
[30] Erden, M. S., Leblebicioglu, K. e Halici, U. (2004). Multi-Agent Systems-Based Fuzzy Controller Design with Genetic Tuning for a Mobile Manipulator Robot in the Hand Over Task.
Journal of Intelligent and Robotic Systems. Vol. 39, Issue 3, 287-306
[31] Espndola, R. P. (1999). Otimizao de Regras Fuzzy de Classificao por Algoritmos Genticos. Dissertao de Mestrado, COPPE/PEC.
[32] Espinosa, J., Vandewalle, J. e Wertz, V. (2004). Fuzzy Logic, Identification and Predictive
Control. Springer-Verlag.
[33] Eykoff, P. (1974). System Identification, Parameter and State Estimation. John Willey & Sons.
[34] Fogel, D. B. e Atmar, J. W. (1990). Comparing genetic operators with gaussian mutations in
simulated evolutionary processes using linear systems, Formal Aspects of Computing (Historical Archive), Vol. 63, Issue 2, 111-114.
[35] Fogel, D. B., Fogel, L. J. e Atmar, J. W. (1991). Meta-evolutionary programming. Twenty-Fifth
Conference on Signals, Systems and Computers, Pacific Grove, CA, USA, Vol. 1, 540-545.
[36] Goldbarg, M. C. e Luna, H. P. (2000). Otimizao Combinatria e Programao Linear. Editora
Campus.
[37] Goodwin, G. C., Graebe, S. F. e Salgado, M. E. (2001). Control System Design. Prentice Hall.

REFERNCIAS BIBLIOGRFICAS

124

[38] Goonatilake, S. e Khebbal, S. (1995). Intelligent Hybrid Systems. John Wiley & Sons.
[39] Gven, M. K. e Passino, K. M. (2001). Avoiding exponential parameter growth in fuzzy systems, IEEE Transactions on Fuzzy Systems, Vol. 9, 194-199.
[40] Haykin, S. (1999). Neural Networks: A Comprehensive Foundation, 2nd Edition. Prentice
Hall.
[41] Haykin, S. e Veen, B. V. (2000). Sinais e Sistemas. Bookman.
[42] He, L. e Mort, N. (2000). Hybrid Genetic Algorithms for Telecommunications Network BackUp Routeing. BT Technology Journal, Vol. 18, Issue 4, 42-50.
[43] Herrera, F. e Lozano, M. (1996). Adaptation of Genetic Algorithm Parameters Based on Fuzzy
Logic Controllers. Genetic Algorithms and Soft Computing, Physica-Verlag.
[44] Hinterding, R. (1996). Gaussian mutation and self-adaption for numeric genetic algorithms.
IEEE International Conference on Evolutionary Computation, Perth, Australia, Vol.1, 384389.
[45] Holland, J. H. (1962). Outline for a logical theory of adaptive systems. Journal of ACM 9
297-314.
[46] Holland, J. H. (1975). Adaptation in Natural and Artificial Systems. Ann Arbor, MI: University
of Michigan Press.
[47] Homaifar, A. e McCormick, E. (1995). Simultaneous Design of Membership Functions and
Rule Sets for Fuzzy Controllers Using Genetic Algorithms. IEEE Transactions on Fuzzy Systems, Vol. 3, Issue 2, 129-139.
[48] Jain, L. C. e Jain, R. K. (1997). Advances in Fuzzy Systems - Applications and Theory. Hybrid
Intelligent Engineering Systems, Vol. 11, World Scientific.
[49] Jain, L. C. e Martin, N. M. (1998). Fusion of Neural Networks, Fuzzy Sets, and Genetic Algorithms. CRC Press.
[50] Jikai, Y., Hongtao, Y. H. S. e Yuanbin, H. (1997). Fuzzy Control Technique Based on Genetic
Algorithms Optimizing and Its Applications. IEEE International Conference on Intelligent Processing Systems, Beijing, China, Vol. 1, 329-333.

REFERNCIAS BIBLIOGRFICAS

125

[51] Johansen, T. A., Shorten, R. e Murray-Smith, R. (2000). On the interpretation and identification
of dynamic Takagi-Sugeno fuzzy models. IEEE Transactions on Fuzzy Systems, Vol. 8, Issue
3, 297-313.
[52] Cavalcante Junior, F. L. (2000). Controle Preditivo Utilizando um Modelo Nebuloso. Dissertao de mestrado, DCA/FEEC/UNICAMP, Campinas, SP, Brasil.
[53] Kailath, T. (1980). Linear Systems. Prentice-Hall.
[54] Karr, C. e Freeman, L. M. (1998) Industrial Applications of Genetic Algorithms. CRC Press.
[55] Kibangou, A.Y., Favier, G. e Hassani, M. M. (2003).Generalized orthonormal basis selection
for expanding quadratic Volterra filters. 13th IFAC Symposium on System Identification, The
Netherlands, 1119-1124.
[56] Kim, J. e Zeigler, B. P. (1996). Hierarchical Distributed Genetic Algorithms: A Fuzzy Logic
Controller Design Application. IEEE Intelligent Systems, Vol. 11, Issue 3, 76-84.
[57] Kumar, K. e Wu, B. (1999). Application of Genetic and Fuzzy Modelling in Time Series Analysis. Proceedings of the Third IEEE International Conference on Computational Intelligence
and Multimedia Applications, New Delhi, India, 128-132.
[58] Kumar, P., Chandna, V. K. e Thomas, M. S. (2004). Fuzzy-Genetic Algorithm for PreProcessing Data at the RTU. IEEE Transactions on Power Systems, Vol. 19, Issue 2, 718-723.
[59] Kikuchi, S., Tominaga, D., Arita, M., Takahashi, K. e Tomita, M. (2003). Dynamic modeling
of genetic networks using genetic algorithm ans S-system. Bioinformatics, Vol. 19, 643-650.
[60] Koza, J. R., Bennett III, F. H., Andre, D., Keane, M. A. e Dunlap, F. (1997). Automated
Synthesis of Analog Electrical Circuits by Means of Genetic Programming. IEEE Transactions
on Evolutionary Computation, Vol. 1, N. 2, 109-128.
[61] Kosko, B. (1997). Fuzzy Engineering, Prentice Hall.
[62] Laabidi, K. e Bouani, F. (2004). Genetic Algorithms for Multiobjective Predictive Control.
First International Symposium on Control, Communications and Signal Processing, 149-152.
[63] Larraaga, P., Kuijpers, C. M. H., Murga, R. H., Inza, I. e Dizdarevic, S. (1999). Genetic
Algorithms for the Travelling Salesman Problem: A Review of Representations and Operators.
Artificial Intelligence Review, Vol. 13, Issue 2, 129-170.

REFERNCIAS BIBLIOGRFICAS

126

[64] Lee, M. A. e Takagi, H. (1993). Dynamic Control of Genetic Algorithms using Fuzzy Logic
Techniques. Proceedings of the 5th International Conference on Genetic Algorithms, San Francisco, CA, USA, 76-83.
[65] Lee, M. A. e Takagi, H. (1993). Integrating Design Stages of Fuzzy Systems using Genetic
Algorithms. Second IEEE International Conference on Fuzzy Systems, San Francisco, CA,
USA, Vol. 1, 612-617.
[66] Leung, F. H. F., Lam, H. K., Ling, S. H. e Tam, P. K. S. (2004). Optimal and Stable Fuzzy Controllers for Nonlinear Systems Based on an Improved Genetic Algorithm. IEEE Transactions
on Industrial Electronics, Vol. 51, N. 1, 172-182.
[67] Li, N., Li, S. Y. e Xi, Y. G. (2004). Multi-model predictive control based on the Takegi-Sugeno
fuzzy models: a case study. Information Sciences, Vol. 165, 247-263.
[68] Lima, C. M. R. R (2002). Otimizao da Frota de Veculos na Distribuio de Gs. Monografia
de Graduao, Universidade Federal do Rio Grande do Norte, Natal, RN.
[69] Lima, R. N. B., Miranda, M. N., Filho, J. V. S., Pedroza, A. C. P. e Mesquita, A. C. (2002).
HW/SW codesign of handoff protocol for wireless ATM networks based on performance optimization using genetic algorithm. Proceedings. 15th Symposium on Integrated Circuits and
Systems Design, 29-34.
[70] Linkens, D. A. e Nyongesa, H. O. (1996). Learning Systems in intelligent control: an appraisal
of fuzzy, neural and genetic algorithm control applications. Proceedings of the IEEE Control
Theory and Applications, Vol. 143, Issue 4, 367-386.
[71] Liska, J. e Melsheimer, S. S. (1994). Complete Design Of Fuzzy Logic Systems Using Genetic
Algorithms. IEEE World Congress on Computational Intelligence, Proceedings of the Third
IEEE Conference on Fuzzy Systems, Vol. 2, 1377-1382.
[72] Ljung, L. (1999) System identification: Theory for the user, Z Edition. Prentice-Hall.
[73] Mamdani, E. H. (1976). Application of fuzzy logic to approximate reasoning using linguistic
synthesis. Proceedings of the Sixth IEEE International Symposium on Multiple-valued Logic,
Logan, Utah, USA, 196-202.
[74] Maner, B. R., Doyle III, F. J., Ogunnaike, B. A. e Pearson, R. K. (1996). Nonlinear Model predictive control of a simulated multivariable polymerization reactor using second-order Volterra
models. Automatica, Vol. 32, Issue 9, 1285-1301.

REFERNCIAS BIBLIOGRFICAS

127

[75] McCulloch, W. S. e Pitts, W. H. (1943). A logical calculus of the ideas immanent in nervous
activity. Bulletin of Mathematical Biophysics, Vol. 5, 115-133.
[76] Medeiros, A. V., Maitelli, A. L. e Gabriel Filho, O. (2001). Otimizao das Funes de Pertinncia de um Controlador Nebuloso utilizando Algoritmos Genticos. V Simpsio Brasileiro
de Automao Inteligente, Canela, RS.
[77] Medeiros, A. V. (2003). Utilizao de Tcnicas de Inteligncia Artificial no Controle de Sistemas. Monografia de Graduao, Universidade Federal do Rio Grande do Norte, Natal, RN.
[78] Medeiros, A. V., Maitelli, A. L. e Arajo, F. M. U. (2003). Gerao das regras de inferncia de um Controlador Nebuloso utilizando Algoritmos Genticos. VI Simpsio Brasileiro de
Automao Inteligente, Bauru, SP.
[79] Michalewicz, Z. (1996). Genetic Algorithms + Data Structures = Evolution Programs. 3
Edio, Springer-Verlag.
[80] Michalewicz, Z., Nazhiyath, G., e Michalewicz, M. (1996). A Note on Usefulness of Geometrical Crossover for Numerical Optimization Problems, Proceedings of the 5th Annual Conference on Evolutionary Programming, San Diego, CA. MIT Press, Cambridge, MA, 305-312.
[81] Murray-Smith, R. e Johansen, T. A. (1997). Multiple Model Approaches to Modelling and
Control. Taylor and Francis.
[82] Ng, K. C. e Li, Y. (1994). Design Of Sophisticated Fuzzy Logic Controllers Using Genetic
Algorithms. IEEE World Congress on Computational Intelligence, Proceedings of the Third
IEEE Conference on Fuzzy Systems, Orlando, FL, USA, Vol. 3, 1708-1712.
[83] Ninness, B., Gmez, J.-C. e Weller, S. (1995). MIMO System Identification Using Orthonormal Basis Functions. Proceedings of the 34th IEEE Conference on Decision and Control, New
Orleans, LA, USA, Vol. 1, 703-708.
[84] Ninness, B. M. e Gustafsson, F. (1997). A Unifying Construction of Orthonormal Bases for
System Identification. IEEE Transactions on Automatic Control. Vol 42, Issue 2, 515-521.
[85] Norgaard, M., Ravn, O., Poulsen, N. K. e Hansen, L. K. (2000). Neural Networks for Modelling and Control of Dynamic Systems. Springer.
[86] Ogata, K. (1978) System Dynamics. Prentice-Hall.
[87] Ogata, K. (1995) Discrete-time control systems, 2nd Edition. Prentice-Hall.

REFERNCIAS BIBLIOGRFICAS

128

[88] Ogunnaike, B. A. e Ray, W. H. (1994). Process Dynamics, Modeling, and Control. Oxford
University Press.
[89] Oliveira, G. H. C., Campello, R. J. G. B. e Amaral, W. C. (1999). Fuzzy Models within Orthonormal Basis Function Framework. IEEE International Fuzzy Systems Conference, Seoul,
Korea, Vol. 2, 957-962.
[90] Palm, W. J. (1983). Modeling, Analysis and Control of Dynamic Systems. John Wiley & Sons.
[91] Park, D. Kandel, A. e Langholz, G. (1994). Genetic-Based New Fuzzy Reasoning Models with
Application to Fuzzy Control. IEEE Transactions on Systems, Man and Cybernetics, Vol. 24,
Issue 1, 39-47.
[92] Parks, T. R. (1999). Manual for Model 730 - Magnetic Levitation System, ECP.
[93] Pedrycz, W. e Gomide, F. A. C. (1998). An Introduction to Fuzzy Sets: Analysis and Design
(Complex Adaptive Systems). MIT Press.
[94] Pea-Reyes, C. A. (2002). Coevolutionary Fuzzy Modeling. Tese de doutorado, Section
deinformatique, cole Polytechnique Fdrale de Lausanne, Lausanne, Suia.
[95] Rosa, A. (2005). Desenvolvimento de Modelos Discretos de Volterra usando Funes de Kautz.
Dissertao de Mestrado, DCA/FEEC/UNICAMP, Campinas, SP, Brasil.
[96] Rosenblatt, F. (1958). The Perceptron: A Probabilistic Model for Information Storage and
Organization in the Brain. Cornell Aeronautical Laboratory, Psychological Review, Vol. 65,
No. 6, 386-408.
[97] Ruan, D. (1997). Intelligent Hybrid Systems - Fuzzy Logic, Neural Networks and Genetic
Algorithms. Kluwer Academic Publishers.
[98] Russo, M. (1998). FuGeNeSys - A Fuzzy Genetic Neural System for Fuzzy Modeling. IEEE
Transactions on Fuzzy Systems, Vol. 6, Issue 3, 373-388.
[99] Setnes, M., Babuska, R., Kaymak, U. e van Nauta Lemke, H. R. (1998). Similarity measures
in fuzzy rule base simplification, IEEE Transactions on Systems, Man and Cybernetics - Part
B: Cybernetics, Vol. 28, 376-386.
[100] Shaw, I. S. e Simes, M. G. (1999). Controle e Modelagem Fuzzy. Edgard Blcher.

REFERNCIAS BIBLIOGRFICAS

129

[101] Schaffer, J. D., Whitley, D. e Eshelman, L. J. (1992). Combinations of genetic algorithms and
neural networks: a survey of the state of the art. International Workshop on Combinations of
Genetic Algorithms and Neural Networks, Baltimore, MD, USA, 1-37.
[102] Su, C. T., Lii, G. R. e Hwung, H. R. (1996). A Neuro-Fuzzy Method for Tracking Control.
IEEE International Conference on Industrial Technology, Shanghai, China, 682-686.
[103] Subbu, R. e Bonissone, P. P. (2003). A Retrospective View of Fuzzy Control of Evolutionary
Algorithm Resource. IEEE International Conference on Fuzzy Systems, St. Louis, MO, USA,
Vol. 1, 143-148.
[104] Takagi, T. e Sugeno, M. (1985). Fuzzy identification of systems and its applications to modeling and control. IEEE Transactions on Systems, Man, and Cybernetics. Vol. 15, 116-132.
[105] Tenorio, M. F. e Lee, W. (1990). Self-organizing network for optimum supervised learning.
IEEE Transactions on Neural Networks, NN-1, 100-109.
[106] Tsoukalas, L. H. e Uhrig, R. E. (1997). Fuzzy and Neural Approaches in Engineering. WileyInterscience.
[107] United States Patent and Trademark Office. http://www.uspto.gov/index.html. Acessado em
julho de 2005.
[108] Van den Hof, P. M. J., Heuberger, P. S. C. e Bokor, J. (1994). System identification with generalized orthonormal basis functions. Proceedings of the 33rd IEEE Conference on Decision and
Control, Lake Buena Vista, FL, USA, Vol. 4, 3382-3387.
[109] Verbruggen, H. B. e Babuska, R. (1999). Fuzzy Logic Control, Advances in Applications.
World Scientific.
[110] Vonk, E., Jain, L. C. e Johnson, R. P. (1997). Automatic Generation of Neural Network Architecture Using Evolutionary Computation. World Scientific.
[111] Von Zuben, F. J. (2005). Notas de Aula da disciplina Computao Evolutiva, disponvel em
http://www.dca.fee.unicamp.br/vonzuben. Acessado em 13/02/2005.
[112] Wahlberg, B. (1991). System identification using Laguerre models. IEEE Transactions on Automatic Control, Vol. 36, Issue 5, 551-562.
[113] Wahlberg, B. (1994). System identification using Kautz models. IEEE Transactions on Automatic Control, Vol. 39, Issue 6, 1276-1282.

REFERNCIAS BIBLIOGRFICAS

130

[114] Wallace, C. S. e Freeman, P. R. (1987). Estimation and inference by compact coding. J. R. Stat.
Soc. B, Vol. 49, 240-265.
[115] Wang, L.-X. e Mendel, J. M. (1992). Fuzzy basis functions, universal approximation, and
orthogonal least-squares learning. IEEE Transactions on Neural Networks, Vol.3, Issue 5, 807814.
[116] Wu, C. J. e Liu, G. Y. (2000). A Genetic Approach for Simultaneous Design of Membership
Functions and Fuzzy Control Rules. Journal of Intelligent and Robotic Systems, Vol. 28, Issue
3, 195-211.
[117] Zadeh, L. A. (1965) Fuzzy Sets. Information and Control, Vol. 8, 338-353.
[118] Zhang, T., Jamshidi, M., Coelho, L. S. e Krohling, R. A. (2002). Robust Control Systems with
Genetic Algorithms. CRC Press.

You might also like