Professional Documents
Culture Documents
rea de concentrao:
Banca Examinadora
Akebo Yamakami, Dr. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . DT/FEEC/Unicamp
Myriam Regattieri De Biase da Silva Delgado, Dr. . . . . . . . DAINF/CEFET-PR
Campinas, SP
Janeiro/2006
M468m
Titulo em Ingls: Modeling of nonlinear dynamics systems using fuzzy systems, genetic
algorithms and orthonormal basis functions
Palavras-chave em Ingls: Dynamic systems modeling, Takagi-Sugeno fuzzy model,
Orthonormal basis functions, Optimization of models, genetic
algorithms, Akaike information criterion, Similarity measures
rea de concentrao: Automao
Titulao: Mestre em Engenharia Eltrica
Banca examinadora: Akebo Yamakami e Myriam Regattieri de Biase da Silva Delgado.
Data da defesa: 23/01/2006
ii
Resumo
Esta dissertao apresenta uma metodologia para a gerao e otimizao de modelos fuzzy TakagiSugeno (TS) com Funes de Base Ortonormal (FBO) para sistemas dinmicos no lineares utilizando um algoritmo gentico. Funes de base ortonormal tm sido utilizadas por proporcionarem
aos modelos propriedades como ausncia de recurso da sada e possibilidade de se alcanar uma
razovel capacidade de representao com poucos parmetros. Modelos fuzzy TS agregam a essas
propriedades as caractersticas de interpretabilidade e facilidade de representao do conhecimento.
Enfim, os algoritmos genticos se apresentam como um mtodo bem estabelecido na literatura na
tarefa de sintonia de parmetros de modelos fuzzy TS.
Diante disso, desenvolveu-se um algoritmo gentico para a otimizao de duas arquiteturas, o
modelo fuzzy TS FBO e sua extenso, o modelo fuzzy TS FBO Generalizado. Foram analisados modelos locais lineares e no lineares nos conseqentes das regras fuzzy, assim como a diferena entre a
estimao local e a global (utilizando o estimador de mnimos quadrados) dos parmetros desses modelos locais. No algoritmo gentico, cada arquitetura contou com uma representao cromossmica
especfica. Elaborou-se para ambas uma funo de fitness baseada no critrio de Akaike. Em relao
aos operadores de reproduo, no operador de crossover aritmtico foi introduzida uma alterao
para a manuteno da diversidade da populao e no operador de mutao gaussiana adotou-se uma
distribuio varivel ao longo das geraes e diferenciada para cada gene. Introduziu-se ainda um
mtodo de simplificao de solues atravs de medidas de similaridade para a primeira arquitetura
citada. A metodologia foi avaliada na tarefa de modelagem de dois sistemas dinmicos no lineares:
um processo de polimerizao e um levitador magntico.
Palavras-chave: Modelagem de Sistemas Dinmicos, Modelo Fuzzy Takagi-Sugeno, Funes de
Base Ortonormal, Otimizao de Modelos, Algoritmos Genticos, Critrio de Akaike, Medidas de
Similaridade.
iii
Abstract
This work introduces a methodology for the generation and optimization of Takagi-Sugeno (TS)
fuzzy models with Orthonormal Basis Functions (OBF) for nonlinear dynamic systems based on a
genetic algorithm. Orthonormal basis functions have been used because they provide models with
properties like absence of output feedback and the possibility to reach a reasonable approximation
capability with just a few parameters. TS fuzzy models aggregate to these properties the characteristics of interpretability and easiness to knowledge representation in a linguistic manner. Genetic
algorithms appear as a well-established method for tuning parameters of TS fuzzy models.
In this context, it was developed a genetic algorithm for the optimization of two architectures,
the OBF TS fuzzy model and its extension, the Generalized OBF TS fuzzy model. Local linear
and nonlinear models in the consequent of the fuzzy rules were analyzed, as well as the difference
between local and global estimation (using least squares estimation) of the parameters of these local
models. Each architecture had a specific chromosome representation in the genetic algorithm. It was
developed a fitness function based on the Akaike information criterion. With respect to the genetic
operators, the arithmetic crossover was modified in order to maintain the population diversity and
the Gaussian mutation had its distribution varied along the generations and differentiated for each
gene. Besides, it was used, in the first architecture presented, a method for simplifying the solutions
by using similarity measures. The whole methodology was evaluated in modeling two nonlinear
dynamic systems, a polymerization process and a magnetic levitator.
Keywords: Dynamic Systems Modeling, Takagi-Sugeno Fuzzy Model, Orthonormal Basis Functions, Optimization of Models, Genetic Algorithms, Akaike Information Criterion, Similarity Measures.
iv
vi
Agradecimentos
Acima de tudo, a Deus.
Ao meu orientador Prof. Wagner Caradori do Amaral pela orientao e compreenso com o ritmo do
trabalho.
Ao meu co-orientador Prof. Ricardo J. G. B. Campello pela grande contribuio para o aprimoramento de toda a pesquisa.
minha namorada Cynthia pela ajuda e companheirismo nas muitas noites, feriados e fins de semana
investidos nesse mestrado.
A meus pais, Beto e Lcia, pelos ensinamentos que formaram a base de toda minha educao.
Ao CNPq pelo apoio financeiro de parte dos trabalhos.
vii
viii
Sumrio
Lista de Figuras
xiii
Lista de Tabelas
xvii
xix
1 Introduo
2.1
2.2
2.3
2.4
2.5
O que um Modelo? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1
Modelos Matemticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Modelos Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.1
Funo de Transferncia . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.2
Espao de Estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.3
Representao Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
2.2.4
. . . . . . . . . . . . . . . . . . . . . . . . . .
10
2.2.5
ARX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
2.2.6
ARMAX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
2.2.7
12
Modelos No Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
2.3.1
NARX e NARMAX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
2.3.2
Modelo de Volterra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
2.3.3
Redes Neurais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
Modelos Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
2.4.1
Princpios e Aplicaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
2.4.2
19
2.4.3
21
Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
ix
SUMRIO
x
3
25
3.1
25
3.2
30
3.2.1
31
3.2.2
31
3.2.3
32
3.2.4
34
3.3
35
3.4
37
3.5
4
39
41
4.1
41
4.2
43
4.2.1
44
4.2.2
Aplicaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
45
47
4.3.1
48
4.3.2
51
Representao Cromossmica . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
52
4.4.1
53
Avaliao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
4.5.1
59
4.5.2
61
Operadores de Seleo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
4.6.1
64
Reproduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
65
4.7.1
66
4.8
Condies de Parada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
73
4.9
Medidas de Similaridade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
74
4.9.1
75
4.10 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
76
Resultados de Modelagem
79
5.1
79
5.1.1
79
4.3
4.4
4.5
4.6
4.7
Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Levitador Magntico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
SUMRIO
5.1.2
5.1.3
5.2
5.3
Processo de Polimerizao . . . . . . . . . . . . . . . . . . . . . . . . . . .
Organizao dos Resultados . . . . . . . . . . . . . . . . . . . . . . . . . .
81
81
82
84
90
5.4
xi
Modelo fuzzy TS FBO com Plo nico - Modelos Locais Lineares . . . . . . 107
Modelo fuzzy TS FBO com Plo nico - Modelos Locais No Lineares . . . 110
6 Concluses
117
Referncias bibliogrficas
121
xii
SUMRIO
Lista de Figuras
2.1
16
2.2
16
2.3
20
3.1
26
3.2
28
4.1
52
4.2
52
4.3
56
4.4
57
4.5
58
4.6
62
4.7
65
4.8
66
4.9
68
69
71
77
5.1
Levitador magntico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
80
5.2
82
5.3
Diversidade da populao para o modelo fuzzy TS FBO com plo nico e modelos
locais lineares (levitador magntico). . . . . . . . . . . . . . . . . . . . . . . . . . .
5.4
87
Limite de similaridade para o modelo fuzzy TS FBO com plo nico e modelos locais
lineares (levitador magntico). . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
xiii
88
LISTA DE FIGURAS
xiv
5.5
5.6
5.7
5.8
5.9
Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO com plo nico
e modelos locais lineares (levitador magntico). . . . . . . . . . . . . . . . . . . . .
88
Funes de pertinncia de entrada para o modelo fuzzy TS FBO com plo nico e
modelos locais lineares (levitador magntico). . . . . . . . . . . . . . . . . . . . . .
89
Sada real e a fornecida pelo modelo fuzzy TS FBO com plo nico e modelos locais
lineares (levitador magntico). . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
90
92
92
5.10 Evoluo do EQM do melhor indivduo da populao para o modelo fuzzy TS FBO
Generalizado com estimao local e modelos locais lineares (levitador magntico). .
94
5.11 Dinmica do estado na premissa das regras para o modelo fuzzy TS FBO Generalizado
com estimao local e modelos locais lineares (levitador magntico). . . . . . . . . .
94
5.12 Funes de pertinncia de entrada para o modelo fuzzy TS FBO Generalizado com
estimao local e modelos locais lineares (levitador magntico). . . . . . . . . . . .
95
5.13 Modelos locais para o sistema fuzzy TS FBO Generalizado com estimao local e
modelos locais lineares (levitador magntico). . . . . . . . . . . . . . . . . . . . . .
96
5.14 Sada real e a fornecida pelo modelo fuzzy TS FBO Generalizado com estimao local
e modelos locais lineares (levitador magntico). . . . . . . . . . . . . . . . . . . . .
96
5.15 Diversidade da populao para o modelo fuzzy TS FBO Generalizado com modelos
locais no lineares e estimao global (levitador magntico). . . . . . . . . . . . . .
99
5.16 Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO Generalizado
com modelos locais no lineares e estimao global (levitador magntico). . . . . . .
99
5.17 Evoluo do EQM do melhor indivduo da populao para o modelo fuzzy TS FBO
Generalizado com modelos locais no lineares e estimao global (levitador magntico).100
5.18 Dinmica do estado na premissa das regras para o modelo fuzzy TS FBO Generalizado
com modelos locais no lineares e estimao global (levitador magntico). . . . . . . 101
5.19 Funes de pertinncia de entrada para o modelo fuzzy TS FBO Generalizado com
modelos locais no lineares e estimao global (levitador magntico). . . . . . . . . 101
5.20 Modelos locais para o sistema fuzzy TS FBO Generalizado com modelos locais no
lineares e estimao global (levitador magntico). . . . . . . . . . . . . . . . . . . . 102
5.21 Sada real e a fornecida pelo modelo fuzzy TS FBO Generalizado com modelos locais
no lineares e estimao global (levitador magntico). . . . . . . . . . . . . . . . . . 103
LISTA DE FIGURAS
xv
5.22 Modelos locais anti-simtricos para o sistema fuzzy TS FBO Generalizado com modelos locais no lineares e estimao global (levitador magntico). . . . . . . . . . . . 104
5.23 Sinais normalizados de entrada e sada para treinamento (CSTR). . . . . . . . . . . . 105
5.24 Diversidade da populao para o modelo fuzzy TS FBO com plo nico e modelos
locais lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.25 Limite de similaridade para o modelo fuzzy TS FBO com plo nico e modelos locais
lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
5.26 Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO com plo nico
e modelos locais lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
5.27 Funes de pertinncia de entrada para o modelo fuzzy TS FBO com plo nico e
modelos locais lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
5.28 Sada real e a fornecida pelo modelo fuzzy TS FBO com plo nico e modelos locais
lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
5.29 Diversidade da populao para o modelo fuzzy TS FBO com plo nico e modelos
locais no lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
5.30 Limite de similaridade para o modelo fuzzy TS FBO com plo nico e modelos locais
no lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
5.31 Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO com plo nico
e modelos locais no lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . 113
5.32 Funes de pertinncia de entrada para o modelo fuzzy TS FBO com plo nico e
modelos locais no lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . 114
5.33 Sada real e a fornecida pelo modelo fuzzy TS FBO com plo nico e modelos locais
no lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
xvi
LISTA DE FIGURAS
Lista de Tabelas
5.1
5.2
Resumo dos resultados do modelo fuzzy TS FBO com plo nico (levitador magntico). 85
5.3
Resumo dos resultados do modelo fuzzy TS FBO com plo nico sem o parmetro de
5.4
5.5
5.6
5.7
83
85
Melhor resultado (menor EQM) do modelo fuzzy TS FBO com plo nico (levitador
magntico). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
86
Soluo fornecida pelo AG para o modelo fuzzy TS FBO com plo nico e modelos
locais lineares (levitador magntico). . . . . . . . . . . . . . . . . . . . . . . . . . .
89
Resumo dos resultados do modelo fuzzy TS FBO Generalizado com estimao local
(levitador magntico). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
91
Resumo dos resultados do modelo fuzzy TS FBO Generalizado com estimao local
sem o parmetro de expanso (levitador magntico). . . . . . . . . . . . . . . . . .
91
Melhor resultado do modelo fuzzy TS FBO Generalizado com estimao local (levitador magntico). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
93
Soluo fornecida pelo AG para o modelo fuzzy TS FBO Generalizado com modelos
locais lineares e estimao local (levitador magntico). . . . . . . . . . . . . . . . .
93
5.10 Resumo dos resultados do modelo fuzzy TS FBO Generalizado com estimao global
(levitador magntico). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
97
5.8
5.9
5.11 Resumo dos resultados do modelo fuzzy TS FBO Generalizado com estimao global
sem o parmetro de expanso (levitador magntico). . . . . . . . . . . . . . . . . .
97
5.12 Melhor resultado do modelo fuzzy TS FBO Generalizado com estimao global (levitador magntico). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
98
5.13 Soluo fornecida pelo AG para o modelo fuzzy TS FBO Generalizado com modelos
locais no lineares e estimao global (levitador magntico). . . . . . . . . . . . . . 100
5.14 Configurao do AG para o sistema CSTR. . . . . . . . . . . . . . . . . . . . . . . 106
5.15 Resumo dos resultados do modelo fuzzy TS FBO com plo nico (CSTR). . . . . . . 107
xvii
xviii
LISTA DE TABELAS
5.16 Resumo dos resultados do modelo fuzzy TS FBO com plo nico sem o parmetro de
expanso (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
5.17 Melhor resultado do modelo fuzzy TS FBO com plo nico (CSTR). . . . . . . . . . 108
5.18 Soluo fornecida pelo AG para o modelo fuzzy TS FBO com plo nico e modelos
locais lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
5.19 Soluo fornecida pelo AG para o modelo fuzzy TS FBO com plo nico e modelos
locais no lineares (CSTR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
cido Desoxirribonuclico
AG
Algoritmos Genticos
AIC
ARIMAX
ARMAX
ARX
CSTR
EQM
FBO
FIR
FP
Funo de Pertinncia
GFS
MDL
MML
MQ
Mnimos Quadrados
NARMAX
NARX
NEFCON
xx
NFIR
PD
Proporcional Derivativo
PI
Proporcional Integral
RNA
TS
Takagi-Sugeno
Captulo 1
Introduo
Algoritmos genticos (AG) tm sido aplicados na tarefa de otimizao de sistemas fuzzy desde o
incio da dcada de 90. Sistemas fuzzy do tipo Takagi-Sugeno (TS), Mamdani ou relacional (alm
de redes neuro-fuzzy) foram projetados com fins de modelagem ou controle utilizando variaes do
algoritmo gentico originalmente proposto por Holland no incio dos anos 60. As pesquisas seguiram
a tendncia de otimizar cada vez mais parmetros do sistema fuzzy com cada vez menos interao
humana. Aos poucos foram analisados tambm outros critrios qualitativos para os sistemas obtidos,
tais como interpretabilidade e simplicidade. Assim, no bastava a um modelo representar adequadamente determinado sistema real - era preciso desempenhar essa tarefa de maneira compreensvel e
simples. medida que foram abordados sistemas mais complexos surgiram novas arquiteturas de
otimizao, envolvendo nveis hierrquicos e o conceito de co-evoluo.
Em se tratando da obteno de modelos fuzzy, um aspecto de especial interesse nas pesquisas
recentes refere-se ao compromisso entre capacidade de representao do modelo fuzzy e sua complexidade. Neste sentido, foram definidas mtricas para avaliar quo interpretvel seria um modelo
(em termos de simplicidade da base de regras ou disposio das funes de pertinncia) face sua
capacidade de representao de um determinado sistema real.
O presente trabalho aborda exatamente este compromisso. Incorpora-se aos modelos fuzzy TS
com Funes de Base Ortonormal (FBO), propostos originalmente por Oliveira et al em 1999 [89],
um mtodo automtico de otimizao baseado em algoritmos genticos. Este mtodo permite a
obteno de modelos ao mesmo tempo simples (com um pequeno nmero de parmetros, alm de
interpretvel) e com satisfatria capacidade de representao. Mais especificamente, o algoritmo
gentico desenvolvido possibilita a otimizao de duas arquiteturas, o modelo fuzzy TS FBO e sua
extenso, o modelo fuzzy TS FBO Generalizado, proposto originalmente em [14, 15]. Para a primeira,
composta por uma nica base de funes ortonormais e referenciada no texto como arquitetura de
1
Introduo
plo nico1, otimiza-se um plo real ou um par de plos complexos conjugados (dependendo se
as funes ortonormais utilizadas so de Laguerre ou de Kautz), o nmero de variveis de entrada
do modelo, a quantidade de funes de pertinncia por varivel de entrada e o nmero de funes na
base ortonormal. Para a segunda arquitetura, otimiza-se um plo complexo para cada modelo local,
alm do nmero de funes em cada base ortonormal. Em ambas, a disposio e configurao das
funes de pertinncia do modelo fuzzy tambm foram automaticamente determinadas. Note-se que o
nmero de funes na base ortonormal (ou bases ortonormais) corresponde ao nmero de estados nos
modelos locais do sistema fuzzy, influenciando diretamente a capacidade de representao do modelo.
As principais contribuies desta pesquisa residem na proposta de duas representaes cromossmicas originais, na elaborao de uma funo de fitness baseada no critrio de informao de
Akaike, na alterao do operador de crossover aritmtico, no uso de um operador de mutao gaussiana com distribuies variveis e distintas para cada gene e no uso de medidas de similaridade para
a simplificao de funes de pertinncia redundantes (e conseqente reduo da base de regras de
inferncia).
Esta dissertao est organizada da seguinte forma. Aps esta introduo, o captulo 2 apresenta o
conceito de modelagem de sistemas dinmicos e uma srie de modelos lineares e no lineares. Alguns
so apresentados apenas para contextualizar o trabalho (como as funes de transferncia e as redes
neurais) enquanto outros sero efetivamente utilizados nos captulos posteriores (como os modelos
em espao de estados e os FBO lineares). Em particular, enfoca-se o modelo fuzzy TS, que constitui
o pilar das arquiteturas sujeitas otimizao pelo AG.
Reserva-se o captulo 3 para a apresentao detalhada dos modelos fuzzy TS FBO e fuzzy TS FBO
Generalizado, obtidos com a utilizao de funes de base ortonormal como filtros para a gerao
das variveis lingsticas (estados) do modelo fuzzy TS. As funes de base ortonormal possuem uma
srie de vantagens para a aplicao em modelagem de sistemas dinmicos no lineares, como necessidade de um nmero menor de parmetros para se atingir uma dada capacidade de representao
e ausncia de realimentao da sada do modelo. Neste captulo discriminam-se quais parmetros
dos modelos sero otimizados autonomamente pelo AG. Alm disso, descrevem-se duas variaes do
mtodo de estimao de mnimos quadrados: estimao local e estimao global. A aplicao dessas
duas variaes na estimao dos coeficientes dos conseqentes das regras de inferncia do modelo
fuzzy TS FBO Generalizado gera modelos com comportamentos bem distintos, os quais so analisados no captulo 5. Como na arquitetura com plo nico a mesma base ortonormal est presente em
todas as regras (dinmica comum, diferenciando-se apenas as relaes estticas entre os estados das
diversas regras), aplica-se apenas a estimao global dos parmetros.
1
Essa terminologia (plo nico) dever ser interpretada como uma base nica de funes ortonormais, parametrizada
por um plo real ou por um par de plos complexos conjugados, em contraste com a extenso Generalizada, que ser
parametrizada por um nmero qualquer de plos reais ou complexos conjugados.
3
O captulo 4, o principal da dissertao, dedicado apresentao dos algoritmos genticos,
seus princpios, aplicaes e fuso com sistemas fuzzy, formando os sistemas gentico-fuzzy. Aps
uma reviso da evoluo dos sistemas gentico-fuzzy, o texto detalha cada componente ou etapa do
AG, primeiramente de forma geral e ento a implementao especfica desta dissertao, seguindo a
ordem: representao cromossmica, avaliao dos indivduos que codificam os modelos, operador
de seleo e operadores de reproduo (crossover e mutao). Por ltimo, descreve-se um mtodo
para a eliminao de redundncia de funes de pertinncia no modelo fuzzy TS FBO com plo nico
atravs do uso de medidas de similaridade. Tal mtodo no aplicado na arquitetura Generalizada
pois a representao cromossmica elaborada para esta menos flexvel que aquela elaborada para a
arquitetura com plo nico, conforme ser justificado no captulo 4. No decorrer de todo o captulo
apresentam-se as motivaes e justificativas para o modo como foi projetado cada componente ou
etapa do algoritmo gentico.
Os resultados de modelagem so apresentados e analisados no captulo 5. Aplica-se o mtodo
desenvolvido no captulo 4 na tarefa de modelagem de dois sistemas dinmicos no lineares com
diferentes graus de complexidade: um processo de polimerizao e um levitador magntico. Os
resultados obtidos indicam a eficincia da metodologia proposta, possibilitando o levantamento de
conjecturas sobre a aplicabilidade de cada arquitetura na modelagem de sistemas dinmicos no
lineares.
Finalmente, o captulo 6 traa as concluses sobre a pesquisa realizada e apresenta algumas perspectivas para sua continuao.
Introduo
Captulo 2
Modelagem de Sistemas Dinmicos
O objetivo desse captulo descrever os principais conceitos relacionados ao contexto no qual se
insere a presente dissertao. So apresentadas as bases tericas que sero utilizadas em captulos
posteriores e os principais conceitos envolvidos. Dessa forma, parte-se de definies simples (como
o conceito de sistema e modelo) e prossegue-se at a contextualizao de todo o trabalho. Delega-se
aos captulos subseqentes a tarefa de aprofundamento dos principais temas abordados.
6
em um conjunto de dados experimentais.
A escolha do tipo do modelo depende do propsito definido para o mesmo e do tipo e quantidade
de informao disponvel sobre o sistema. No presente trabalho, como o objetivo a obteno de
modelos que possam ser usados em sistemas de controle, buscar-se- obter modelos matemticos
para os sistemas abordados. A prxima seo apresenta mais detalhes sobre as caractersticas de um
modelo matemtico.
(2.2)
sendo a e b constantes, u1 (t) e u2 (t) entradas arbitrrias e y1 = f (u1 (t)), y2 = f (u2 (t)).
Qualquer relao ou modelo que no satisfaa (2.2) no linear. Por exemplo, funes logartmicas, trigonomtricas ou potncias tornam um modelo matemtico no linear. A importncia
da linearidade em um modelo reside nas simplificaes obtidas durante sua anlise. Alm disso,
possvel em um modelo linear isolar os efeitos das variveis de entrada e estud-las separadamente.
No entanto, a maioria dos sistemas reais no linear, caso no sejam feitas restries quanto aos
valores de suas entradas. A anlise em determinadas faixas de operao pode vir a fornecer certo grau
de linearidade ao modelo. Porm, dependendo da aplicao, a considerao da natureza no linear
do sistema pode ser essencial nas tarefas sendo realizadas, no podendo ser descartada do modelo.
a0 y +a1
(n1)
(m)
y + . . . + an1 y + an y = b0 u +b1
(m1)
+ . . . + bm1 u + bm u, (n m)
(2.3)
(n)
sendo y a sada do sistema e u sua entrada ( y = derivada de ordem n com relao ao tempo t). A
funo de transferncia desse sistema obtida tomando-se a transformada de Laplace de ambos os
Y (s)
b0 sm + b1 sm1 + . . . + bm1 s + bm
L {y(t)}
=
=
L {u(t)}
U(s)
a0 sn + a1 sn1 + . . . + an1 s + an
(2.4)
mapeamento inverso, isto , do domnio discreto para o contnuo, pode ser realizado diretamente ao
se explicitar z na relao (2.5).
O conceito de funo de transferncia importante na medida em que fornece um modelo matemtico til para utilizao nas fases de anlise e projeto de um controlador.
A funo de transferncia uma propriedade do sistema em si, independente da magnitude e natureza dos sinais de entrada. Assim, caso a funo de transferncia de um sistema seja conhecida,
sua sada pode ser estudada para vrios sinais diferentes de entrada, obtendo-se dessa forma mais
conhecimento sobre a natureza do sistema. Se este no for o caso, possvel obt-la de forma experimental aplicando-se entradas conhecidas no sistema e analisando-se suas respostas. Um dos mtodos
aplicveis nessa tarefa o mtodo de Sundaresan. Esse mtodo permite obter os parmetros de uma
funo de transferncia de segunda ordem com atraso puro de tempo desde que esteja disponvel a
sada do sistema a uma entrada degrau [3, 27].
(2.6)
(2.7)
(2.8)
Para sistemas discretos possvel usar uma notao semelhante da equao (2.8), bastando
substituir o vetor de estado contnuo x por x(k), a sada y por y(k), a entrada u por u(k) e finalmente
a derivada x por x(k + 1).
preciso notar que a representao em espao de estados de um sistema fsico no nica, mas
10
C(q)
B(q)
u(k) +
e(k)
F (q)
D(q)
(2.9)
=0
g( )u(t )d
(2.10)
Conhecendo-se g( )|
=0 e u(r) para r t possvel calcular a sada y(r), r t, para qualquer
entrada. Assim, a resposta ao impulso caracteriza o sistema.
Ao se considerar o domnio discreto, a representao da resposta ao impulso dada pelo somatrio
11
de convoluo:
y(k) =
X
i=0
g(i)u(k i)
(2.11)
Caso o sistema seja assintoticamente estvel possvel truncar o somatrio infinito em um nmero
mximo de termos L. Alm disso, normalmente existem distrbios atuando no sistema, como rudo
de medio ou atuao de entradas no controladas. Para considerar de forma geral tais distrbios o
termo e(k), representando rudo branco, includo na equao. Dessa forma, obtm-se o modelo de
resposta ao impulso finita (FIR, do ingls Finite Impulse Response) [72].
y(k) =
L
X
i=0
g(i)u(k i) + e(k)
(2.12)
2.2.5 ARX
Alm da resposta ao impulso finita, outra forma simples de representar uma relao de entradasada em um sistema atravs da seguinte equao a diferenas:
y(k) + a1 y(k 1) + . . . + ana y(k na ) = b1 u(k 1) + . . . + bnb u(k nb ) + e(k)
(2.13)
Como o termo de rudo e(k) aparece na equao a diferenas, esse modelo classificado como
um modelo de erro na equao, ao contrrio do modelo FIR, onde o erro adicionado diretamente
sada y(k).
Ao se introduzir a notao:
A(q) = 1 + a1 q 1 + . . . + ana q na
e
B(q) = b1 q 1 + . . . + bnb q nb
obtm-se o modelo autoregressivo com entradas externas (ou ARX, do ingls AutoRegressive with
eXogenous inputs):
A(q)y(k) = B(q)u(k) + e(k)
(2.14)
O caso especial em que na = 0 resulta no modelo FIR. O modelo ARX especialmente til
pois permite o uso de mtodos simples porm poderosos de estimao dos parmetros do modelo
(regresso linear).
A principal desvantagem dos modelos ARX a falta de liberdade na modelagem da dinmica do
12
1
B(q)
u(k) +
e(k)
A(q)
A(q)
(2.15)
observa-se que o rudo branco filtrado por um filtro com a mesma dinmica do sistema. Quando esta
no for a representao mais fiel do sistema, o modelo ARMAX, descrito na seo seguinte, pode ser
usado.
2.2.6 ARMAX
possvel adicionar flexibilidade ao modelo ARX ao se descrever a dinmica do rudo como
um processo de mdia mvel. A equao a diferenas desse novo modelo pode ser vista na
equao (2.16):
y(k) + a1 y(k 1) + . . . + ana y(k na ) = b1 u(k 1) + . . . + bnb u(k nb ) + e(k)
+ c1 e(k 1) + . . . + cnc e(k nc )
(2.16)
(2.17)
Assim como o modelo ARX, este um modelo de erro na equao. O modelo ARMAX considerado uma estrutura padro usada em modelagem e controle de sistemas.
Uma variao com um integrador embutido no modelo a representao ARIMAX, onde o I vem
da operao de integrao. O modelo ARIMAX obtido substituindo-se y(k) na equao (2.17) por
y(k) = y(k) y(k 1). Tal variao til na descrio de sistemas com perturbaes lentas [72].
g(i) =
j=1
j j (i)
(2.18)
13
sendo j escalares e j (i) a i-sima funo ortonormal. Ao substituir g(i) da equao (2.18) na
equao (2.11), obtm-se:
y(k) =
=
=
j j (i)u(k
i=0 j=1
X
X
j
j=1
i=0
i)
j (i)u(k i)
j lj (k)
(2.19)
j=1
O sinal lj (k) o resultado da filtragem linear da entrada u(k i) pelo filtro ortonormal carac-
terizado pela funo j . Pode-se truncar o ltimo somatrio da equao (2.19) em um nmero N de
funes ortonormais, obtendo-se assim o modelo linear FBO [14]:
y(k) =
N
X
j lj (k)
(2.20)
j=1
Uma das vantagens deste modelo a possibilidade de se incorporar conhecimento sobre o sistema
na base de funes ortonormais {j }. O efeito imediato a sensvel reduo do nmero de parmetros
do modelo. A seo 3.1 apresentar outras caractersticas e vantagens dos modelos FBO, enquanto a
seo 3.2.3 contextualizar sua aplicao no presente trabalho.
(2.21)
14
(2.22)
l X
m nX
a ,nb
X
cp,mp (n1 , . . . , nm )
p
Y
i=1
y(k ni )
m
Y
i=p+1
u(k ni )
(2.23)
sendo que nessa representao os produtrios so por definio unitrios quando o ndice final
menor que o inicial.
Nesta equao, l o grau de no linearidade da funo F [.], na e nb so os mximos atrasos
considerados da sada e da entrada, respectivamente, e cp,mp so os parmetros escalares que multiplicam os diferentes termos do modelo. Embora esse tipo de representao para a funo F [.]
possibilite o uso de mtodos eficientes de estimao dos parmetros do modelo, persiste um grande
problema que a definio da estrutura do modelo. Nessa tarefa, devero ser estabelecidos os maiores
atrasos na e nb (e nc , em um modelo NARMAX) e o grau de no linearidade l do modelo. A complexidade desta tarefa reside no fato de que para pequenos atrasos e graus de no linearidade o nmero
de parmetros no modelo cresce rapidamente. Este assunto ser abordado na seo 3.1.
(2.24)
15
sendo o termo y1 (t) definido exatamente como na equao (2.10) e os demais termos:
y2 =
..
.
yi =
..
.
...
Como o termo yi(t) nessa expanso contm contribuies de ordem i da entrada u(t), o modelo
de Volterra representa uma generalizao no linear de ordem i da integral de convoluo linear que
caracteriza completamente sistemas lineares invariantes no tempo. A equao (2.25) j supe que o
sistema causal (limite inferior das integrais iguais a zero). A funo gi (1 , . . . , i ) denominada
kernel de Volterra de ordem i, sendo i o grau de no linearidade do sistema. Assim, cada kernel gi
corresponde generalizao de dimenso i da resposta ao impulso de um sistema linear.
O modelo discreto de Volterra obtido substituindo-se as integrais de convoluo pelos somatrios de convoluo. Em uma notao mais compacta, tem-se:
y(k) =
j=1 1
...
X
j
gj (1 , . . . , j )
j
Y
i=1
u(k i )
(2.26)
Assim, embora tenha algumas limitaes, o modelo de Volterra discreto representa uma extenso
simples e lgica dos modelos lineares FIR. Alm disso, sua estrutura conveniente para o desenvolvimento de uma srie de estratgias de controle. A principal limitao dos modelos de Volterra
est relacionada ao elevado nmero de parmetros que devem ser estimados, mesmo para modelos de
baixa ordem e pequeno grau de no linearidade. Uma abordagem para o tratamento desse problema
o desenvolvimento dos coeficientes do modelo em termos de funes de base ortonormal, as quais
sero detalhas na seo 3.1. O uso dessa tcnica permite reduzir a dimenso do modelo mantendo a
sua capacidade de representao [28].
16
pesos, os quais servem para ponderar a entrada recebida por cada n da rede, codificando o conhecimento embutido no modelo [40].
O primeiro modelo de neurnio artificial foi proposto por McCulloch e Pitts em 1943 [75]. Tratase de uma simplificao do que se sabia a respeito do neurnio biolgico naquela poca. A sua
descrio matemtica resultou em um modelo com n terminais de entrada, x1 , x2 , . . . , xn e apenas
um terminal de sada y. A sada y uma funo do somatrio das entradas ponderadas pelos pesos
correspondentes, tal qual indicado na Figura 2.1.
x1 Pw1
PP
P
x2 hh
w2h PPP P
h
hhh f ( x w )
..
i i
.
wn
xn
y
x2
x3
Camada
intermediria
17
Como uma rede neural no linear em seus parmetros, algoritmos especiais de treinamento
devem ser usados. O algoritmo de aprendizado mais conhecido para treinamento de uma rede neural
perceptron multicamadas o backpropagation [10]. A maioria dos mtodos de aprendizado para
redes neurais desse tipo utiliza variaes deste algoritmo.
O backpropagation um algoritmo supervisionado que utiliza pares (entrada, sada desejada)
para, atravs de um mecanismo de correo de erros, ajustar os pesos da rede. O treinamento ocorre
em duas fases, forward e backward, onde cada fase percorre a rede em um sentido.
No contexto de modelagem de sistemas dinmicos, foram j estudadas diversas arquiteturas para
uma rede neural. Em particular, possvel estender os modelos FIR, ARX e ARMAX para os modelos
NNFIR, NNARX e NNARMAX, sendo NN o acrnimo em ingls para rede neural (neural network).
Esses modelos traduzem o fato de as entradas da rede neural serem compostas pelos termos regressores dos respectivos modelos lineares [85].
18
O conceito de dualidade, estabelecendo que algo pode e deve coexistir com o seu oposto, faz a
lgica fuzzy parecer natural, at mesmo inevitvel. Muitas das experincias humanas no podem ser
classificadas simplesmente como verdadeiras ou falsas. Entre a certeza de ser e a certeza de no ser,
existem infinitos graus de incerteza. Esta imperfeio intrnseca informao representada numa
linguagem natural foi tratada matematicamente no passado com o uso da teoria das probabilidades.
Pode-se definir a lgica fuzzy descrevendo a motivao para a sua criao. Necessitava-se de uma
ferramenta capaz de capturar informaes vagas, aproximadas, em geral descritas em uma linguagem
natural e express-las de uma maneira sistemtica. O passo seguinte seria convert-las para um formato numrico, manipulvel por um computador. Outra definio a colocaria como uma lgica que
suporta os modos de raciocnio que so aproximados, ao invs de exatos, como estamos naturalmente
acostumados a trabalhar. Para isso, utiliza-se uma abordagem multivalorada.
Um exemplo com essas caractersticas so as tarefas de tomadas de deciso. Muitas variveis no
so definidas em termos exatos. O uso da lgica fuzzy pode significar minimizao de custos por
facilitar a implementao dessas estratgias ou justificar as aes tomadas.
O controle de processos industriais foi a rea pioneira de utilizao da lgica fuzzy. As primeiras
experincias datam de meados da dcada de 70 ([73] e referncias inclusas). Hoje em dia, uma
grande variedade de aplicaes comerciais e industriais est disponvel, destacando-se neste cenrio
o Japo e, mais recentemente, os EUA e a Alemanha. Dentre os exemplos tpicos incluem-se produtos de consumo, tais como geladeiras (Sharp), ar condicionado (Mitsubishi), cmeras de vdeo
(Canon, Panosonic), mquinas de lavar roupa (Sanyo), aspiradores de p, etc. Na indstria automotiva
destacam-se transmisses automticas (Nissam, Lexus), injeo eletrnica, suspenso ativa e freios
antibloqueantes. Sistemas industriais incluem controle de grupo de elevadores (Hitachi, Toshiba),
veculos autoguiados e robs mveis (Nasa, IBM), controle de motores (Hitachi), ventilao de tneis
urbanos (Toshiba), controle de trfego urbano e controle de partida e parada de metrs (Tkio). Estas
citaes so ilustrativas, pois correntemente j foram anunciadas mais de 1000 patentes envolvendo
lgica fuzzy [107].
Apesar do uso e da aplicao no Brasil ser incipiente, vrias indstrias e empresas vm desenvolvendo produtos e servios utilizando de alguma forma os conceitos fuzzy (Villares, IBM, Klockner &
Moeller, Robertshaw, Yokogawa, HI Tecnologia) [77].
Controladores baseados em lgica fuzzy possuem propriedades interessantes de confiabilidade e
robustez. Sistemas convencionais processam equaes complexas em seqncia. Caso ocorra algum
erro em alguma delas, a discrepncia final obtida pode ser significativa. Devido ao processamento
independente de cada regra do controlador fuzzy, o efeito de um problema intermedirio amortecido.
Isso implica que uma falha parcial do sistema no deteriora a performance do controlador como um
todo.
19
A teoria dos conjuntos fuzzy pode ainda ser usada na modelagem de sistemas dinmicos. Uma
srie de arquiteturas fuzzy foram j demonstradas como aproximadores universais [93]. Isto significa
que so capazes de aproximar qualquer funo contnua em um domnio compacto com qualquer
nvel de preciso desejado.
Alm da propriedade interessante de aproximao universal dos modelos fuzzy, estes ainda adicionam uma nova dimenso informao contida no modelo. Trata-se da dimenso lingstica,
fornecendo descries intuitivas sobre o comportamento do sistema modelado ([32]).
(2.27)
Assim, o valor A(x) indica com que grau o elemento x pertence ao conjunto A [93]. Um grau
de pertinncia 1 equivale ao clssico smbolo de pertinncia enquanto um grau de pertinncia 0
um identificador que pode assumir um dentre vrios valores. Deste modo, uma varivel lingstica pode assumir um valor lingstico dentre vrios outros em um conjunto de termos lingsticos.
Cada termo lingstico caracterizado por uma funo de pertinncia. A expresso lingstica das
variveis tratadas se d atravs de predicados mnemnicos, como erro, temperatura ou variao
da presso. permitido ainda o uso de modificadores qualificadores: pequeno positivo, muito
grande negativo ou aproximadamente zero.
Em princpio, as funes de pertinncia podem ser qualquer funo que produza valores entre 0
e 1. Comumente estas so definidas como triangulares, trapezoidais, sigmides ou gaussianas (como
exibido na Figura 2.3). Funes de pertinncia do tipo singleton tambm so usadas. As FP adotadas
neste trabalho so gaussianas1, descritas pela equao (2.28):
(x )2
A(x) = exp
2 2
1
(2.28)
20
com correspondendo ao centro da FP e sua abertura.
pouco centro
esquerda
esquerda
1
pouco
direita
direita
0.9
0.8
0.7
A(x )
0.6
0.5
0.4
0.3
0.2
0.1
0
5
Posio x
21
se
22
[100], porm este requer um considervel esforo computacional, pois surge em sua definio o
clculo numrico de integrais.
Uma segunda abordagem para a defuzzificao consiste no centro dos mximos [100]. Trata-se
de calcular a mdia ponderada entre os valores de cada termo da varivel lingstica de sada. Tal
mtodo descrito pela equao (2.31), sendo y a sada final do sistema fuzzy, yi a sada intermediria
de cada uma das r regras e wi o peso da i-sima regra [93].
y =
r
X
wi y i
i=1
r
X
(2.31)
wi
i=1
(2.32)
n
Y
As,j (uj )
(2.33)
j=1
Alm disso, o valor de yi na equao (2.31) escolhido como o valor para o qual Bi (yi ) mximo.
Em funes de pertinncia gaussianas ou triangulares, por exemplo, trata-se do valor modal.
Este mtodo atende um requisito essencial em aplicaes em controle, a continuidade [100]. Isso
significa que uma mudana infinitesimal em uma varivel de entrada no causa uma variao abrupta
em nenhuma das variveis de sada.
No modelo fuzzy TS, a base de regras da forma:
se
..
.
2.5 Resumo
23
entrada. Embora na equao (2.34) apaream nas premissas das regras todas as variveis de entrada,
esta no uma exigncia da arquitetura fuzzy TS. Pode ser usado um nmero menor de variveis nas
premissas, por exemplo com o objetivo de diminuir o tamanho da base de regras. O modelo fuzzy TS
combina uma descrio global baseada em regras com uma aproximao local que, no contexto de
identificao de sistemas, normalmente escolhida como um modelo de regresso linear. No caso de
as funes fi serem funes afins, por exemplo, o conseqente da i-sima regra seria da forma:
y = ai,1 u1 + . . . + ai,n un + ai,n+1
(2.35)
O modelo fuzzy TS resultante fcil de se identificar, pois alm de cada regra descrever uma
regio fuzzy na qual as sadas dependem das entradas de forma linear, os parmetros dos conseqentes
ai,1 , . . . , ai,n+1 podem ser facilmente estimados, por exemplo, via mnimos quadrados2.
Como as sadas das regras no esto definidas atravs de termos lingsticos, a etapa de defuzzificao no necessria aps o processo de inferncia fuzzy. A sada final y calculada da
mesma forma que na equao (2.31), com a diferena que o valor de cada yi o resultado direto do
conseqente da i-sima regra.
Assim como apresentado para as redes neurais da seo anterior, modelos fuzzy dinmicos podem
ser construdos ao se adotar como variveis de entrada nos antecedentes das regras as variveis de
regresso de entrada e/ou de sada do sistema real [32, 81].
Na seo 3.2.4 do captulo 3 ser apresentada uma arquitetura mais geral para sistemas fuzzy,
os modelos fuzzy TS Generalizados, nos quais os conseqentes das regras so modelos dinmicos
completos em espao de estados.
2.5 Resumo
O objetivo deste captulo foi descrever em linhas gerais o contexto de modelagem de sistemas
dinmicos, foco do presente trabalho. Inicialmente apresentaram-se as principais propriedades de
modelos matemticos, apontando-se quais destas propriedades esto presentes nos modelos desenvolvidos nesta dissertao. Em suma, tratar-se- de modelos no lineares, discretos, determinsticos,
a parmetros concentrados, invariantes no tempo, no autnomos, paramtricos e monovariveis.
Foram abordados alguns modelos especficos, tanto lineares quanto no lineares. Os modelos
fuzzy, que constituem a base dos modelos analisados neste trabalho, foram estudados mais detalhadamente. O tema do prximo captulo o modelo fuzzy TS com Funes de Base Ortonormal (FBO).
2
Mesmo no caso de modelos locais no lineares nas entradas o mtodo dos mnimos quadrados pode ser usado pois a
sada do modelo continua linear nos parmetros.
24
Ser descrita a arquitetura cujos parmetros de projeto estaro sujeitos otimizao pelo algoritmo
gentico apresentado no captulo 4.
Captulo 3
Modelo Fuzzy TS FBO
O captulo anterior discorreu sobre conceitos bsicos de modelagem de sistemas dinmicos,
apresentando uma srie de modelos lineares e no lineares, com maior nfase nos modelos fuzzy. O
presente captulo analisa com maior profundidade o conceito de Funes de Base Ortonormal (FBO),
introduzido na seo 2.2.7, e apresenta alguns exemplos de modelos baseados neste conceito. dada
maior ateno ao modelo fuzzy TS FBO, proposto originalmente em [89] e foco deste trabalho, resultado da incorporao de Funes de Base Ortonormal nos modelos fuzzy TS. A seo 3.3 explicita
quais parmetros desta arquitetura sero otimizados pelo algoritmo gentico descrito no captulo 4.
Por fim, analisam-se dois modos de estimao dos coeficientes dos conseqentes das regras dos modelos fuzzy TS FBO.
(3.1)
Embora seja possvel o uso de mtodos eficientes de estimao para realizaes particulares do
operador F , este modelo possui a desvantagem de apresentar recurso da sada, alm de uma definio
adequada da estrutura do modelo ser crtica. As funes de base ortonormal, como ser explicado
nesta seo, servem como ferramenta para resolver estes problemas, alm de agregar outras vantagens
na modelagem de sistemas dinmicos.
25
26
possvel reescrever a equao (3.1) conforme a equao (3.2), na qual os termos da sada foram
substitudos ao se utilizar a prpria equao (3.1) de forma recursiva.
y(k) = G[u()]k1
=
(3.2)
Para sistemas com memria finita1 , possvel truncar a representao (3.2) em um nmero de
termos, obtendo [89]:
y(k) = G[u(k 1), . . . , u(k )]
(3.3)
A representao (3.3) uma extenso no linear da resposta ao impulso finita descrita na
seo 2.2.4. Trata-se do desenvolvimento do sinal de entrada u(k) em uma base de funes de transferncia no operador de deslocamento no tempo q 1 , base essa dada pelo conjunto de funes de
transferncia pulsadas definido pela equao (3.4):
NFIR,i (q 1 ) = q i , i = 1, . . . ,
(3.4)
(3.5)
Note-se que as funes de transferncia pulsadas da base (3.4) podem ser escritas de forma
recursiva, ou seja, NFIR,i+1 (q 1 ) = q 1 NFIR,i (q 1 ). O diagrama de blocos do modelo NFIR,
considerando-se a recurso das funes de transferncia de sua base, exibido na Figura 3.1.
u(k) - 1 u(k 1) - 1 u(k 2) - 1 u(k )
q
q
q
..
.
-
y(k)-
Um sistema possui memria finita se o valor de entrada u(k ), para suficientemente grande, no influencia
significativamente a sada y(k) [33].
27
em (3.3) requer um nmero muito maior de termos de regresso () do que aquele requerido pela
representao NARX original em (3.1) para uma mesma preciso, especialmente na representao de
sistemas lentos.
No lugar de utilizar a base dada pelas funes da equao (3.4), possvel adotar as funes de
base ortonormal, as quais tratam os problemas mencionados atravs da incorporao de conhecimento
a priori sobre as dinmicas do sistema na base de funes de transferncia. O efeito imediato a
considervel diminuio do nmero de parmetros no modelo para se alcanar uma dada capacidade
de representao, alm de ser uma arquitetura sem recurso da sada.
As bases de funes ortonormais so completas no espao L2 [0, ) das funes contnuas quadra-
ticamente integrveis em [0, ). Dessa forma, qualquer funo neste espao pode ser representada
com preciso arbitrria por uma combinao linear das funes desta base. Considerando o caso
discreto, isto significa que existe um inteiro positivo n tal que para qualquer > 0 tem-se:
k=0
f (k)
n
X
i=1
i i (k)
!2
<
(3.6)
sendo f (k) uma funo quadraticamente somvel, n o nmero de funes na base ortonormal, i
escalares e i a i-sima funo ortonormal. A aproximao da funo f (k) ser to boa quanto
maior for o nmero de funes ortonormais utilizado, sendo exata para um nmero infinito de funes.
Embora em princpio sistemas com integradores no pertenam ao espao L2 [0, ), uma mudana de
variveis (anlise da variao da sada do sistema, no lugar da sada instantnea) elimina o problema,
permitindo tambm o tratamento desses sistemas.
Assim, da mesma forma que a base (3.4) usada para gerar as entradas do operador no linear
G no modelo NFIR (3.3), as funes de base ortonormal com funes de transferncia FBO,i (q 1 )
geram os sinais [89]:
li (k) = FBO,i(q 1 )u(k)
(3.7)
(3.8)
Cada sinal li corresponde convoluo entre a entrada u e a i-sima funo da base ortonormal
i . Visto de outra forma, resultado da filtragem da entrada u pelo filtro ortonormal FBO,i [14]. A
Figura 3.2 exibe o diagrama de blocos para o modelo FBO.
As funes de base ortonormal tm sido aplicadas com sucesso nas tarefas de modelagem e controle de sistemas dinmicos ([14, 16, 83, 89, 108, 113] e referncias inclusas). O modelo dinmico
28
u(k)
- FBO,1
l1 (k) -
- FBO,2
l2 (k) -
..
.
- FBO,n
y(k)
-
ln (k) -
29
n1
1 p2
q 1 (q 1 p)
(1 pq 1 )n
n = 1, . . . ,
(3.9)
cz 2 + b(c 1)z + 1
1 c2 (z b)
Kau,n (z) = 2
z + b(c 1)z c z 2 + b(c 1)z c
q
"
#n1
, para n mpar
#n1
para n par
(3.10)
sendo b = ( + )/(1 + ) e c = .
Modelos baseados em funes ortonormais admitem a seguinte representao em espao de estados [16, 89]:
l(k + 1) = A l(k) + b u(k)
y(k) = H(l(k))
(3.11)
sendo l(k) = [l1 (k) . . . ln (k)]T o vetor de estados ortonormais2. possvel incorporar ainda ao mo2
Como afirmado anteriormente, os termos li (k) so na verdade o resultado da filtragem da entrada u pelo filtro
30
delo FBO da equao (3.11) qualquer informao a priori sobre o atraso de transporte do sistema,
substituindo nesta equao u(k) por u(k ), sendo o atraso conhecido [14]. Assim, possvel
reduzir ainda mais o nmero de parmetros no modelo atravs da respectiva reduo do nmero de
funes ortonormais necessrias para determinada preciso.
A =
b =
p
1 p2
(p)(1 p2 )
..
.
0
p
1 p2
..
.
0 ... 0
0 ... 0
p ...
.. . .
.
.
(p)n2 (1 p2 ) (p)n3 (1 p2 )
1 p2
1 p (p)2 . . . (p)n1
0
..
.
... p
i
(3.12)
(3.13)
sendo p o plo de Laguerre. Para a representao em espao de estados da base de Kautz, consultar
[113].
Escolhida a base de funes ortonormais, os tipos diferentes de modelos FBO so determinados
pelo operador H da equao (3.11). A seo seguinte apresenta possveis escolhas para este operador,
(3.14)
sendo o vetor de parmetros livres a ser estimado e (k) um vetor de dados funo dos estados ortonormais l(k), comumente denominado vetor de regressores [3]. Os parmetros destes modelos podem ser estimados eficientemente atravs do mtodo de mnimos quadrados, detalhado na
seo 3.4.
ortonormal FBO,i . Assim, esta a interpretao correta para a expresso estado ortonormal usada no decorrer de todo
o texto.
31
(k) =
"
l(k)
1 l1 (k) . . . ln (k)
iT
(3.15)
O vetor de parmetros possui ento dimenso igual ordem do modelo mais um, n + 1.
n
X
j=1
j lj (k) +
j
n X
X
(3.16)
j=1 i=1
32
(3.17)
fuzzy apresentado na seo 2.4.3. Mais especificamente, adotam-se como variveis de entrada do sistema fuzzy TS os prprios estados ortonormais li (k). Dessa forma, a base de regras da equao (2.34)
reescrita como:
se
..
.
y(k) =
r
X
wi (l(k))yi
i=1
r
X
(3.19)
wi (l(k))
i=1
O vetor de dados (k) para este modelo depende da escolha para as funes fi (.) de cada modelo
local. Como exemplo, caso sejam adotadas funes afins do tipo:
y = ai,1 l1 + . . . + ai,n ln + ai,n+1
(3.20)
Pr
i=1
(3.21)
33
parmetros consiste nos coeficientes ai,j das funes afins nos conseqentes das regras (3.20):
= [a1,1 a1,2 . . . a1,n+1 . . . ar,1 . . . ar,n+1 ]T
(3.22)
Os modelos locais afins, a menos da constante ai,n+1 , so lineares. possvel utilizar tambm
modelos locais no lineares, como os modelos de Volterra de segunda ordem. Neste caso, basta
utilizar a expresso (3.16) nos modelos locais.
O nmero de parmetros livres a serem estimados por mnimos quadrados para o modelo fuzzy
TS FBO calculado como a soma da quantidade de parmetros de cada modelo local. A frmula
para modelos afins a mesma da seo 3.2.1 e para modelos de Volterra de segunda ordem a da
seo 3.2.2. O nmero total de regras r calculado considerando uma base de regras completa, isto
, que contm tantas regras quantas so as combinaes entre as funes de pertinncia de todas as
variveis de entrada do modelo. Assim, caso a i-sima varivel de entrada possua mi funes de
pertinncia associadas a ela, o nmero total de regras do modelo, considerando uma base de regras
completa, :
r=
n
Y
mi
(3.23)
i=1
Modelos fuzzy TS FBO foram aplicados com sucesso nas tarefas de modelagem [13] e controle
[14] de sistemas dinmicos, fornecendo resultados melhores (em termos de melhor aproximao com
menor nmero de parmetros) que modelos lineares FBO ou Volterra FBO. No entanto, nestes trabalhos a seleo da estrutura dos modelos e de alguns parmetros livres foi realizada de modo emprico,
sem a aplicao de mtodos de otimizao bem consolidados na literatura. A distribuio das funes
de pertinncia no universo de discurso, por exemplo, era feita de forma homognea, com centros
igualmente espaados e larguras iguais s distncias entre centros consecutivos [16, 39]. Alm disso,
determinava-se o plo de Laguerre atravs da observao da resposta do sistema a uma entrada em
geral do tipo degrau. Aps se avaliar qual seria aproximadamente a dinmica dominante do sistema,
realizava-se uma busca iterativa discreta em torno desta regio.
Tais metodologias, apesar de fornecerem solues que demonstraram a superioridade das arquiteturas e mtodos propostos, ainda eram passveis de uma maior otimizao, com o acrscimo de algum
esforo computacional [13, 15, 16]. O presente trabalho foca essa otimizao dos modelos fuzzy TS
FBO. Os parmetros do modelo que sero otimizados so apresentados na seo 3.3 e o mtodo de
otimizao proposto descrito no captulo 4. No captulo 5 realiza-se uma anlise comparativa entre
essas metodologias no automticas e a abordagem aqui proposta.
34
ento
(3.24)
li (k + 1) = Ai li (k) + bi u(k)
yi (k)
= fi (li (k))
sendo Ai e bi parametrizados por um plo pi , fornecendo o vetor de estados li (k), fi (li (k)) o i-simo
mapeamento esttico que gera i-sima sada yi (k) do respectivo modelo local e 1 (k), . . . , n (k) as
variveis das premissas das regras, obtidas segundo a equao (3.25).
(k + 1) =
r
X
wi ((k))li (k + 1)
i=1
r
X
(3.25)
wi ((k))
i=1
sendo (k) = [ 1 (k) . . . n (k) ]T . Os pesos wi ((k)) correspondem ao nvel de ativao da i-sima
regra, computados atravs da aplicao da t-norma adotada (ver seo 2.4.3). Seguindo o mesmo
35
y(k) =
r
X
wi ((k))yi (k)
i=1
r
X
(3.26)
wi ((k))
i=1
Assim como no modelo fuzzy TS FBO, caso os modelos locais fi (li (k)) de cada regra em (3.24)
sejam lineares nos parmetros, ento o modelo Generalizado tambm o ser, e novamente mtodos
eficientes de estimao podero ser aplicados.
Para demonstrar que o modelo fuzzy TS FBO Generalizado realmente uma generalizao do
modelo fuzzy TS FBO apresentado na seo 3.2.3, basta fazer com que os plos pi de cada modelo
em espao de estados em (3.24) sejam iguais. Dessa forma, a partir da equao (3.25), (k) = li (k),
para i = 1, . . . , m. Assim, os modelos locais passam a compartilhar o mesmo vetor de estados
ortonormais, e a sada final do modelo (3.26) recai no caso do modelo fuzzy TS FBO (3.19).
Foi demonstrado em [14, 15, 16] que os modelos fuzzy TS FBO so capazes de aproximar com
preciso arbitrria sistemas dinmicos no lineares discretos que sejam causais, invariantes no tempo,
sem descontinuidades, com memria finita e entrada limitada em um intervalo fechado. A demonstrao est baseada na capacidade de aproximao universal dos modelos fuzzy e de modelos de
Volterra.
Esta dissertao est focada nos dois ltimos modelos, fuzzy TS FBO e fuzzy TS FBO Generalizado. Trata-se da incorporao de um mtodo de otimizao na etapa de definio da estrutura
destes modelos. A prxima seo define o escopo do mtodo proposto.
36
Plo real ou complexo da base de funes ortonormais, o qual gera a matriz A, o vetor b e
assim o vetor de estados ortonormais l(k);
Nmero n de estados nos modelos locais. Como os estados so definidos por uma mesma base
de funes ortonormais, este nmero mantido fixo para todos os modelos locais;
Nmero de estados nas premissas das regras (nmero de variveis de entrada). Embora nos
desenvolvimentos anteriores tenha ficado implcito que este nmero seria igual ao nmero de
estados nos modelos locais, como afirmado na seo 2.4.3 pode ser usado um nmero menor
de estados nas premissas das regras;
ndice dos estados nas premissas das regras. Alm de definir quantas variveis de entrada
existiro no sistema, o mtodo escolhe quais seriam as mais adequadas dentro do conjunto de
estados;
Nmero de funes de pertinncia por varivel de entrada. Neste caso, possvel determinar
nmeros distintos de funes de pertinncia para variveis de entrada distintas;
Configurao de cada funo de pertinncia. Como ser justificado na seo 4.4.1 do captulo 4,
as funes de pertinncia adotadas para os modelos fuzzy so gaussianas, parametrizadas em
dois parmetros: sua abertura e centro. Ambos so definidos automaticamente pelo AG.
Como est sendo suposto o uso de uma base de regras completa, o nmero de regras do modelo
fuzzy ser dado pela equao (3.23), considerando o nmero de estados nas premissas das regras e o
nmero de funes de pertinncia em cada estado definidos pelo AG.
Para o modelo fuzzy TS FBO Generalizado, os seguintes parmetros so definidos pelo AG:
Plos reais ou complexos de cada modelo local;
Nmero de estados nos modelos locais. Como agora os modelos locais so parametrizados em
plos distintos, o nmero de estados de cada modelo local otimizado de forma independente;
ndice dos estados nas premissas das regras. Embora o nmero de estados nas premissas das
regras seja uma entrada do AG, o mtodo fornece o conjunto de estados mais adequados;
Configurao de cada funo de pertinncia, tambm gaussiana.
A seo 4.4.1 apresentar as justificativas para a otimizao de menos parmetros livres no modelo
fuzzy TS FBO Generalizado. Em suma, os argumentos sero baseados na complexidade da tarefa de
se otimizar toda a arquitetura deste modelo, alm de ser possvel o uso de alguma informao a
37
priori sobre as caractersticas do sistema sendo modelado (como o nmero de regies de operao
esperado).
Alm destes parmetros otimizados pelo AG, restam ainda todos os coeficientes dos modelos
locais. Como afirmado anteriormente, estes parmetros podem ser estimados usando o mtodo dos
mnimos quadrados. A seo seguinte apresenta tal mtodo e analisa duas opes possveis de sua
aplicao. A primeira, estimao global, ser usada em ambas arquiteturas propostas. J a segunda,
estimao local, ser aplicada apenas no modelo fuzzy TS FBO Generalizado.
(3.27)
Para tal, supe-se que seja feito um conjunto de N medidas da sada y(k), fornecendo o vetor y,
correspondentes a N vetores (k), agrupados na matriz = [1 (k) 2 (k) . . . N (k)]T . Assim:
+
y =
(3.28)
N
X
i=1
(i)2 = kk2
(3.29)
(3.30)
38
i
i
(3.31)
Os vetores i (k) que formam a matriz i so definidos ligeiramente diferentes para a estimao
local, j que agora cada modelo local possui um conjunto especfico de estados ortonormais. Considerando modelos locais lineares para manter a simplicidade na anlise, para a i-sima regra tm-se:
i (k) = [1 lTi ] = [1 li1 (k) li2 (k) . . . lin (k)]
3
(3.32)
3.5 Resumo
39
wj
j = X
m
wi
(3.33)
(3.34)
i=1
e os termos wj correspondendo ao peso da j-sima regra, calculados de acordo com a t-norma adotada.
Alm das diferenas entre estimao global e local discutidas anteriormente, outro aspecto relevante a complexidade dos clculos das matrizes inversas nas equaes (3.30) e (3.31). No primeiro
caso, tm-se um problema de complexidade O([r(n + 1)]3 ) enquanto a estimao local representa
uma complexidade menor, O(r(n + 1)3 ) [11, 52, 36]. Para modelos fuzzy TS FBO Generalizados
com um nmero de regras (modelos locais) r elevado, a estimao global pode demandar um elevado
esforo computacional.
O captulo 5 apresenta os resultados obtidos utilizando-se tanto a estimao local quanto a global
na tarefa de modelagem de um sistema levitador magntico. Naquela ocasio ser discutido o desempenho de cada um dos mtodos dentro da arquitetura proposta neste trabalho.
3.5 Resumo
Este captulo primeiramente detalhou o conceito de Funes de Base Ortonormal, explicitando
o conjunto de vantagens ao se utilizar essa metodologia em modelagem de sistemas dinmicos. Em
particular, foram apresentadas as bases de Laguerre e de Kautz.
Em seguida discutiu-se brevemente os modelos FBO Linear e de Volterra, e mais apuradamente os
modelos fuzzy TS FBO e fuzzy TS FBO Generalizado, os quais constituem o foco do presente trabalho.
Para estes modelos, foram listados os parmetros de projeto que sero definidos e otimizados de forma
autnoma.
Por ltimo, descreveram-se duas formas de estimao dos coeficientes dos conseqentes das regras dos modelos fuzzy: estimao global, mais adequada nas tarefas que envolvem predio, por
permitir em geral uma melhor aproximao da funo desejada; e local, que permite interpretao
local dos modelos locais, sendo til tambm na anlise e validao dos modelos.
O prximo captulo detalha o mtodo usado para a otimizao dos parmetros livres de projeto da
arquitetura apresentada neste captulo.
40
Captulo 4
Projeto de Sistemas Fuzzy TS FBO utilizando
Algoritmos Genticos
A computao evolutiva constituda pelos mtodos computacionais inspirados na teoria da
evoluo natural das espcies. Tais mtodos so baseados em uma populao de indivduos sujeitos
a avaliao, modificaes e seleo. As instncias dos algoritmos fundamentados em princpios evolutivos so chamadas de algoritmos evolutivos. Historicamente, os algoritmos evolutivos incluem as
tcnicas de estratgias evolutivas, programao gentica e algoritmos genticos.
Os algoritmos genticos foram desenvolvidos por Holland no incio dos anos 60 [45]. Originalmente, foram projetados como um sistema formal para adaptao, e no otimizao. Suas caractersticas bsicas eram a forte nfase em recombinao (crossover), uso de um operador de seleo probabilstico e a interpretao da mutao como um operador secundrio. Embora em sua forma original
os algoritmos genticos representassem solues atravs de cadeias binrias, um grande nmero de
variantes foi desenvolvido para ampliar o mbito de aplicaes do algoritmo.
Este captulo descreve a tcnica dos algoritmos genticos e a arquitetura elaborada para o projeto automtico do sistema Fuzzy TS FBO. Em cada seo, a partir da seo 4.4, detalha-se uma
caracterstica ou componente dos algoritmos genticos de um modo geral e ento a sua configurao
especfica na metodologia ora proposta.
42
sucedem, formando uma populao final mais adequada, ou adaptada, ao ambiente em questo.
At meados do sculo XIX, os naturalistas acreditavam que cada espcie havia sido criada separadamente por um ser supremo ou atravs de gerao espontnea. O trabalho do naturalista Carolus
Linnaeus sobre a classificao biolgica de organismos despertou o interesse pela similaridade entre
certas espcies, levando a acreditar na existncia de uma certa relao entre elas. Outros trabalhos influenciaram os naturalistas a favor da teoria da seleo natural, tais como os de Jean Baptiste
Lamark, que sugeriu uma teoria evolucionria baseada no uso e desuso de rgos; e de Thomas
Robert Malthus, que props que fatores ambientais tais como epidemias e carncia de alimentos
limitavam o crescimento de uma populao.
Depois de mais de 20 anos de observaes e experimentos, Charles Darwin apresentou em 1858
sua teoria de evoluo atravs de seleo natural, simultaneamente ao naturalista ingls Alfred Russel
Wallace. No ano seguinte, Darwin publicou o seu On the Origin of Species by Means of Natural
Selection com a sua teoria completa [21].
Este trabalho influenciou no apenas as reas de Biologia, Botnica e Zoologia, mas tambm teve
grande impacto sobre o pensamento religioso, filosfico, poltico e econmico da poca. A teoria
da evoluo e a computao nasceram praticamente na mesma poca: Charles Babbage, um dos
fundadores da computao moderna e amigo pessoal de Darwin desenvolveu sua mquina analtica
em 1833.
Por volta de 1900, o trabalho de Gregor Mendel, desenvolvido em 1865, sobre os princpios
bsicos de herana gentica, foi redescoberto pelos cientistas e tambm influenciou as pesquisas
relacionadas evoluo. A moderna teoria da evoluo combina os fundamentos da gentica de
Mendel com as idias de Darwin e Wallace sobre a seleo natural, criando o princpio bsico de
Gentica Populacional: a variabilidade entre indivduos em uma populao de organismos que se
reproduzem sexualmente produzida pela mutao e pela recombinao gentica.
Os princpios de Darwin procuram explicar a biodiversidade a partir de uma proposta inicial para
sobrevivncia de genes - a formao de indivduos ou fentipos - e um processo de mudanas graduais
que adaptam e transformam os indivduos de acordo com as exigncias ambientais. O modelo ressalta
o fato de que os indivduos mais aptos iro, provavelmente, sobreviver por um perodo de tempo mais
longo e deixaro uma herana gentica mais intensa na populao. A evoluo dita darwiniana
um modelo de aproximao gradual para evoluo - no permite saltos evolucionrios ou macromutaes. No paradigma darwiniano o principal mecanismo operacional da transferncia gentica
a reproduo sexuada.
A reproduo sexuada uma estratgia de constituio de novos indivduos com, pelo menos,
dois indivduos compartilhando seus genes na formao da descendncia. Esse tipo de reproduo
ocorre em dois contextos:
43
44
A n-sima gerao possui pelo menos um indivduo que seguramente satisfaa a soluo do
problema, sendo n um nmero menor que a quantidade mxima de geraes fixada para o
algoritmo gentico;
O melhor indivduo da populao se repete por um nmero pr-estabelecido de vezes. Esta
situao caracteriza o encerramento do algoritmo por estagnao do melhor indivduo;
A mdia da adaptabilidade da populao no se altera por um determinado nmero de geraes.
Este caso chamado de encerramento por estagnao da evoluo da populao;
A diversidade da populao atinge um limite inferior indicando convergncia.
A prxima subseo discute a importncia da definio adequada dos diversos parmetros envolvidos durante a aplicao de algoritmos genticos. A seguinte cita alguns exemplos de aplicaes
promissoras ou j bem-sucedidas dessa tcnica.
45
4.2.2 Aplicaes
Solues adaptativas so normalmente requeridas em sistemas que atuam em um ambiente dinmico. Sistemas adaptativos, ou evolutivos, tentam resolver problemas acumulando conhecimento
sobre eles e utilizando estas informaes para gerar solues razoveis. reas comuns de aplicao
so: configurao de sistemas complexos, alocao de tarefas, seleo de rotas e outros problemas de
otimizao.
Para a definio inequvoca do escopo de aplicao dos algoritmos evolutivos necessria a introduo dos conceitos de mtodos fortes e mtodos fracos [79]. Os mtodos fortes so aqueles
concebidos para resolverem problemas genricos mas desenvolvidos para atuarem em um ambiente
especfico, bem determinado, onde esto presentes caractersticas como linearidade, estacionariedade,
diferenciabilidade e/ou continuidade. Uma classe ainda mais restrita so os mtodos especficos, elaborados para resolverem problemas especficos em ambientes tambm especficos.
Por outro lado, os mtodos fracos so concebidos para serem aplicados a problemas genricos em
ambientes tambm genricos, ou seja, no requisitando as caractersticas existentes para os mtodos
fortes. Embora no garantam a obteno da soluo tima do problema sendo abordado, geralmente
46
fornecem uma boa aproximao para essa soluo, em tempo de execuo computacional compatvel
com a necessidade do problema.
Os mtodos fracos, que englobam as tcnicas evolutivas, devem ser aplicados apenas quando no
existem mtodos fortes ou especficos efetivos para o problema em questo. A tarefa do projeto
automtico de um sistema fuzzy, que representa o enfoque central do presente trabalho, uma rea
potencial de aplicao para os mtodos fracos, em especial para os algoritmos evolutivos, o que
corroborado pelo volume de pesquisa nessa rea (ver seo 4.3.1).
Segue uma listagem de algumas aplicaes dos algoritmos genticos:
Controle de sistemas dinmicos [62, 54, 118];
Sntese de circuitos analgicos: para determinadas entradas e sadas, o algoritmo gentico gera
a topologia , o tipo e o valor dos componentes do circuito [60];
Sntese de protocolos de comunicao: determinao de quais funes do protocolo devem ser
implementadas em hardware e quais devem ser implementadas em software para que o melhor
desempenho seja alcanado [69];
Gerenciamento de redes: superviso do trfego nos links e das filas nos buffers de roteadores
para descobrir rotas timas e para reconfigurar as rotas existentes no caso de falha de algum
link [42];
Otimizao evolutiva multi-critrio: otimizao de funes com mltiplos objetivos que sejam
conflitantes [25];
Problemas de otimizao complexos. Casos tpicos so problemas de alocao, localizao,
roteamento de veculos e o problema do caixeiro viajante, todos com grande potencial de aplicao na rea de logstica [8, 63].
Cincias biolgicas: modelagem de processos biolgicos para o entendimento do comportamento de estruturas genticas [59];
Definio da arquitetura de redes neurais [49, 101, 110].
Determinao e otimizao dos componentes de sistemas fuzzy (ver referncias na seo 4.3.1);
Como foi afirmado na seo 3.3 do captulo 3, o tema desta dissertao relaciona-se (porm no
restrito) ao ltimo item da listagem anterior, considerando no entanto sistemas fuzzy TS baseados
em funes de bases ortonormais. A seo seguinte dedicada a uma descrio mais detalhada dessa
rea de pesquisa.
47
48
reviso sucinta da evoluo das pesquisas envolvendo os chamados Genetic Fuzzy Systems - GFS
[17, 18].
(4.1)
Alm disso, a base de regras completa do sistema do tipo Mamdani e os ganhos proporcional
e integral dos controladores foram tambm obtidos com o algoritmo gentico. A aplicao foi um
49
50
rais usando AG e teorias de sistemas fuzzy. Testa-se o sistema em um conjunto de dados simulados e
na previso do comportamento dos mercados de aes de Taiwan e da Malsia. Em ambos os casos,
os resultados obtidos so melhores que aqueles fornecidos por um modelo ARIMA.
Semelhantemente ao trabalho de Homaifar e McCormick [47], Wu e Liu desenvolveram em 2000
[116] um AG que otimiza as FP triangulares de entrada e a base de regras completa de um controlador fuzzy do tipo Mamdani. As melhorias no mtodo referem-se a uma maior flexibilidade no
desenvolvimento do sistema fuzzy, atravs da incluso de um nmero maior de parmetros de projeto
no algoritmo gentico. Outras caractersticas so uma codificao com nmeros reais, o uso do operador de crossover convexo, de mutao no-uniforme e seleo por rank. A aplicao tambm em
um sistema de controle de posicionamento.
Delgado et al. introduziram um sistema gentico-fuzzy hierrquico em 2001 [22]. A arquitetura conta com o uso do mtodo dos mnimos quadrados para a estimao (local ou global) dos
conseqentes no lineares de modelos TS, alm de um procedimento de poda para a eliminao de
redundncia nas regras. Testa-se o sistema em problemas de classificao e aproximao de funes.
Em 2002, Delgado et al. deram continuidade ao trabalho [25]. Um sistema gentico-fuzzy gera autonomamente todo um sistema classificador, desde a forma e quantidade de funes de pertinncia
das variveis de entrada at a base de regras. Uma arquitetura hierrquica usada, formada por um
conjunto de populaes sujeitas a um processo de co-evoluo. Implementa-se uma otimizao multicritrio (considerando acurcia, interpretabilidade, simplicidade e autonomia) baseada em algoritmos
genticos.
Em 2004 foi publicado um artigo por Cordn et al. [18] retratando o estado da arte da pesquisa
em sistemas gentico-fuzzy. So descritas as principais arquiteturas j propostas, as aplicaes j realizadas e as novas tendncias nessa rea. Uma anlise crtica da importncia dos algoritmos genticos
durante o projeto de sistemas fuzzy efetuada, levantando aspectos como as diferentes abordagens
possveis (com maior ou menor grau de autonomia no projeto), as poucas alternativas existentes e a
necessidade de formalizao de um mtodo de avaliao de desempenho de um GFS. Em seguida so
apresentadas algumas questes que ainda permanecem em aberto, incitando a pesquisa contnua para
a melhoria do desempenho das arquiteturas atuais bem como para a criao de outras novas.
Algumas publicaes recentes esto focadas na aplicao de sistemas gentico-fuzzy dentro de um
contexto maior, no sendo estes os destaques maiores da pesquisa cientfica. Dessa forma, relata-se a
aplicao de diversas configuraes dos GFS como parte de sistemas complexos, os quais abordam,
por exemplo, pr-processamento de dados em sistemas de potncia [58] ou controle multi-agente de
manipuladores robticos [30]. Neste ltimo caso, um sistema de controle fuzzy do tipo Mamdani
operado por 3 agentes independentes. Trata-se do controle de um rob com a tarefa de interagir com
um humano. So ponderados para a avaliao do desempenho do controlador o tempo de atuao, o
51
52
0 1
0 0
4 9
12 B
5 2
53
Relata-se ainda o uso de representaes com valores reais, atravs de permutaes ou por meio
de rvores hierrquicas [6]. Mesmo a representao binria apresenta a variante de se adotar o cdigo
Gray [6]. A escolha pela representao a ser utilizada dependente da natureza do problema em
estudo. Alm disso, os operadores genticos, abordados na seo 4.7, tambm esto intrinsecamente
conectados ao tipo de representao adotada.
A primeira populao de indivduos normalmente criada de maneira aleatria. recomendado
apenas o cuidado para que seus indivduos tenham uma ampla representatividade no domnio do
problema em estudo. Em caso contrrio, corre-se o risco do processo de busca paralisar em um
ponto de mximo local, em um problema de maximizao, ou mnimo local, em um problema de
minimizao, fornecendo assim um resultado indesejvel para a soluo global do problema.
Um importante fator a ser considerado durante a elaborao da representao cromossmica
a manuteno da validade dos indivduos durante o processo evolutivo. Idealmente, aps a criao
da populao, todos os operadores genticos devem manter a validade de um indivduo, no sentido
de que este continue representando uma soluo factvel do problema. Caso tal factibilidade possa
vir a ser violada, algum procedimento deve ser executado para corrigir, ou eliminar, o indivduo
problemtico. Uma primeira opo aplicar um mtodo de verificao e correo em cada indivduo
aps a atuao dos operadores de reproduo. Obviamente, a etapa corretiva pode demandar alto custo
computacional, devendo ser postergada o mximo possvel. A segunda opo a implementao de
uma funo de penalizao dos indivduos que representam solues infactveis. Tal funo deve
ser cuidadosamente elaborada para que no faa com que o algoritmo gentico fornea, ao final do
processo evolutivo, solues simplesmente factveis, sem a otimizao do critrio de desempenho
(ver seo 4.5).
Quando o contexto no for suficiente para distinguir as duas arquiteturas, falar-se- em fuzzy TS FBO com plo
nico referindo-se arquitetura descrita na seo 3.2.3 para diferenci-la da arquitetura fuzzy TS FBO Generalizado,
descrita na seo 3.2.4.
54
3. Parmetros que no tenham uma quantidade fixa pr-determinada (como o nmero de estados nas premissas das regras) possuem certo grau de liberdade para aumentar ou diminuir seu
nmero;
4. Restries de integridade sejam automaticamente preservadas, ou facilmente passveis de correo, durante a aplicao dos operadores genticos;
5. A representao no seja esparsa.
Em ambas as representaes descritas a seguir, preciso representar plos complexos que definem
a dinmica de estados de um modelo. Adota-se uma representao em coordenadas cartesianas, para
se atender ao primeiro requisito anteriormente definido e dispensar a converso entre coordenadas
(polar para cartesiana) em cada avaliao de fitness. No entanto, na populao inicial os plos so gerados em coordenadas polares e so garantidamente estveis ( contidos no interior do crculo unitrio).
Seus valores em coordenadas cartesianas so ento trivialmente obtidos.
As funes de pertinncia dos termos lingsticos so escolhidas como gaussianas, parametrizadas
por dois valores: seu centro e sua abertura. Essa escolha no crtica uma vez que tem sido confirmado que a maior importncia na definio das parties das variveis de entrada de sistemas fuzzy
reside na disposio e grau de sobreposio das funes de pertinncia2 , e no propriamente em seu
formato (se gaussiana, triangular ou trapezoidal) [93]. Espinosa et al. exibem um estudo no qual
concluem que modelos fuzzy TS com funes de pertinncia gaussianas geram interpolaes no lineares das vizinhanas dos modelos locais [32]. Esses modelos apresentam melhores resultados em
uma srie de exemplos de aproximao de funes, comparados a modelos utilizando funes de pertinncia triangulares ou polinomiais. De fato, a maioria dos resultados de aproximao universal em
sistemas fuzzy assume o uso de funes de pertinncia gaussianas [14, 39, 61, 115].
A arquitetura aqui proposta permite ainda duas interpretaes para a codificao das funes de
pertinncia. Na primeira, os valores de seus centros so absolutos. Na segunda, as posies de seus
centros so relativas. Apenas o valor do centro da primeira funo de pertinncia absoluto. A partir
da segunda, o valor real do centro obtido somando-se seu valor de centro a todos os anteriores, ou
seja, o parmetro centro define a distncia entre os centros de funes de pertinncia vizinhas. Essa
implementao possibilita o controle do grau mnimo ou mximo de sobreposio entre as funes de
pertinncia de forma trivial, bastando para isso impor esses limites diretamente aos respectivos genes
do cromossomo. Claramente, o controle das aberturas (ou larguras) das funes de pertinncia pode
ser feito independentemente da interpretao dada a seus centros.
2
Esta tarefa pode ser associada definio de uma moldura cognitiva, a qual composta por vrios conjuntos fuzzy
normais usados como pontos de referncia para o processamento de informaes fuzzy [93]. As propriedades mais importantes relativas s molduras cognitivas, como especificidade e foco de ateno, no fazem meno ao tipo de funo
de pertinncia utilizada.
55
Esta segunda interpretao (posio relativa dos centros) uma opo natural da arquitetura proposta, porm a tcnica das medidas de similaridades, descrita na seo 4.9, alm de um mtodo
eficiente no controle da sobreposio entre funes de pertinncia, um mecanismo de simplificao
de modelos fuzzy. Sendo assim, a primeira interpretao apresentada ser adotada neste trabalho.
A inicializao de todos os parmetros codificados na populao feita segundo uma distribuio
uniforme, j que em princpio no h informaes sobre regies do espao de busca probabilisticamente mais promissoras, onde se poderia, por exemplo, centrar Gaussianas (ver seo 4.7.1).
Uma varivel aleatria com distribuio uniforme em um intervalo [a, b] tal que todo nmero
nesse intervalo possui a mesma probabilidade de ocorrncia. Dessa forma espera-se que a inicializao da populao seja representativa de todo o espao de busca, desde que, para cada parmetro
sendo otimizado, sejam estipulados os limites a e b de seus universos. Esta etapa depende do problema sendo tratado e do conhecimento sobre as ordens de grandeza dos parmetros codificados no
algoritmo gentico. Como exemplo, a deciso pela inicializao das partes real e imaginria dos plos dos modelos fuzzy TS FBO estabelece o intervalo [0, 1]. Para a parte real do plo, a justificativa
para se trabalhar apenas no semiplano direito do crculo unitrio3 que no existe sistema equivalente contnuo para sistemas discretos (como o caso) com plos no semiplano esquerdo do plano
complexo z. Em relao parte imaginria do plo, como este sempre complexo conjugado (base
de Kautz) basta representar o semiplano superior, pois o semi plano inferior um espelho [41].
Descreve-se a seguir a representao para o modelo fuzzy TS FBO com plo nico e em seguida
para o modelo Generalizado.
Representao para o modelo fuzzy TS FBO com plo nico
Para essa arquitetura, os modelos locais so parametrizados no mesmo plo complexo, ou seja,
possuem a mesma dinmica de estados. O que diferencia cada modelo local so as relaes estticas
desses estados. A arquitetura proposta mais flexvel que no caso do sistema fuzzy TS FBO Generalizado, descrito adiante nesta seo, no sentido de que permite maior autonomia no projeto do modelo
fuzzy. Primeiramente no necessria a informao a priori da quantidade de modelos locais a ser
obtida. Em adio, permitido ao algoritmo variar o nmero de funes de pertinncia por varivel
de entrada, alm de variar o prprio nmero de variveis de entrada (estados). O nmero de estados
presentes nos conseqentes das regras tambm otimizado. A representao matricial elaborada
facilmente interpretvel.
A Figura 4.3 ilustra o cromossomo elaborado para a representao em questo. Trata-se de uma
matriz com valores reais e inteiros. As nicas informaes que devem ser previamente fornecidas
ao algoritmo gentico so os nmeros mximos de variveis de entrada (estados) e de funes de
3
56
11
12
13
..
.
11
12
13
..
.
21
22
23
..
.
21
22
23
..
.
..
.
maxvl 1
maxvl 2
maxvl 3
..
.
maxvl 1
maxvl 2
maxvl 3
..
.
1maxtl
1maxtl
2maxtl
2maxtl
maxvl maxtl
maxvl maxtl
Figura 4.3: Representao cromossmica para o modelo fuzzy TS FBO com plo nico.
Na Figura 4.3, o plo de Kautz representado pelos parmetros e (coordenadas cartesianas,
da forma j), na primeira coluna da matriz. Na seqncia das colunas, cada par representa o
conjunto de funes de pertinncia associadas respectiva varivel de entrada. Dessa forma, a segunda e terceira colunas codificam as funes de pertinncia da primeira varivel de entrada, sendo
as aberturas determinadas pelos parmetros ij e os centros por ij , com os ndices i e j referenciando
a varivel de entrada e o termo lingstico, respectivamente. Os limites mximos para essas quantidades so, respectivamente, maxvl e maxtl . O nmero de estados nos conseqentes das regras
determinado pelo parmetro k (nmero comum de estados em todos os modelos locais).
Nesta representao cromossmica deve-se observar alguns aspectos. Primeiramente, uma varivel deve possuir ao menos dois termos lingsticos (funes de pertinncia) para que sua existncia
seja justificada. Assim, caso em algum momento do processo de otimizao reste apenas um termo
lingstico para determinada varivel, este termo deve ser excludo, assim como a respectiva varivel.
Esta ao tomada pois uma varivel com um nico termo lingstico pode ser tida como o prprio
universo de discurso, no representando uma partio significativa. Outra condio que deve ser
satisfeita que o nmero k de estados nos conseqentes das regras no seja inferior quantidade de
variveis (estados) nas premissas das regras. Embora sejam permitidas at maxvl variveis de entrada,
um cromossomo pode exibir um nmero menor (as duplas de colunas correspondentes s variveis
inexistentes so nulas). O parmetro k, que tambm define a dimenso do vetor de estados da base
ortonormal, deve ento sempre ser maior ou igual ao nmero efetivo de variveis nas premissas das
regras. Finalmente, os operadores de recombinao (crossover) implementados devem respeitar a
semntica dos elementos no cromossomo, bem como suas restries de valorao.
Computacionalmente, a populao de indivduos com esta representao uma matriz de dimenso N(maxtl (2maxvl + 2)), sendo N o nmero de indivduos na populao. Diferentemente da
representao apresentada na prxima seo, alguns loci de um cromossomo podem vir a ter valores
nulos. Esta condio ocorre quando uma varivel lingstica no utiliza todos os termos lingsticos
possveis, ou o nmero mximo de variveis no alcanado. Em termos de eficincia computacional, esta uma desvantagem dessa representao. A aplicao das medidas de similaridade para
57
simplificao do sistema fuzzy (ver seo 4.9) tende a criar ainda mais lacunas. Uma alternativa seria
o uso de uma estrutura de dados mais sofisticada, como uma lista duplamente encadeada. No entanto,
a representao matricial extremamente simples e transparente, agilizando consideravelmente a
aplicao dos operadores genticos, justificando assim sua adoo.
Representao para o modelo fuzzy TS FBO Generalizado
Nesta implementao, cada modelo local parametrizado em um plo complexo (base de Kautz).
O nmero de modelos locais deve ser fornecido por um especialista humano no processo sendo modelado, ou seja, uma entrada do algoritmo. Essa restrio justificada devido ao alto grau de complexidade na elaborao de uma arquitetura algortmica e computacional ao mesmo tempo flexvel e
eficiente para a otimizao tambm do nmero de modelos locais do sistema fuzzy. Na arquitetura
ora proposta o nmero de modelos locais corresponde ao nmero de regras do sistema fuzzy, nmero
este dado pela combinao de todos os termos lingsticos das variveis lingsticas de entrada (base
de regras completa).
Assim, considerando o conhecimento do nmero r de modelos locais esperados para o modelo
fuzzy, os parmetros livres de projeto, otimizados pelo algoritmo gentico, so: os r plos, compostos
pelo par abcissa e ordenada (valores reais); um conjunto de m funes de pertinncia gaussianas para
cada um dos n estados nas premissas das regras4 , compostas por um valor de centro e um de abertura
(valores reais); r nmeros indicando as quantidades de estados nos conseqentes das regras (valores
inteiros); e n inteiros especificando quais estados estaro presente nas premissas das regras. Adota-se
uma representao para o cromossomo na forma de um vetor, conforme ilustrado na Figura 4.4.
1
. . . r
. . . nm
11
nm
11
k1
...
1m
1m
. . . kr
L1
...
n1
n1
...
. . . Ln
58
formada por uma matriz na qual cada linha representa um indivduo codificado na forma da Figura 4.4.
A Figura 4.5 apresenta um exemplo numrico de um cromossomo e o respectivo modelo codificado.
Trata-se de um modelo com duas regras (logo, dois plos, uma varivel de entrada e duas funes de
pertinncia).
0,27 0,44 0,13 0,56
5 3
R1 : se ( 2 (k) A1,2 )
(
l1 (k + 1) = A1 l1 (k) + b1 u(k)
ento
y1 (k)
= f1 (l1 (k))
R2 : se ( 2 (k) A2,2 )
ento
l2 (k + 1) = A2 l2 (k) + b2 u(k)
y2 (k)
= f2 (l2 (k))
Figura 4.5: Exemplo numrico da representao cromossmica para o modelo fuzzy TS FBO Generalizado.
Os parmetros A1 e b1 do modelo local da regra R1 , bem como o vetor de estados l1 (k) com 5
estados, so obtidos a partir do primeiro plo codificado no cromossomo, 0,27 j 0,44. Os respectivos parmetros da segunda regra so obtidos a partir do segundo plo, 0,13 j 0,56. O segundo
modelo local possui 3 estados no vetor de estados l2 (k). As duas funes de pertinncia presentes
na premissa das regras (A1,2 e A2,2 ), cuja varivel de entrada o resultado da inferncia fuzzy sobre
o segundo estado ortonormal dos modelos locais, possuem aberturas iguais a 1,12 e 1,70 e centros
iguais a -0,47 e 1,08, respectivamente.
4.5 Avaliao
Aps a definio da representao cromossmica, necessrio elaborar uma estratgia de avaliao dos indivduos da populao. Esta funo de avaliao depende do problema sendo tratado.
Uma propriedade que ela deve possuir explicitar quais cromossomos representam as melhores configuraes para a soluo do problema em questo, assim como apontar aqueles que geram elementos
insatisfatrios. Convenciona-se que essa funo, tambm chamada funo de fitness, deve atribuir
valores mais altos aos indivduos melhores, mais aptos a resolver o problema de otimizao, e valores
menores s solues pobres. Alm disso, so comumente usadas funes no negativas.
4.5 Avaliao
59
60
o critrio MDL tem a forma:
+ k log N
MDL(k) = log p(z|)
2
(4.2)
a funo de
sendo a estimativa de mxima verossimilhana do vetor de parmetros , p(z|)
densidade de probabilidade condicional de pZ (), k o nmero de parmetros no modelo e N o
nmero de observaes. O primeiro termo da equao (4.2) pode ser interpretado como o nmero
de bits necessrio para codificar as observaes, enquanto o segundo termo como o nmero de bits
necessrio para codificar os parmetros do modelo [105].
Uma proposta semelhante, chamada mnimo comprimento de mensagem (MML, Minimum Message Length), possui tambm dois termos. O primeiro analisa a estimativa dos parmetros desconhecidos do modelo e o segundo uma funo das observaes, a qual utiliza uma codificao tima
baseada na distribuio de probabilidade dos dados obtida pela estimativa dos parmetros. O critrio
MML difere do MDL basicamente em sua implementao e na viso probabilstica de seus idealizadores [114].
Um terceiro critrio o critrio de informao de Akaike (AIC, Akaike information criterion),
cuja idia essencial estabelecer quantos parmetros incluir no modelo minimizando o erro de modelagem. definido como [3]:
2
AIC(n ) = N ln[erro
(n )] + 2n
(4.3)
2
sendo N o nmero de observaes, erro
(n ) a varincia do erro de modelagem (erro de predio de
o nmero de parmetros no modelo.
um passo frente ou resduo) e n = dim[]
Nesse critrio, medida que so includos termos no modelo, o nmero de graus de liberdade
2
aumenta permitindo um melhor ajuste aos dados. Dessa forma, erro
(n ) diminui quando n aumenta.
A partir de um determinado momento, a diminuio da varincia dos resduos devido incluso de
um novo termo no modelo insignificante, no sendo justificada a incluso deste termo. Assim,
a primeira parcela da equao (4.3) quantifica a diminuio na varincia dos resduos resultante da
incluso de um termo, enquanto a segunda parcela penaliza a incluso de cada termo. A ponderao
originalmente estipulada para a incluso de um termo 2. Outros critrios de informao semelhantes
ao AIC so citados na literatura modificando-se as ponderaes entre os dois termos da equao (4.3)
[3].
As vantagens e desvantagens de cada uma das abordagens supracitadas no esto bem definidas
na literatura, ainda sendo motivos de debate [6]. Neste trabalho adota-se o critrio de informao
de Akaike como base para o clculo do fitness de um indivduo, como descrito a seguir. A escolha
justificada principalmente pela maior facilidade de clculo, j que no necessita, por exemplo, estimar
61
1
1 + AIC(i)
(4.4)
sendo AIC(i) a normalizao do critrio de Akaike no intervalo [0, 1], calculado para o i-simo
indivduo segundo a equao (4.3). Tal normalizao necessria pois, como pode ser visto na
2
equao (4.3), quando a varincia do erro de modelagem erro
(n ) muito baixa ( o que natural nas
ltimas geraes do algoritmo gentico), o valor de AIC(n ) pode se tornar negativo. Tal normalizao, no entanto, no interfere no processo evolutivo uma vez que, para o operador de seleo adotado
(ver seo 4.6), o importante a ordem relativa de grandeza entre os valores de fitness dos indivduos
da populao.
O valor de n presente na equao (4.3) calculado computando-se a quantidade de parmetros
do modelo como um todo. Para o sistema fuzzy TS FBO com plo nico, so 2 parmetros devido
ao plo complexo ou 1 se o plo for real, 2 parmetros para cada funo de pertinncia, mais o total
de parmetros nos conseqentes das regras, calculados utilizando o estimador de mnimos quadrados. Para a arquitetura fuzzy TS FBO Generalizado, contabilizam-se 2 parmetros para cada par de
plos complexos conjugados (no caso geral, duas vezes o nmero de modelos locais identificados), 2
parmetros para cada funo de pertinncia nas premissas das regras, mais o nmero de parmetros
dos conseqentes nos modelos locais (que neste caso podem ser distintos), estimados utilizando o
algoritmo dos mnimos quadrados.
O nmero de parmetros dos conseqentes de cada regra depende do tipo de modelo local adotado. No caso de modelos lineares com n estados tem-se n + 1 parmetros para cada regra. Para os
modelos locais no lineares de Volterra de segunda ordem o nmero de parmetros para n estados
[(n + 1)(n + 2)]/2 em cada regra.
62
O critrio de seleo determinstica contempla somente os indivduos que atendem a determinadas caractersticas previamente estabelecidas como desejveis. Os indivduos que no atenderem o
critrio de escolha sero eliminados sumariamente. Dessa forma, no h chance de um indivduo que
no satisfaa os requisitos vir a ser escolhido para fazer parte da prxima gerao.
Na seleo estocstica os indivduos que apresentarem maior adaptabilidade tero mais chance de
serem escolhidos. Os de menor adaptabilidade tero menos chance, mas podero eventualmente ser
selecionados.
Na seleo hbrida o processo de seleo intercala os critrios de escolha determinsticos e estocsticos. Dessa forma, h a garantia de escolha de parte dos melhores indivduos da populao,
porm mantendo a possibilidade de seleo tambm dentro de todo o espao de solues.
Um mtodo de seleo muito utilizado o Mtodo da Roleta. um processo eminentemente
estocstico, portanto probabilstico e variante com as geraes.
A Figura 4.6 exemplifica uma roleta para uma determinada gerao de uma populao com 6
indivduos.
Indiv. 6
Indiv. 1
Indiv. 5
Indiv. 2
Indiv. 4
Fitness
0.65 (1)
0.95 (2)
0.20 (3)
0.80 (4)
0.40 (5)
0.50 (6)
Indiv. 3
63
dois problemas inerentes. Se a populao contm uma soluo de fitness significativamente maior
que as demais solues na populao, esta ir ocupar a maior parte da roleta. Assim, a maioria das
rodadas da roleta sortear essa mesma soluo. Isto far com que a populao perca sua diversidade
e provocar a convergncia prematura do algoritmo para uma soluo sub-tima.
O segundo problema pode ocorrer aps vrias geraes, quando a maioria dos membros da populao possui aproximadamente o mesmo fitness. Neste caso, as fatias da roleta possuem praticamente o mesmo tamanho e as solues possuem aproximadamente as mesmas probabilidades de
serem escolhidas. Obviamente, trata-se de uma busca quase aleatria.
O operador de seleo baseado em rank semelhante ao mtodo da roleta, porm as fatias so
atribudas aos indivduos de acordo com sua posio aps a ordenao (ascendente ou descendente)
pelo valor do fitness. Assim, em uma populao de tamanho , ao indivduo com menor valor de
fitness ser atribudo o rank zero e ao com o maior valor, o rank 1. A seleo por rank no
apresenta nenhuma das duas desvantagens citadas para o mtodo da roleta.
Aps a ordenao, podem ser utilizados mapeamentos lineares ou no lineares para a determinao da probabilidade de seleo de cada indivduo. Supondo que o rank do i-simo indivduo
dado por rank(i), ento, para um mapeamento linear, tem-se que sua probabilidade de seleo dada
por [6]:
p(i) =
rank(i)
(
(1)
(4.5)
sendo e so as quantidades esperadas de filhos dos indivduos com menor e maior fitness, respectivamente.
Um exemplo de mapeamento no linear :
p(i) = (1 )1rank(i)
(4.6)
com (0, 1). Esta distribuio est relacionada a uma distribuio de Bernoulli [6].
Outro mecanismo de seleo o operador de Boltzmann, o qual altera o valor do fitness de cada
indivduo segundo a funo densidade de probabilidade de Boltzmann, equao (4.7), fornecendo sua
probabilidade de seleo i :
i =
1
1 + exp(Fi /T )
(4.7)
64
4.7 Reproduo
65
4.7 Reproduo
A reproduo a fase do algoritmo gentico em que os indivduos filhos so gerados com o objetivo de compor a nova populao. Consiste na ao de operadores genticos, os quais so aplicados
sobre os indivduos pais, gerando os filhos. A literatura prope uma quantidade muito grande de
operadores genticos. A definio dos operadores de reproduo est intrinsecamente ligada ao tipo
de representao adotada, a qual, por sua vez, depende da classe de problemas que se estuda. Como
exemplo, ao se trabalhar com o problema do caixeiro viajante, os operadores genticos devem garantir a validade do indivduo aps sua atuao, considerando que um determinado alelo deve ocorrer
obrigatoriamente uma nica vez em um cromossomo [63].
So dois os operadores genticos bsicos utilizados durante a fase de reproduo nos algoritmos
genticos: Recombinao e Mutao.
O operador de recombinao (ou crossover) envolve a participao de dois indivduos pais. A
tcnica da recombinao consiste na troca de material gentico entre os pais, gerando dois candidatos
a filhos. escolhido aleatoriamente um conjunto de pontos que delimita a regio de troca dos genes.
As variaes desse mtodo referem-se determinao do nmero de pontos e sua distribuio dentro
do cromossomo, assim como no modo como os genes so trocados. Independentemente de como se
processa a recombinao, ela sempre gerar dois filhos. Em algumas abordagens, destes dois filhos
apenas um sobrevive. A escolha do filho sobrevivente, o qual se tornar um indivduo na prxima
gerao, pode ser feita de diversas formas. Em uma delas, simplesmente realizado um sorteio entre
os dois candidatos a filho. Outra opo a seleo elitista - a escolha recai sobre o candidato de maior
adaptabilidade.
O operador de crossover geomtrico [80] um exemplo utilizado para codificao real, isto ,
uma na qual os genes assumem valores reais. Dados dois pais, ele gera um nico filho conforme
ilustrado na Figura 4.7. Este operador atribui a cada gene do filho a raiz quadrada do produto entre
os respectivos genes dos pais. Esta operao tende a preservar as caractersticas de pais semelhantes
e fazer uma combinao daqueles mais diferentes.
x1
Pai 1
x2 ... xn
y1
x1 y1
Filho
x2 y2 ...
Pai 2
y2 ... yn
xn yn
66
durante a replicao do material gentico dos cromossomos envolvidos em um crossover. Uma mutao pode ser caracterizada pela eliminao, duplicao, inverso ou deslocamento de um conjunto
de genes [6].
Nos algoritmos genticos, o operador gentico de mutao envolve a participao de apenas um
indivduo. Esta tcnica consiste, em analogia Biologia Gentica, na alterao de um ou mais genes
de um indivduo aps o crossover. O novo indivduo gerado para a prxima gerao pode assim
possuir alguma caracterstica adicional que lhe fornea melhor adaptao que seu gerador. Os pontos
que identificaro as posies dos genes que sofrero as transformaes so escolhidos aleatoriamente.
A motivao para a existncia do operador de mutao, alm da coerncia biolgica, a introduo
de diversidade na populao. Desta forma, a mutao assegura que a probabilidade de se chegar a
qualquer ponto do espao de busca nunca ser nula. Alm disso, contorna o problema dos timos
locais atravs da leve alterao da direo da busca.
Um exemplo de operador de mutao a mutao por inverso. Aps a escolha aleatria de
dois pontos no cromossomo, o operador inverte os genes entre estes pontos. A Figura 4.8 ilustra
o comportamento desse operador ao se sortear o primeiro e o ltimo gene do cromossomo para a
delimitao da inverso.
Cromossomo original
0.55 0.23 1.70 3.01 0.84 -1.22
4.7 Reproduo
67
Dado que a representao proposta real (em contrapartida representao binria), o uso do
crossover aritmtico imprescindvel. Os operadores de crossover tradicionais de um ponto ou de
n-pontos, mesmo em codificaes binrias, apresentam o problema de no serem capazes de realizar
um explorao eficaz do espao de busca. Para codificaes reais, o nico meio de se alcanar essa
explorao permitindo que os indivduos filhos possuam genes que no esto presentes em nenhum
de seus pais [6].
O operador de crossover aritmtico descrito em [79] atua sobre os genes xi e yi de dois indivduos
pais x e y criando o indivduo filho z segundo a mdia ponderada:
zi = xi + (1 )yi
sendo um nmero aleatrio no intervalo [0, 1] e i = 1, ..., L os loci do cromossomo de comprimento
L.
A modificao implementada aqui consiste em ampliar o intervalo de para [; 1 + ]. O
parmetro de expanso percentual permite a extrapolao dos limites estabelecidos por xi e yi .
O efeito imediato dessa alterao permitir ao operador uma explorao mais efetiva do espao
de busca, dado que em sua verso original o valor de determinado gene de um indivduo filho
limitado pelos valores dos respectivos genes dos indivduos pais. Alm disso, opera-se com um valor
distinto de para cada elemento, ou seja, i . Esta medida, aliada a uma alta taxa de ocorrncia de
crossover, contribui para a manuteno da diversidade da populao durante sua evoluo. Como a
seleo realizada com reposio (um mesmo indivduo pode ser selecionado mais de uma vez para
reproduo), para a gerao de dois indivduos iguais uma srie pouco provvel de eventos deveria
ocorrer: a seleo do mesmo par de pais e para cada poro considerada do cromossomo os mesmo
nmeros i deveriam ser sorteados.
No captulo 5 apresentar-se- uma comparao dos resultados obtidos com essa modificao no
crossover aritmtico e sem a mesma. Em suma, essa modificao permitiu ao algoritmo gentico
manter de fato a diversidade da populao por um nmero maior de geraes, fornecendo resultados
mdios melhores.
O valor do parmetro de expanso percentual no deve ser muito grande, sob pena de degenerao do algoritmo gentico em uma busca aleatria. Este valor deve ser tal que permita a explorao
mais efetiva do espao de busca em torno dos dois genes sendo combinados (e no apenas entre
eles), porm deve tambm respeitar a propriedade inerente aos operadores de crossover de manter
nos indivduos filhos caractersticas presentes em seus pais. Para ilustrar a sensibilidade do algoritmo gentico a mudanas nesse parmetro, considere o seguinte cenrio hipottipo. Os genes sendo
combinados pelo crossover aritmtico residem no intervalo [0, 1], obtidos por uma distribuio uni-
68
forme. Um cromossomo possui um nmero de genes n elevado, digamos 10.0005 . Seja a seguinte
norma para medida de diferena entre um filho f e seus pais p1 e p2 :
d=
2 X
n
1X
|fj pij |
n i=1 j=1
(4.8)
sendo j o ndice do gene no cromossomo. A Figura 4.9 exibe o clculo da norma (4.8) para o
crossover entre dois pais sorteados aleatoriamente gerando um filho e para diferentes valores do
parmetro . Para = 0 tem-se o crossover aritmtico original descrito em [79]. Observa-se que
0.65
0.6
Diferena
0.55
0.5
0.45
0.4
0.35
0.2
0.4
0.6
0.8
Parmetro de expanso ()
Este valor elevado utilizado para explicitar a sensibilidade aos valores do parmetro .
4.7 Reproduo
69
1.2
0.8
0.6
0.4
0.2
Pai 1
Pai 2
Filho
0.2
10
12
14
16
18
20
Genes
70
valor mnimo. Alm dessas duas verificaes, existe outra opcional, relativa ao uso da segunda representao para as funes de pertinncia explicada na seo 4.4.1, isto , posio relativa (e no
absoluta) dos centros. Como os parmetros representam a distncia entre dois centros consecutivos das funes gaussianas, seu valor deve ser maior que o mnimo estabelecido pelo projetista,
garantindo um grau mximo de sobreposio das funes de pertinncia. Se o valor resultante for
menor que o permitido, atribui-se este mnimo ao respectivo gene do indivduo.
No modelo fuzzy TS FBO Generalizado, outra verificao trivial necessria consiste em garantir
que os ndices dos estados nas premissas sejam vlidos, ou seja, valores menores ou iguais ao menor
dos parmetros indicando a quantidade de estados dos modelos locais. Caso esta condio no seja
satisfeita, sorteiam-se novos valores vlidos para estes ndices.
Uma anlise semelhante tambm prevista para o modelo fuzzy TS FBO com plo nico. O
nmero de estados nos conseqentes deve ser igual ou maior ao nmero de estados (variveis lingsticas) dos antecedentes. Esta verificao necessria pois o nmero de estados nos modelos FBO
locais (ordem dos modelos) dado pelo nmero de estados nos conseqentes das regras. Caso este
nmero fosse inferior ao nmero de estados dos antecedentes, uma regra iria referenciar em sua
premissa uma varivel inexistente. Assim como no modelo Generalizado, a correo do indivduo
consiste no sorteio de um valor vlido para o parmetro em questo. vlido esclarecer que, mesmo
que o mtodo dos mnimos quadrados atribua a um estado dos conseqentes um coeficiente nulo, este
estado em si possui uma dinmica prpria, podendo assim estar presente nas premissas das regras.
Da mesma forma, pode acontecer de um estado no estar presente nas premissas das regras, e sim
apenas nos conseqentes. Neste caso, embora tal estado no atue na etapa de seleo das regras que
sero ativadas, ele contribue com sua dinmica para a representao do sistema como um todo.
O operador de crossover uniforme agora descrito. Ele no utiliza pontos de cruzamento propriamente ditos. Em seu lugar, determina, por meio de uma mscara binria, que genes de cada pai sero
herdados pelos filhos. A Figura 4.11 ilustra a atuao desse operador. Caso o i-simo elemento da
mscara seja 1, ento o valor do i-simo gene do filho 1 ser igual ao gene correspondente do pai 1.
Se tal elemento da mscara for 0, o valor do i-simo gene do filho 1 ser igual ao gene correspondente
do pai 2. A atribuio dos genes do filho 2 segue o processo inverso.
O operador de crossover uniforme aplicado no modelo fuzzy TS FBO Generalizado diretamente
como descrito anteriormente, verificando-se apenas os requisitos relativos estabilidade do plo e
ndice dos estados nas premissas das regras.
Para sua aplicao no modelo fuzzy TS FBO com plo nico, preciso se estipular o que ser
considerado como unidade bsica para intercmbio entre os cromossomos, dado o sorteio da mscara
binria. Tais unidades sero compostas por um conjunto de genes com uma semntica bem definida.
So consideradas como unidades para o crossover uniforme:
4.7 Reproduo
71
0 0
Mscara
1 0 1 1 0
4 2
Pai 1
6 1 3 5 6
Pai 2
1 4 3 6 1
0 1
Filho 1
6 3 3 5 5
Filho 2
4 2 4 1 6
1 6
72
Mutao
O operador de mutao tradicional em representaes com nmeros reais atua sobre um gene yi
gerando um elemento yi segundo a equao (4.9):
yi = yi + M
(4.9)
sendo M uma realizao de uma varivel aleatria. As diferentes verses de mutao so dadas pelas
diferentes distribuies da varivel aleatria M. O operador de mutao implementado nesse trabalho
baseado em uma distribuio Gaussiana.
A funo densidade de probabilidade para uma varivel aleatria com distribuio Gaussiana
dada pela equao (4.10):
(x )2
1
g(x) = exp
2 2
2
(4.10)
sendo o valor mdio da distribuio e 2 sua varincia. conveno fazer = 0 durante a aplicao do operador de mutao Gaussiana, o que tambm implementado no presente trabalho. Assim, o controle sobre a atuao do operador de mutao, em termos de quo diferentes de seus pais
os indivduos filhos podem ser gerados, concentra-se em um nico parmetro, a varincia 2 , ou,
equivalentemente, no desvio padro . So descritas na literatura muitas abordagens nas quais este
parmetro varivel, sendo funo da taxa de convergncia do algoritmo gentico (diversidade da
populao), da efetividade de mutaes anteriores ou do nmero de geraes j processadas. Alm
disso, outras funes de densidade de probabilidade j foram propostas, tais como a distribuio de
Cauchy e a de Laplace [6]. Neste trabalho, a varincia , alm de varivel, tambm diferenciada para
componentes distintos do cromossomo sendo mutado.
Embora a distribuio inicial (e possivelmente em todas geraes) da populao no seja Gaussiana (ver seo 4.4.1), o desvio padro dos genes de um indivduo uma medida da diversidade da
populao e por isso adequado como parmetro para ajustar o nvel de perturbao do operador de
mutao. Uma srie de estudos corroboram a idia de que o nvel de perturbao do operador de
mutao deve diminuir com o tempo, seguindo de alguma forma a tendncia da prpria diversidade
da populao, tornando a busca mais acurada medida que o algoritmo gentico tende a convergir
[6, 34, 35, 44].
Aps essa pequena introduo possvel detalhar como o operador de mutao pode ser implementado nas arquiteturas propostas. Como as representaes agrupam num mesmo cromossomo
elementos de domnios diferentes, um tratamento diferenciado dado a cada um deles.
Primeiramente, calculado o desvio padro i de cada gene i na populao. Para a arquitetura
fuzzy TS FBO com plo nico, preciso desconsiderar os eventuais genes nulos para determinados
73
parmetros. Por exemplo, algumas funes de pertinncia podem no estar presentes em determinado
indivduo. O valor zero no cromosso, que indica a ausncia de uma funo de pertinncia, no
considerado no clculo do desvio padro para aquela funo de pertinncia em particular. Para o
modelo fuzzy TS FBO Generalizado, o clculo do desvio padro dos genes resume-se ao desvio
padro de cada coluna da matriz numrica que codifica a populao. Em seguida, para os parmetros
com codificao real, a mutao consiste na adio da realizao de uma varivel aleatria Gaussiana
com mdia zero e desvio padro i . Para os parmetros com codificao inteira, apenas efetua-se o
arredondamento da perturbao para o inteiro mais prximo antes de esta ser adicionada ao gene em
questo.
As mesmas verificaes de validade descritas para o crossover aritmtico so realizadas aps uma
mutao, para ambas as arquiteturas.
74
|AB |
|AB |
(4.11)
75
j=1 [A (xj )
B (xj )]
j=1 [A (xj ) B (xj )]
S(A, B) = Pm
(4.12)
76
efetuadas, diminuindo a diversidade da populao e acelerando a convergncia do algoritmo provavelmente em direo a um timo local. Com essas preocupaes em mente, elaborou-se uma equao
para se tornar dinmico o valor desse limite. Nas geraes iniciais o valor prximo ao mximo,
1. medida que a diversidade da populao cai, o limite de similaridade tambm cai, porm bem
mais lentamente. Este comportamento requerido para evitar que a realizao de muitas fuses e/ou
eliminaes nas geraes iniciais do algoritmo gentico incorra em decrscimo ainda mais acentuado
da diversidade da populao.
A equao (4.13) mostra como o limite L calculado em funo da diversidade da populao na
i-sima gerao, i , da diversidade inicial da populao, 0 e do limite mnimo de similaridade :
L = + (1 )(1 (1 min(1, i /0 )) )
(4.13)
sendo uma potncia par e min(.) o operador de mnimo (retorna o menor de seus argumentos). Este
operador de mnimo usado para limitar superiormente em 1 o valor resultante desta equao na
eventualidade da diversidade da populao em uma gerao intermediria (i ) se tornar maior do que
a diversidade inicial (0 ).
A Figura 4.12 ilustra a atuao dessa funo. Os dados da diversidade da populao foram simulados como uma funo exponencial decrescente. A curva em azul no grfico j o resultado da
normalizao i /0 . As curvas em vermelho so o resultado do uso de diferentes potncias , de 2 at
10. A seta indica o sentido crescente de , ou seja, se inicia em = 2 e aponta para = 10. O limite
mnimo de similaridade nestas curvas = 0, 2. Valores desse limite acima de aproximadamente
0, 8 implicam em poucas fuses de funes de pertinncia (a menos que estas sejam extremamente
semelhantes). Valores abaixo de 0, 3 se mostram mais adequados nas ltimas geraes do algoritmo
gentico, concluindo a simplificao do conjunto de funes de pertinncia. Sendo assim, conclui-se
que os valores mais adequados para a potncia na equao (4.13) so = 8 ou = 10. No entanto,
estes valores no so crticos, no sentido que sua escolha afeta pouco o desempenho do algoritmo
gentico, j que as vrias curvas definindo o limite L, para valores de elevados, so semelhantes
entre si e apresentam o comportamento desejado.
4.10 Resumo
Este captulo detalhou como um algoritmo gentico aplicado na tarefa de otimizao de modelos
fuzzy TS FBO com plo nico e fuzzy TS FBO Generalizado. Aps uma breve introduo sobre o
tema, levantando os princpios biolgicos motivadores dos algoritmos genticos, sua estrutura bsica
e reas de aplicao, alm de uma reviso sobre os chamados Sistemas Gentico-Fuzzy, descrevem-se
4.10 Resumo
77
i /0
0.9
Limite
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
20
40
60
80
100
Geraes
78
Captulo 5
Resultados de Modelagem
Este captulo apresenta os resultados obtidos ao se aplicar o mtodo descrito no captulo 4 para a
modelagem de sistemas dinmicos no lineares. Foram abordados dois sistemas: um levitador magntico e um processo bioqumico de polimerizao. A anlise qualitativa dos modelos encontrados
baseia-se principalmente em seu desempenho (considerando o erro quadrtico mdio calculado em
srie sinttica) e em sua complexidade.
A prxima seo descreve em mais detalhes os sistemas fsicos abordados. As sees seguintes
apresentam os resultados de modelagem.
Resultados de Modelagem
80
Bobina 2
y2
Disco 2
y1
Disco 1
Bobina 1
Figura 5.1: Levitador magntico.
(5.1)
sendo:
Fm12 : fora de interao magntica entre os discos.
Fu11 : fora de interao magntica entre a bobina 1 e o disco 1,
Fu21 : fora de interao magntica entre a bobina 2 e o disco 1,
Estas foras so descritas pelo seguinte conjunto de equaes [95]:
c
(yc + y2 y1 + d)4
i1
=
a(100y1 + b)4
i2
=
a(yc + 100y1 + b)4
Fm12 =
Fu11
Fu21
81
(5.2)
Resultados de Modelagem
82
vir a direcionar o processo de busca em determinado sentido. Alm disso, os dados de entrada/sada
de todos os sitemas analisados, e portanto seus universos de discurso, esto normalizados. Se este
no fosse o caso, ento de fato os valores apresentados para os limites das funes de pertinncia
representariam grandezas distintas em cada problema.
O valor do parmetro de expanso percentual do operador de crossover aritmtico foi escolhido
baseado nos argumentos formulados na seo 4.7.1.
Finalmente, os resultados apresentados foram obtidos ao se executar o algoritmo gentico em um
R
computador com processador dual Intel Pentium
4 de 3,4 GHz e 1 GB de memria RAM.
Sada
Entrada
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
10
12
14
16
18
20
Tempo (s)
Figura 5.2: Sinais normalizados de entrada e sada para treinamento (levitador magntico).
O sinal de entrada foi projetado de forma a atender aos requisitos de ser persistentemente excitante, tornando possvel a tarefa de se extrair dos dados de entrada/sada informaes sobre as
dinmicas dominantes do sistema [3]. Trata-se de um sinal pseudo-aleatrio composto por uma srie
de degraus de amplitudes diferentes. Quando o objetivo obter modelos no lineares de sistemas
dinmicos, importante que os sinais de entrada, alm de possuir uma grande faixa de freqncia,
devem tambm ter excurses em diferentes amplitudes, o que leva o sistema a atingir diferentes pon-
83
tos de operao [3]. De fato, observam-se na Figura 5.2 dois comportamentos distintos no sistema,
um mais oscilatrio que o outro, dependendo se a variao do sinal de entrada foi positiva ou negativa.
Esta informao foi utilizada no momento de se definir como 2 a quantidade de modelos locais na
arquitetura fuzzy TS FBO Generalizado. Isso implica que o modelo deve possuir apenas um estado
(varivel de entrada) na premissa das regras e duas funes de pertinncia (ver seo 3.2.4).
Como os algoritmos genticos so mtodos no determinsticos de otimizao, para avaliar seu
desempenho na tarefa de sintonia de modelos fuzzy TS FBO no adequado analisar apenas uma
simulao em particular. Os resultados apresentados na seqncia foram coletados aps a execuo
do AG por um nmero de rodadas igual a 35. Os grficos exibidos correspondem a uma rodada
cujos resultados esto prximos queles da mdia de todas as rodadas. Para o levitador magntico, a
configurao do AG em todas as rodadas foi a exibida na tabela 5.1
Parmetros de Execuo
TS FBO Plo nico
Tamanho da populao
100
Nmero mximo de geraes
80
Taxa de crossover
0,85
Taxa de mutao
0,20
Expanso percentual mxima
do operador de crossover ()
0,20
Percentual da diversidade
inicial para convergncia
3
Controle de sobreposio
no
Abertura mnima das
FP gaussianas
0,3
Abertura mxima das
FP gaussianas
3
Nmero mximo de estados nos
conseqentes das regras
7
Nmero mximo de
variveis de entrada (maxvl )
4
Nmero mximo de FP por
varivel de entrada (maxtl )
3
Limite inferior para aplicao
das medidas de similaridade ()
0,2
Potncia para uso na equao
do limite de similaridade ()
8
TS FBO Generalizado
100
80
0,85
0,20
0,20
3
no
0,3
3
7
-
Resultados de Modelagem
84
processo evolutivo continua at que o nmero de geraes alcance o Nmero mximo de geraes
ou a diversidade da populao atinja o Percentual da diversidade inicial para convergncia. Cada
indivduo deve respeitar os limites Nmero mximo de estados nos conseqentes das regras, Nmero
mximo de variveis de entrada e Nmero mximo de FP por varivel de entrada. Alm disso, as aberturas das funes de pertinncia so restritas ao intervalo entre Abertura mxima das FP gaussianas
e Abertura mnima das FP gaussianas. Finalmente, as probabilidades de ocorrncia das operaes de
crossover (que utiliza o valor Expanso percentual mxima do operador de crossover para o crossover
aritmtico) e mutao so dadas pelos parmetros Taxa de crossover e Taxa de mutao, respectivamente. Como o operador de crossover aritmtico possui maior capacidade de manter a diversidade da
populao (pois tende a gerar indivduos filhos distintos dos pais) este aplicado com probabilidade
de ocorrncia maior que o operador de crossover uniforme. Cada vez que uma operao de crossover
deve ser efetuada, realiza-se um sorteio entre o operador aritmtico, com probabilidade de ocorrncia
de 70%, e o operador uniforme, com probabilidade de 30%. A opo de controle de sobreposio
no foi usada uma vez que a interpretao adotada em todas as simulaes para a representao cromossmica foi a com distncias absolutas entre os centros das funes de pertinncia, e no a com
distncias relativas. Esta ltima opo seria uma perspectiva para trabalhos futuros.
Seguindo a ordem de apresentao das representaes cromossmicas do captulo 4, sero primeiramente exibidos os resultados para a arquitetura fuzzy TS FBO com plo nico e em seguida a
Generalizada.
Na seqncia do texto, para a simplicidade da escrita, ser usada a notao de modelo linear e modelo no linear
quando o mais apropriado seria respectivamente modelo local linear nos conseqentes das regras e modelo local no
linear nos conseqentes das regras.
EQM mdio
Nmero mdio de parmetros
AIC mdio
Menor EQM
Nmero de parmetros do menor EQM
AIC do menor EQM
Maior EQM
Nmero de parmetros do maior EQM
AIC do maior EQM
Desvio padro do EQM
Desvio padro do AIC
Nmero mdio de geraes
Tempo mdio de processamento
por rodada (min)
85
Linear No Linear
0,0016962 0,00093761
52,54
111,43
-3996,40
-4201,63
0,0005747
0,0005061
213
154
-4228,85
-4416,22
0,0074675
0,0035242
23
94
-2994,77
-3318,51
0,0015281
0,0006193
326,04
298,16
46,00
35,11
26,05
51,38
Tabela 5.2: Resumo dos resultados do modelo fuzzy TS FBO com plo nico (levitador magntico).
EQM mdio
Nmero mdio de parmetros
AIC mdio
Nmero mdio de geraes
Linear
0,0019517
50,43
-3954,78
32,83
Tabela 5.3: Resumo dos resultados do modelo fuzzy TS FBO com plo nico sem o parmetro de
expanso (levitador magntico).
Observa-se que o algoritmo gentico forneceu, com o parmetro de expanso, um EQM mdio
menor ao caso sem tal parmetro. Visto de outra forma, os resultados sem o parmetro de expanso
(crossover aritmtico original) possuam em mdia 4% menos parmetros, porm fornecendo um
EQM mdio 15% maior. O valor do AIC mdio confirma as comparaes anteriores, uma vez o
valor menor foi obtido com o parmetro de expanso (lembrando que um menor AIC corresponde a
um melhor resultado). Alm disso, o nmero mdio de geraes com o parmetro de expanso foi
sensivelmente maior que sem o mesmo, corroborando a afirmao da seo 4.7.1 da manuteno da
diversidade da populao.
A tabela 5.4 apresenta os resultados do melhor indivduo de todas as rodadas, considerando-se
o menor EQM. Ao contrrio do que ser observado nos resultados para a arquitetura fuzzy TS FBO
Generalizado, aqui ambos os modelos linear e no linear apresentaram valores prximos um do outro
para o melhor EQM de todas as rodadas.
Os valores de EQM apresentados na tabela 5.4 so consideravelmente menores que aqueles obti-
Resultados de Modelagem
86
Linear
No Linear
0,0005747
0,0005061
-4228,85
-4416,22
24
4
8
36
0,85702 j 0,31570 0,80883 j 0,23776
213
154
Tabela 5.4: Melhor resultado (menor EQM) do modelo fuzzy TS FBO com plo nico (levitador
magntico).
dos para a arquitetura Generalizada apresentada na prxima seo. No entanto, deve ser notado
que a quantidade de parmetros dos modelos com plo nico bem superior. Por se tratar de uma
arquitetura mais flexvel, durante o processo evolutivo surgem indivduos que codificam modelos
com elevado nmero de parmetros. A funo de fitness implementada e as medidas de similaridade impedem que o nmero de parmetros de todos os indivduos aumente arbitrariamente. Assim,
embora os melhores indivduos2 de todas as rodadas de fato apresentem uma grande quantidade de
parmetros, os indivduos com EQM prximo mdia da tabela 5.2 apresentam consideravelmente
um menor nmero de parmetros. Na verdade, considerando os parmetros definidos na tabela 5.1,
a arquitetura fuzzy TS FBO com plo nico teria em princpio liberdade para gerar modelos com at
675 parmetros, no caso de modelos locais lineares, e at 2943 parmetros, para modelos locais no
lineares.
Como ilustrao, exibem-se na seqncia os resultados detalhados de uma rodada cujo EQM se
aproximou da mdia dos resultados apresentados na tabela 5.2. Em particular, considera-se o uso
de modelos locais lineares nos conseqentes das regras. Estes modelos so escolhidos pois o valor
mdio do EQM similar aos encontrados com a arquitetura Generalizada, de forma que seja possvel
comparar o desempenho de cada proposta. Ao se escolher modelos com valores prximos de EQM (e
aceitveis), o julgamento pelo melhor ser baseado na complexidade de cada um, a qual avaliada em
termos do seu nmero de parmetros. Em suma, o melhor modelo dentre um conjunto com valores
prximos de EQM ser aquele com o menor nmero de parmetros.
Na simulao ora apresentada, o AG consumiu 43 geraes, fornecendo ao final do processo
evolutivo um valor de diversidade da populao igual a 0,31 (a diversidade inicial foi 25,34). A
Figura 5.3 exibe a curva da diversidade da populao ao longo das geraes, com um decaimento
caracterstico.
O limite para atuao das medidas de similaridade, como exposto na seo 4.9, toma como base
2
A no ser que seja explicitado o contrrio, o termo melhor indivduo referir-se- ao indivduo que representa o
modelo mais preciso, ou seja, com o menor EQM.
87
25
Diversidade
20
15
10
10
15
20
25
30
35
40
Geraes
Figura 5.3: Diversidade da populao para o modelo fuzzy TS FBO com plo nico e modelos locais
lineares (levitador magntico).
de clculo o valor da diversidade corrente da populao. Utilizando os parmetros definidos na
tabela 5.1, o AG realizou simplificaes nas funes de pertinncia respeitando o limite de
similaridade mostrado na Figura 5.4.
O comportamento do limite de similaridade exibido na Figura 5.4 semelhante ao da Figura 4.12,
obtida de forma analtica. O resultado exatamente o esperado, poucas simplificaes de funes
de pertinncia nas primeiras geraes do AG e um progressivo aumento medida que o AG tende a
convergir.
A convergncia da populao, indicada pela Figura 5.3, faz com que o valor do critrio de Akaike
mdio da populao, base para o clculo do fitness, tambm tenda a se estabilizar, o que confirmado
pelo grfico da Figura 5.5.
Ao final da rodada, o AG forneceu a soluo apresentada na tabela 5.5. Tal soluo codifica um
modelo com um total de 23 parmetros. Para fins de comparao, note-se que a melhor soluo de
todas as rodadas possuia aproximadamente 9 vezes mais parmetros, porm reduzindo o valor do
EQM em apenas 3 vezes.
A Figura 5.6 exibe as funes de pertinncia para os termos lingsticos de entrada, completando
a soluo fornecida pelo AG. O algoritmo gentico selecionou como varivel nica de entrada o
primeiro estado ortonormal3. Desse modo, com uma varivel de entrada e dois termos lingsticos
3
Na verdade, no lugar de primeiro estado ortonormal seria mais correto falar varivel resultante da inferncia fuzzy
TS aplicada aos sinais obtidos na filtragem da entrada pela primeira funo da base ortonormal, porm a expresso
Resultados de Modelagem
88
1
0.9
0.8
0.7
Limite
0.6
0.5
0.4
0.3
0.2
0.1
0
10
15
20
25
30
35
40
Geraes
Figura 5.4: Limite de similaridade para o modelo fuzzy TS FBO com plo nico e modelos locais
lineares (levitador magntico).
14000
12000
10000
AIC Mdio
8000
6000
4000
2000
0
2000
4000
10
15
20
25
30
35
40
Geraes
Figura 5.5: Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO com plo nico e
modelos locais lineares (levitador magntico).
89
Plo
0,79924 j 0,26822
Nmero de regras
2
Nmero de parmetros nos conseqentes
8
EQM
0,0019020
Tabela 5.5: Soluo fornecida pelo AG para o modelo fuzzy TS FBO com plo nico e modelos locais
lineares (levitador magntico).
L1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
4
Figura 5.6: Funes de pertinncia de entrada para o modelo fuzzy TS FBO com plo nico e modelos
locais lineares (levitador magntico).
Finalmente, a Figura 5.7 exibe o resultado final obtido. So comparados os dados de sada do
sistema real com os fornecidos pelo modelo fuzzy TS FBO com plo nico, para um conjunto de
dados de validao diferente do utilizado na estimao dos parmetros dos modelos locais. Para essa
simulao o valor do EQM foi de 0,0019020.
Para fins de comparao, ao se adotar a metodologia tradicional de distribuio homognea
das funes de pertinncia no universo de discurso proposta em [39] e aplicada em [16], e considerando um modelo com a mesma estrutura do exemplificado anteriormente (nmero de regras,
estados ortonormais, etc.), obtm-se um EQM de 0,0025306, ou seja, 33% maior que a soluo
fornecida pelo algoritmo gentico.
estado ortonormal ser utilizada por convenincia de escrita.
Resultados de Modelagem
90
Sada real
Sada estimada
1.2
0.8
0.6
0.4
0.2
10
12
Tempo (s)
Figura 5.7: Sada real e a fornecida pelo modelo fuzzy TS FBO com plo nico e modelos locais
lineares (levitador magntico).
EQM mdio
Nmero mdio de parmetros
AIC mdio
Menor EQM
Nmero de parmetros do menor EQM
AIC do menor EQM
Maior EQM
Nmero de parmetros do maior EQM
AIC do maior EQM
Desvio padro do EQM
Desvio padro do AIC
Nmero mdio de geraes
Tempo mdio de processamento
por rodada (min)
91
Linear No Linear
0,0017423
0,0011960
25,86
61,26
-3901,70
-4128,91
0,0015965
0,0005823
26
83
-3952,70
-4465,75
0,0024847
0,0019559
24
45
-3676,50
-3782,26
0,0002055
0,0005619
65,05
286,72
36,20
34,17
9,28
17,15
Tabela 5.6: Resumo dos resultados do modelo fuzzy TS FBO Generalizado com estimao local
(levitador magntico).
EQM mdio
Nmero mdio de parmetros
AIC mdio
Nmero mdio de geraes
Linear
0,0021789
26,20
-3769,00
37,29
Tabela 5.7: Resumo dos resultados do modelo fuzzy TS FBO Generalizado com estimao local sem
o parmetro de expanso (levitador magntico).
Resultados de Modelagem
92
12
10
Diversidade
10
15
20
25
Geraes
Figura 5.8: Diversidade da populao para o modelo fuzzy TS FBO Generalizado com estimao
local e modelos locais lineares (levitador magntico).
2800
3000
AIC Mdio
3200
3400
3600
3800
4000
10
15
20
25
Geraes
Figura 5.9: Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO Generalizado com
estimao local e modelos locais lineares (levitador magntico).
93
Linear
No Linear
0,0015965
0,0005823
-3952,70
-4465,75
2
2
0,82869 j 0,27907 0,82271 j 0,27665
0,80999 j 0,26396 0,80093 j 0,24151
26
83
6
7
7
7
Tabela 5.8: Melhor resultado do modelo fuzzy TS FBO Generalizado com estimao local (levitador
magntico).
Primeiro plo
0,89091 j 0,16241
Segundo plo
0,82444 j 0,26901
Nmero de estados no 1 modelo
5
Nmero de estados no 2 modelo
7
ndice do estado nas premissas
2
EQM
0,0017220
Tabela 5.9: Soluo fornecida pelo AG para o modelo fuzzy TS FBO Generalizado com modelos
locais lineares e estimao local (levitador magntico).
Antes de apresentar o conjunto das funes de pertinncia para os termos lingsticos de entrada,
a Figura 5.11 exibe a dinmica da varivel de estado resultante da inferncia fuzzy TS (equao (2.31)
do captulo 2) envolvendo o segundo estado da base de funes ortonormais de cada modelo local.
Observam-se duas regies de operao bem distintas: uma em torno de zero e outra entre um
e dois. As funes de pertinncia encontradas pelo AG, mostradas na Figura 5.12, so capazes de
classificar corretamente tais regies de operao. Note-se que a FP L2 praticamente nula em
torno de zero, ocorrendo o mesmo para a FP L1 aps aproximadamente o valor 1.
A capacidade do AG de realizar otimizao com mltiplos objetivos evidente nestes resultados.
Como explicitado na seo 4.3.2, desde que os operadores reprodutivos e a funo de fitness levem em
conta a diversidade semntica codificada em um mesmo cromossomo, durante o processo evolutivo
os parmetros se adequam uns aos outros, e de forma tima. Esta busca multidimensional eficiente
permite a obteno de resultados indicativos da grande viabilidade da metodologia ora proposta.
No caso presente, estes resultados podem ser resumidos nas figuras 5.13 e 5.14. A Figura 5.13
exibe as sadas dos dois modelos locais juntamente com a sada da planta. Ao se analisar esta figura
juntamente com as Figuras 5.11 e 5.12 conclui-se que cada modelo local de fato representa o sistema
em uma regio de operao bem determinada. A base de regras do modelo fuzzy TS FBO Gene-
Resultados de Modelagem
94
x 10
10
15
20
25
Geraes
Figura 5.10: Evoluo do EQM do melhor indivduo da populao para o modelo fuzzy TS FBO
Generalizado com estimao local e modelos locais lineares (levitador magntico).
2.5
1.5
0.5
0.5
10
12
Tempo (s)
Figura 5.11: Dinmica do estado na premissa das regras para o modelo fuzzy TS FBO Generalizado
com estimao local e modelos locais lineares (levitador magntico).
95
L2
L1
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
4
Figura 5.12: Funes de pertinncia de entrada para o modelo fuzzy TS FBO Generalizado com
estimao local e modelos locais lineares (levitador magntico).
ralizado tem como funo selecionar cada modelo local tomando como base o valor do estado nas
premissas das regras e as configuraes das funes de pertinncia fornecidos pelo AG.
Finalmente, a Figura 5.14 exibe o resultado final obtido. So comparados os dados de sada do
sistema real com os fornecidos pelo modelo fuzzy TS FBO Generalizado com estimao local dos
conseqentes das regras. Para essa simulao o valor do EQM foi de 0,0017220. Observa-se que o
modelo obtido consiste nas melhores aproximaes de cada um dos modelos locais lineares. Por outro
lado, o mtodo no otimizado de distribuio homognea das funes de pertinncia no universo de
discurso fornece, para um modelo com a mesma estrutura do descrito acima, um EQM de 0,0028360,
65% maior que a soluo fornecida pelo algoritmo gentico.
Resultados de Modelagem
96
Modelo 1
Modelo 2
Sada real
1.2
1
0.8
0.6
0.4
0.2
0
0.2
10
12
Tempo (s)
Figura 5.13: Modelos locais para o sistema fuzzy TS FBO Generalizado com estimao local e modelos locais lineares (levitador magntico).
Sada real
Sada estimada
1.2
1
0.8
0.6
0.4
0.2
0
0.2
10
12
Tempo (s)
Figura 5.14: Sada real e a fornecida pelo modelo fuzzy TS FBO Generalizado com estimao local e
modelos locais lineares (levitador magntico).
97
Linear No Linear
EQM mdio
0,0083562
0,0018611
Nmero mdio de parmetros
20,71
43,03
AIC mdio
-3178,80
-3879,90
Menor EQM
0,0055663
0,0015395
Nmero de parmetros do menor EQM
22
45
AIC do menor EQM
-3237,60
-3941,30
Maior EQM
0,0141410
0,0027026
Nmero de parmetros do maior EQM
20
36
AIC do maior EQM
-3200,40
-3808,60
Desvio padro do EQM
0,00218605
0,0002675
Desvio padro do AIC
81,17
45,00
Nmero mdio de geraes
25,94
22,29
Tempo mdio de processamento
por rodada (min)
5,21
6,30
Tabela 5.10: Resumo dos resultados do modelo fuzzy TS FBO Generalizado com estimao global
(levitador magntico).
EQM mdio
Nmero mdio de parmetros
AIC mdio
Nmero mdio de geraes
Linear
0,0019060
44,89
-3893,40
21,54
Tabela 5.11: Resumo dos resultados do modelo fuzzy TS FBO Generalizado com estimao global
sem o parmetro de expanso (levitador magntico).
Resultados de Modelagem
98
modelo Generalizado no linear com estimao global, possuindo pouco mais da metade do nmero
total de parmetros deste ltimo.
Linear
No Linear
0,0055663
0,0015395
-3237,60
-3941,30
2
2
0,79327 j 0,25582 0,84744 j 0,25934
0,16555 j 0,03512 0,42894 j 0,72567
22
45
4
6
5
2
Tabela 5.12: Melhor resultado do modelo fuzzy TS FBO Generalizado com estimao global (levitador magntico).
Para facilitar a comparao do desempenho dos diferentes modelos abordados neste trabalho,
exibem-se na seqncia os resultados detalhados de uma rodada cujo desempenho se aproximou da
mdia dos resultados apresentados na tabela 5.10, considerando-se o uso de modelos locais no lineares nos conseqentes das regras, os quais apresentaram um EQM mdio prximo ao detalhado
anteriormente para o modelo com estimao local.
Na simulao ora apresentada, o AG consumiu 18 geraes, fornecendo ao final do processo
evolutivo um valor de diversidade da populao igual a 0,31 (a diversidade inicial foi 10,26). A
Figura 5.15 exibe a curva da diversidade da populao ao longo das geraes. A estabilizao do
valor do critrio de Akaike mdio da populao, exibido na Figura 5.16, confirma a convergncia da
populao.
A Figura 5.17 apresenta a evoluo do erro quadrtico mdio do melhor indivduo da populao.
Neste ponto deve ser notado que, embora a estratgia de elitismo esteja sendo utilizada, pode acontecer de o melhor indivduo de uma gerao apresentar um EQM maior que o melhor da gerao
anterior. A explicao para tal evento simples: como est sendo utilizado um critrio de avaliao
que, alm do desempenho (em termos de um baixo erro) considera tambm a complexidade do modelo, um certo indivduo, por codificar um modelo com menos parmetros, pode possuir um valor de
fitness mais elevado, mesmo com um EQM maior. Tal comportamento ocorre nessa simulao em
particular, conforme pode ser observado na Figura 5.17.
Ao final da rodada, o AG forneceu a soluo apresentada na tabela 5.13, a qual codifica um
modelo com um total de 36 parmetros.
Ao se proceder com a estimao global dos parmetros dos modelos locais de cada regra, no
esperado que ao se analisar cada um destes modelos locais isoladamente seja observada alguma
99
12
10
Diversidade
10
12
14
16
18
Geraes
Figura 5.15: Diversidade da populao para o modelo fuzzy TS FBO Generalizado com modelos
locais no lineares e estimao global (levitador magntico).
8000
6000
AIC Mdio
4000
2000
2000
4000
10
12
14
16
18
Geraes
Figura 5.16: Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO Generalizado com
modelos locais no lineares e estimao global (levitador magntico).
Resultados de Modelagem
100
3
x 10
8
7
6
5
4
3
2
1
10
12
14
16
18
Geraes
Figura 5.17: Evoluo do EQM do melhor indivduo da populao para o modelo fuzzy TS FBO
Generalizado com modelos locais no lineares e estimao global (levitador magntico).
Primeiro plo
0,90461 j 0,19269
Segundo plo
0,84671 j 0,32033
Nmero de estados no 1 modelo
3
Nmero de estados no 2 modelo
4
ndice do estado nas premissas
1
EQM
0,0018657
Tabela 5.13: Soluo fornecida pelo AG para o modelo fuzzy TS FBO Generalizado com modelos
locais no lineares e estimao global (levitador magntico).
dinmica particular do sistema real, como evidente no caso de estimao local analisado na seo
anterior. Os plos de cada modelo local exibidos na tabela 5.13 no caracterizam nica e completamente uma regio de operao especfica do sistema real (ver Figura 5.20), e apenas aps a interpolao dos modelos locais, atravs da inferncia fuzzy TS, obtm-se um modelo representativo do
sistema real.
Dessa forma, embora o comportamento da varivel lingstica de entrada, exibido na Figura 5.18,
seja semelhante ao observado no modelo com estimao local, as funes de pertinncia encontradas
pelo AG no particionam o universo de discurso do mesmo modo anterior. Ao contrrio, so praticamente sobrepostas (Figura 5.19).
Esta sobreposio quase completa das funes de pertinncia indica que mais razovel aplicar
101
1.5
0.5
0.5
10
12
Tempo (s)
Figura 5.18: Dinmica do estado na premissa das regras para o modelo fuzzy TS FBO Generalizado
com modelos locais no lineares e estimao global (levitador magntico).
L2
L1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
4
Figura 5.19: Funes de pertinncia de entrada para o modelo fuzzy TS FBO Generalizado com
modelos locais no lineares e estimao global (levitador magntico).
Resultados de Modelagem
102
a arquitetura fuzzy TS FBO Generalizada com a estimao local dos parmetros dos modelos locais,
tendo em vista sua motivao e definio originais descritas na seo 3.2.4. O efeito da sobreposio
a incapacidade de o processo de inferncia fuzzy TS de diferenciar as regies de operao distintas
do sistema modeladas individualmente por cada regra, uma vez que praticamente o mesmo grau de
ativao ser atribudo a cada uma destas regras.
A Figura 5.20 corrobora os comentrios anteriores, ao exibir as sadas dos dois modelos locais
juntamente com a sada da planta. Observa-se que no h correlao direta entre cada modelo local e
alguma regio de operao especfica do sistema real.
2
Modelo 1
Modelo 2
Sada real
1.5
0.5
0.5
10
12
Tempo (s)
Figura 5.20: Modelos locais para o sistema fuzzy TS FBO Generalizado com modelos locais no
lineares e estimao global (levitador magntico).
Por fim, a Figura 5.21 exibe o modelo final obtido. O valor do EQM para esse modelo com 36
parmetros foi de 0,0018657. Para fins de comparao, os resultados exibidos anteriormente para
o modelo Generalizado com estimao local foram um EQM de 0,0017220 para um modelo com
25 parmetros, ou seja, um menor EQM com um modelo mais simples. Ainda mais, considerando o
mtodo no otimizado de distribuio homognea das funes de pertinncia no universo de discurso,
o modelo apresenta um EQM de 0,0064353, 245% maior que a soluo fornecida pelo algoritmo
gentico para o modelo fuzzy TS FBO Generalizado com modelos locais no lineares e estimao
global.
Com fins ilustrativos, a Figura 5.22 apresenta os modelos locais obtidos em outra rodada do
AG cujo EQM para um modelo tambm com 36 parmetros foi de 0,0018440, prximo ao obtido
no modelo previamente descrito. Observa-se que os modelos locais obtidos so praticamente anti-
103
Sada real
Sada estimada
1.2
0.8
0.6
0.4
0.2
0
0.2
10
12
Tempo (s)
Figura 5.21: Sada real e a fornecida pelo modelo fuzzy TS FBO Generalizado com modelos locais
no lineares e estimao global (levitador magntico).
simtricos. Como as funes de pertinncia para este caso tambm estavam sobrepostas, ocorre uma
interpolao dos modelos locais obtidos, resultando em uma estimativa global razovel.
Na verdade, a estimao global deve em teoria fornecer um modelo com melhor capacidade de representao em
relao aquele obtido com estimao local caso ambos os modelos sejam idnticos [2, 3, 51]. Porm este no o caso
aqui, uma vez que como os modelos estavam em populaes distintas do AG possuam estruturas distintas (nmero de
estados, plos, etc.).
Resultados de Modelagem
104
4
Modelo 1
Modelo 2
Sada real
10
12
Tempo (s)
Figura 5.22: Modelos locais anti-simtricos para o sistema fuzzy TS FBO Generalizado com modelos
locais no lineares e estimao global (levitador magntico).
de pertinncia de entrada no universo de discurso de modo que cada modelo local atue eficazmente
na tarefa de representao do comportamento do sistema.
Alm de apresentar um resultado final melhor, a estimao local mais vantajosa em termos
de clculos numricos. A estimao dos parmetros dos modelos locais feita de forma separada,
ou seja, so calculadas duas matrizes pseudo-inversas5 de dimenso menor que aquela presente na
estimao global dos parmetros. As conseqencias so, para a estimao local, um menor tempo
de processamento para o clculo das matrizes pseudo-inversas, as quais so ainda, em mdia, melhor
condicionadas.
No algoritmo gentico todas estas caractersticas acabam por favorecer a obteno de melhores
solues (melhores modelos) ao se utilizar a estimao local.
No caso geral, sero calculadas tantas matrizes pseudo-inversas quantos forem os modelos locais.
105
1
Sada
Entrada
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
10
12
Tempo (h)
Resultados de Modelagem
106
Parmetros de Execuo
TS FBO Plo nico
Tamanho da populao
100
Nmero mximo de geraes
80
Taxa de crossover
0,85
Taxa de mutao
0,20
Expanso percentual mxima
do operador de crossover ()
0,20
Percentual da diversidade
inicial para convergncia
3
Controle de sobreposio
no
Abertura mnima das
FP gaussianas
0,3
Abertura mxima das
FP gaussianas
3
Nmero mximo de estados nos
conseqentes das regras
7
Nmero mximo de
variveis de entrada (maxvl )
4
Nmero mximo de FP por
varivel de entrada (maxtl )
3
Limite inferior para aplicao
das medidas de similaridade ()
0,2
Potncia para uso na equao
do limite de similaridade ()
8
Tabela 5.14: Configurao do AG para o sistema CSTR.
107
EQM mdio
Nmero mdio de parmetros
AIC mdio
Menor EQM
Nmero de parmetros do menor EQM
AIC do menor EQM
Maior EQM
Nmero de parmetros do maior EQM
AIC do maior EQM
Desvio padro do EQM
Desvio padro do AIC
Nmero mdio de geraes
Tempo mdio de processamento
por rodada (min)
Linear No Linear
0,0009744
0,0005689
48,11
60,69
-2779,64
-2857,39
0,0000766
0,0000752
78
138
-3491,90
-3398,80
0,0054286
0,0026339
22
78
-2032,20
-2130,30
0,0012133
0,0004744
339,18
262,45
41,49
56,69
12,41
21,49
Tabela 5.15: Resumo dos resultados do modelo fuzzy TS FBO com plo nico (CSTR).
EQM mdio
Nmero mdio de parmetros
AIC mdio
Nmero mdio de geraes
Linear No Linear
0,0021007
0,0005885
37,83
62,31
-2747,16
-2847,70
38,34
44,17
Tabela 5.16: Resumo dos resultados do modelo fuzzy TS FBO com plo nico sem o parmetro de
expanso (CSTR).
de todas as solues.
As duas prximas sees apresentam resultados de modelagem para o sistema CSTR que ilustram
a afirmao anterior, para modelos locais lineares e no lineares, respectivamente.
5.3.1 Modelo fuzzy TS FBO com Plo nico - Modelos Locais Lineares
Como exemplo, exibem-se na seqncia os resultados detalhados de uma rodada cujo EQM foi
aproximadamente metade da mdia dos resultados apresentados na tabela 5.15, ou seja, da mesma
ordem de grandeza dos resultados obtidos com modelos locais no lineares. Assim, considerando
dois modelos com desempenhos semelhantes em termos de suas capacidades de representao,
possvel classificar como melhor aquele que seja menos complexo (menor nmero de parmetros).
Nesta rodada em particular, o AG consumiu 55 geraes, interrompendo sua execuo pela convergncia da populao. O valor da diversidade ao final do processo evolutivo foi igual a 0,91 (a
Resultados de Modelagem
108
Linear No Linear
0,0000766
0,0000752
-3491,90
-3398,80
8
6
8
21
0,72843
0,74245
78
138
Tabela 5.17: Melhor resultado do modelo fuzzy TS FBO com plo nico (CSTR).
diversidade inicial foi 31,55). A Figura 5.24 exibe a curva da diversidade da populao ao longo das
geraes.
35
30
Diversidade
25
20
15
10
10
15
20
25
30
35
40
45
50
55
Geraes
Figura 5.24: Diversidade da populao para o modelo fuzzy TS FBO com plo nico e modelos locais
lineares (CSTR).
O limite de similaridade calculado em funo da diversidade da populao est exibido na
Figura 5.25. Nesta simulao, as fuses e eliminaes de variveis redundantes foram efetuadas
com maior fora nas dez ltimas geraes.
Assim como a diversidade, a curva do critrio de Akaike mdio da populao tambm tende a se
estabilizar, como mostrado na Figura 5.26.
Ao final desta rodada, o AG forneceu a soluo apresentada na tabela 5.18. Para este caso,
o nmero de parmetros do modelo foi 22, enquanto a mdia das solues foi 48,11. O modelo
obtido adotando-se a abordagem da distribuio homognea das funes de pertinncia (mtodo sem
109
1
0.9
0.8
0.7
Limite
0.6
0.5
0.4
0.3
0.2
0.1
0
10
15
20
25
30
35
40
45
50
55
Geraes
Figura 5.25: Limite de similaridade para o modelo fuzzy TS FBO com plo nico e modelos locais
lineares (CSTR).
6000
5000
4000
AIC Mdio
3000
2000
1000
0
1000
2000
3000
10
15
20
25
30
35
40
45
50
55
Geraes
Figura 5.26: Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO com plo nico e
modelos locais lineares (CSTR).
Resultados de Modelagem
110
otimizao) apresentou um EQM de 0,0019952, quase 300% maior que aquele obtido com o algoritmo gentico proposto.
Plo
0,91911
Nmero de regras
2
Nmero de parmetros nos conseqentes
8
EQM
0,0005068
Tabela 5.18: Soluo fornecida pelo AG para o modelo fuzzy TS FBO com plo nico e modelos
locais lineares (CSTR).
A Figura 5.27 exibe as funes de pertinncia para os termos lingsticos de entrada, completando
a soluo fornecida pelo AG. O algoritmo gentico selecionou como varivel de entrada o primeiro
estado ortonormal.
L1
L2
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
8
Figura 5.27: Funes de pertinncia de entrada para o modelo fuzzy TS FBO com plo nico e
modelos locais lineares (CSTR).
A Figura 5.28 exibe o resultado final obtido, comparando os dados de sada do sistema real com
os fornecidos pelo modelo fuzzy TS FBO com plo nico e modelos locais lineares.
5.3.2 Modelo fuzzy TS FBO com Plo nico - Modelos Locais No Lineares
Para a soluo ora apresentada, o AG no convergiu antes de executar o limite mximo de 80
geraes. Porm, como pode ser observado na Figura 5.29, a diversidade da populao de fato se
111
Sada real
Sada estimada
1.2
0.8
0.6
0.4
0.2
0
0
10
12
Tempo (h)
Figura 5.28: Sada real e a fornecida pelo modelo fuzzy TS FBO com plo nico e modelos locais
lineares (CSTR).
estabilizou em torno de 2,5, apenas no alcanou um valor inferior a 3% da diversidade inicial, a
qual foi igual a 31,68. Assim, a interrupo do AG, neste caso, no implicou em uma interrupo do
processo evolutivo, pois a populao no apresentava melhorias significativas nas ltimas geraes.
O limite para atuao das medidas de similaridade teve um comportamento semelhante ao da diversidade, no variando consideravelmente quando esta ltima tambm se estabilizou. A Figura 5.30
exibe o comportamento desse limite. Como a curva apresentada no se aproximou do limite mnimo
estipulado na tabela 5.14, o AG permitiu a existncia de funes de pertinncia mais sobrepostas que
no caso anterior, como ser observado na Figura 5.32.
O valor do critrio de Akaike mdio da populao nesta rodada apresentou uma dinmica um
tanto ruidosa, porm seguindo o objetivo de minimizao. Atribui-se este comportamento ao fato
de a populao manter um certo nvel de diversidade acima do limite mnimo pr-estabelecido. Esta
diversidade permite a contnua renovao de uma parcela da populao, atravs da atuao dos operadores genticos. Dessa forma, ora a mdia do critrio de Akaike pode aumentar e ora diminuir,
oscilando em torno de um nvel que pode ser tido como o timo para essa rodada em particular. O
grfico da Figura 5.31 exibe tal comportamento para o critrio de Akaike mdio da populao.
Aps as 80 geraes, o AG foi interrompido e forneceu a soluo apresentada na tabela 5.19, a
qual codifica um modelo com um total de 26 parmetros. Para este modelo em particular a soluo
fornecida pelo AG aproxima-se daquela obtida quando da distribuio homognea das funes de
pertinncia no universo de entrada. Sendo assim, neste caso ambas as estratgias forneceram modelos
Resultados de Modelagem
112
35
30
Diversidade
25
20
15
10
10
20
30
40
50
60
70
80
Geraes
Figura 5.29: Diversidade da populao para o modelo fuzzy TS FBO com plo nico e modelos locais
no lineares (CSTR).
1
0.9
0.8
0.7
Limite
0.6
0.5
0.4
0.3
0.2
0.1
0
10
20
30
40
50
60
70
80
Geraes
Figura 5.30: Limite de similaridade para o modelo fuzzy TS FBO com plo nico e modelos locais
no lineares (CSTR).
113
10000
8000
AIC Mdio
6000
4000
2000
2000
4000
10
20
30
40
50
60
70
80
Geraes
Figura 5.31: Evoluo do AIC mdio da populao para o modelo fuzzy TS FBO com plo nico e
modelos locais no lineares (CSTR).
equivalentes. Vale ressaltar, no entanto, que este um caso especial, uma vez que em todas as simulaes apresentadas anteriormente, tanto para o CSTR quanto para o levitador magntico, nas duas
arquiteturas analisadas (plo nico e Generalizada), os resultados obtidos com o mtodo automtico
baseado em algoritmos genticos aqui proposto foram sensivelmente melhores.
Plo
0.76593
Nmero de regras
2
Nmero de parmetros nos conseqentes
10
EQM
0.0004894
Tabela 5.19: Soluo fornecida pelo AG para o modelo fuzzy TS FBO com plo nico e modelos
locais no lineares (CSTR).
A Figura 5.32 exibe as funes de pertinncia da soluo final. Assim como no caso de modelos
locais lineares, aqui o algoritmo gentico selecionou como varivel de entrada o primeiro estado
ortonormal. Note-se que as funes de pertinncia esto mais sobrepostas que as apresentadas na
Figura 5.27.
A Figura 5.33 apresenta os dados de sada do sistema real e os fornecidos pelo modelo fuzzy TS
FBO com plo nico e modelos locais no lineares. Este resultado ligeiramente melhor que o obtido
com modelos locais lineares, porm, como afirmado anteriormente, este modelo possui um total de
26 parmetros, contra 22 daquele com modelos locais lineares. Analisando de outra forma, o modelo
Resultados de Modelagem
114
L2
L1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
8
Figura 5.32: Funes de pertinncia de entrada para o modelo fuzzy TS FBO com plo nico e
modelos locais no lineares (CSTR).
atual apresenta um EQM 4% menor que aquele com modelos locais lineares porm com 15% a mais
de parmetros. Logo, este acrscimo de parmetros no justificado, sendo ento mais adequado o
modelo fuzzy TS FBO com plo nico e modelos locais lineares para a modelagem do sistema CSTR.
5.4 Resumo
115
Sada real
Sada estimada
1.2
0.8
0.6
0.4
0.2
0
0
10
12
Tempo (h)
Figura 5.33: Sada real e a fornecida pelo modelo fuzzy TS FBO com plo nico e modelos locais
no lineares (CSTR).
5.4 Resumo
Este captulo apresentou os resultados de modelagem para dois sistemas dinmicos no lineares,
um levitador magntico e um processo de polimerizao. Exemplificaram-se todas as arquiteturas
propostas no presente trabalho, quais sejam, modelo fuzzy TS FBO com plo nico, fuzzy TS FBO
Generalizado com estimao local e fuzzy TS FBO Generalizado com estimao global. Para estas
arquiteturas, utilizaram-se tanto modelos locais lineares quanto no lineares nos conseqentes das
regras. Por sua menor complexidade, analisou-se para o processo de polimerizao apenas o modelo
fuzzy TS FBO com plo nico.
Os resultados de modelagem obtidos para ambos os sistemas indicam a eficincia do mtodo
proposto. Um conjunto de simulaes utilizando a abordagem no automtica de distribuio homognea das funes de pertinncia no universo de discurso forneceu a base comparativa para a
concluso sobre a eficincia do mtodo baseado em algoritmos genticos. Outro conjunto de simulaes indicou a inferioridade dos resultados ao se utilizar o operador de crossover aritmtico original,
sem o parametro de expanso.
Em particular, para o processo de polimerizao, o modelo fuzzy TS FBO com modelos locais
lineares forneceu os melhores resultados. Para o levitador magntico ambas as arquiteturas tiverem
desempenhos compatveis em termos da minimizao do critrio de Akaike (base do clculo do fitness
das solues), sendo que o modelo com plo nico apresenta em mdia valores menores do erro
116
Resultados de Modelagem
quadrtico mdio, porm com um nmero maior de parmetros. Alm disso, os modelos obtidos com
essa arquitetura apresentavam em mdia um nmero maior de funes ortonormais (estados), capazes
de representar bem qualquer dos dois modos dominantes do sistema (que no so muito distintos) com
um nico par intermedirio de plos complexos conjugados. A arquitetura com plo nico tambm
demandou maior tempo de processamento computacional, o que pode ser explicado pelo fato de sua
representao cromossmica ser muito mais flexvel.
Considerando-se apenas a arquitetura Generalizada para o levitador magntico, o mtodo de estimao que forneceu melhor desempenho foi a estimao local dos parmetros dos conseqentes das
regras. Este resultado merece ateno especial pois concilia os dois objetivos em princpio conflitantes quando da estimao de parmetros. Como afirmado na seo 3.4, a estimao local permite
uma interpretao local do modelo, sendo por exemplo til nas etapas de anlise e validao dos
modelos (ferramenta essencial neste captulo). Naquela seo foi tambm afirmado que em geral
a estimao global que fornece a melhor aproximao do sistema, em termos de um EQM menor.
No entanto, para a arquitetura proposta, o algoritmo gentico forneceu modelos ao mesmo tempo
interpretveis localmente e com capacidade de representao do sistema melhor que a obtida com
estimao global dos parmetros dos conseqntes das regras (resultado semelhante foi obtido em
[51]).
Outra observao interessante foi a obteno de melhores resultados com modelos locais lineares
nos conseqentes das regras, para os dois sistemas analisados. Conjectura-se que modelos locais
no lineares (Volterra de segunda ordem) produzem modelos com um maior nmero de parmetros
sem no entanto introduzir sensveis melhorias na capacidade de representao devido aos termos no
lineares, sofrendo assim maior penalizao pelo critrio de Akaike.
Captulo 6
Concluses
De concepo recente, os sistemas fuzzy TS FBO vm demonstrando sua eficcia na modelagem e
controle de sistemas dinmicos no lineares [89, 13, 14, 16]. Os modelos obtidos com essa arquitetura
apresentam uma srie de vantagens se comparados a outras possveis abordagens (ver seo 3.1).
As arquiteturas fuzzy TS FBO e fuzzy TS FBO Generalizado (apresentadas em detalhe no captulo 3) so baseadas nos modelos em espao de estados, linear FBO, de Volterra e fuzzy TS descritos
no captulo 2. Em suma, os modelos baseados em funes de base ortonormal possuem as desejveis
caractersticas de ausncia de realimentao da sada (e eventuais erros de predio), necessidade
de um menor nmero de parmetros para alcanar uma dada preciso (atravs da incorporao de
conhecimento sobre a dinmica do sistema nos plos que definem as funes da base ortonormal) e
tolerncia a dinmicas no modeladas ou a pequenas diferenas na ordem dos vetores de regresso.
Modelos fuzzy TS baseados em funes de base ortonormais, alm das caractersticas acima, agregam
as propriedades de interpretabilidade [32] e facilidade de representao do conhecimento dos sistemas
fuzzy. No entanto, os resultados promissores j obtidos com essa arquitetura no utilizavam nenhum
mtodo computacional inteligente para sua otimizao automtica.
O objetivo da presente dissertao foi indicar uma possvel direo para a realizao desta ltima
tarefa, ou mais especificamente, para a definio e otimizao da estrutura de modelos fuzzy TS FBO
e fuzzy TS FBO Generalizado.
A soluo adotada foi um algoritmo gentico, mtodo de otimizao bem consolidado na literatura
acadmica e com uma vasta gama de aplicaes prticas. Foi possvel obter modelos de sistemas
dinmicos no lineares (um processo de polimerizao e um levitador magntico) com grande grau
de autonomia ao se utilizar a metodologia proposta neste trabalho, confirmando sua eficincia.
No captulo 3 foram explicitados os parmetros dos modelos fuzzy TS FBO otimizados pelo AG
descrito no captulo 4. A otimizao de alguns parmetros dos modelos fuzzy TS j foi abordada
em outros trabalhos na literatura acadmica (ver referncias da seo 4.3.1), incluindo a forma e
117
Concluses
118
localizao das funes de pertinncia [76] e a base de regras de inferncia. Trabalhos mais recentes
tambm determinavam de forma automtica quantas e quais variveis de entrada seriam usadas no
sistema, bem como quantas funes de pertinncia estariam associadas a cada uma delas [26, 94].
As contribuies deste trabalho no contexto acima so:
Elaborao de uma representao cromossmica para o modelo fuzzy TS FBO com plo nico
e outra para o modelo fuzzy TS FBO Generalizado;
Incluso de um coeficiente de expanso no operador de crossover aritmtico para a manuteno
da diversidade da populao e obteno de melhores solues;
Uso de um operador de mutao gaussiana com desvio padro varivel e distinto para cada
gene;
Para a arquitetura fuzzy TS FBO com plo nico, otimiza-se:
O plo complexo que caracteriza a base de funes ortonormais;
O nmero de variveis de entrada do modelo;
A quantidade de funes de pertinncia para cada varivel de entrada;
Nmero de funes na base ortonormal;
Alm desses parmetros, ainda inclui-se uma etapa de simplificao das funes de pertinncia atravs das medidas de similaridade;
Para a arquitetura fuzzy TS FBO Generalizado, otimiza-se:
Um plo complexo para cada modelo local;
Nmero de funes em cada base ortonormal;
Quais funes da base ortonormal estaro presentes nas premissas das regras (variveis
de entrada);
A disposio e configurao das funes de pertinncia em ambas as arquiteturas tambm foi
otimizada.
A arquitetura fuzzy TS FBO Generalizado, por sua maior complexidade, teve menos parmetros
otimizados. No entanto, mesmo nesse caso, o grau de autonomia na definio da estrutura do modelo
era alto, bastando basicamente ser definido por um especialista o nmero de modelos locais esperado
para o sistema. Ainda para o modelo Generalizado, foram analisadas duas formas de estimao dos
coeficientes das regras: estimao local e global. Verificou-se para o sistema levitador magntico que
119
a estimao local seria mais adequada, uma vez que ao mesmo tempo permite uma interpretao clara
do modelo, em termos da correta classificao das diferentes regies de operao do sistema, alm
de possibilitar uma melhor representao do mesmo (menor erro de aproximao em srie sinttica)
com um modelo menos complexo (menor nmero de parmetros). Este resultado particularmente
interessante pois em princpio a estimao global dos parmetros deveria fornecer um modelo com
melhor capacidade de representao, mesmo a custa de uma perda em sua interpretabilidade (ver
seo 5.2.4). Para ambos os sistemas estudados o uso de modelos locais lineares apresentou melhores
resultados em comparao aos modelos locais no lineares de Volterra de segunda ordem. Logo, para
as arquiteturas propostas neste trabalho, os termos no lineares nos modelos locais so mais penalizados pelo critrio de Akaike sem resultar em melhorias significativas na capacidade de representao
do modelo como um todo.
Estas concluses foram obtidas com a anlise das simulaes documentadas no captulo 5. Todas
as possveis combinaes das arquiteturas propostas foram avaliadas de forma estatstica, apresentando-se no os melhores resultados obtidos (que poderiam de certa forma polarizar sua interpretao), mas sim aqueles que se aproximaram da mdia de todas as simulaes. Em todos os casos,
a corretude das implementaes computacionais foi comprovada pela verificao do comportamento
esperado do algoritmo gentico (como a queda da diversidade da populao bem como do valor
mdio do critrio de Akaike com o passar das geraes) e pela obteno de modelos satisfatrios
para os sistemas estudados, resultado este que confirma ainda a eficincia da metodologia aqui proposta. A qualidade dos modelos foi avaliada tanto pela forma e disposio das funes de pertinncia
obtidas quanto pela comparao das respostas (sadas) fornecidas pelos modelos com aquelas do
sistema real, ambos sujeitos a um mesmo sinal de entrada (diferente do utilizado na etapa de otimizao). Alm disso, foram realizadas vrias simulaes para comparao de resultados com estratgias
sem otimizao automtica (distribuio homognea de funes de pertinncia) e com o operador
de crossover aritmtico original. Todos os resultados comparativos, tambm relatados no captulo 5,
indicam a relevncia do presente trabalho.
A principal direo para continuidade deste trabalho a investigao de um mtodo automtico
para a definio do nmero de modelos locais na arquitetura fuzzy TS FBO Generalizado. Atualmente
esta uma entrada do algoritmo, porm mtodos de agrupamento baseados em um conjunto de dados
de treinamento, por exemplo, podem ser aplicados nessa tarefa [81]. Outra possibilidade seria a
elaborao de uma representao cromossmica flexvel, que permitisse o aumento e diminuio do
nmero de modelos locais, alterando o conjunto de funes de pertinncia de tal forma que a base de
regras completa fosse composta por tantas regras quantos fossem os modelos locais. Seria possvel
tambm investigar o uso de base de regras no completas.
Ainda para o modelo fuzzy TS FBO Generalizado, podem ser implementados ao mesmo tempo
120
Concluses
modelos locais lineares e no lineares, modelando diferentes regies de operao do sistema real [32].
Logo, caso o sistema real possua regies de operao distintas, algumas podendo ser modeladas por
modelos lineares e as demais por no lineares, ento tal implementao da arquitetura fuzzy TS FBO
Generalizado seria adequada, uma vez que os modelos fuzzy permitem a transio suave entre seus
modelos locais [93].
Alm dessas possveis continuaes na pesquisa da modelagem de sistemas dinmicos utilizando
a arquitetura proposta, outra perspectiva se refere sua aplicao em controladores baseados em
modelos, os controladores preditivos [1, 12, 32, 67, 81, 109].
Referncias Bibliogrficas
[1] Abonyi, J. (2003). Fuzzy Model Identification for Control. Birkhuser.
[2] Abonyi, J. e Babuska, R. (2000). Local and global identification and interpretation of parameters in Takagi-Sugeno fuzzy models. Ninth IEEE International Conference on Fuzzy Systems,
San Antonio, TX, USA, Vol. 2, 835-840.
[3] Aguirre, L. A. (2004). Introduo a Identificao de Sistemas, 2 Edio, Editora UFMG.
[4] Anderson, J. A. (1995). An introduction to neural networks. MIT Press.
[5] Amaral, J. F. M., Vellasco, M. M., Tanscheit, R. e Pacheco, M. A. C. (2001). A Neuro-FuzzyGenetic System for Automatic Setting of Control Strategies. Genetic Fuzzy Systems: New
Developments, IFSA/NAFIPS Conference, Vancouver, Canada, 1553-1558.
[6] Bck, T., Fogel, D. B. e Michalewicz, Z. (2000). Evolutionary Computation 1, Basic Algorithms and Operators. Institute of Physics Publishing, Bristol and Philadelphia.
[7] Bck, T., Fogel, D. B. e Michalewicz, Z. (2000). Evolutionary Computation 2, Advanced Algorithms and Operators. Institute of Physics Publishing, Bristol and Philadelphia.
[8] Blanton, J. L. Jr. e Wainwright, R. L. (1993) Multiple Vehicle Routing with Time and Capacity
Constraints Using Genetic Algorithms. Proceedings of the 5th International Conference on
Genetic Algorithms, San Francisco, CA, USA, 452-459.
[9] Bodin, P., Silva, T. O. E. e Wahlberg, B. (1996). On the construction of orthonormal basis
functions for system identification. Proceedings of the IFAC World Congress, San Francisco,
CA, USA, Vol. 1, 369-374.
[10] Braga, A. P., Ludermir, T. B. e Carvalho, A. C. P. L. F. (2000). Redes Neurais Artificiais. LTC
- Livros Tcnicos e Cientficos Editora.
[11] Brassard, G. e Bratley, P. (1996) Fundamentals of algorithmics. Prentice-Hall.
121
REFERNCIAS BIBLIOGRFICAS
122
[12] Camacho, E. F. e Bordons, C. (2004). Model Predictive Control, 2nd Edition. Springer.
[13] Campello, R. J. G. B., Meleiro, L. A. C., Amaral, W. C. e Maciel Filho, R. (2001). Identification of a bioprocess using Laguerre function based models. Proceedings of the Sixth World
Congress of Chemical Engineering, Melbourne, Australia, p. CD.
[14] Campello, R. J. G. B. (2002). Arquiteturas e Metodologias para Modelagem e Controle
de Sistemas Complexos Utilizando Ferramentas Clssicas e Modernas. Tese de Doutorado,
DCA/FEEC/UNICAMP, Campinas, SP, Brasil.
[15] Campello, R. J. G. B. e Amaral, W. C. (2002). Takagi-Sugeno Fuzzy Models within Orthonormal Basis Function Framework and their Application to Process Control. Proceedings of the
11th IEEE Int. Conference on Fuzzy Systems, 1399-1404.
[16] Campello, R. J. G. B., Meleiro, L. A. C. e Amaral, W. C. (2004). Control of a Bioprocess using
Orthonormal Basis Function Fuzzy Models. Proceedings of the IEEE International Conference
on Fuzzy Systems, Budapest, Hungary, Vol. 2, 801-806.
[17] Cordn, O. (2001). Genetic fuzzy systems : evolutionary tuning and learning of fuzzy knowledge bases. World Scientific.
[18] Cordn, O., Gomide, F., Herrera, F., Hoffmann, F. e Magdalena, L. (2004). Ten years of genetic
fuzzy systems: current framework and new trends. Fuzzy Set and Systems, Vol. 141, 5-31.
[19] Cybenko, G. (1988). Continuous Valued Neural Network with two Hidden Layers are Sufficient. Technical Report, Department of Computer Science, Tufts University.
[20] Cybenko, G. (1989). Approximation by Superpositons of a Sigmoid Function. Mathematics of
Control, Signals and Systems, Vol. 2, 303-314.
[21] Darwin, C. (1859). The origin of species by means of natural selection, or the preservation of
favoured races in the struggle for life. John Murray, London, United Kingdom.
[22] Delgado, M. R., Von Zuben, F. e Gomide, F. (2001). Hierarchical genetic fuzzy systems. Information Sciences, Vol. 136, 29-52.
[23] Delgado, M. R., Von Zuben, F. e Gomide, F. (2001). Local and global estimation of TakagiSugeno consequent parameters in genetic fuzzy systems. Joint 9th IFSA World Congress and
20th NAFIPS International Conference, Vancouver, BC, Canada, Vol. 3, 1247-1252.
REFERNCIAS BIBLIOGRFICAS
123
REFERNCIAS BIBLIOGRFICAS
124
[38] Goonatilake, S. e Khebbal, S. (1995). Intelligent Hybrid Systems. John Wiley & Sons.
[39] Gven, M. K. e Passino, K. M. (2001). Avoiding exponential parameter growth in fuzzy systems, IEEE Transactions on Fuzzy Systems, Vol. 9, 194-199.
[40] Haykin, S. (1999). Neural Networks: A Comprehensive Foundation, 2nd Edition. Prentice
Hall.
[41] Haykin, S. e Veen, B. V. (2000). Sinais e Sistemas. Bookman.
[42] He, L. e Mort, N. (2000). Hybrid Genetic Algorithms for Telecommunications Network BackUp Routeing. BT Technology Journal, Vol. 18, Issue 4, 42-50.
[43] Herrera, F. e Lozano, M. (1996). Adaptation of Genetic Algorithm Parameters Based on Fuzzy
Logic Controllers. Genetic Algorithms and Soft Computing, Physica-Verlag.
[44] Hinterding, R. (1996). Gaussian mutation and self-adaption for numeric genetic algorithms.
IEEE International Conference on Evolutionary Computation, Perth, Australia, Vol.1, 384389.
[45] Holland, J. H. (1962). Outline for a logical theory of adaptive systems. Journal of ACM 9
297-314.
[46] Holland, J. H. (1975). Adaptation in Natural and Artificial Systems. Ann Arbor, MI: University
of Michigan Press.
[47] Homaifar, A. e McCormick, E. (1995). Simultaneous Design of Membership Functions and
Rule Sets for Fuzzy Controllers Using Genetic Algorithms. IEEE Transactions on Fuzzy Systems, Vol. 3, Issue 2, 129-139.
[48] Jain, L. C. e Jain, R. K. (1997). Advances in Fuzzy Systems - Applications and Theory. Hybrid
Intelligent Engineering Systems, Vol. 11, World Scientific.
[49] Jain, L. C. e Martin, N. M. (1998). Fusion of Neural Networks, Fuzzy Sets, and Genetic Algorithms. CRC Press.
[50] Jikai, Y., Hongtao, Y. H. S. e Yuanbin, H. (1997). Fuzzy Control Technique Based on Genetic
Algorithms Optimizing and Its Applications. IEEE International Conference on Intelligent Processing Systems, Beijing, China, Vol. 1, 329-333.
REFERNCIAS BIBLIOGRFICAS
125
[51] Johansen, T. A., Shorten, R. e Murray-Smith, R. (2000). On the interpretation and identification
of dynamic Takagi-Sugeno fuzzy models. IEEE Transactions on Fuzzy Systems, Vol. 8, Issue
3, 297-313.
[52] Cavalcante Junior, F. L. (2000). Controle Preditivo Utilizando um Modelo Nebuloso. Dissertao de mestrado, DCA/FEEC/UNICAMP, Campinas, SP, Brasil.
[53] Kailath, T. (1980). Linear Systems. Prentice-Hall.
[54] Karr, C. e Freeman, L. M. (1998) Industrial Applications of Genetic Algorithms. CRC Press.
[55] Kibangou, A.Y., Favier, G. e Hassani, M. M. (2003).Generalized orthonormal basis selection
for expanding quadratic Volterra filters. 13th IFAC Symposium on System Identification, The
Netherlands, 1119-1124.
[56] Kim, J. e Zeigler, B. P. (1996). Hierarchical Distributed Genetic Algorithms: A Fuzzy Logic
Controller Design Application. IEEE Intelligent Systems, Vol. 11, Issue 3, 76-84.
[57] Kumar, K. e Wu, B. (1999). Application of Genetic and Fuzzy Modelling in Time Series Analysis. Proceedings of the Third IEEE International Conference on Computational Intelligence
and Multimedia Applications, New Delhi, India, 128-132.
[58] Kumar, P., Chandna, V. K. e Thomas, M. S. (2004). Fuzzy-Genetic Algorithm for PreProcessing Data at the RTU. IEEE Transactions on Power Systems, Vol. 19, Issue 2, 718-723.
[59] Kikuchi, S., Tominaga, D., Arita, M., Takahashi, K. e Tomita, M. (2003). Dynamic modeling
of genetic networks using genetic algorithm ans S-system. Bioinformatics, Vol. 19, 643-650.
[60] Koza, J. R., Bennett III, F. H., Andre, D., Keane, M. A. e Dunlap, F. (1997). Automated
Synthesis of Analog Electrical Circuits by Means of Genetic Programming. IEEE Transactions
on Evolutionary Computation, Vol. 1, N. 2, 109-128.
[61] Kosko, B. (1997). Fuzzy Engineering, Prentice Hall.
[62] Laabidi, K. e Bouani, F. (2004). Genetic Algorithms for Multiobjective Predictive Control.
First International Symposium on Control, Communications and Signal Processing, 149-152.
[63] Larraaga, P., Kuijpers, C. M. H., Murga, R. H., Inza, I. e Dizdarevic, S. (1999). Genetic
Algorithms for the Travelling Salesman Problem: A Review of Representations and Operators.
Artificial Intelligence Review, Vol. 13, Issue 2, 129-170.
REFERNCIAS BIBLIOGRFICAS
126
[64] Lee, M. A. e Takagi, H. (1993). Dynamic Control of Genetic Algorithms using Fuzzy Logic
Techniques. Proceedings of the 5th International Conference on Genetic Algorithms, San Francisco, CA, USA, 76-83.
[65] Lee, M. A. e Takagi, H. (1993). Integrating Design Stages of Fuzzy Systems using Genetic
Algorithms. Second IEEE International Conference on Fuzzy Systems, San Francisco, CA,
USA, Vol. 1, 612-617.
[66] Leung, F. H. F., Lam, H. K., Ling, S. H. e Tam, P. K. S. (2004). Optimal and Stable Fuzzy Controllers for Nonlinear Systems Based on an Improved Genetic Algorithm. IEEE Transactions
on Industrial Electronics, Vol. 51, N. 1, 172-182.
[67] Li, N., Li, S. Y. e Xi, Y. G. (2004). Multi-model predictive control based on the Takegi-Sugeno
fuzzy models: a case study. Information Sciences, Vol. 165, 247-263.
[68] Lima, C. M. R. R (2002). Otimizao da Frota de Veculos na Distribuio de Gs. Monografia
de Graduao, Universidade Federal do Rio Grande do Norte, Natal, RN.
[69] Lima, R. N. B., Miranda, M. N., Filho, J. V. S., Pedroza, A. C. P. e Mesquita, A. C. (2002).
HW/SW codesign of handoff protocol for wireless ATM networks based on performance optimization using genetic algorithm. Proceedings. 15th Symposium on Integrated Circuits and
Systems Design, 29-34.
[70] Linkens, D. A. e Nyongesa, H. O. (1996). Learning Systems in intelligent control: an appraisal
of fuzzy, neural and genetic algorithm control applications. Proceedings of the IEEE Control
Theory and Applications, Vol. 143, Issue 4, 367-386.
[71] Liska, J. e Melsheimer, S. S. (1994). Complete Design Of Fuzzy Logic Systems Using Genetic
Algorithms. IEEE World Congress on Computational Intelligence, Proceedings of the Third
IEEE Conference on Fuzzy Systems, Vol. 2, 1377-1382.
[72] Ljung, L. (1999) System identification: Theory for the user, Z Edition. Prentice-Hall.
[73] Mamdani, E. H. (1976). Application of fuzzy logic to approximate reasoning using linguistic
synthesis. Proceedings of the Sixth IEEE International Symposium on Multiple-valued Logic,
Logan, Utah, USA, 196-202.
[74] Maner, B. R., Doyle III, F. J., Ogunnaike, B. A. e Pearson, R. K. (1996). Nonlinear Model predictive control of a simulated multivariable polymerization reactor using second-order Volterra
models. Automatica, Vol. 32, Issue 9, 1285-1301.
REFERNCIAS BIBLIOGRFICAS
127
[75] McCulloch, W. S. e Pitts, W. H. (1943). A logical calculus of the ideas immanent in nervous
activity. Bulletin of Mathematical Biophysics, Vol. 5, 115-133.
[76] Medeiros, A. V., Maitelli, A. L. e Gabriel Filho, O. (2001). Otimizao das Funes de Pertinncia de um Controlador Nebuloso utilizando Algoritmos Genticos. V Simpsio Brasileiro
de Automao Inteligente, Canela, RS.
[77] Medeiros, A. V. (2003). Utilizao de Tcnicas de Inteligncia Artificial no Controle de Sistemas. Monografia de Graduao, Universidade Federal do Rio Grande do Norte, Natal, RN.
[78] Medeiros, A. V., Maitelli, A. L. e Arajo, F. M. U. (2003). Gerao das regras de inferncia de um Controlador Nebuloso utilizando Algoritmos Genticos. VI Simpsio Brasileiro de
Automao Inteligente, Bauru, SP.
[79] Michalewicz, Z. (1996). Genetic Algorithms + Data Structures = Evolution Programs. 3
Edio, Springer-Verlag.
[80] Michalewicz, Z., Nazhiyath, G., e Michalewicz, M. (1996). A Note on Usefulness of Geometrical Crossover for Numerical Optimization Problems, Proceedings of the 5th Annual Conference on Evolutionary Programming, San Diego, CA. MIT Press, Cambridge, MA, 305-312.
[81] Murray-Smith, R. e Johansen, T. A. (1997). Multiple Model Approaches to Modelling and
Control. Taylor and Francis.
[82] Ng, K. C. e Li, Y. (1994). Design Of Sophisticated Fuzzy Logic Controllers Using Genetic
Algorithms. IEEE World Congress on Computational Intelligence, Proceedings of the Third
IEEE Conference on Fuzzy Systems, Orlando, FL, USA, Vol. 3, 1708-1712.
[83] Ninness, B., Gmez, J.-C. e Weller, S. (1995). MIMO System Identification Using Orthonormal Basis Functions. Proceedings of the 34th IEEE Conference on Decision and Control, New
Orleans, LA, USA, Vol. 1, 703-708.
[84] Ninness, B. M. e Gustafsson, F. (1997). A Unifying Construction of Orthonormal Bases for
System Identification. IEEE Transactions on Automatic Control. Vol 42, Issue 2, 515-521.
[85] Norgaard, M., Ravn, O., Poulsen, N. K. e Hansen, L. K. (2000). Neural Networks for Modelling and Control of Dynamic Systems. Springer.
[86] Ogata, K. (1978) System Dynamics. Prentice-Hall.
[87] Ogata, K. (1995) Discrete-time control systems, 2nd Edition. Prentice-Hall.
REFERNCIAS BIBLIOGRFICAS
128
[88] Ogunnaike, B. A. e Ray, W. H. (1994). Process Dynamics, Modeling, and Control. Oxford
University Press.
[89] Oliveira, G. H. C., Campello, R. J. G. B. e Amaral, W. C. (1999). Fuzzy Models within Orthonormal Basis Function Framework. IEEE International Fuzzy Systems Conference, Seoul,
Korea, Vol. 2, 957-962.
[90] Palm, W. J. (1983). Modeling, Analysis and Control of Dynamic Systems. John Wiley & Sons.
[91] Park, D. Kandel, A. e Langholz, G. (1994). Genetic-Based New Fuzzy Reasoning Models with
Application to Fuzzy Control. IEEE Transactions on Systems, Man and Cybernetics, Vol. 24,
Issue 1, 39-47.
[92] Parks, T. R. (1999). Manual for Model 730 - Magnetic Levitation System, ECP.
[93] Pedrycz, W. e Gomide, F. A. C. (1998). An Introduction to Fuzzy Sets: Analysis and Design
(Complex Adaptive Systems). MIT Press.
[94] Pea-Reyes, C. A. (2002). Coevolutionary Fuzzy Modeling. Tese de doutorado, Section
deinformatique, cole Polytechnique Fdrale de Lausanne, Lausanne, Suia.
[95] Rosa, A. (2005). Desenvolvimento de Modelos Discretos de Volterra usando Funes de Kautz.
Dissertao de Mestrado, DCA/FEEC/UNICAMP, Campinas, SP, Brasil.
[96] Rosenblatt, F. (1958). The Perceptron: A Probabilistic Model for Information Storage and
Organization in the Brain. Cornell Aeronautical Laboratory, Psychological Review, Vol. 65,
No. 6, 386-408.
[97] Ruan, D. (1997). Intelligent Hybrid Systems - Fuzzy Logic, Neural Networks and Genetic
Algorithms. Kluwer Academic Publishers.
[98] Russo, M. (1998). FuGeNeSys - A Fuzzy Genetic Neural System for Fuzzy Modeling. IEEE
Transactions on Fuzzy Systems, Vol. 6, Issue 3, 373-388.
[99] Setnes, M., Babuska, R., Kaymak, U. e van Nauta Lemke, H. R. (1998). Similarity measures
in fuzzy rule base simplification, IEEE Transactions on Systems, Man and Cybernetics - Part
B: Cybernetics, Vol. 28, 376-386.
[100] Shaw, I. S. e Simes, M. G. (1999). Controle e Modelagem Fuzzy. Edgard Blcher.
REFERNCIAS BIBLIOGRFICAS
129
[101] Schaffer, J. D., Whitley, D. e Eshelman, L. J. (1992). Combinations of genetic algorithms and
neural networks: a survey of the state of the art. International Workshop on Combinations of
Genetic Algorithms and Neural Networks, Baltimore, MD, USA, 1-37.
[102] Su, C. T., Lii, G. R. e Hwung, H. R. (1996). A Neuro-Fuzzy Method for Tracking Control.
IEEE International Conference on Industrial Technology, Shanghai, China, 682-686.
[103] Subbu, R. e Bonissone, P. P. (2003). A Retrospective View of Fuzzy Control of Evolutionary
Algorithm Resource. IEEE International Conference on Fuzzy Systems, St. Louis, MO, USA,
Vol. 1, 143-148.
[104] Takagi, T. e Sugeno, M. (1985). Fuzzy identification of systems and its applications to modeling and control. IEEE Transactions on Systems, Man, and Cybernetics. Vol. 15, 116-132.
[105] Tenorio, M. F. e Lee, W. (1990). Self-organizing network for optimum supervised learning.
IEEE Transactions on Neural Networks, NN-1, 100-109.
[106] Tsoukalas, L. H. e Uhrig, R. E. (1997). Fuzzy and Neural Approaches in Engineering. WileyInterscience.
[107] United States Patent and Trademark Office. http://www.uspto.gov/index.html. Acessado em
julho de 2005.
[108] Van den Hof, P. M. J., Heuberger, P. S. C. e Bokor, J. (1994). System identification with generalized orthonormal basis functions. Proceedings of the 33rd IEEE Conference on Decision and
Control, Lake Buena Vista, FL, USA, Vol. 4, 3382-3387.
[109] Verbruggen, H. B. e Babuska, R. (1999). Fuzzy Logic Control, Advances in Applications.
World Scientific.
[110] Vonk, E., Jain, L. C. e Johnson, R. P. (1997). Automatic Generation of Neural Network Architecture Using Evolutionary Computation. World Scientific.
[111] Von Zuben, F. J. (2005). Notas de Aula da disciplina Computao Evolutiva, disponvel em
http://www.dca.fee.unicamp.br/vonzuben. Acessado em 13/02/2005.
[112] Wahlberg, B. (1991). System identification using Laguerre models. IEEE Transactions on Automatic Control, Vol. 36, Issue 5, 551-562.
[113] Wahlberg, B. (1994). System identification using Kautz models. IEEE Transactions on Automatic Control, Vol. 39, Issue 6, 1276-1282.
REFERNCIAS BIBLIOGRFICAS
130
[114] Wallace, C. S. e Freeman, P. R. (1987). Estimation and inference by compact coding. J. R. Stat.
Soc. B, Vol. 49, 240-265.
[115] Wang, L.-X. e Mendel, J. M. (1992). Fuzzy basis functions, universal approximation, and
orthogonal least-squares learning. IEEE Transactions on Neural Networks, Vol.3, Issue 5, 807814.
[116] Wu, C. J. e Liu, G. Y. (2000). A Genetic Approach for Simultaneous Design of Membership
Functions and Fuzzy Control Rules. Journal of Intelligent and Robotic Systems, Vol. 28, Issue
3, 195-211.
[117] Zadeh, L. A. (1965) Fuzzy Sets. Information and Control, Vol. 8, 338-353.
[118] Zhang, T., Jamshidi, M., Coelho, L. S. e Krohling, R. A. (2002). Robust Control Systems with
Genetic Algorithms. CRC Press.