You are on page 1of 74

REPUPLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE

Ministre de lEnseignement Suprieur et de la Recherche Scientifique

Facult de Technologie
Dpartement de Gnie Electrique

Cours
Commande Intelligente

Spcialit :
Master 2 Automatique
Master 2 Commande des Systmes Electriques

Prsent Par Lenseignant

Dr Samir ZEGHLACHE

Sommaire

2A Master AUT+CSE

CHAPITRE I : COMMANDE PAR LOGIQUE FLOU


I.1. Methodologie de la logique floue.
I.1.1. Introduction
I.1.2. Principe de la logique floue
I.1.3. Principe..
I.2. Les bases thoriques de la logique floue..
I.2.1. Variables linguistiques, fonctions d'appartenance.
I.2.2. Univers de discours, ensemble flou, degr d'appartenance
I.3. Dductions floues (infrences).
I.4. Oprations en logique floue..
I.4.1. Complment d'un ensemble (fonction ngation)
I.4.2. Intersection de deux ensembles (fonction "Et")
I.4.3. Union de deux ensembles (fonction "Ou")
I.4.4. Tableau rcapitulatif..
I.4.5.Oprateurs Et, Ou raliss par oprateurs arithmtiques
I.5. Le raisonnement flou
I.5.1. Gnralits.
I.5.2. Limplication floue
I.5.3. Linfrence floue
I.5.4. Agrgation des rgles.
I.6. Conclusion
I.7. PRINCIPE DUN CONTROLEUR FLOU.
I.7.1. Introduction
I.7.2.Les raisons dun contrle flou.
I.7.3. Principe dun contrleur flou.
I.7.3.1. La fuzzification
I.7.3.2. Infrence ..
I.7.3.2.1. Description par matrice dinfrence.
I.7.3.2.2. Traitement numrique des infrences
I.7.3.2.3. Mthode dinfrence somme-produit...
I.7.4. La dfuzzification..
I.8. CONCEPTION DES REGULATEURS FLOUS ..
I.8.1. Exemple 1 : Rgulateur flou de vitesse et de position dune machine lectrique..
I.8.1.1 Rgulateur flou de vitesse..
I.8.1.2 Rgulateur de position par la logique floue
I.8.1.3 Rsultats exprimentaux.
I.8.2. Exemple 2 : Navigation ractive dun robot mobile..
I.9. Rsultats du simulateur graphique Pioneer II..

01
01
01
01
02
03
04
05
05
05
06
07
07
07
08
08
08
09
09
10
11
11
11
12
12
14
14
15
15
19
21
21
21
29
31
33
35

CHAPITREII : COMMANDE ET IDENTIFICATION PAR LES RESEAUX DE


NEURONE ARTIFICIELS
II.1. Introduction
II.2. Gnralits.
II.3. Neurone biologique
II.4. Elments de base
II.4.1. Structure de base.
II.4.2 Fonction d'activation
I

38
38
38
39
39
40

II.5. L'apprentissage des rseaux de neurones...


II.5 Algorithme d'apprentissage.
II.6 Identification et commande des systmes par les rseaux de neurones..
II.6.1. Identification des processus par rseaux de neurones.
II.6.1.1. Identification directe.
II.6.1.2. Identification inverse
I.6.2. Commande des processus par rseaux de neurones.
I.6.2.1. Apprentissage dun contrleur conventionnel...
I.6.2.2. Commande inverse avec apprentissage en ligne...
II.7. Avantages et Inconvnients des rseaux de neurones
II.7.1. Avantages des rseaux de neurones
II.7.2. Inconvnients des rseaux de neurones...

41
41
42
42
42
43
44
44
44
45
45
45

CHAPITRE III : COMMANDE PAR LES RESEAUX DE NEURONE FLOUE


III.1 Rseaux neuro-flou
III.2 L'architecture Nomura.
III.2.1 Fonctions des diffrentes couches.
III.2.2 Ralisation des fonctions d'appartenance..
III.2.3 Calcul des valeurs de vrit i ...
III.2.4 Algorithme d'apprentissage.
III.3 L'architecture LSC ..
III.4 L'architecture ANFIS .
III.4.1 Algorithme d'apprentissage.

48
49
50
51
51
51
53
54
57

CHAPITRE IV : OPTIMISATION DE COMMANDES FLOUE PAR LES


ALGORITHMES GENETIQUES
IV.1 Algorithme genetique adopte pour loptimisation dun SIF..
IV.2 Reprsentation des solutions (codage)..
IV.3 Oprateurs gntiques...
IV.4 Rsultats de simulation..
IV.4.1 Optimisation des paramtres du contrleur

60
60
60
61
61

BIBLIOGRAPHIE..

64

II

Chapitre I
Commande par Logique Flou

Commande par logique flou

2A Master AUT+CSE

I.1. METHODOLOGIE DE LA LOGIQUE FLOUE


I.1.1. Introduction
La logique floue suscite actuellement un intrt gnral de la part des chercheurs, des
ingnieurs et des industriels, et plus gnralement de la part de tous ceux qui prouvent le besoin
de formaliser des mthodes empiriques, de gnraliser des modes de raisonnement naturel,
dautomatiser la prise de dcision dans leur domaine et de construire des systmes artificiels
effectuant les tches habituellement prises en charge par les humains.
La logique floue est une technique pour le traitement de connaissances imprcises bases,
sur des termes linguistiques; elle donne les moyens de convertir une commande linguistique base
sur le raisonnement humain, en une commande automatique, permettant ainsi la commande des
systmes complexes dont les informations sont exprimes dune faon vague et mal dfinie.
Dans le domaine du gnie lectrique, la commande logique floue a fait lobjet de plusieurs
travaux : dans la commande des convertisseurs statiques et dans la commande des machines
lectriques [1], [2], [3], dans la navigation de robots mobiles [4], [5]. Toutes ces applications ont
dmontr quun rgulateur logique floue est plus robuste quun rgulateur conventionnel [2], [6].
Les performances que la commande floue peut apporter par comparaison avec les
commandes classiques, sont essentiellement dues la mthode de conception de ces rgulateurs.
En effet, ces derniers ne ncessitent pas la connaissance des modles mathmatiques du systme.
Par contre ils ont besoin dun ensemble de rgles bases essentiellement sur les connaissances dun
oprateur qualifi manipulant le systme.

Afin de pouvoir appliquer la technique de la logique floue la commande dune machine


lectrique en vitesse et position et la navigation dun robot mobile dans un environnement
inconnu, nous allons nous intresser de plus prs cette technique. Dans ce contexte, on se
limitera aux proprits essentielles de la commande par logique floue qui nutilise quune petite
partie de toutes les rgles existantes de la thorie de la logique floue.
I.1.2. Principe de la logique floue
I.1.3. Principe
Une des caractristiques du raisonnement humain est qu'il est gnralement fond sur des
donnes imprcises ou mme incompltes. En effet les connaissances dont nous disposons sur un
systme quelconque sont gnralement incertaines ou vagues, soit parce que nous avons un doute
sur leur validit ou alors nous prouvons une difficult les exprimer clairement.
Premier exemple : Soit E lensemble des tailles possible et A lensemble des grandes
tailles. En logique boolienne, on est soit de petite taille, soit de grande taille. Si 170 cm est la
frontire entre les deux, on est petit pour x<170 cm et grand pour x>=170. Mais si lon mesure 169
cm, on est petit !!!...cette discontinuit est totalement absurde (Figure I.1.a). Le plus correcte sera
donc de reprsenter A par un ensemble flou permettant un passage progressif des tailles petites aux
tailles grandes (Figure I.1.b).

A (x)
Grand

E (x)

1
170 cm

Petit

Grand

0.5

A (x)
160 170 180
1

Petit

Figure I.1.b : Reprsentation les 2


variables (grand et petit) par la
logique flou
170 cm

Figure I.1.a : Reprsentation les 2 variables


(grand et petit) par la logique boolienne
Deuxime exemple : Une temprature de 16C dans la logique classique correspond au
seul ensemble "Tide", alors que dans le modle flou, elle appartient la fois aux ensembles
"Froid" et "Tide".
Il est donc ncessaire de penser et de dvelopper un nouveau type de raisonnement : le
raisonnement approch, qui permettra de traiter mathmatiquement limprcis et lincertain. Le
premier avoir soulign ces possibilits de dveloppement est Lotfi A. Zadeh qui ds 1965
introduit la thorie de la logique floue [7], [8].
Cest une technique pour le traitement de connaissances imprcises et incertaines. Elle
permet de prendre en considration des variables linguistiques dont les valeurs sont des mots ou
des expressions du langage naturel, telles que rapide, lent, grand, petit, etc....
Un exemple : dans la logique classique, une vitesse peut tre qualifie par les termes
Eleve . Dans la logique floue, des chelons dapprciation intermdiaires de la variable vitesse
sont possibles. La Vitesse devient une variable linguistique dont les valeurs sont par exemple :
Trs faible , Faible , Moyenne , Eleve , Trs leve .
La logique floue peut tre considre comme une extension de la logique classique ou
binaire.
I.2. Les bases thoriques de la logique floue
L'exemple suivant montre o nous voulons en venir avec cette thorie. Nous voulons
raliser une rgulation de temprature sur la base de rgles telles que :
1- Si la temprature est basse, Alors le chauffage doit tre fort,
2- Si la temprature est moyenne Et que la pression est haute, Alors le chauffage doit tre
moyen Et le volet doit tre ouver.
3- Si la temprature est trop leve Ou la pression trop forte, Alors le chauffage doit tre
arrt Et le volet ouvert.

4- Si la temprature est trop leve Et que la pression n'est pas trop haute, Alors le
chauffage doit tre arrt Et le volet en position mdiane.
5- et ainsi de suite.. .
On dcrit ainsi des situations l'aide de combinaisons de l'appartenance des valeurs
mesures un ensemble dtermin de valeurs d'entres. Chaque situation demande une action
dtermine, pour cela on fait appel un certain nombre d'opration sur les ensembles, que nous
allons examiner dans la suite.
Les lments de base de la logique floue sont les suivants [8]:
*
les ensembles flous (fuzzy sets) pour la reprsentation de variables linguistiques ;
*
les fonctions dappartenance (memberships functions) qui dcrivent le degr
dappartenance de grandeurs physiques (vitesse, courant, temprature) un ensemble flou (faible,
lev, chaud) ;
*
les oprateurs flous qui permettent lnonciation de relations logiques entre les assertions
floues (conclusion du genre Si, Alors );
linfrence floue cest dire la dduction de nouvelles informations dj disponibles sur
la base des rgles linguistiques.
Le premier concept important expliquer est celui de variable linguistique et de sousensemble floue [7].

I.2.1. Variables linguistiques, fonctions d'appartenance


La notion de variable linguistique permet de modliser les connaissances imprcises ou
vagues sur une variable dont la valeur prcise est inconnue. Une variable linguistique, ou variable
floue, est donc une variable dont les valeurs appartiennent des ensembles flous pouvant
reprsenter des mots du langage naturel. Ainsi une variable floue peut prendre simultanment
plusieurs valeurs linguistiques.
Par exemple la variable Taille peut appartenir aux ensembles floues " Petit, Moyen,
Grand ".
La variable linguistique peut tre reprsente par un triplet (x, T(x), U), dans lequel x est le
nom de la variable linguistique, T(x) lensemble des noms des valeurs linguistiques de x et U
lensemble de rfrence (univers de discours).
Par exemple : x = Vitesse est une variable linguistique, son ensemble de valeurs peut tre :
T(Vitesse) = [ Faible, Moyenne, Eleve,....] o chaque terme dans T(Vitesse) est caractris
par un ensemble flou dans un univers de discours U = [0, 100] (figure. I-1).
vitesse

lente

moyenne

rapide

1
0.5
Km/h
40
55
70
Figure I- 2 Reprsentation floue de la variable Vitesse
3

On attribue chaque valeur de la variable linguistique des fonctions dappartenance , dont


la valeur varie entre 0 et 1, en tenant compte de la classification en un certain nombre densembles
flous.
Le plus souvent, on utilise pour les fonctions dappartenance de forme trapzodales ou
triangulaires, rectangulaires ou de type singleton. Il sagit des formes les plus simples (figure I-2).

A(x)

A(x)

A(x)

1
1

1
x

26

22

0
21

26

Intervalle flou

Ensemble net

Nombre flou

Figure I-3 Exemples de fonctions d'appartenance


lente

moyenne

I.2.2. Univers de discours, ensemble flou, degr d'appartenance


En logique classique, une variable peut prendre deux valeurs possibles : vrai (1) ou faux (0).
En logique floue, un ensemble flou A dun univers de discours ( ensemble de toutes les
valeurs possibles de x ) X est dfini par une fonction dappartenance A qui tout lment x
appartenant X, associe un nombre A(x) compris entre 0 et 1, qui reprsente le degr ou facteur
dappartenance de x lensemble flou A
(0 reprsentant la non - appartenance et 1 lappartenance totale).
Le concept densemble flou a donc pour objectif de permettre des gradations progressives
dans lappartenance dun lment une classe.
L'appellation d'un ensemble flou est d'ordinaire en relation avec la signification que l'on
souhaite lui donner et ce mot correspond la valeur de la variable linguistique x appartenant X.
Prenons l'exemple de la taille d'une personne classe en deux ensembles flous Petite et
Grande , chaque personne a une taille qui se situe entre les deux (figure I-3).

Petit

Si je mesure 1m 65, jappartiens la fois


lensemble Petite et lensemble Grande
avec des degrs dappartenance respectifs de 0.5 Si je mesure 1m 40, je nappartiens qu
lensemble Petite avec un degr 1, - Si je
mesure 1m 80, je nappartiens qu lensemble
Grande avec un degr 1.

Grand

0
1m 65

Taille

Figure I-4 Reprsentation floue de la variable Taille


4

I.3. Dductions floues (infrences)


Afin de tirer des conclusions, plusieurs valeurs de variables linguistiques sont lies entre
elles par des rgles. On parle alors de dductions floues ou infrences.
Les rgles peuvent alors tre exprimes sous la forme gnrale:
Opration:

= Si Condition 1 Et Condition 1,
Si Condition 2 Et Condition 2,
.
.
Si Condition m Et Condition m,

Alors Consquence 1, ou
Alors Consquence 2, ou
.
Alors Consquence m.

Si les conditions, qui sont exprimes par la condition (prmisse), sont vraies, alors laction
spcifie la consquence (conclusion), aura lieu.
Les infrences avec plusieurs rgles sont caractrises par le fait qu'en gnral plusieurs
rgles sont (plus ou moins) simultanment vrifies. L'opration qui doit tre effectue doit tenir
compte des diffrentes conditions et s'obtient par les rgles de calcul de la logique floue.

I.4. Oprations en logique floue


Les variables linguistiques sont lies entre elles au niveau des infrences par des oprateurs
Et ou Ou. Il sagit doprateurs de la logique floue qui interviennent sur les fonctions
dappartenance reprsentant les variables linguistiques.
Les oprateurs les plus importants sont : l'intersection , l'union , et le complment .
Nous allons gnraliser ces fonctions fondamentales de la thorie des ensembles. On devra
retrouver dans le cas classique les fonctions habituelles. Les solutions proposes devront rpondre
certaines proprits (croissance, associativit,...) spcifiques aux fonctions considres.
I.4.1. Complment d'un ensemble (fonction ngation)
a) Critres
Une fonction ngation n(x) doit vrifier les conditions suivantes:
n(x) :[0, 1] [0, 1]
n(x) si x
(croissance)
n(1) = 0 et n(0) = 1
(conditions aux limites)
b) Choix
Il existe plusieurs fonctions rpondant aux critres noncs. On a choisi d'adopter la
fonction (figure.I-5) :
Non ( A(x) = 1- A(x)

c) Illustration
(x)

non (x)

1
0

0
70

80

80

70

Figure I-5 Fonction dappartenance de loprateur Non

I.4.2. Intersection de deux ensembles (fonction "Et")


a) Critres
Une fonction "Et" associe deux ensembles d'univers de discours x et y doit remplir les
conditions suivantes:
Et (x, y): [0, 1][0, 1][0, 1]
Et (x, y) = Et (y, x)
( commutativit )
si x < y Et z < t : Et (x, z) < Et (y, t)
( croissance )
Et (x, Et (y, z)) = Et (Et (x, y), z)
( associativit )
Et (0, x) = 0, Et (1, x) = x
( conditions aux limites )
b) Choix
De nombreuses possibilits existent (voir tableau rcapitulatif). La premire proposition,
due Zadeh, est encore aujourd'hui souvent utilise: la fonction minimum. Son interprtation est
simple: un lment ne peut pas appartenir plus l'intersection de deux ensembles qu' chacun de
ceux-ci. Cette fonction est illustre ci-aprs (figure I-6).
c) Illustration

(A)

(A Et B)

(B)

100

130

Figure I-6 Fonction dappartenance de loprateur Et

100

130

I.4.3. Union de deux ensembles (fonction "Ou")


a) Critres
La fonction doit tre telle que:
Ou (x, y): [0, 1][0, 1][0, 1]
Ou (x, y) = Ou (y, x)
Si x < y Ou z < t : Ou (x, z) < Ou (y, t)
Ou (x, Ou (y, z)) = Ou (Ou (x, y), z)
Ou (0, x) = x Ou (1, x) = 1

(commutativit)
(croissance)
(associativit)
(conditions aux limites)

b) Choix
Plusieurs choix sont galement possibles, dont les plus courants sont repris dans le tableau
illustratif ci-aprs. C'est gnralement la fonction maximum qu'on slectionne. Elle est illustre cidessous (figure I-7 ).
c) Illustration
(A)

(B)

(A Ou B)

40

60

60 80

80

60

80

Figure I- 7 Fonction dappartenance de loprateur Ou

I.4.4. Tableau rcapitulatif


Appellation
Zadeh
Probalistique
Lukasiewicz
Hanacher (>0)

ET
min(x , y)
xy
max (x + y-1, 0)
x y/(+(1- )(x + y - x y ))

Weber

x si y = 1, y si x = 1
0 sinon

OU
max(x , y)
x+y-xy
min(x + y, 1)
(x + y +x y - (1-) x y)
/(1- (1 - ) x y)
x si y = 0, y si x = 0
1 sinon

NON
1-x
1-x
1-x
1-x
1-x

I.4.5. Oprateurs Et, Ou raliss par oprateurs arithmtiques


Les ralisations prcdentes donnent dans la plupart des cas des rsultats convenables.
Cependant pour le rglage et la commande, il peut tre judicieux dutiliser dautres oprateurs
dans le but de les excuter par microprocesseur [7].
7

L'oprateur Et dans ce cas est ralis par la fonction du produit des fonctions
d'appartenances:
c(x) = a(x)* b(x)
(I-1)
L'oprateur Ou est ralis par la formation de la somme (valeur moyenne) des fonctions
dappartenances:
c(x) = [ a(x) + b(x) ] / 2
(I-2)
I.5. Le raisonnement flou
I.5.1 Gnralits
Aprs avoir expos la rpartition des valeurs mesures en ensembles flous et dfini les
oprations sur ces ensembles, nous allons maintenant introduire le raisonnement flou et voir
comment un rgulateur peut tre excut sur la base des rgles logiques.
L'exemple prcdent de la commande de la temprature nous a donn un aperu du concept
du raisonnement utilis : Si les conditions sont remplies, Alors la conclusion est valide.
Avec cet unique schma de raisonnement et les trois oprateurs Et , Ou et Non , nous
pouvons dj prendre un grand nombre de dcisions logiques Nous produisons aussi une nouvelle
information (une dcision) partir d'informations anciennes.
Le raisonnement flou fait appel trois notions et tapes fondamentales [6]:
- limplication floue,
- linfrence floue,
- lagrgation des rgles.
I.5.2. Limplication floue
Limplication floue donne une information sur le degr de vrit dune rgle floue [7]. En
dautres termes, on quantifie la force de vracit entre la prmisse et la conclusion. Considrons par
exemple les deux propositions floues
x est A
y est B

O x et y sont des variables floues et A et B des ensembles flous


de lunivers du discours U.
ainsi que la rgle floue : Si x est A Alors y est B .
Limplication floue donne alors le degr de vrit de la rgle floue prcdente partir des
degrs dappartenance de x A (prmisse) et de y B (conclusion). Il nexiste pas une faon
unique de dfinir limplication floue.
On notera implication : oprateur imp (quivalent loprateur Alors).
Parmi toutes les normes dimplication qui existent celles qui sont les plus utilises sont :
- La norme Mamdani
- La norme Larsen

: imp ( A(x), B(y)) = min( A(x), B(y))


: imp ( A(x), B(y)) = ( A(x) . B(y))
8

(I-3)
(I-4)

I.5.3. Linfrence floue


Le problme tel qu'il se pose en pratique n'est gnralement pas de mesurer le degr de
vracit d'une implication mais bien de dduire, l'aide de faits et de diverses rgles implicatives,
des vnements potentiels. En logique classique, un tel raisonnement porte le nom de Modus
Ponens (raisonnement par laffirmation).
Si p q vrai
Et p vrai
Alors q vrai
Il nous faut le gnraliser. Vont intervenir dans cette tape la fonction d'implication de
l'implication floue, image du lien Et les fonctions d'appartenance des sous-ensembles des
prmisse(s) et conclusion(s), images de l'importance des vnements.
De faon gnrale, les conditions dutilisation du
suivantes :

Modus Ponens Gnralis sont les

prmisse
conclusion
Rgle floue :
Si x est A
Alors y est B
Fait observ:
Si x est A'
-----------------------------------------------------------------Consquence :
y est B'
A' et B' sont les ensembles flous constats dans le cas que l'on traite et ne sont pas
ncessairement strictement gaux A et B. B' est lensemble flou rsultant de A' par l'application
de l'implication.
Les informations disponibles pour dterminer la consquence sont donc dune part celles
relatives la rgle, quantifies par limplication floue B/A(x, y) , dautre part celles relatives au fait
observ, quantifies par la fonction dappartenance A.
I.5.4. Agrgation des rgles
Lorsque la base de connaissance comporte plusieurs rgles (comme notre exemple de la
rgulation de temprature), lensemble flou infr B est obtenu aprs une opration appele
agrgation des rgles. En dautres termes lagrgation des rgles utilise la contribution de toutes les
rgles actives pour en dduire une action de commande floue. Gnralement, les rgles sont
actives en parallle et sont lies par loprateur Ou [7].
Nous pouvons considrer que chaque rgle donne un avis sur la valeur attribuer au signal
de commande, le poids de chaque avis dpend du degr de vrit de la conclusion.
Dans lexemple suivant :
Si x est A Et y est B Alors z est C Ou
Si x est A Et y est B Alors z est C Ou .....
Lensemble flou rsultant est obtenu en prenant, pour chaque valeur de sortie z, la valeur
maximale des degrs dappartenance de chaque contribution.(figure I-7).
Dans cet exemple, loprateur Et est reprsent par loprateur min , limplication
est reprsent par loprateur minet loprateur Ou est reprsent par loprateur max :
9

R1:

}
min
x0

y0

max.
A

C
z

R2:

}
min
x0

y0

Figure I-8 Principe de lagrgation de deux rgles

I.6. Conclusion
Dans ce chapitre, nous avons vu ce qu'tait la logique floue, quels taient ses intrts et
pos ses bases mathmatiques. Le principes de la logique floue, lutilisation du concept densemble
flou peuvent tre appliqus beaucoup de problmes o, selon la nature de linformation, la
manipulation de limprcis ou vague est indispensable: (classification, dcision multicritre, base
de donnes, commande).
Nous sommes maintenant arms pour voir comment un contrle de processus peut tre
ralis en logique floue. Ce sera l'objet du chapitre suivant.

10

I.7. PRINCIPE DUN CONTROLEUR FLOU


I.7.1. Introduction
Dans ce chapitre, nous nous intressons l'application de la logique floue dans les systmes
de commande et aux mthodes de conception des contrleurs flous. Nous appliquons la logique
floue deux domaines prcis, celui du contrle dune machine lectrique et dun robot mobile.
Nous verrons pourquoi le contrle flou s'est implant, comment le raliser et illustrerons ensuite ses
principes sur lexemple de rgulation de vitesse et de position dune machine lectrique et la
navigation floue dun robot mobile dans un environnement inconnu.
Les caractristiques de chacun des blocs constituant la structure gnrale d'un rgulateur
flou sont prsents [1], savoir la:
Fuzzification
Infrence
Dfuzzification.
I.7.2. Les raisons dun contrle flou
Actuellement, la technique de la mesure et de la rgulation est bas essentiellement sur la
connaissance et lanalyse mathmatique (quations diffrentielles, fonctions de transfert,...) du
processus.
Le dimensionnement d'un contrleur conventionnel PID (Proportionnel- Intgral- Drive)
demande la connaissance prcise du modle du systme contrler. Les valeurs d'entre du PID
doivent tre mesures le plus exactement possible pour viter dentacher d'une erreur l'image de
l'tat du systme qu'elles dcrivent.
Un contrleur flou, lui ne demande aucune de ces deux spcifications. Il n'est pas ncessaire
de connatre le modle analytique du processus pour le concevoir. Le contrleur flou ne traite pas
de relations mathmatiques bien dfinies mais utilise des infrences avec plusieurs rgles, se basant
sur des variables linguistiques, ces infrences sont alors traites par les oprateurs de la logique
floue.
La connaissance du modle mathmatique du processus nest pas ncessaire, tout au
moins quant aux premires ralisations. Cest lexprience des oprateurs du procd ou les
connaissances des experts, qui sont prises en compte pour tablir la commande floue. Les
algorithmes de rglage conventionnels sont alors remplacs par une srie de rgles linguistiques de
la forme Si...,Alors. Ainsi, on obtient un algorithme heuristique.
La commande par logique floue peut sappliquer tout domaine de la commande
traditionnelle. De plus, elle peut oprer lorsque les procds commander sont mal connus ou
difficiles dcrire prcisment, ou lorsque les variables sont values subjectivement et exprimes
en langage naturel et non numriquement.
Le rglage par logique floue se prte particulirement bien deux domaines d'applications [7]:
Conception de rgulateurs pour des processus mal modlisables .
Conception de rgulateurs non linaires pour des processus modlisables.
11

La commande floue est simple raliser, flexible et donc facilement adaptable aux
conditions de fonctionnement du processus ou une installation particulire. Elle est robuste face
aux perturbations qui peuvent affecter le processus.
Les rgles sont faciles comprendre et modifier puisquelles sont exprimes par des
termes de la langue naturelle. Le dveloppement dun rgulateur flou est conomique, dautant plus
quil existe des logiciels dapplication et de plus en plus des composants spcialiss.
Enfin, un contrleur flou bnficie dun aspect d'adaptabilit, de robustesse et de stabilit et
plusieurs tudes et ralisations industrielles ont montr que ce dernier peut donner des meilleures
rsultats que les rgulateurs classiques [7].
I.7.3. Principe dun contrleur flou
Un contrleur flou (figure II-1) ne diffre pas tellement d'un contrleur traditionnel. On
retrouve chaque fois un bloc de traitement, un bloc d'entre (quantification, calculs pralables...)
et un bloc de sortie (pour la dtermination de la commande u partir de l'incrment du par
exemple) [7].
Deux blocs supplmentaires apparaissent dans le cas d'un contrleur flou: un bloc de
fuzzification et un bloc de dfuzzifcation . Le bloc de fuzzification constitue l'interface entre le
monde physique et celui des sous - ensemble d'infrence (infrence engine) et une base de rgles
(rules base). Le rle de ce dernier bloc sera d'chafauder le raisonnement.
Le bloc de fuzzification convertira les valeurs d'entres en sous ensembles flous. Le moteur
d'infrence activera les rgles dont les prmisses seront vrifies. Chaque rgle active donnera lieu
un sous-ensemble de sortie. Il restera au bloc de dfuzzification agrger ceux-ci et en extraire
une action prcise et ralisable au niveau de la commande.
I.7.3.1. La fuzzification
Dans les problmes de commande, les donnes observes sont habituellement physiques
(relles). Or le traitement de ces donnes est bas sur la thorie des ensembles flous; ceci ncessite
donc une procdure de fuzzification.
Lopration de fuzzification reprsente le passage des grandeurs relles (ou physiques) aux
valeurs floues. Cette tape ncessite souvent une conversion analogique/digitale, ainsi que le
traitement des grandeurs mesures et leur transformation en variables linguistiques avec la
dfinition des fonctions dappartenance.
A l'univers de discours d'une entre X (ensemble des valeurs possibles de x ), on associera
N sous - ensemble flous nots Ei (valeurs linguistiques). Chacun de ceux-ci sera dfini par sa
fonction d'appartenance Ei(x), 0 < Ei(x) < 1.
Le rle du bloc de fuzzification sera de dterminer pour un xi donn (variable observe ou
mesure) les degrs d'appartenance de xi chacun des sous - ensemble flous Ei.

12

Variables
dobservation
et

Normalisation
Facteurs dchelle

Jeu de
rgles

Fuzzification

Infrence

Dfuzzification

Dnormalisation
Facteurs
dchelle
Variation
de commande
u

Figure II -1 Configuration interne d'un contrleur par logique floue.


La fuzzification proprement dite consiste dfinir les fonctions d'appartenance pour les
diffrentes variables d'entre et de sortie. Dans le cas du rglage par logique floue, on utilise en
gnral des formes trapzodales et triangulaires pour les fonctions d'appartenance.
Dans ce but, les grandeurs physiques (par exemple l'erreur et la drive de la grandeur
rguler) sont rduites des grandeurs normalises [1]. On suppose que ces dernires varient
normalement dans le domaine : -1 x 1.
Ceci pose le problme de choix des facteurs dchelles. Les gains dadaptation et de
normalisation jouent alors un rle extrmement important car ce sont eux qui fixent les
performances dynamiques de la commande.
En gnral, on introduit pour une variable x trois, cinq ou sept ensembles flous, reprsents
par des fonctions d'appartenance, comme le montre la figure (II-2). Le nombre des ensembles
dpend de la rsolution et de l'intervention du rglage dsir [7].
Une subdivision plus fine, c'est--dire plus de sept ensembles flous, n'apporte en gnral
aucune amlioration du comportement dynamique du systme contrl par la logique floue. Par
contre, un tel choix complique la formation des rgles dinfrences et augmente le temps de
traitement.
Les diffrents ensembles flous sont caractriss par des dsignations standards: la
signification des symboles est indique au tableau (II-1).

13

Symboles
NG
NM
NP
EZ
PP
PM
PG

Significations
Ngatif Grand
Ngatif Moyen
Ngatif Petit
Environ Zro
Positif Petit
Positif Moyen
Positif Grand

Tableau II -1 Dsignation standard des ensembles flous.

NG

N
M

EZ

PM

PG

x
-1

- 0.5

0.5

Figure II - 2 Fuzzification avec cinq fonctions d'appartenance.


I.7.3.2. Infrence
Dans cette partie du rgulateur les valeurs des variables linguistiques dentre et de sortie
sont lies par plusieurs rgles qui doivent tenir compte du comportement statique et dynamique du
systme rgler ainsi que des buts de rglage envisags en particulier le circuit de rglage doit tre
stable et bien amorti. La stratgie de rglage dpend essentiellement des infrences adoptes. Il
nest pas possible dindiquer des rgles prcises, lexprience joue ici un rle important.
Pour exprimer les infrences ils existent plusieurs possibilits savoir par description
linguistique et symbolique, ainsi que par tableaux et matrices dinfrence [7]. Dans ce cours, nous
utiliserons cette dernire description.
I.7.3.2.1. Description par matrice dinfrence
Le grand intrt de cette mthode est la possibilit de regrouper les rgles en une matrice.
Cest une reprsentation graphique, lintersection dune colonne et dune ligne se trouve
lensemble correspondant de la variable de sortie xR , dfini par une rgle dinfrence.
Les variables dentres sont lies par loprateur Et, tandis que les variables de sortie des
diffrentes rgles sont considrer par loprateur Ou. Cette mthode impose donc une restriction
au niveau des rgles, dont la condition ne peut contenir que loprateur Et.
Dans la plupart des contrles. un nombre de deux variables en entre est suffisant et on peut
donc utiliser un tel tableau. Son implmentation est facile et l'approximation, mme grossire,
introduite au niveau des valeurs ne perturbe que peu le fonctionnement. De par sa nature, le
contrleur flou tient en effet compte d'une certaine imprcision.

14

Lorsquil y a plus de deux variables, il faut juxtaposer plusieurs matrices. Cependant, ce


genre de description devient complexe lorsquil y a plus de trois ou quatre variables et si ces
dernires sont subdivises en un nombre lev densembles.
Si toutes les positions de la matrice dinfrence sont remplies, on parle de rgles dinfrence
compltes, dans le cas contraire il sagit de rgles dinfrence incompltes (figure II-3).

XR

X1
NG

X2

NG
NM
EZ
PM
PG

PG
PM

NM

PM
EZ
NM

EZ
PG
PM
EZ
NM
NG

PM
PM
EZ
NM

PG
NM
NG

Figure II -3 Matrice dinfrence incompltes pour deux variables linguistique x1 et x2


I.7.3.2.2. Traitement numrique des infrences
En gnral deux ou plusieurs rgles sont actives en mme temps. Une rgle dinfrence
floue est active lorsque le facteur dappartenance li la condition de cette rgle est non nul. Il
existe plusieurs possibilits pour les oprateurs qui sappliquent aux fonctions dappartenance. On
introduit alors la notion de mthode dinfrence.
En rglage par logique floue, on utilise en gnral une des mthodes suivantes [7]:
Mthode dinfrence Max-Min.
Mthode dinfrence Max-Prod.
Mthode dinfrence Somme-Prod.
Le nom de la mthode dsigne les oprateurs utiliss respectivement pour lagrgation et
limplication. Le tableau suivant indique la manire de leur utilisation :

Mthodes
Max-min
Max-prod
Som-prod

Oprateurs sur Prmisses


Ou
Et
Max
Min
Max
Min
Som
Prod

Oprateur Implication
Imp
Min
Prod
Prod

Oprateur Agrgation
Max
Max
Som

I.7.3.2.3. Mthode dinfrence somme-produit


La mthode dinfrence somme-produit ralise, au niveau de la condition, loprateur Ou
par la formation de la somme moyenne, tandis que loprateur Et est ralis par la formation du
produit. La conclusion de chaque rgle, prcde par Alors, liant le facteur dappartenance de la
condition avec la fonction dappartenance de la variable de sortie par loprateur Et, est ralise
par la formation du produit. Loprateur Ou qui lie les diffrentes rgles est ralis par la formation
de la somme moyenne; ainsi sexplique la dsignation par Som-Prod de cette mthode dinfrence.
15

La mthode dinfrence Som-Prod est reprsente graphiquement la figure (II-4). Sur la


figure (II-5), nous avons reprsent les deux autres mthodes dinfrence.
La fonction dappartenance rsultante est donne par :
RES(xR) = [ R1(xR) + ..........+ Rm(xR) ]/m
Avec:
Ri(xR) :
ci
:
0i(xR) :
m
:

Ri(xR) = ci . 0i (xR),

(II-1)

i = 1......,m

La fonction dappartenance partielle (rsultante de la rgle i )


Facteur dappartenance de la condition
Fonction dappartenance de la conclusion
Le nombre de rgles intervenant dans linfrence.

Pour illustrer cette mthode on prsente lexemple suivant ; celle dun rgulateur flou avec
deux variables dentre (x1) et (x2) et une variable de sortie (xR). Chacune est dcompose en trois
ensembles NG, EZ, PG. On suppose que les valeurs sont : x1 = 0.44 et x2 = 0.67
Pour linfrence :
xR : = Si (x1 PG Et x2 EZ) Alors xR=EZ
Si (x1 EZ Ou x2 NG) Alors xR=NG

Ou

Avec les facteurs d'appartenance PG(x1 = 0.44) = 0.67 et EZ(x2 = 0.67) = 0.33, la
premire condition prend le facteur d'appartenance Ci = 0.22 (produit des deux valeurs).
Pour la condition de la deuxime rgle, on a :
EZ(x1 = 0.44) = 0.33 et NG(x2= 0.67) = 0.67 , ce qui donne Ci = 0.5
Les fonctions d'appartenance hachures sur la figure (II-4), sobtiennent par la formation de
la somme (valeur moyenne de R1 et R2).

16

Et

x1 PG

Si

x2 EZ

NG

EZ

PG

NG

EZ

0.67

-1

xR=EZ

Alors

x1

C1=0..22

0..33

-1

NG

PG

EZ

PG

Rgle 1

0..22

x2

-1

x1

1
x1=0.44

RES(xR
)

x2=-0.67

Som Ou
-1

NG

EZ

PG

NG

EZ

Si

x1 EZ

x1

-1

Ou

NG

PG

EZ

1
C2=0..5

0.33

xR

0.67

-1

x2

PG

0.5
-1

Alors

x2 NG

x1

Rgle 2

xR=NG

Figure II-4: Mthode dinfrence Som-Prod pour deux variables dentre et deux rgles

17

x1 PG

Si

x2 EZ

Et

NG

EZ

PG

NG

EZ

NG

PG

x1

EZ

min
-1

xR=EZ

Alors

PG

Rgle 1

min
-1

x2

-1

x1

RES (xR)

x1=0.44

1
max Ou

x2=-0.67

-1

NG

EZ

PG

NG

EZ

x1

x1 EZ

Si

Si
NG

EZ

Et

PG

NG

EZ

x1

-1

x2 EZ

PG

Alors
NG

PG

x1

Rgle 2

xR=NG

Alors

EZ

xR=EZ
1

PG

Rgle 1

min
-1

EZ

min

x2

x2 NG

Ou

x1 PG

NG

PG
1
C2=0..67

-1

xR

max
-1

-1

1 x2

-1

x1

RES
(x )

x1=0.44

1
max Ou

x2=-0.67

-1

NG

EZ 1

PG

NG

EZ

-1

x1 EZ

Ou

xR

PG

x1

-1

Alors

x2 NG

EZ 1

x2

-1

NG

PG
1
C2=0..67

x1

max

Si

xR=NG

Figure II-5 Principe des mthodes dinfrence Max-Min et Max-Prod

18

Rgle 2

I.7.4. La dfuzzification
La dernire tape du contrle, appele dfuzzification consiste dfinir prcisment quelle
doit tre laction sur le processus. En effet, le procd ne peut pas interprter des ordres du type
Petit ou Grand , etc., on doit lui envoyer une valeur physique.
Les mthodes dinfrences fournissent une fonction dappartenance rsultante rs(xR) pour
la variable de sortie xR. L'opration de dfuzzification permet de calculer partir de cette dernire
la valeur relle de la variable de sortie appliquer au processus. On doit souvent prvoir un
traitement de signal de sortie et sa conversion numrique - analogique
Le choix d'une mthode de dfuzzification est un point trs dlicat lors de l'laboration
d'une technique de contrle en logique floue. Celui-ci conditionnera en effet grandement
l'volution dynamique de la commande. On distingue trois mthodes diffrentes (figure II-6): celle
du maximum, celle de la moyenne des maxima et celle du centre de gravit (ou centrode ). Il est
toutefois reconnu que la mthode de centre de gravit donne les meilleurs rsultats [1], [6].

(x)

(x)

(x)

Mthode des centres


de gravit

Mthode de la moyenne
des maxima

Mthode du maxima

Figure II-6 Principe des diffrentes mthodes de dfuzzification.


Mthode du maxima :
Cette mthode consiste choisir comme sortie x0 du bloc de dffuzification, une des
valeurs possdant la plus grande appartenance au sous-ensemble flou x.
Il se peut que le systme possde plusieurs maxima identiques, dans ce cas et afin dviter
un choix arbitraire, on choisit deffectuer la moyenne des maxima.
La mthode du maximum l'avantage d'tre simple, rapide et facile. Elle est
malheureusement ambigu et provoque de nombreuses discontinuits.

Mthode de la moyenne des maxima :


Dans le cas ou plusieurs sous-ensembles ont le mme maximum, on ralise une commande
u=

ui

, ui tant la commande issue du ieme sous-ensemble flou slectionnable.

19

r : nombre de maxima identiques


Les avantages et inconvnients de la mthode de la moyenne des maxima restent grosso
modo ceux de la mthode du maximum.
Mthode du centre de gravit (centroide) :
Cette mthode consiste a calculer le centre de gravit de la fonction dappartenance
rsultante rs(xR). Labscisse u de ce centre de gravit donne la valeur de commande appliquer
et peut tre dtermine par la relation gnrale suivante :
1

u=

x R rs ( x R )d x R

1
1

(II-2)

rs ( x R )d x R

Lintgrale au dnominateur donne la surface, tandis que lintgrale au numrateur


correspond au moment de la surface.
Cette mthode va permettre d'viter de trop grandes discontinuits et supprimera toute ambigut.
Elle semble donc optimale mais son implmentation est difficile et surtout coteuse en calculs. Elle
se simplifie notablement lorsquon utilise la mthode dinfrence Som-prod ou des singletons pour
les fonctions dappartenance des variables de sortie.
II-4. Contrleurs flous usuels :
Les contrleurs flous sont principalement de deux types:
-

Contrleur flou type Mamdani


Contrleur flou type Sugeno

Pour un systme deux variables, les rgles floues sont de la forme :


SI x est Ai Et y est Bi ALORS z est Ci

(II-3)

o Ai et Bi sont des sous-ensembles flous, par contre Ci peut appartenir aussi bien au
domaine symbolique ( sous-ensemble flou) quau domaine numrique.
Loriginalit de la mthode de Sugeno rside dans le fait que la conclusion de chaque
rgle nappartient pas au domaine symbolique, mais est dfinie sous forme numrique comme une
combinaison linaire des entres
.
Selon la mthode de Sugeno, les rgles floues, dans le cas de deux variables, sexpriment
donc selon la forme suivante :
SI x est Ai Et y est Bi Alors z = p0+p1.x +p2.y
On parle dans ce cas de contrleur flou de type Sugeno dordre 1.

20

(II-4)

Dans la suite de ce mmoire, nous nutiliserons quun raisonnement simplifi de Sugeno


(contrleur flou de type Sugeno dordre 0 ) o les rgles floues utilises sont du type :
SI x est Ai Et y est Bi Alors z = p0

(II-5)

Dans le contrleur flou type Sugeno, les tapes dagrgation et de dfuzzification des
rgles floues se font simultanment et la relation (II.2) devient :
u=

i zi
i
i

(II-6)

Cette mthode est plus simple mettre en uvre et donne aussi de bons rsultats en
commande floue que la mthode de Mamdani . Le calcul en temps rel de cette expression ne pose
pas de problme.
Une remarque peut tre formule sur le nom donn cette tape. En effet, elle est
appele dfuzzification alors quelle ne manipule aucune donne floue. Ce choix a t dict afin
dtablir une similitude entre ce type de contrleur et le contrleur de type Mamdani o le
cheminement fuzzification infrence floue dfuzzification a t introduit. A la place de
dfuzzification , le terme agrgation aurait t prfrable.
I.8. CONCEPTION DES REGULATEURS FLOUS
I.8.1. Exemple 1 : Rgulateur flou de vitesse et de position dune machine lectrique
Nous allons maintenant illustrer les principes du contrleur flou sur l'exemple de la
rgulation de vitesse et de position dune machine lectrique.
La phase de conception dun contrleur flou passe toujours par quatre stades que nous
allons dtailler successivement.
I.8.1.1 Rgulateur flou de vitesse
1 re tape : Choix des entres et sorties
Il sagit de dterminer les caractristiques fonctionnelles (1) et oprationnelles (2) du
contrleur.
(1)- Il faut dabord choisir les variables dentre et de sortie. Leur choix dpend du contrle
que lon veut raliser. Que souhaite-t-on au juste commander ? A laide de quels paramtres va-ton obtenir la commande ?
(2)- Il faudra ensuite se pencher sur le domaine des valeurs que pourront prendre ces
variables). On partitionne alors ces domaines en intervalles, auxquels on associe un label descriptif
(valeurs linguistique). Cette tape revient dfinir les univers des discours des variables dentre et
de sortie et les diviser en sous-ensembles flous. Cette rpartition est intuitif et bas sur
lexprience. On est dailleurs gnralement amen laffiner en cours de conception. Une rgle de
bonne pratique est de fixer 5 9 intervalles par univers de discours. Il faut galement prvoir un
plus grand nombre de zones proximit du point de fonctionnement optimal pour en faciliter
lapproche rgulire [2].

21

Illustration sur le rgulateur de vitesse


Dans le cas de la rgulation de vitesse, on a besoin habituellement de lerreur (e=r ref -r)
et de la drive derreur (de) et parfois de l'intgration derreur :

e(k ) = rref (k ) r (k )

(III-1)

de(k ) = e(k ) e(k 1)

La sortie du rgulateur de vitesse est la valeur du courant de rfrence iq ou le couple dans


le schma de la commande dune machine lectrique. Si cette sortie est directement applique au
processus, le contrleur est alors appel contrleur flou de type PD [6] (figure III-1) et. on peut
crire :
iq= Fuzzy (e, de)

Ke

diq

Contrleur
flou
de

Kdiq

Kde

Figure III-1 Schma de principe dun contrleur flou de type PD


Par contre, si la sortie du contrleur flou est considre comme un incrment de commande,
le contrleur est appel contrleur flou de type PI [6] (figure III-2) et on peut crire :

diq = Fuzzy (e, de) ou encore iq = F uzzy edt,

soit iq(k ) = diq(k ) + iq (k 1)

de ;

(III-2)

e
Ke

de

Contrleur
flou

iq
Kiq

Kde

Figure III-2 Schma de principe dun contrleur flou de type PI


Le contrleur de type PID (figure III-3) peut tre obtenu en combinant des contrleurs
flous de type PI et PD de faon suivante :

22

Kdiq
e
Ke

Contrleur
flou

de

iq

Kiq
+

Kde

Figure III-3 Schma de principe Contrleur flou de type PID


On remarque que cette structure de commande floue de type PID (figure V-9) est en fait une
association en srie dun contrleur flou de base et dune structure de rgulation de type PI, qui,
elle, nest pas floue [6].
Comme les fonctions dappartenance sont normalises entre [-1, 1], les variables sont
multiplies avec des gains proportionnels. Finalement, la structure du rgulateur de vitesse
logique floue est reprsente par la figure (III-4).
Daprs ce schma, le systme est compos :
du contrleur flou compos :
dun bloc de calcul de variation de lerreur au cours du temps (de) ;
des facteurs dchelles associs lerreur, sa drive et la
commande (diq);
dun bloc de fuzzification de lerreur , de sa variation et de la commande;
des rgles de contrle flou et dun moteur dinfrence ;
dun bloc de dfuzzification utilis pour la transformation de la commande floue
en valeur numrique ;
dun bloc intgrateur
du processus contrler.
Contrleur Flou
e

Ke

ref

+ -

Calcul de
de

Fuzzificati
on

de

Rgles
de
contrle diq
flou
~
de~
Infrence
e~

Kdiq
Dfuzzification
diq

Kde

Processus

Limitation
du couple
iq

Figure III-4 Structure du rgulateur de vitesse logique floue

23

iq

2 me tape : Dfinition des fonctions dappartenance


La premire tape de conception a permis de cerner au mieux les caractristiques
linguistiques des variables. Il faut maintenant dfinir compltement les sous-ensembles flous, cest
dire expliciter leurs fonctions dappartenance. Une fois encore, lintuition et lexprience auront
leur rle jouer. Quelques principes ressortent de la pratique: choix de fonctions triangulaires ou
trapzodales, recouvrement dune fonction de 10 50% de lespace des sous-ensembles voisins,
somme des degrs dune zone de recouvrement gale 1 (degr maximal dappartenance) [6], [8].
Illustration sur lexemple
Les fonctions dappartenance des variables dentre sont illustres par la figure (III-5)
avec :
NB : Negative Big
(Ngative Grand)
NM : Negative Medium (Ngative Moyenne)
NS : Negative Small
(Ngative Petit)
ZE : Zero

PB : Postive Big
PM : Postive Medium
PS : Postive Small

(Positive Grand)
(Positive Moyenne)
(Positive Petit)

On constate que les fonctions dappartenance de lerreur ont une forme asymtrique crant
une concentration autour de zro qui amliore la prcision prs du point de fonctionnement dsir.
Pour la mme raison, les formes des fonctions dappartenance de la variable de sortie sont
galement asymtriques (figure III-6). Cependant, nous introduisons deux sous-ensembles
additionnels compte-tenu de la sensibilit de cette variable [2].
NVB : Negative Very Big
PVB : Positive Very Big

(Negative Trs Grand)


(Positive Trs Grand)

Degr dappartenane (e)


1

NB

NM

NS

EZ

PS

-0.2

0.2

PM

PB

0.8
0.6
0.4
0.2
0
-1

-0.8

-0.6

-0.4

erreur e

24

0.4

0.6

0.8

D e g r d 'a p p a r t e n a n c e ( d e )
N B

N M

N S

E Z

P S

P M

P B

0 .8

0 .6

0 .4

0 .2

0
-1

-0 .5

0
0 .5
V a r i a t i o n d e l 'e r r e u r d e

Figure III -5 Fonctions d'appartenance des variables d'entre


D e g r d 'a p p a r t e n a n c e ( d i q )
N V B

N B

N M

N S

E Z

P S

P M

P B

P V B

0 .8

0 .6

0 .4

0 .2

0
-1

-0 .5
0
V a ria tio n d u C o u ra n t:

0 .5

d iq

Figure III -6 Fonctions d'appartenance de la variable de sortie


3 me tape : Dfinition du comportement du contrleur flou
Cette tape concerne llaboration de la base de rgle du contrleur. Cest de nouveau un
expert sa connaissance du problme que lon se fiera le plus souvent. Dans le cadre de la
rgulation (asservissement), on utilise frquemment lerreur (observation) et la variation de lerreur
(dynamique du processus). A partir de ces deux entres, traduites sous la forme de variables floues,
il est possible de dterminer les rgles dans le domaine temporel et on peut construire une matrice
Situation/Action reprenant toutes les possibilits linguistiques de celles-ci [1].
Analyse du comportement dynamique - Dtermination du jeu de rgles
Lanalyse temporelle, qui doit conduire tablir les rgles du contrleur flou, peut par
exemple consister considrer la rponse un chelon dun processus piloter en fonction des
objectifs que lon se sera fix en boucle ferme, et crire les rgles pour chaque type de
comportement du processus :
a)- Pour expliquer la procdure suivre [6], on considre les neuf points indiqus sur la
rponse un chelon (figure III-7) et, pour chacun de ces points, on explicite lexpertise sous la
forme suivante :

25

*
*
*
*
*
*
*
*
*

1 Si e = PB Et de = ZE
2 Si e = PB Et de = NS

Alors du = PB
Alors du = PM

(dpart, commande importante)


(augmentation de la commande pour
gagner l'quilibre)
3 Si e = PM Et de = NS Alors du = PS
(trs faible augmentation de u pour ne
pas dpasser)
4 Si e = PS Et de = NS Alors du = ZE
(convergence vers lquilibre correct)
5 Si e = ZE Et de = NS Alors du = NS
(freinage du processus)
6 Si e = NS Et de = NS Alors du = NM (freinage et inversion de la variation
de la commande)
7 Si e = NM Et de = ZE Alors du = NM
(rappel du processus vers lquilibre
correct)
8 Si e = NS Et de = PS Alors du = ZE
(convergence vers lquilibre correct)
9 Si e = ZE Et de = ZE Alors du = ZE
(quilibre)
S o rtie 7

6
5

R f re n ce

te m p s

Figure III -7 Ecriture du jeu de rgles grce une analyse temporelle


En dcrivant point par point le comportement du processus et laction de variation de
commande appliquer, on en dduit la table du contrleur flou de base (figure III-8 ) qui
correspond en fait table de rgles trs connue de Mac Vicar - Whelan [6] :
e
de
PB
PM
PS
ZE
NS
NM
NB

NB
ZE
NS
NM
NB
NB
NB
NB

NM

NS

ZE

PS

PM

PB

PS
ZE
NS
NM
NB
NB
NB

PM
PS
ZE
NS
NM
NB
NB

PB
PM
PS
ZE
NS
NM
NB

PB
PB
PM
PS
ZE
NS
NM

PB
PB
PB
PM
PS
ZE
NS

PB
PB
PB
PB
PM
PS
ZE

Figure III -8 Table de rgles de MacVicar-Whelan


b)- Pour dduire les autres rgles, nous procdons nouveau une autre expertise [3]. La
forme gnrale de la rponse de vitesse est reprsente sur la figure (III-9). Selon lamplitude de e

26

et le signe de la variation derreur de, la rponse de vitesse est divise en quatre rgions. Les
indices utiliss pour identifier chaque rgion sont dfinies comme suit :
a1 : e > 0 et de < 0,
a3 : e < 0 et de > 0,

a2 : e < 0 et de < 0,
a4 : e > 0 et de > 0,

Pour accrotre la rsolution de la reprsentation dynamique, les rponses autour du point de


fonctionnement et aux extremums de la figure (III-9-a) sont reprsentes respectivement sur la
figure (III-9-b) et (III-9-c).
1.4
1.2

R p o n se
a1

a2 a3

a4

R f re n ce

1.0
0.8
0.6
0.4
0.2

te m p s

0.5

Rponse

1.5

Rponse

C1
C2

m1
m2
m3

Rfrence

C3

Rfrence

C4
C5
C6

m4
m5
m6

Temps
b)

Temps

c)

Pour identifier la pente de la rponse lors du passage par le point de rfrence on utilise
lindice ci dfini comme suit :
Figure III -9 Comportement dynamique de la rponse de vitesse
c1
c2
c3
c4
c5
c6

:(e>0e<0)
:(e>0e<0)
:(e>0e<0)
:(e<0e>0)
:(e<0e>0)
:(e<0e>0)

et
et
et
et
et
et

de <<< 0
de << 0
de < 0
de > 0
de >> 0
de >>> 0

Quant lindice mi reprsentatif du dpassement de la consigne, il est dfini par :

27

m1 : de 0 et e <<< 0
m2 : de 0 et e << 0
m3 : de 0 et e < 0

m4 : de 0 et e > 0
m5 : de 0 et e >> 0
m6 : de 0 et e >>> 0

Les trois types dindices mentionns ci-dessous sont


reprsent sur la table de la figure (III-10).
e
de
NB
NM
NS
ZE
PS
PM
PB

NB

NM NS

ZE
c1
c2
c3
ZE
c4
c5
c6

a2
m1

m2

m3

a3

combins ensemble, ceci est

PS

PM

PB

a1
m4

m5

m6

a4

Figure III 10 Rgles linguistiques de contrle

Finalement le tableau de la figure (III-8) est lgrement modifi pour tenir compte de la
variable de sortie qui est forme de neuf valeurs floues (figure III-11).

NB
NM
NS
de ZE
PS
PM
PB

NB
NM NS
NVB NVB NVB
NVB NVB NB
NVB NB NM
NB
NM
NS
NM
NS
ZE
NS
ZE
PS
ZE
PS
PM

e
ZE
NB
NM
NS
ZE
PS
PM
PB

PS
NM
NS
ZE
PS
PM
PB
PVB

PM
NS
ZE
PS
PM
PB
PVB
PVB

PB
ZE
PS
PM
PB
PVB
PVB
PVB

Figure III -11 Base de rgles du rgulateur I de vitesse


Dans le tableau (figure III-11), chaque lment formalise une rgle comme, par exemple :
Si [ e(k) est NM ] Et [ de(k) est ZE ], Alors [ diq(k) est NM ]
Cet ensemble de rgles regroupe toutes les situations possibles du systme values par les
diffrentes valeurs attribues e et sa variation de et toutes les valeurs correspondantes de la
variation de la commande diq.
Les univers de discours normaliss associs e , de et diq sont identiques et
sont fixs entre 1 et +1. Cette normalisation des variables dentre (sortie) ncessite donc
lobtention de facteurs dchelles respectifs pour chacune delles.
28

Lvaluation des gains proportionnels provient de lexprience. Pour le gain Ke , par


exemple, on peut commencer avec un facteur qui dpend de lerreur maximale. Effectivement ces
valeurs font partie de la procdure dvaluation par simulation. On a trouv les valeurs suivantes
pour la machine lectrique simule :
Ke = 0.08

Kde = 1.25

Kdiq = 14.9

Dans une deuxime approche dun rgulateur logique floue, on utilise diffrentes
fonctions dappartenance pour la variable de sortie (figure III-12):
Degr dappartenance (diq)
1 NVB

NB

NM

NS ZE PPS

PM

PB

PVB

0.5

0
-1

-0.8

-0.6

-0.4

-0.2

0.2

0.4

0.6

0.8

Variation du courant diq


Figure III -12 Fonctions dappartenance retenues pour la variable
de sortie diq(k) (II)
Grce cette fonction dappartenance, appele singleton , on tire profit du calcul de la
variable de sortie. Dans ces conditions, la formule du centre de gravit se simplifie par :
m

diq

(diq )diq

res

= i =1

(III-3)

(diq )
i =1

m tant le nombre totale de rgles.


Par rapport la premire approche, les rgles sont aussi modifies (figure III-12).
e
NB NM NS ZE PS
PM
PB
ZE
ZE
NB NVB NVB NVB NB NM
ZE
PS
NM NVB NVB NB NB NM
PB
PM
NS NVB NB NB NM PS
PB
PB
de ZE NVB NB NM ZE PM
NVB
NB
NS
PM
PB
PB
PVB
PS
PVB
PVB
PM NVB ZE PM PB PB
PVB
PVB
PB NVB ZE PM PB PVB
Figure III -12 Base des rgles du rgulateur modifi
I.8.1.2 Rgulateur de position par la logique floue
Pour le rgulateur de position on a essay plusieurs approches, en utilisant comme variable
dentre lerreur entre la position relle et la position de consigne et la variation temporelle de cette
29

erreur, comme pour la rgulation de vitesse. Finalement, il tait le plus simple, et avec le meilleur
rsultat, de choisir un rgulateur avec une variable dentre et une variable de sortie, notamment
lerreur epos de la position pour lentre et la vitesse de rfrence ref pour la sortie.
Lide de ce rgulateur est justifie par les principes suivants :
Si lerreur est nulle, la vitesse lest aussi.
Si lerreur nest pas nulle, il faut tourner trs rapidement pour liminer cette erreur.
Enfin, ce but peut tre atteint par un couplage trois tats :
vitesse maximale positive,
vitesse maximale ngative,
vitesse nulle.
La figure (III-13) illustre les fonctions dappartenance des deux variables :
On constate, que les sous-ensembles de ref (sauf ZE) sont tous assez loin de zro. En
mme temps, les sous-ensembles de lerreur sont plutt orients vers zro. Ces faits correspondent
la deuxime rflexion.
En consquence, les rgles pour la ralisation sont les suivantes :
Degr dappartenane (epos)
1

NB

NM

NS

EZ

PS

0.2

PM

PB

0.8
0.6
0.4
0.2
0
-1

-0.8

-0.6

-0.4

-0.2

erreur position epos

30

0.4

0.6

0.8

Degr dappartenance ( ref)


NM

1 NB

ZE

NS

PM

PS

PB

0.5

0
-1

-0.8

-0.6

-0.4

-0.2

0.2

0.4

0.6

0.8

Vitesse de rfrence r ref


Figure III -13

Fonctions dappartenance du rgulateur de position

I.8.1.3 Rsultats exprimentaux


Les rgulateurs logique floue sont raliss laide du Toolbox Fuzzy Logic de
Simulink. La figure (III-14) montre lditeur de ce module avec ses diffrentes fentres.

Figure III-14 Fentres de lditeur du Toolbox Fuzzy de Matlab


31

Une comparaison des rsultats dexprimentation de la commande de la machine synchrone


aimants permanents par des correcteurs classiques (PI et rgulateur dtat) et un correcteur flou a
t faite (figures III-15 et III-16). Compte tenu des rsultats [11], le PI flou semble pourvoir
remplacer le PI conventionnel pour amliorer les performances dynamiques de ce dernier.
Le PI Flou est trs peu sensible aux variations des paramtres du systme ainsi qu'aux
perturbations externes ce qui justifie sa robustesse. Il permet d'obtenir des temps de monte trs
faibles par rapport au PI classique grce aux larges domaines physiques de la variation de l'erreur et
de la variation de commande.
250

tr/min

tr/min

2500
2000

200

1500
1000

Rglage dtat

500

150

Rgulateur PI

Rglage dtat

100

Rgulateur flou

Rgulateur PI

500

Rgulateur flou
0
0

0.

0.

0.

0.

0.

1.

temps (s)

Figure III-15 : Rponses de Vitesse


(Rgulateurs PI, dEtat et Flou)

rds

rds

40

35

30

25

Rgulateur PI

Rglage dtat
20

15

Rgulateur PI

10

Rgulateur Flou

-10

Rgulateur Flou

-20

5
0

temps (s)

Rglage dtat

-30

0.1

0.2

0.3

0.4

-40
0

0.5

0.

temps (s)

1.

temps (s)

Figure III-16 : Rponses de Position


(Rgulateurs PI, dEtat et Flou)

32

I.8.2. Exemple 2 : Navigation ractive dun robot mobile


Un robot mobile est souvent astreint suivre une trajectoire de rfrence, trajectoire
pouvant tre :
soit calcule dynamiquement en fonction des obstacles,
soit matrialise par une piste trace sur le sol ou un cble enterr (cas de chariot
filoguid).
Dans le premier cas, le robot doit se localiser par rapport une trajectoire (immatrielle)
de rfrence ; dans le second, tout changement de trajectoire implique des interventions matrielles
parfois lourdes.
Dans la navigation ractive, il ny a pas de trajectoire de rfrence : le robot doit se
dplacer en vitant de lui mme les obstacles quil repre par un systme de perception (radar,
capteurs infra-rouges ou ultrasons). Ses tches sont souvent dcomposes en vitement
dobstacles et recherche du but.
Pour raliser la dtection dobstacles, nous avons choisi dutiliser un ensemble de capteurs
ultrasons qui prsentent des caractristiques intressantes tant dun point de vue performance que
du point de vue cot ou facilit dimplantation sur un robot mobile.
Le robot Pioneer II supporte une range de huit capteurs ultrasonores travers huit
transducteurs [9] placs en son avant. En option, il peut galement tre quip dune autre range
de huit capteurs ultrasonores placs en son arrire.
Les sonars avants sont positionns de la manire suivante : un de chaque cot et six de face,
spars de vingt degrs dintervalle (figure III-17).

Figure III-17: La disposition des sonars avant du robot Pioneer II.

33

Le champ de mesure de ces capteurs est compris entre 10 cm de porte minimale 5m de


porte maximale.
Le choix de contrleur flou pour la navigation dun robot mobile sest impos
naturellement :
les rgles de conduite sont gnriques, valables pour tous les robots mobiles ;
elles peuvent tre individualises par apprentissage, pour tenir compte des
caractristiques mcaniques et dynamiques des robots ;
introduction de connaissances rend le robot immdiatement efficace, ds le dbut de
lapprentissage ; lapprentissage sert alors amliorer la conduite ;
enfin, le comportement du robot est toujours prvisible puisque, pour une situation
donne, les rgles appliques sont interprtables.
De nombreux auteurs ont propos des contrleurs flous pour la navigation ractive, le
nombre de rgles variant de 8 271. Dans ce dernier cas, 243 rgles taient ddies lvitement
dobstacles et 28 la recherche de lobjectif. Un tel nombre de rgles nest pas trs raisonnable :
cela nuit la lisibilit et complique inutilement lapprentissage.
Dans nos simulations et les exprimentations menes sur un vrai robot ( le robot Pioneer
II), nous avons utilis un contrleur de navigation de type suivant :
les entres sont les distances dans les trois directions : gauche, frontale et droite :
ces distances sont obtenues par balayage avec un systme de perception form de huit capteurs
ultrasons.
les sorties sont les commandes de vitesse et de changement de direction du robot :
ces deux commandes sont, le cas chant, transformes en vitesses de rotation pour des roues
motrices gauche et droite.
Les distances sont values par rapport aux deux sous-ensembles flous Proche et
Loin , reprsents la figure (III-18.) Ces sous-ensembles flous sont dfinis par deux
paramtres :
- "dm", dsignant la distance minimum par rapport un obstacle, cette distance pouvant
varier avec la vitesse
- "ds", dsignant la distance de scurit, au del de laquelle le robot peut circuler vitesse
leve (ds = 800 mm).
(D.)
P

dm

ds

Distance(mm)

Figure III-18 : Sous-ensembles flous dfinis pour les variables distances (gauche, face, droite)

34

Les distances dans les trois directions ( gauche, en face, droite) permettent de dfinir
huit situations synoptiques de base, notes (Si) avec i=1 8) immdiatement interprtables et pour
lesquelles la conduite tenir dcoule du simple bon sens.
Ainsi, la situation S1 (des obstacles proches dans les trois directions) correspond un culde-sac : il faut sarrter et tourner fortement vers la droite ou la gauche. La situation S2 correspond
un chemin libre droite, donc le robot doit tourner droite. La situation S7 correspond un
obstacle sur la droite, quil faut viter en tournant lgrement gauche.
Les angles sont valus par rapport au sens trigonomtrique : positif vers la gauche et
ngatif sinon.
Ainsi, la politique consistant se diriger directement vers le point darrive en vitant les
obstacles en longeant les murs en tenant sa droite s'exprime symboliquement par les huit rgles
floues suivantes :

SI
SI
SI
SI
SI
SI
SI
SI

S1 : (P ,P, P)
S2 : (P ,P, L)
S3 : (P ,L, P)
S4 : (P ,L, L)
S5 : (L ,P, P)
S6 : (L ,P, L)
S7 : (L ,L, P)
S8 : (L ,L, L)

Alors
Alors
Alors
Alors
Alors
Alors
Alors
Alors

V est ZR
V est ZR
V est Vmoy
V est Vmax
V est ZR
V est ZR
V est Vmax
V est Vmax

Et
Et
Et
Et
Et
Et
Et
Et

est NG
est NG
est ZR
est NP
est PG
est PG
est PP
est (obj)

(III-5)

Les labels utiliss sont : NG (Ngatif-Grand), NP (Ngatif-Petit), NM (Ngatif-Moyen),


ZR (zro), PP (Positif-Petit), PG (Positif-Grand), Vmoy (Vitesse moyenne) et Vmax (Vitesse
maximum).
Les sept premires rgles sont utilises pour l'vitement d'obstacle alors que la huitime
rgle permet datteindre lobjectif ( (obj) dsigne langle qui spare laxe du robot et le point
darrive).
Les grandeurs de sorties sont la vitesse du robot et la direction qu'il doit prendre. Pour
construire un contrleur flou de type Takagi-Sugeno d'ordre 0, les valeurs symboliques des
conclusions sont remplaces par des valeurs numriques Vitj et Phij. Les sorties infres
deviennent :
V = i.Vi
Car i = 1

= i. i

et

pour i = 1 8

(III-6)

O i reprsente la valeur de vrit de la rgle i.


I.9. Rsultats du simulateur graphique Pioneer II
Dans cette partie, nous prsentons des rsultats obtenus par linterface graphique du
simulateur du robot Pioneer II.

35

Niveau 0 : Atteindre un point darrive


Nous rappelons que ce niveau de comptence permet au robot datteindre un point, et plus
particulirement le point darrive, lorsque lenvironnement est trs peu contraint. La figure (III18) propose des exemples de telles situations. Sur lexemple (a) de cette figure, le point darrive
est situ larrire du robot lorsque celui-ci se trouve dans sa position de dpart.

(a)

(b)
Figure III.18 : Exemples du niveau Atteindre un point darrive.

Le robot fait demi-tour et soriente vers le point cible. Dans la figure (III-18-.b), le robot ne
rencontrant aucun obstacle devant lui se dirige directement vers le point darrive.
Niveau 1 : Evitement des obstacles fixes :
A ce niveau, les obstacles ne posent pas de limitations majeures lvolution du robot.
Lopration consiste simplement faire progresser le robot autour des diffrents objets situs dans
son espace de travail en modifiant constamment la direction suivie par le robot. Des exemples de
tels environnements ainsi que les trajectoires correspondantes du robot sont prsents sur la figure
(III-19).
36

(a)

(b)

Figure III.19 : Exemples dvitement dobstacles fixes


Les solutions proposes assurent la navigation du robot partir dinformations fournies par
les capteurs ultrasons, lenvironnement est priori inconnu. Pour un mme type
denvironnements, de faibles variations dans les positions des points de dpart et darrive du robot
peuvent engendrer dimportants carts dans les prises de dcision. La figure (III-20) illustre cet
aspect o, pour un mme environnement, deux positions voisines du point darrive sont
proposes.
A partir du point A, les trajectoires dcrites par le robot sen trouvent logiquement
modifies. Cette diffrence provient du choix du couloir libre retenu en en ce point. Dans la figure
(III-20-a), le robot dcide de suivre le couloir libre situ gauche du point A. Par contre, le robot
choisit de suivre le couloir libre situ droite de cet obstacle dans la figure (III-20-b).

(a)

(b)

Figure III-20: Influence de la position du point darrive sur la trajectoire dcrite.


37

Chapitre II
Commande et Identification par les
Rseaux de Neurone Artificiels

Commande et identification par les rseaux de neurone artificiels

2A Master AUT+CSE

II.1. Introduction
Lun des dfis de lhomme aujourdhui est de copier la nature et de reproduire des modes de
raisonnement et de comportement qui lui sont propre. Les rseaux de neurones, sont ns de cette
envie, ils constituent une famille de fonctions non linaires paramtres, utilises dans de nombreux
domaines (physique, chimie, biologie, finance, etc.), notamment pour la modlisation de processus et
la synthse de lois de commandes, Ce cours dcrit une technique intelligente nouvellement introduite
dans le monde de lautomatique. Il sagit principalement des rseaux de neurones artificiels et les
diffrentes structures qui leurs sont associes ainsi que nous abordons par la suite lidentification et le
contrle de processus par les rseaux de neurones pour la synthse de lois de commandes.

II.2. Gnralits
Lorigine des rseaux de neurones vient de lessai de modlisation mathmatique du cerveau
humain. Les premiers travaux datent de 1943 et sont luvre de MM. Mac Culloch et Pitts. Ils
supposent que limpulsion nerveuse est le rsultat dun calcul simple effectu par chaque neurone et
que la pense ne grce leffet collectif dun rseau de neurones interconnects (figure I.1). Ils ont
connu des dbuts prometteurs vers la fin des annes 50, mais le manque dapprofondissement de la
thorie a gel ces travaux jusquaux annes 80.

Figure II.1 Structure dun rseau de neurones biologiques.


Les rseaux de neurones forment une famille de fonctions non linaires, permettant de
construire, par apprentissage, une trs large classe de modles et de contrleurs. Un rseau de
neurones est un systme doprateurs non linaires interconnects, recevant des signaux de lextrieur
par ses entres, et dlivrant des signaux de sortie, qui sont en fait les activits de certains neurones.

II.3. Neurone biologique


Le neurone est une cellule compose dun corps cellulaire et dun noyau. Le corps cellulaire se
ramifie pour former ce que lon nomme les dendrites. Celles-ci sont parfois si nombreuses que lon
parle alors de chevelure dendritique ou darborisation dendritique. Cest par les dendrites que
linformation est achemine de lextrieur vers le soma, corps du neurone. Linformation traite par le
neurone chemine ensuite le long de laxone (unique) pour tre transmise aux autres neurones. La
transmission entre deux neurones nest pas directe. En fait, il existe un espace intercellulaire de
38

Commande et identification par les rseaux de neurone artificiels

2A Master AUT+CSE

quelques dizaines dAngstroms (10- 9 m) entre laxone du neurone affrent et les dendrites (on dit une
dendrite) du neurone effrent. La jonction entre deux neurones est appele la synapse (figure I.2).

Figure II.2 Schma simplifi dun neurone biologique.


Les rseaux de neurones artificiels (Artificial Neural Networks ANN) constituent une
approche fondamentalement nouvelle dans le traitement de linformation. Ce sont des systmes
parallles, adaptatifs et distribus dont le fonctionnement imite celui des rseaux de neurones
biologiques tout en reproduisant leurs caractristiques de base :
1. La connaissance est acquise par le rseau travers un processus dapprentissage ;
2. Les connexions entre neurones, appeles poids synaptiques, sont utilises pour le
stockage de la connaissance.
Du point de vue structurel, un rseau de neurones est dun certain nombre dunits de traitement
simples appeles neurones formels ou artificiels. Ces derniers sont connects entre eux de faon
produire la rponse correspondant aux entres reues par le rseau. Plusieurs modles de neurones
artificiels ont t dvelopps, sinspirant du principe de fonctionnement du neurone biologique qui
assure essentiellement les fonctions suivantes :

Rception des signaux provenant des neurones voisins ;


Intgration de ces signaux ;
Gnration dune rponse ;
Transmission de celle-ci dautres neurones.

II.4. Elments de base


II.4.1. Structure de base
Le premier modle du neurone formel date des annes quarante. Il t prsent par Mc Culloch et
Pitts. Sinspirant de leurs travaux sur les neurones biologiques ils ont proposs le modle suivant:

Figure II.3 le neurone formel


39

Commande et identification par les rseaux de neurone artificiels

2A Master AUT+CSE

Un neurone formel est une fonction algbrique non linaire et borne, dont la valeur dpend des
paramtres appels poids synaptiques ou poids des connexions. Dune faon plus gnrale, un neurone
formel est un lment de traitement (oprateur mathmatique) possdant n entes (qui sont les
neurones externes ou les sorties des autres neurones), et une seule sortie. Ce modle est dcrit
mathmatiquement par les quations suivantes:
n

s=

w x

i i

i =1

yn = (s )
O xi, wi, et yn sont respectivement, les entres, les poids synaptiques, la fonction d'activation et la
sortie du neurone.

II.4.2 Fonction d'activation


Les fonctions dactivations reprsentent gnralement certaines formes de non linarit.
Lune des formes de non linarit la plus simple, et qui est approprie aux rseaux discret, est la
fonction signe, figure II.3.a. Une autre variante de ce type des non linarits est la fonction de
Heaviside, figure II.3.b. Pour la majorit des algorithmes dapprentissage il est ncessaire dutiliser
des fonctions sigmodes diffrentiables, telles que la fonction sigmode unipolaire, figure II.3.c et la
fonction sigmode bipolaire, figure II.3.d. La classe, la plus utilise des fonctions dactivation, dans le
domaine de la modlisation et de la commande des systmes non linaires est la fonction sigmode
bipolaire.

Figure II.4 Diffrentes fonctions d'activation


Donc un rseau de neurone est un ensemble dlments de traitement de linformation, avec
une topologie spcifique dinterconnexions (architecteur du rseau) entre ces lments et une loi
dapprentissage pour adapter les poids de connexions (poids synaptiques), il est caractris par un
paralllisme gain trs fin et forte connectivit. Nous entendons par l que dans un rseau de
neurones donn, linformation est traite par grand nombre de processeurs lmentaires trs simples,
chacun tant reli dautres processus. Ce processus trs simple est un neurone formel dsign ainsi
son fonctionnement s'inspire d'une modlisation des cellules biologiques. Ils sont dots de deux
proprits importantes qui sont l'origine de leur intrt pratique des domaines trs divers:
Capacit d'adaptation ou d'apprentissage qui permet au rseau de tenir compte des nouvelles
contraintes ou de nouvelles donnes du monde extrieur,
Capacit de gnralisation qui est son aptitude de donner une rponse satisfaisante une entre qui
ne fait pas partie des exemples partir desquels il apprit.
40

Commande et identification par les rseaux de neurone artificiels

2A Master AUT+CSE

II.5. L'apprentissage des rseaux de neurones


L'information que peut acqurir un rseau de neurones est reprsente dans les poids des
connexions entre les neurones. L'apprentissage consiste donc ajuster ces poids de telle faon que le
rseau prsente certains comportements dsirs. En d'autres termes, l'apprentissage des rseaux de
neurones consiste ajuster les poids synaptiques de telle manire que les sorties du rseau soient aussi
proches que possible des sorties dsires. Il existe deux types d'apprentissage:
L'apprentissage supervis: pour lequel on dispose de la sortie dsire et qui consiste ajuster les
poids synaptiques de telle sorte minimiser l'cart entre la sortie dsire et la sortie du rseau,
L'apprentissage non supervis: pour lequel le rseau de neurones organise lui-mme les entres qui
lui sont prsentes de faon optimiser un critre de performances donn,

Figure II.5 Un rseau multicouche comportant 2 neurones dentre, 4 neurones cachs


et un neurone de sortie

II.5 Algorithme d'apprentissage


L'apprentissage des rseaux de neurones, consiste adapter les poids synaptiques de telle
manire que l'erreur entre la sortie du rseau et la sortie dsire soit aussi petite que possible. La
plupart des algorithmes d'apprentissage des rseaux de neurones est base sur les mthodes du
gradient: ils cherchent minimiser un critre de la forme suivante:

J=

1
2

(y (X ) y (X ))
m

rq

d
q

q =1

O y rq et y qd sont la sortie du rseau et la sortie dsire pour le vecteur d'entre Xp. Cette optimisation
se fait d'une manire itrative, en modifiant les poids en fonction du gradient de la fonction de cot
selon la loi d'adaptation suivante:

wlji (k + 1) = wlji (k )

J
wlji

41

Commande et identification par les rseaux de neurone artificiels

2A Master AUT+CSE

O wlji est le poids de la connexion entre le jme neurone de la couche l et le ime neurone de la couche
l-1
i=1,,n+1 la ime composante du vecteur d'entre,
j=1,,m+1 la ime composante du vecteur de sortie,
l=1,,L l'ordre d'une couche dans le rseau de neurone,
est une constante positive (>0) appele taux d'apprentissage.
Le gradient est calcul par une mthode spcifique aux rseaux de neurones, dites mthode de rtro
propagation. Dans cette mthode il est possible de calculer le gradient de la fonction cot en
retropropageant l'erreur commise en sortie vers les couches caches.

II.6 Identification et commande des systmes par les rseaux de neurones


Par leur capacit dapproximation universelle, les rseaux de neurones sont bien adapts pour
lidentification et commande des systmes non linaires. En effet dans ce cas la fonction commande
est une fonction non linaire, lobjectif est alors dapproximer cette fonction par les RNA (rseaux de
neurones artificiels). Cette approximation est ralise par apprentissage des poids du rseau,
lapprentissage peut se faire hors ligne ou en ligne :
Dans le cas de hors ligne, lapprentissage est bas sur un ensemble de donnes dfinissant la
fonction commande,
Dans le cas den ligne, la mise jour des poids est essentiellement adaptative.

II.6.1. Identification des processus par rseaux de neurones


Le principe de lidentification par rseau neuronaux consiste substituer aux modles
paramtriques classiques des modles neuronaux, c'est--dire proposer un modle tablissant une
relation entre son entre et sa sortie et dterminer, partir du couple des signaux dentre-sortie, le
comportement du modle. Deux raisons importantes nous motivent:
Prdire le comportement dun systme pour diffrentes conditions de fonctionnement ;
Elaborer une loi de commande appliquer au processus, pour quil ralise lobjectif assign.
Nous citerons deux techniques didentification base de rseaux de neurones multicouches : la
mthode didentification directe et la mthode didentification inverse.

II.6.1.1. Identification directe


La figure II.6 montre le schma gnral didentification directe dun processus. Sur cette
figure, le rseau de neurones identificateur RNI est utilis en parallle avec un processus de type boite
noire. La sortie du processus, y, est compare avec la sortie du rseau de neurones, y , puis lerreur

y y est utilise afin daffiner les paramtres du systme neuronal.

42

Commande et identification par les rseaux de neurone artificiels

2A Master AUT+CSE

Figure II.6 Schma didentification directe dun processus par rseau de neurones.
Considrons un systme non linaire avec une entre u(k) et une sortie y(k)
y(k) peut dpendre de u(k) seulement, ou de u(k) et les tats prcdents de y et/ou u cest dire
y(k)=F(u(k))
Ou
y(k)=F(u(k-1),,u(k-m),y(k-1),y(k-2),,y(k-n))
Le principe de lidentification directe par rseau de neurones consiste construire le rseau (en
gnrale MLP) qui approxime la fonction F, cette approximation se fait par apprentissage hors ligne.
Etant donn la fonction F, il faut construire un RNA pour raliser lapproximation, on gnre une base
de donnes de N chantillon y(k-1), y(k-2),.,y(k-n), u(k-1),,u(k-m) (les entrs) et on obtient y(k)
(la sortie) partir de F. Lobjectif de lapprentissage est de dterminer la fonction F partir de ces
donnes. A linstant t, on donne au RNA :

y(k-1), y(k-2),.,y(k-n), u(k-1),,u(k-m) et on obtient la sortie y (k ) . La mise jour des poids du


rseau est base sur la minimisation de lerreur entre y(k) et y (k ) .

1
J=
2

y y
i

i =1

II.6.1.2. Identification inverse


Dans cette mthode, lentre du processus est compare avec la sortie de lidentificateur
neuronal RNI est la sortie du processus est injecte comme entre du rseau de neurones (figure II.7).
Aprs un apprentissage hors-ligne du modle inverse, le RNI peut tre configur afin dassurer un
contrle directe du processus.

43

Commande et identification par les rseaux de neurone artificiels

2A Master AUT+CSE

Figure II.7 Schma didentification inverse dun processus avec un rseau de neurones.

I.6.2. Commande des processus par rseaux de neurones


La littrature scientifique fait mention de diffrentes architectures de commande. Les plus
simples se basent sur lapprentissage dun contrleur conventionnel dj existant, dautres oprent un
apprentissage hors-ligne du modle inverse du processus ou dun modle de rfrence et enfin,
dautres travaillent compltement en ligne.

I.6.2.1. Apprentissage dun contrleur conventionnel


Un rseau de neurones peut reproduire le comportement dun contrleur conventionnel dj
existant (PI, PID, RST, ...) grce ses facults dapprentissage et dapproximation. Il suffit de le
soumettre un apprentissage hors ligne pendant une phase didentification directe en considrant que
le contrleur est lui-mme un processus. La figure II.7 montre le principe de lidentification directe
dun contrleur conventionnel.

Figure II.7 Schma didentification directe dun contrleur conventionnel avec un RNI.
Le but de cette architecture nest pas de perfectionner les performances du contrleur
conventionnel dj existant, mais de saffranchir des contraintes dimplmentations matrielles que
peuvent ncessiter certains rgulateurs. La mthode de rgulation de type RST par exemple est
reconnue pour ses bonnes performances en commande mais elle pose de srieux problmes en
intgration numrique.

I.6.2.2. Commande inverse avec apprentissage en ligne


Le principe de cette commande repose sur une didentification par modle inverse. La figure
II.8 reprsente le schma de commande inverse avec un (RNC). Cette architecture reprend le mme
principe que celui de lidentification inverse montre dans la figure II.8. En effet, Lentre de
rfrence r est compare la sortie y du processus pour former lerreur de poursuite, e = r y qui sert
44

Commande et identification par les rseaux de neurone artificiels

2A Master AUT+CSE

modifier les paramtres du rseau en ligne. Aprs avoir appris le modle inverse, le neuro-contrleur
dlivre la sortie u du RNC qui est la commande injecte en entre du processus, lerreur est alors nulle
et la sortie y est gale la rfrence r. Ce principe est identique au RNI de la figure II.6 ou lorsque
lapprentissage du modle inverse est accompli, la sortie du RNI est gale lentre du processus.
Lavantage de la commande inverse avec un RNC est le suivi en temps rel de lvolution du
processus, car lapprentissage est ralis en ligne.

Figure II.8 Schma de commande inverse avec un RNC.


Comme les performances de cet organe de commande dpendent troitement de la fidlit du modle
inverse, la stabilit et le niveau de performance ne sera pas garanti dans le cas ou le modle inverse
nexiste pas ou sil est difficile trouver.

II.7. Avantages et Inconvnients des rseaux de neurones


II.7.1. Avantages des rseaux de neurones
Capacit de reprsenter nimporte quelle fonction, linaire ou pas, simple ou complexe ;
Facult dapprentissage partir dexemples reprsentatifs, par rtropropagation des erreurs.
Lapprentissage (ou construction du modle) est automatique ;
Rsistance au bruit ou au manque de fiabilit des donnes ;
Simple manier, beaucoup moins de travail personnel fournir que dans lanalyse statistique
classique. Aucune comptence en matis, informatique statistique requise ;
Comportement moins mauvais en cas de faible quantit de donnes ;
Pour lutilisateur novice, lide dapprentissage est plus simple comprendre que les complexits des
statistiques multivariables.

II.7.2. Inconvnients des rseaux de neurones


Labsence de mthode systmatique permettant de dfinir la meilleure topologie du rseau et le
nombre de neurones placer dans la (ou les) couche(s) cache(s) ;
Le choix des valeurs initiales des poids du rseau et le rglage du pas dapprentissage, qui jouent un
rle important dans la vitesse de convergence ;
Le problme du sur-apprentissage (apprentissage au dtriment de la gnralisation) ;
La connaissance acquise par un rseau de neurone est code par les valeurs des poids synaptiques, les
rseaux de neurones sont donc des boites noires o les connaissances sont inintelligibles pour
lutilisateur.

45

Commande et identification par les rseaux de neurone artificiels

2A Master AUT+CSE

Exemple 1 :
Le but de cet exemple est de mettre en place un rseau de neurones qui contient une couche cache de
10 neurones et une couche de sortie de 1 neurone, on utilisant la rtropropagation du gradient avec une
base dapprentissage qui contient 70 point, pour laborer un programme didentification de la fonction

f (x ) = sin(x )

2 x 2 .
1.5

1
0.8

1
0.6
0.4

0.5

0.2

0
-0.2

-0.5

-0.4
-0.6

-1

-0.8
-1
-2

-1.5

-1

-0.5

0.5

1.5

-1.5
-2

Apprentissage avec 5 itrations


1.5

0.5

0.5

-0.5

-0.5

-1

-1

-1.5

-1

-0.5

0.5

-1

-0.5

0.5

1.5

Apprentissage avec 50 itrations

1.5

-1.5
-2

-1.5

1.5

-1.5
-2

Apprentissage avec 100 itrations

-1.5

-1

-0.5

0.5

1.5

Apprentissage avec 1000 itrations

Exemple 2 :
Soit le systme discret donn par la fonction de transfert suivante :
H ( z ) = z 1

b1 + b2 z 1
1 a1 z 1

Avec
b1 = 1 , b2 = 0.8 , a1 = 0.5
et lquation de rcurrence liant la sortie y ( k ) lentre u ( k )
y ( k ) = a1 y ( k 1) + b1 u ( k 1) + b2 u ( k 2 )

Le but de cet exercice est lidentification des paramtres (b1, b2, a1) on utilisant une base
dapprentissage qui contient 500 points dentrs sortie (u(k),y(k)) et un rsaux de neurone exprim par
la figure suivante :
y ( k 1)

b
W1

u ( k 1)

W2

u ( k 2)

W3

Wp+b

Les entrs du rseau p = y ( k 1) u ( k 1) u ( k 2 )


46

o (k )

Commande et identification par les rseaux de neurone artificiels

2A Master AUT+CSE

Lapprentissage du rseau consiste modifier, a chaque pas les poids et les biais afin de minimiser la
somme des carrs des erreurs en sortie.
A chaque pas dapprentissage, lerreur en sortie est calcule comme la diffrence entre la cible
recherche y ( k ) et la sortie o ( k ) du rseau.
La quantit minimiser, a chaque pas dapprentissage k est :

J=

T
1 T
1
e ( k ) e ( k ) = ( y ( k ) o ( k )) ( y ( k ) o ( k ))
2
2

Ladaptation des poids se faisant dans le sens inverse du gradient, la matrice de poids de ltape future
(t+1) est :

J
W

W ( t + 1) = W ( t )

J
J o ( k )
=
W o ( k ) W
J
= o (k ) y (k )
o ( k )
o ( k )
W

(W p ( k ) + b )
W

= pT ( k ) Avec p ( k ) dsigne les entrs du rseau

W ( t + 1) = W ( t ) + ( y ( k ) o ( k ) ) pT ( k ) Avec dsigne les entrs du rseau


De mme, on obtient lexpression de la modification du biais :

b ( t + 1) = b ( t ) + ( y ( k ) o ( k ) )
1.5

les poids du resau

0.5

-0.5
0

100

200
300
iteration

400

500

On remarque que les poids du rseau convergent vers les paramtres (b1, b2, a1) du systme
47

Chapitre III
Commande par les Rseaux de Neurone
Floue

Commande par les rseaux de neurone floue

2A Master AUT+CSE

III.1 Rseaux neuro-flou


Jusqu'aux annes 90, ces deux techniques (neuronal et flou) apparaissaient comme des
approches bien distinctes, ayant chacune leurs avantages et leurs inconvnients et leurs
domaines spcifiques.
Dans le domaine du contrle des processus, la commande floue se prtait bien un
interfaage avec un oprateur humain en raison de sa capacit traiter des termes
linguistiques. Par contre, il subsistait toujours une certaine part d'arbitraire dans le choix des
fonctions d'appartenance et d'imprcision dans l'criture des rgles qui conduisait une
solution qui peut tre assez loin de l'optimum.
D'un autre ct, les rseaux neuromimtiques (rseaux multicouches) taient tout
indiqus dans les cas o l'on ne dispose que de donnes numriques pour laborer la
commande. Ces rseaux apprenaient par l'exemple en minimisant une fonction cot ce qui
leur confrait de bonnes qualits de gnralisation. Par contre, il tait trs difficile d'y
introduire de la connaissance a priori car le contenu du rseau n'tait pas interprtable (bote
noire).
Elles prsentent galement des points communs :
Les

deux

mthodes,

appliques

au

contrle,

prsentent de bonnes

qualits de robustesse et sont capables d'extrapolation et de gnralisation.


Aucune

des deux mthodes ne ncessite de modle mathmatique du

systme contrler et elles peuvent donc toutes deux s'appliquer des systmes non
linaires sans complications particulires.
L'ide est donc apparue tout naturellement au dbut des annes 90 de crer un systme
d'infrence floue optimis, cherchant utiliser les mthodes d'apprentissage supervis, comme
par exemple la rtropropagation du gradient, pour optimiser automatiquement certains
paramtres d'un systme d'infrence floue.
Dans ce qui suit, nous allons prsenter trois architectures neuro-flou qui permettent
d'optimiser un systme d'infrence flou : l'architecture Nomura, l'architecture LSC et
l'architecture ANFIS.

48

Commande par les rseaux de neurone floue

2A Master AUT+CSE

III.2 L'architecture Nomura


L'architecture Nomura est une mthode d'autoparamtrage d'un systme d'infrence
flou dans laquelle est abord le concept " neuro-flou". Elle fut prsente par les scientifiques
japonais Hiroyoshi Nomura [Nomura 91], Isao Hayashi et Noburu Wakami.
Contrairement au perceptron multicouche standard, le rseau n'est pas entirement
connect et chaque couche du rseau a une fonction particulire, laquelle correspond une
fonction d'activation spcifique.
Ce rseau prsente une complte analogie structurelle avec un systme d'infrence
floue de type "Sugeno" d'ordre zro (i.e. dans lequel les conclusions des rgles sont nettes).
Les fonctions d'appartenance sont triangulaires ce qui a conduit au dveloppement d'un
algorithme spcifique.
Nous raisonnerons sur un exemple (qui peut facilement se gnraliser) de systme
d'infrence floue deux entres e et e dont la connaissance s'exprime sous la forme de rgles
floues de type :
Rgle i : Si e est Ai1 et e est Ai2 alors u est Wi
Dans lesquelles les conclusions sont des valeurs exactes (non floues), notes Wi. La prise de
dcision est faite l'issue des tapes suivantes:
Pour une entre donne (e, e), on calcule les diffrents degrs d'appartenance aux sousensembles flous Ai1 ou Ai2 apparaissant dans la partie prmisse des rgles. C'est l'tape de
fuzzyfication.
Pour chaque rgle, on calcule la valeur de vrit i telle que:
i =ET((x1 est A1),(x2 est A2))

Enfin, il faut agrger les rgles et tirer la conclusion. Les valeurs Wi des parties
conclusion des rgles sont pondres par les valeurs de vrit des prmisses:

W
y=

(III.1)

Chacune de ces tapes sera ralise par les neurones d'une des couches du systme
d'infrence floue (figure II.1).

49

Commande par les rseaux de neurone floue


Couche 2

Couche 3

A1

Couche 1

Couche 4

ET
Valeurs

Fonctions
D'apparte
nance

X1

2A Master AUT+CSE

An

des
rgles

ET

de

B1

X2

Conclusion

ET

vrit

Bn

W1
Wi

y
Agrgation

Wn

ET

Figure III.1 Reprsentation du systme d'infrence floue


III.2.1 Fonctions des diffrentes couches

La premire reoit les entres du rseau.

La deuxime couche calcule les degrs d'appartenance des entres aux diverses

fonctions d'appartenance.

La troisime couche calcule les valeurs de vrit l'aide des poids entre les deux

couches caches (ils dfinissent l'oprateur ET choisi).

La

quatrime

couche

est

la

couche

de

sortie. Elle fait l'agrgation des

diffrentes rgles et calcule la valeur de sortie. Les poids Wi du rseau entre la troisime et
la dernire couche constituent la partie conclusion des rgles.

50

Commande par les rseaux de neurone floue

2A Master AUT+CSE

III.2.2 Ralisation des fonctions d'appartenance


Les fonctions d'appartenance

de

la prmisse proposes par Nomura

sont de type triangulaire caractrises par leur centre aij pour positionner la fonction
sur l'univers du discours, et la largeur bij pour caractriser son tendue sur cet univers
(figure III.6).
Aij(xj)

A ij (x j ) = 1

2. x j a ij
bij

xj
aij
bij

Figure III.2 Fonction d'appartenance utilise


III.2.3 Calcul des valeurs de vrit i
La conjonction floue utilise dans le rseau de Nomura est celle dfinie par
Lukasiewicz comme suit :
ET(X,Y)= max [0, A(x)+B(x)-1 ]

(III.2)

III.2.4 Algorithme d'apprentissage


C'est une mthode extrmement gnrale base sur la descente du gradient, o
chaque paramtre Ti est modifi par rtropropagation en fonction de sa part dans l'erreur
globale E :
E=

1
( y y r )2
2

(III.3)

Ti ( k + 1) = Ti ( k ) (E / Ti )

(III.4)

aij (t + 1) = a ij (t ) K a

( E )
(a ij )

(III.5)

bij (t + 1) = bij (t ) K b

( E )
(bij )

(III.6)

Wi ( t + 1) = Wi ( t ) K w

( E )
(Wi )

(III.7)

51

Commande par les rseaux de neurone floue

2A Master AUT+CSE

Aprs drivation on obtient :


aij (t + 1) = aij (t )

K a .i

.( y y r ) (Wi (t ) y ). sgn(x j aij (t )).

2
bij (t ). Aij ( x j )

(III.8)

i =1

bij (t + 1) = bij (t )

K b . i

.( y y r ) (Wi (t ) y ).

1 Aij ( x j )
Aij ( x j )

1
bij (t )

(III.9)

i =1

Wi (t + 1) = Wi (t )

K w . i
n

.( y y r )

(III.10)

i =1

Il ya dautre travaux qui utilise le produit pour le calcule le degr de vrit i dans
larchitecture de Nomura, soit le contrleur neuro-floue qui contient deux entr (e, e) avec
deux fonction dappartenance de type triangle pour chaque entr, et deux sous ensemble floue
(small, Large)
Rgle
Rgle
Rgle
Rgle

R1:
R2:
R3:
R4:

If e
If e
If e
If e

est
est
est
est

Small
Small
Large
Large

and
and
and
and

e
e
e
e

is
is
is
is

Small
Large
Small
Large

then
then
then
then

y
y
y
y

is
is
is
is

bl ,
b2 ,
b3 ,
b4 ,

i
A11

Small

a11
b11

e
A21

A22

R1

b1

2
R2

b2

b3
b4

R4

Large

a22
b22

Figure III.3 Reprsentation du systme d'infrence floue


52

R3

Small

a12
b12

Large

a21
b21

A12

Commande par les rseaux de neurone floue

2A Master AUT+CSE

Ladaptation des paramtres des fonctions dappartenances des prmisses et des conclusions
est donne par les lois suivantes :
aij (t + 1) = aij (t ) K a

( E )
(a ij )

(III.5)

bij (t + 1) = bij (t ) K b

( E )
(bij )

(III.6)

bi (t + 1) = bi ( t ) K w

( E )
(Wi )

(III.7)

III.3 L'architecture LSC


L'architecture LSC vient du nom du laboratoire Systmes Complexes de l'Universit
d'Evry Val d'Essonne qui est l'origine de sa proposition [Benreguieg 97]. Elle ressemble
l'architecture Nomura, la diffrence subsiste au niveau de l'algorithme d'apprentissage qui est
effectu entirement en ligne en minimisant une fonction cot E pour gnrer les paramtres
wi de la partie conclusion des rgles et les ajuster. Les fonctions d'appartenance

de

la

prmisse proposes par cette architecture sont de type gausienne dfinies par la relation
(III.8):

x i cij
2 ij

ij (xi ) = exp

) 2

(III.8)

ij

cij - ij

cij

cij + ij

xi

Figure III.4 Reprsentation du systme d'infrence floue


Soit le contrleur neuro-floue qui contient deux entr (e, e) avec trois fonction
dappartenance de type gaussienne pour chaque entr, et neuf fonction dappartenance de type
singleton en sortie larchitecture du rseau et prsent par la figure suivante :

53

Commande par les rseaux de neurone floue

2A Master AUT+CSE

Figure III.5 Reprsentation du systme d'infrence floue


Lapprentissage est bas sur la mthode de la descente du gradient, o chaque
paramtre wi est modifi par rtropropagation en fonction de sa part dans l'erreur globale E :
E=

1
(y yr )
2

Wi (t + 1) = Wi (t )

(III.9)
K w .Oi
9

.( y y r )

i = 1,2,....,9

(III.10)

k =1

III.4 L'architecture ANFIS


Cette

architecture

appartient

une

classe

de

rseaux

adaptatifs

RBF

[Jang 93a] fonctionnellement quivalent un systme d'infrence floue de type Sugeno,


connue sous le nom de ANFIS (Adaptive-Network-based Fuzzy Inference System) [Jang93b].
Cette technique applique la mthode des moindres carre combine la rtropropagation du
gradient dans l'apprentissage.
Pour simplifier la comprhension et sans perte de gnralit, nous considrons un
systme deux entres x1 et x2 et une sortie y. Considrons aussi un modle flou de TS1 de
ce systme, compos des deux rgles suivantes :
Si x1 est A1 et x2 est B1 alors y1 = F1(x1,x2 ) = a1x1 +b1x2 + c1

(III.11)

Si x1 est A2 et x2 est B2 alors y2 = F2(x1,x2 ) = a2 x1 +b2 x2 +c2

(III.12)

Jang a propos de reprsenter cette base de rgles par le rseau adaptatif de la figure (III.7)
La mthode ANFIS est base sur l'utilisation de rseaux multicouches (adaptative
networks) o chaque cellule ralise une fonction propre respectant les paramtres qui lui ont

54

Commande par les rseaux de neurone floue

2A Master AUT+CSE

t fournis. L'application de l'exemple prcdent peut donc tre reprsente de la manire


suivante (figure III.6):
Le rseau adaptatif ANFIS est un rseau multi-couches dont les connexions ne sont
pas pondres, ou ont toutes un poids de 1. Les nuds sont de deux types diffrents selon leur
fonctionnalit : les nuds carrs (adaptatifs) contiennent des paramtres, et les nuds
circulaires (fixes) nont pas de paramtres. Toutefois chaque nud (carr ou circulaire)
applique une fonction sur ses signaux dentres. La sortie Oik du nud i de la couche k
(appel nud (i, k ) ) dpend des signaux provenant de la couche k 1 et des paramtres du
nud (i, k ) , cest dire,
Oik = f(O1k 1, ... , Onkk11, a, b, c,...)

(III.13)

o nk 1 est le nombre de nuds dans la couche k 1 , et a, b, c,... sont les paramtres du nud

(i, k ). Pour un nud circulaire, ces paramtres nexistent pas.


Dans le rseau de la figure (III.6), les nuds dune mme couche ont des fonctions
issues dune mme famille que nous explicitons ci-dessus :
couche 1
couche 4

A1

couche 2

couche 3

x1 x2

x1

couche 5

A2

w1

v1

v1.F1

B1

w2

x2

v2.F2

v2
x1 x2

B2

Figure III.6 Rseau ANFIS quivalent au raisonnement flou cit


Couche 1 : Chaque nud de cette couche est un nud carr avec une fonction :
Oi1= Ai (x)

(III.14)

o x est lentre du nud i , et Ai le terme linguistique associ sa fonction. Donc le rsultat


que donne cette cellule reprsente le degr avec lequel x satisfait le qualificatif Ai .En dautres
55

Commande par les rseaux de neurone floue

2A Master AUT+CSE

termes, Oi1 est le degr dappartenance de x Ai . Les paramtres dun nud de cette couche
sont ceux de la fonction dappartenance correspondante. Gnralement les fonctions
d'appartenance utilises par la mthode ANFIS sont des gaussiennes ou

des fonctions

cloches.
Couche 2 : Chaque nud i de cette couche est un nud circulaire appel qui engendre
en sortie le produit de ses entres. Ce produit reprsente le degr dactivation dune rgle :

wi = Ai (x1 ).Bi (x2 ), i=1..2

(III.15)

Couche 3 : Chaque nud de cette couche est un nud circulaire appel .


Dans cette couche, les cellules calculent le rapport entre les valeurs de vrit de chaque rgle
par rapport la somme de toutes les valeurs de vrit donnes par chaque rgle. Elles
estiment donc le poids "normalis" de chaque rgle.
wi
w1 + w2

vi =

(III.16)

Couche 4 : Chaque nud de cette couche est un nud carr avec une fonction ralisant le
calcul :

Oi4 = vi.Fi = vi (ai x1+bi x2 +ci), i =1..2

(III.17)

o vi est la sortie de la couche 3, et {ai, bi, ci } est lensemble des paramtres de sortie de la
rgle i .
Couche 5 : Le seul nud de cette couche est un nud circulaire qui effectue la somme des
signaux provenant de la couche 4, cest dire,
O15 = y = vi.Fi

(III.18)

Nous remarquons que la sortie globale du rseau est quivalente la sotie du modle de TS1.
La gnralisation du rseau un systme n entres ne pose aucun problme
particulier. Le Nombre de nuds de la couche 1 est toujours gal au nombre total de termes
linguistiques dfinis. Le Nombre de nuds des couches 2, 3 et 4 est toujours gal au nombre
de rgles floues.
La figure III.7 montre un exemple de rseau ANFIS correspondant un SIF deux
entres avec 9 rgles. A chaque entre, correspondent trois fonctions d'appartenance ce qui
implique que l'espace d'entre est partag en 9 sous-espaces flous o chacun couvre une rgle
floue.

56

Commande par les rseaux de neurone floue

2A Master AUT+CSE

x
A1

A2

A3

N
N
N

B1

B2

B3

B3
B2

f
B1
x
1
1

A1

A2

A3

Figure III.6 Une structure ANFIS 2-entres avec 9 rgles


III.4.1 Algorithme d'apprentissage
Lapprentissage partir dun ensemble de donnes concerne lidentification des
paramtres des prmisses et des consquences, la structure du rseau tant fixe. Lalgorithme
dapprentissage commence par construire un rseau initial, en suite nous appliquons une
mthode dapprentissage par rtro-propagation de lerreur. Jang a propos dutiliser une rgle
hybride dapprentissage qui combine un algorithme de descente de gradient avec une
estimation par moindres carrs (MC).
Dans l'architecture ANFIS, l'apprentissage est bas sur une mthode hybride qui
applique la mthode des moindres carre combine la rtropropagation du gradient tout au
long de l'apprentissage. Les paramtres des conclusions des rgles qui sont linaires par
rapport la sortie du systme d'infrence floue sont ajusts par la mthode des moindres
carres dans le sens "forward" du rseau, puis vient l'ajustement des paramtres des prmisses
des rgles par la mthode du gradient dans le sens ''backward" du rseau, et ce, pour chaque
itration de l'algorithme. Le tableau III.1 nous rsume les diffrentes tapes de l'algorithme :
Paramtres de la prmisse
Paramtres de la conclusion

Forward (une fois)


Fixs
Moindres carres

Backward (une fois)


Descente du gradient
Fixs

Tablaux.III.1 La mthode hybride utilis dans ANFIS


L'identification des paramtres non-linraires de la partie prmisse des rgles floues
avec des fonctions d'appartenance de type gaussienne dfinies par la relation (III.18):

57

Commande par les rseaux de neurone floue

( (

A j (x i ) = exp 0.5 v i j xi ci j
i

))
2

2A Master AUT+CSE

Avec v i j =

(III.18)

i j

o c est la moyenne, v est l'inverse de la variance (cette dernire est adopte afin d'viter la
division par zro lors de son adaptation) s'effectue comme suit:
Considrons l'ensemble des paramtres des prmisses caractris par le vecteur , et
soit un ensemble de donnes entre-sortie ( x( k ), y d ( k )) . Notre objectif est de trouver les
valeurs du vecteur pour que la sortie du systme flou approche le mieux possible la sortie
dsire yd ( k ) , en minimisant le critre :
J=

2
1
f ( x( k ), ) y d ( k )

(III.20)

Lalgorithme de rtro-propagation est donn par:


( k +1 ) = ( k )

(III.21)

avec est le gain d'apprentissage.


Cet algorithme est souvent appel algorithme de rtro-propagation du gradient, utilis
dans les rseaux de neurones. Cependant, ce dernier est connu par ses inconvnients dtre
souvent lent et peut tre pig par des minima locaux lors de l'apprentissage.
Dans un systme flou de type Sugeno, nous avons =[c v ]T , o [c, v] sont les
paramtres des prmisses, nous avons donc:

J J J
=
c v

(III.22)

En utilisant l'expression de la sortie du systme flou, il vient:


J
J k Ail
=

cij k I j k A j cij
ci

o I

c ij

(III.23)

: est l'ensemble des indices (l) des rgles floues (Rl) dont lesquelles apparat l'ensemble

flou Ai j .

J
( y yd )
= k Mk
k

l =1

58

(III.24)

Commande par les rseaux de neurone floue


k

Ai

2A Master AUT+CSE
n

=
l =1

Alkl

( xl )

(III.24)

l i

Pour une fonction d'appartenance gaussienne quation (III.18), on a :

Aij

ci

= v i j ( xi c i j )

Ai j

( xi )

(III.25)

Aprs calcul, il vient :


vij ( xi cij ) k ( y k y d )
2

J
=
cij

kI

j
ci

(III.26)

l =1

De la mme manire, on trouve :


J
=
vij

vij (xi cij )2 k ( yk yd )


kI

j
ci

(III.27)

l =1

59

Chapitre IV
Optimisation de Commandes Floue par
les Algorithmes Gntiques

Optimisation de commandes floue par les algorithmes gntiques

2A Master AUT+CSE

IV.1 Algorithme gntique adopt pour loptimisation dun SIF


Pour dcrire le processus d'optimisation de l'AG, appliqu en commande, considrant
le schma bloc fonctionnel donn dans la figure III.1 o (e) et (e) dsignent respectivement
lerreur et la variation de lerreur.

Alatoire
e
Population initiale

CF-PFF

Modle

Evaluation des performances

Enregistrement du
meilleur chromosome

oui

Arrt ?

non

- Reproduction
- Croisement
- Mutation

Figure III.1 Schma bloc fonctionnel montrant le processus d'optimisation par AG


Les paramtres dtermins par le processus d'exploration, et qui garantissent un
contrle optimal, sont :
d'une part, les paramtres des prmisses,
et d'autre part, les paramtres des conclusions des rgles.
Par l'utilisation de partitions floues fortes, il suffit seulement de coder les valeurs modales des
fonctions d'appartenance, ce qui rduit considrablement l'espace de recherche.
IV.2 Reprsentation des solutions (codage)
Dans le mcanisme de l'AG, les paramtres optimiser sont cods pour former le
chromosome. Il existe deux types de codage dans la littrature, le codage rel et le codage
binaire, nous avons adopt ce dernier.
Dans le codage binaire des paramtres, le nombre de bit pour coder chaque paramtre
dpend de la marge et de la prcision voulue.
Pour un SIF avec n entres et mi triangles par entre, i = 1 n, un individu de la
population est cod par :
A=

C1,1 C1,m1

C2,1 C2,m2

Cn,1 Cn,mn

W11 Wnmn

Les ( Ci , j ) j =i1 reprsentent les valeurs modales des triangles dfinis sur le domaine de
l'entre i. De plus, nous imposons la contrainte :
( i ) ( Ci ,1 < Ci ,2 < ... < Ci ,m )

(III.1)

Par contre, les Wij reprsentent les conclusions des rgles (dans notre cas, des
singletons).
IV.3 Oprateurs gntiques
Au dbut du processus d'optimisation, la population initiale comporte un ensemble de
chromosomes qui sont disperss partout dans l'espace de recherche. La population initiale
60

Optimisation de commandes floue par les algorithmes gntiques

2A Master AUT+CSE

peut tre alatoirement produite ou peut tre en partie fournie par l'utilisateur. Cependant,
dans toutes nos simulations, la population se compose de 200 chromosomes qui sont tous tirs
alatoirement au dbut.
La slection par la mthode de "la roue biaise" est utilise pour dterminer les
membres de la nouvelle population [Goldgerg 94]. Une fois que la nouvelle population est
construite, le croisement est effectu et ensuite est suivi par l'opration de mutation.
IV.4 Rsultats de simulation
Dans ce paragraphe nous examinons les performances de la mthode prsente cidessus en l'appliquant pour la conception d'un contrleur, de type Sugeno d'ordre zro, du
pendule inverse. Le contrleur flou de type Sugeno dterminer a une structure 2 entres(
trois fonctions d'appartenance pour l'erreur (e) et trois fonctions d'appartenance pour la
variation de l'erreur (e)) et une sortie u(t), avec 9 rgles. Les fonctions d'appartenance sont
de type triangulaire formant une partition floue forte. Lobjectif global du systme de
commande est de rduire au minimum l'erreur chaque instant k entre la rponse relle du
systme et le point de consigne, l'indice de performance, F est choisi comme suit:
F = e 2 ( k )

(III.2)

k =1

IV.4.1 Optimisation des paramtres du contrleur


Les paramtres introduits dans l'AG sont reprsents comme suit:

Les valeurs modales des triangles respectivement C11, C12, C13 pour l'erreur (e) et
C21,C22,C23 pour la variation de l'erreur (e), sont choisis entre [-1 1], et chacun est cod
sur une chane de 8 bits, tout en respectant la contrainte (III.1) lors du processus
d'optimisation,
Les conclusions des rgles W11 W33 sont choisies entre [-1 1], et chacun est cod sur
une chane de 8 bits,
La population contient 200 chromosomes (chacun de longueur de 120 bits) et le nombre
maximal de gnration est 100,
La valeur du critre de performance F pour la solution obtenue est gale 277.9652.
Le tableau (III.1 (a),(b)) nous donne les paramtres optimaux obtenus par l'AG aprs 40
gnrations:
Fcts d'appartenance
e
e

Les points modaux des fonctions d'appartenance


-0.7433 (C11)
-0.4450 (C12)
0.5651 (C13)
-0.6173 (C21)
-0.1023 (C22)
0.8750 (C23)
(a)

W11
-0.1042

W12
-0.7482

Les conclusions des rgles (wij)


W13
W21
W22
W23
W31
-0.0281 -0.6063 0.2547
0.1254 -0.1463

W32
0.9015

(b)
TAB.III.1 Paramtres optimaux obtenus par l'AG
La figure III.2 reprsente les fonctions d'appartenance trouves aprs optimisation :

61

W33
0.2321

Optimisation de commandes floue par les algorithmes gntiques

A1

A2

A3
1

Degr d'appartenance

Degr d'appartenance

0.8

0.6

0.4

0.5

B3

0.4

0
-0.5

B2

0.6

0.2

-1

B1

0.8

0.2

-1.5

2A Master AUT+CSE

1.5

-1.5

-1

-0.5

Erreur (e)

0.5

Variation de l'erreur (de)

Figure III.2 Disposition et forme des fonctions d'appartenance aprs optimisation


L'angle du pendule x1 (rd)
1.4
1.2
1
0.8
0.6
0.4
0.2
0
-0.2
-0.4
-0.6
0

Temps (s)

L'angle du pendule x1 (rd)


0.3
0.2
0.1
0
-0.1
-0.2
-0.3
-0.4
-0.5
-0.6

Temps (s)

62

1.5

Optimisation de commandes floue par les algorithmes gntiques

2A Master AUT+CSE

La vitesse du pendule x2 (rd/s)


2

-1

-2

-3

FIG.IV.15 Les rponses du pendule soumis au contrleur optimal obtenues


pour les paramtres nominaux du systme et diffrentes
-4
conditions initiales
-5
-0.6

-0.4

-0.2

0.2

0.4

0.6

0.8

1.2

1.4

L'angle du pendule x1 (rd)

Figure III.3 Les rponses du pendule soumis au contrleur optimal obtenues


pour les paramtres nominaux du systme et diffrentes
conditions initiales
L'angle du pendule x1 (rd)
0.25

0.2

0.15

0.1

0.05

-0.05
0

0.5

1.5

2.5

Temps (s)

La commande u
0.02

-0.02

-0.04

-0.06

-0.08

-0.1

-0.12
0

0.2

0.4

0.6

0.8

1.2

Temps (s)

63

1.4

1.6

1.8

Optimisation de commandes floue par les algorithmes gntiques

2A Master AUT+CSE

La vitesse du pendule x2 (rd/s)


0
-0.1
-0.2
-0.3
-0.4
-0.5
-0.6
-0.7
-0.8
-0.9
-1

0.05

0.1

0.15

0.2

0.25

L'angle du pendule x1 (rd)


FIG.IV.16 Les
Figure III.4 rponses du pendule soumis au contrleur optimal obtenues
pour une variation de 0% 100% de la demi-longueur
du segment (l)

La figure (III.3) montre la performance du contrleur flou optimis pour le contrle du


pendule inverse avec des conditions initiales diffrentes (0.22 rad, 0 rad/s), (0.44 rad, 0 rad/s),
(1.2 rads, 0 rad/s). Nous remarquons que le contrleur arrive toujours stabiliser le pendule
en un temps de rponse denviron 1.25 s pour atteindre l'tat d'quilibre, et il n'choue qu'
partir d'un angle qui dpasse la valeur de 1.2 rads.
Pour voir la raction du contrleur aux changements des paramtres du systme, nous
avons procd une variation de 0% 100% du paramtre l du systme. La figure (III.4)
montre que le contrleur arrive toujours stabiliser le systme avec un temps de rponse
denviron de 1.2 s pour atteindre l'tat d'quilibre. Pour une variation de plus de 100% le
contrleur commence perdre ses caractristiques.

64

Bibliographie

BIBLIOGRAPHIES
[1] R.KETATA
" Mthodologies de rgulation numrique incluant la logique floue "-Thse de Docteur
L.A.A.S Toulouse 1992
[2] M. BAUER
" Application de contrleurs logique floue pour la commande vectorielle des

machines

induction: commande en vitesse et en position "


Rapport de stage ingnieur- ESIM-22 Fvrier 1995
[3] A.IBALIDEN
" Implantation dun rgulateur de type flou sur des commandes donduleurs pilotant des
machines alternatives : application la dtermination des correcteurs "- Rapport dactivits
1994-1995
[4] B. BEAUFRERE
" Application de la logique floue la planification de trajectoires de robots mobiles dans des
environnements inconnus "- Thse de Docteur de luniversit de Poitiers, Dcembre 1994.
[5] P. Y. GLORONNEC
" Algorithme dapprentissage pour systmes dinfrences floues " - INSA de Rennes
(IRISIA)- 1999.
[6] B. DEMAYA
" Commande floue des systmes dynamiques complexes- Application la commande d'un
moteur thermique "- Thse de Docteur LAAS Toulouse - 17 Octobre 1994
[7] H. BUHLER
" Rglage par logique floue " -Presse polytechniques et universitaires Romandes 1994
[8] K. ZINSER, R. SCHREIBER
" La logique floue: une nouveaut prometteuse de la technique d'automatisation "- La
Technique moderne- N 1-2- 1994
[9]M.RACHDI , DJ.MAIZI
"Implantation sur DSP de contrleurs flous pour la commande vectorielle du modle
analogique de la machine asynchrone " - Projet de fin d'tudes ingnieur - EMP 1997
[10] F.AMRANE , N.GOULMANE
"Commande par logique floue dun moteur courant continu "- Projet de fin d'tudes
ingnieur - EMP 1997
65

[11] K.BENMANSOUR
Etude et implantation de contrleurs robustes et flous dune machine synchrone aimants
permanents avec pilotage vectoriel , Thse de magister- Novembre 1999

66

You might also like