Professional Documents
Culture Documents
Thse
Prpare au Laboratoire d'Analyse et d'Architecture des Systmes du CNRS En vue de l'obtention du titre de Docteur de l'Institut National des Sciences Appliques de Toulouse Spcialit Systmes Automatiques Par
A la mmoire de ma mre
A mon Pre
A Becky et A Bruno
Remerciements
Les travaux de recherche de cette thse ont t dvelopps dans le groupe DIagnostic, Supervision et COnduite qualitatifs (DISCO) du Laboratoire dAnalyses et dArchitecture des Systmes de Toulouse (LAAS) du Centre National de la Recherche Scientifique (CNRS). Je tiens tout dabord remercier Monsieur Malik Ghallab, Directeur du LAAS, de mavoir accueilli dans son laboratoire. Je remercie galement Monsieur Joseph Aguilar-Martin et Madame Louise TraveMassuyes, successivement responsables du groupe de recherche DISCO, pour leur accueil. Jexprime ma profonde gratitude et toute ma reconnaissance envers ma directrice de thse, Madame Marie-Vronique LE LANN, professeur lInstitut National de Sciences Appliques (INSA) de Toulouse, pour sa patience, ses avis, ses conversations, son soutien et sa confiance, dont jai bnficis tous leur gards. Je tiens exprimer mes remerciements Madame Monique Polit, professeur lUniversit de Perpignan, ainsi qu Monsieur Josep Maria Fuertes, professeur lUniversit Polytechnique de Catalogne, pour avoir accept dtre rapporteurs de ce travail et pour avoir fait des commentaires et remarques judicieux pour lamliorer. Mes remerciements vont aussi Madame Tatiana Kempowsky, ATER lINSA et Monsieur Naly Rakoto, Matre-assistant de lEcole des Mines de Nantes, pour avoir accept dtre examinateurs de ma thse et membres du jury. La ralisation du travail prsent dans ce mmoire a t possible grce au support financier du peuple mexicain, dans le cadre du programme DGEST-SFERE et lInstitut Technologique de Tuxtla. Ces travaux de recherche ont t raliss en collaboration avec la station de production d'eau potable SMAPA de la ville de Tuxtla Gutirrez, de Chiapas, au Mexique. Je tiens galement remercier Monsieur Raul Saavedra, responsable de SMAPA et Messieurs Humberto Torres et Luis Perez, responsables chimiques successifs de SMAPA, qui ont toujours t prts rpondre mes interrogations techniques. Ce travail nest pas uniquement le mien, un grand nombre de personnes ont contribu son aboutissement. Je tiens remercier dune manire trs spciale, tous ceux qui ont collabor avec moi. Tatiana et Antonio, pour leur aide dans lapplication de LAMDA. A Claudia et Eduard pour leur aide dans la thorie et lapplication de la mthode de validation de transitions. A Victor, Aimed, Carmen, Xavier, Rabah, Mehdi, Fabien, Siegfried et Herv, pour leur aide morale et technique. Jadresse mes remerciements tout le personnel technique et administratif du LAAS : le secrtariat du groupe, le service informatique, le magasin, le service de reprographie et le service de documentation. Ils mont toujours aid par leur disponibilit et leur attention. Mes remerciements vont aussi mes amis mexicains en France et mes amis franais. Para terminar agradezco profundamente a Bruno y Becky por su amor y cario, por apoyarme siempre, por creer en m y permanecer conmigo todo el tiempo de los estudios. Agradezco especialmente a mi Padre, por su cario y por su apoyo en todos los aspectos. Tambin estamos muy agradecidos por nuestras familias en Mxico y les reiteramos que estaremos con ellos siempre, en cualquier lugar que nos encontremos.
ii
2.2 2.3 2.4 2.4.1 2.4.2 2.5 2.5.1 2.5.2 2.5.3 2.6 2.7 2.7.1 2.7.2 2.8
Dfinitions et concepts gnraux ......................................................27 La supervision des procds ............................................................29 Mthodes de diagnostic...................................................................30 Mthodes base de modles ...........................................................31 Mthodes partir de donnes historiques ..........................................33 Approche pour le diagnostic base danalyse des donnes...................34 Diagnostic par reconnaissance de formes...........................................35 Modlisation linaire et slection des mesures (lACP) .........................49 Les rseaux de neurones.................................................................51 Les automates tats finis ..............................................................59 Evolution de la fonction maintenance ................................................60 La maintenance corrective...............................................................61 La maintenance prventive..............................................................62 Conclusion ....................................................................................63
3
3.1 3.2 3.3 3.4 3.4.1 3.4.2 3.4.3 3.5
4 Mthodologie gnrale pour la surveillance des procds de production deau potable ............................................................... 81
4.1 4.2 4.2.1 line) 4.2.2 4.2.3 4.2.4 4.3 Introduction ..................................................................................81 Description gnrale de la mthode pour la surveillance de la station SMAPA 82 Prtraitement des donnes en utilisant ABSALON (ABStraction Analysys ON82 Modle de comportement du procd................................................89 Diagnostic en ligne .........................................................................91 Stratgie pour la validation des transitions ........................................92 Conclusion ....................................................................................99
iii
Description de la station ............................................................... 102 Aspects fonctionnels de la station .................................................. 103 Description des donnes de la station............................................. 106 Stratgie danalyse du procd...................................................... 107 Priode des pluies ....................................................................... 108 Priode dtiage .......................................................................... 112 Conclusion ................................................................................. 121
Conclusion et perspectives........................................................... 123 Bibliographie................................................................................ 127 Annexe A. Rglementation sur leau potable................................ 135 Annexe B. Exemple dapplication de la mthode LAMDA .............. 139 Annexe C. La procdure itrative RMSE/ME ................................. 145
INTRODUCTION GENERALE
L'industrie de leau est sous une pression croissante pour produire une eau potable d'une plus grande qualit au plus faible cot. Ceci reprsente une conomie en terme de cot mais aussi en terme de respect de lenvironnement. Lobjectif de ces travaux est le dveloppement dun outil de supervision/diagnostic dune station de production deau potable dans son ensemble. Avant de sintresser la station dans son ensemble, il est apparu que lunit de coagulation-floculation tait une tape cl dans la production de l'eau potable. Elle permet dliminer les particules collodales qui sont des sources de contamination par la suite. Sa conduite, dans la plupart des installations reste encore manuelle et requiert des analyses de laboratoire longues et coteuses. La dose de coagulant injecter est la variable principale utilise pour conduire une unit de coagulation. Actuellement, le dosage est le plus souvent dtermin par une analyse chimique effectue en laboratoire appele Jar-test . Cette technique danalyse ncessite un prlvement et un temps danalyse relativement important et peut donc tre difficilement intgre dans un systme de surveillance et de diagnostic en temps rel de lunit. Un surdosage de coagulant amne des surcots accrus de traitement, tandis quun sous-dosage conduit un non-respect des spcifications en terme de qualit de leau produite en sortie de la station.
Introduction gnrale
Devant le manque de modle de connaissance simple permettant de dcrire le comportement dune unit de coagulation, le dveloppement dun capteur logiciel a demand le recours llaboration dun modle de comportement du systme partir des donnes caractristiques de l'eau brute telles que la turbidit, le pH, la temprature, etc. La premire partie de la thse a donc consist dvelopper un capteur logiciel bas sur un rseau de neurones permettant de prdire en ligne la dose de coagulant, sur la base des caractristiques mesures de leau brute. La deuxime partie de la thse qui prsentera un aspect plus novateur rside dans lutilisation de cette information dans une structure de diagnostic de lensemble de la station de traitement. A partir des mesures en ligne classiquement effectues, un outil de supervision et de diagnostic de la station de production deau potable dans son ensemble a t dvelopp.
Cet outil est bas sur lapplication dune technique de classification et sur linterprtation des informations obtenues sur tout lensemble du procd de production avec comme finalit lidentification des dfaillances du processus surveill tout en diminuant le nombre de fausses alarmes des diffrentes units de la station de production deau potable. De plus, limpact sur le rle de la maintenance de cet outil est important dans le sens, que plutt que dattendre lapparition dune dfaillance pour intervenir, il est prfrable de suivre en permanence ltat de fonctionnement du procd afin de dtecter au plus tt ses drives. On est ainsi pass dune maintenance curative une maintenance prdictive pour laquelle la caractrisation de ltat de fonctionnement du procd ncessite lutilisation doutils de modlisation, de surveillance et de diagnostic. Lutilisation de techniques issues du domaine de lintelligence artificielle apparat comme la principale alternative pour aborder les problmes connus comme difficilement modlisables par des mthodes analytiques et qui requirent souvent lintervention des experts du domaine ou le traitement dinformation de nature qualitative. Dans ce travail nous proposons lutilisation de la mthode de classification floue LAMDA comme outil dapprentissage automatique pour lextraction de linformation de deux sources diffrentes : la connaissance experte et les enregistrements doprations antrieures. Linnovation de ce travail rside principalement dans lintgration de diffrentes techniques dans un systme global permettant : la reconstruction des donnes, la prvision de la dose de coagulant et sa validation, et la structuration de la procdure de diagnostic de lensemble de la station de production deau potable prenant en compte le rle de la maintenance.
Introduction gnrale
Ces travaux de recherche ont t raliss en collaboration avec la station de production d'eau potable SMAPA de la ville de Tuxtla Gutirrez, de Chiapas, au Mexique. Le mmoire de thse est structur en 5 chapitres suivis dune conclusion gnrale. Le premier chapitre rappelle les caractristiques gnrales dune usine de production deau potable, la plus complte et la plus courante, tout en dtaillant plus spcifiquement le procd sur lequel a port plus spcifiquement notre tude. Dans cette section, nous parlerons tout spcialement du traitement des eaux de surface. Cette station comporte des traitements large spectre daction tels que prtraitement, oxydation, clarification, dsinfection et affinage. Le deuxime chapitre prsente un schma gnral de la supervision des procds et des diffrentes mthodes de diagnostic classes suivant deux catgories : les mthodes base de modles et les mthodes partir de lanalyse de donnes historiques. Comme notre mthodologie pour la supervision et le diagnostic des procds de production deau potable est base sur lanalyse de donnes historiques et de manire plus spcifique sur des rsultats dune classification, ce chapitre dcrit, diffrentes approches pour le diagnostic base de mthodes de classification. Nous prsentons aussi de manire dtaille la mthodologie LAMDA, laquelle a t choisie comme technique de classification spcifique. Finalement, nous exposons lvolution de la fonction maintenance qui a connu une forte mutation depuis quelle est considre comme un des facteurs majeurs dans la matrise de loutil de production et qui a dsormais un rle prventif dans le maintien de ltat de fonctionnement des systmes de production. Nous dcrivons dans le chapitre trois, linstrumentation de la station ainsi que le prtraitement des donnes. Nous y prsentons le dveloppement dun capteur logiciel pour la dtermination en ligne de la dose optimale de coagulant en fonction de diffrentes caractristiques de la qualit de leau brute telles que la turbidit, le pH, la temprature, etc. Nous prsentons la mthodologie utilise pour la construction du capteur logiciel base de rseaux de neurones. Nous dcrivons le modle proprement dit ainsi que la mthode utilise pour lapprentissage et la slection de larchitecture optimale du rseau et en particulier le recours lACP (analyse en composantes principales) pour la dtermination des entres de ce capteur. Nous proposons aussi une mthode, base sur lutilisation du r-chantillonnage par bootstrap, pour la gnration dune mesure de lincertitude sur la dose calcule. Dans le chapitre 4, nous proposons la mthodologie gnrale pour la surveillance des procds de production deau potable. Aprs avoir prsent brivement un outil
Introduction gnrale
permettant le prtraitement des donnes par abstraction de signaux, nous abordons les diffrentes tapes suivre pour llaboration dun systme de surveillance partir de mthodes de classification. Ainsi, la premire phase de cette mthode de surveillance consiste raliser un apprentissage pour identifier et caractriser les diffrents tats de fonctionnement du processus de production deau surveiller. La phase 2, consiste dans la validation des transitions des diffrents tats du modle. La troisime phase consiste faire une reconnaissance en ligne des situations connues et suivre une dmarche prcise dans le cas de dtection de dviations de comportement ou de ncessit de maintenance. Nous terminons ce mmoire avec un chapitre 5 ddi la prsentation des caractristiques gnrales de la station SMAPA de production deau potable et des rsultats obtenus lors de lapplication de la mthodologie propose dans le chapitre 4, partir des descripteurs de leau brute. Nous appliquons la stratgie compose des
quatre tapes diffrentes : le prtraitement des donnes, lanalyse du modle comportemental, lanalyse avec des donnes en ligne, et la validation des transitions.
1.1
Introduction
Leau recouvre 70% de la superficie du globe, mais malheureusement 97 % de
cette eau est sale et non potable et ne convient pas lirrigation. Leau douce, elle, reprsente 3% de leau totale de notre plante. Dans ce faible pourcentage, les rivires et les lacs reprsentent 0,3%, alors que tout le reste est stock dans les calottes polaires glacires. Un des facteurs majeurs qui gouvernent le dveloppement de socits humaines est la proccupation dobtenir et de maintenir une provision adquate deau. Le fait de disposer dune quantit deau suffisante a domin les premires phases de dveloppement. Cependant, les augmentations des populations ont pouss puiser de faon intensive dans les sources en surface de bonne qualit mais qui sont en quantit limite ou les ont contamines ou ont laiss perdurer des gaspillages humains qui ont amen dtriorer la qualit de leau. La qualit de leau ne pourra plus tre oublie dans le processus de dveloppement. La consquence invitable de laugmentation de la population et du dveloppement conomique est le besoin de concevoir des installations de traitement de leau pour fournir une eau de qualit acceptable issue de sources en surface contamines [MONTGOMERY,1985]. La production deau potable peut tre dfinie comme la manipulation dune source deau pour obtenir une qualit de leau qui satisfait des buts spcifis ou des normes riges par la communaut au travers de ses agences rgulatrices.
Leau
est
le
compos
le
plus
abondant
sur
la
surface
du
globe
[EISEMBERG,1969]. Sans elle, la vie comme nous le savons cesserait dexister. Pour lingnieur de leau, la microbiologie est importante pour ses effets sur la sant publique, sur la qualit de leau (proprits physiques et chimiques), et sur la bonne marche de lunit de traitement. Les micro-organismes flottants peuvent tre responsables de problmes de sant publique divers qui incluent des maladies bactriennes telles que le cholra et la gastro-entrite, des infections virales telles que lhpatite, la dysenterie amibienne ou la diarrhe qui proviennent de protozoaires, et des parasites tels que le tnia ou lascaride. La commande et la surveillance des installations de production d'eau potable deviennent de plus en plus importantes et ce quel que soit lendroit dans le monde [LAMRINI et al.,2005]. Cependant, dans le cas des processus complexes, comme celui de production deau potable, il n'est pas toujours possible de driver un modle
mathmatique ou structurel appropri. Les techniques issues de lintelligence artificielle peuvent tre utilises en raison de leur robustesse et de leur capacit tenir compte de la nature dynamique et complexe du procd. Ce type de technique est de plus en plus accept dans lindustrie de production deau potable en tant quoutil de modlisation et de contrle des procds.
1.2
plus grande qualit un cot plus faible. Les eaux vise de potabilisation pour la consommation humaine sont de diffrentes natures. Les eaux souterraines constituent 22 % des rserves deau douce soit environ 1000 milliards de m3 [CARDOT,1999]. Elles sont gnralement dexcellente qualit physico-chimique et bactriologique. Nanmoins, les terrains traverss en influent fortement la minralisation. Les eaux de surface se rpartissent en eaux courantes ou stockes (stagnantes). Elles sont gnralement riches en gaz dissous, en matires en suspension et organiques, ainsi quen plancton. Elles sont trs sensibles la pollution minrale et organique de type nitrate et pesticide dorigine agricole. Dans cette section, nous parlerons plus spcialement de traitement des eaux de surface, mais il est certain que certaines eaux souterraines doivent galement tre traites. Suivant les circonstances, ces deux types de traitement sont semblables ou diffrents, mais de toute faon ils prsentent des points communs. Le principal objectif dune station de production deau potable est de fournir un produit qui satisfait un ensemble de normes de qualit un prix raisonnable pour le
consommateur. Lannexe A en dresse les diffrents paramtres. Lefficacit du traitement adopt dpendra de la faon dont sera conduite lexploitation de lusine de traitement. Pour atteindre lobjectif souhait, lexploitant devra dune part respecter certains principes lmentaires pour assurer le contrle du processus de traitement et le contrle de leau traite, et dautre part disposer dun certain nombre de moyens techniques et humains [VALENTIN,2000]. Nous allons prsenter, dans ce chapitre, les caractristiques gnrales dune usine de production deau potable, la plus complte et la plus courante, tout en dtaillant plus spcifiquement le procd sur lequel porte notre tude. La figure 1.1 reprsente une filire typique de potabilisation applique une eau de surface. Elle comporte des traitements large spectre daction tels que prtraitement, oxydation, clarification, dsinfection et affinage. Les tapes de dferrisation, dmanganisation, dnitratation sont les principaux traitements spcifiques de leau souterraine.
La station de traitement concerne par cette tude est la station de production deau potable SMAPA de la ville de Tuxtla-Gutirrez au Mexique. Elle fournit de leau plus de 800 000 habitants et a une capacit nominale de traitement de 1000 l/s partir de leau brute pompe dans les fleuves Grijalva et Santo Domingo [SMAPA,2005].
Eau
Captage Stockage
potable
Prtraitement
Proxydation
Clarification
OxydationDsinfection
Affinage
Dgrillage
Tamisage
Prchloration Prozonation
Aration
1.2.1 Prtraitement
Une eau, avant dtre traite, doit tre dbarrasse de la plus grande quantit possible dlments dont la nature et la dimension constitueraient une gne pour les traitements ultrieurs. Pour cela, on effectue des prtraitements de leau de surface [CIDF-LdesEaux,2000]. Dans le cas dune eau potable, les prtraitements sont principalement de deux types : le dgrillage, le tamisage.
Le dgrillage, premier poste de traitement, permet de protger les ouvrages avals de larrive de gros objets susceptibles de provoquer des bouchages dans les diffrentes units de traitement. Ceci permet galement de sparer et dvacuer facilement les matires volumineuses charries par leau brute, qui pourraient nuire lefficacit des traitements suivants, ou en compliquer lexcution. Le dgrillage est avant tout destin llimination de gros objets : morceaux de bois, etc. Le tamisage, quant lui, permet dliminer des objets plus fins que ceux limins par le dgrillage. Il sagit de feuilles ou de morceaux de plastique par exemple.
1.2.2 Proxydation
Loxydation est une opration essentielle tout traitement des eaux. Elle est toujours incluse en fin de filire au niveau de la dsinfection. A lissue du prtraitement, on a une eau relativement propre mais qui contient
encore des particules collodales en suspension. Celles-ci nont en elles-mmes rien de dangereux. Il nous arrive souvent de consommer de leau en contenant : le th, le caf, le vin ou le lait qui sont chargs en matires organiques, mais qui soxydent spontanment en prsence dair. On va les dtruire dans la mesure du possible par une oxydation. Celle-ci peut tre faite de trois faons diffrentes : ajout de Chlore (prchloration) ajoute de dioxyde de chlore ajoute dozone (prozonation) La prchloration est effectue avant le procd de clarification. Le chlore est le plus ractif et le plus conomique, mais il a comme inconvnient de former avec certains micropolluants des composs organochlors du type chloroforme ou des composs complexes avec les phnols du type chlorophnol dont le got et lodeur sont dsagrables [CIDF-LdesEaux,2000]. On prfre utiliser le dioxyde de chlore qui cote plus cher mais qui na pas les inconvnients de loxydation par le chlore cits ci-dessus. Ce type de traitement est cependant rserv des cas spcifiques. En effet, lutilisation du dioxyde de chlore prsente, lui aussi, des inconvnients non ngligeables comme sa dcomposition la lumire, ce qui entrane une augmentation du taux de traitement appliquer en priode densoleillement. En conclusion, le dioxyde de chlore est un oxydant plus puissant que le chlore qui reprsente une alternative intressante lutilisation du chlore lorsque celui-ci entrane des problmes de qualit deau.
Enfin, depuis quinze vingt ans, on utilise comme oxydant lozone, qui non seulement a lavantage de dtruire les matires organiques en cassant les chanes molculaires existantes, mais galement a une proprit virulicide trs intressante, proprit que na pas le chlore. Gnralement utilise en dsinfection finale, cette technique peut tre mise en uvre en oxydation. Elle peut aussi tre employe pour lamlioration de la clarification. Lun des avantages dune prozonation est loxydation des matires organiques, et une limination plus importante de la couleur. Un autre avantage est la diminution du taux de traitement (taux de coagulant) dans le procd de clarification. En somme, la prozonation est une solution de substitution la prchloration. On vite ainsi les problmes lis aux sous-produits de la chloration. Nanmoins, ce procd ne rsout pas tous les problmes car certaines algues rsistent lozone. De plus, son cot reste beaucoup plus lev que celui au chlore.
1.2.3 Clarification
La clarification est lensemble des oprations permettant dliminer les matires en suspension MES (minrales et organiques) dune eau brute ainsi que des matires organiques dissoutes [DEGREMONT,2005]. Suivant les concentrations de lun et de lautre des diffrents polluants, on peut tre amen pratiquer des oprations de plus en plus complexes qui vont de la simple filtration avec ou sans ractif jusqu la coagulation floculation dcantation ou flottation filtration. La clarification comprend les oprations suivantes : Coagulation Floculation Filtration La coagulation est lune des tapes les plus importantes dans le traitement des eaux de surface. 90% des usines de production deau potable sont concernes. La difficult principale est de dterminer la quantit optimale de ractif injecter en fonction des caractristiques de leau brute. Un mauvais contrle de ce procd peut entraner une augmentation importante des cots de fonctionnement et le non-respect des objectifs de qualit en sortie. Cette opration a galement une grande influence sur les oprations de dcantation et de filtration ultrieures. En revanche, un contrle efficace peut rduire les cots de main duvre et de ractifs et amliorer la conformit de la qualit de leau traite. En rsum, le contrle de cette opration est donc essentiel pour trois raisons : la matrise de la qualit de leau traite en sortie (diminution de la turbidit), le contrle
10
du coagulant rsiduel en sortie (rglementation de plus en plus stricte de la prsence de coagulant rsiduel dans leau traite) et la diminution des contraintes et des cots de fonctionnement (cots des ractifs et des interventions humaines). Dans les sections 1.3 et 1.4, nous nous focaliserons davantage sur laspect physico-chimique de la coagulation-floculation et la filtration, respectivement.
1.2.4 Oxydation-Dsinfection
La dsinfection est ltape ultime du traitement de leau de consommation avant distribution. Elle permet dliminer tous les micro-organismes pathognes prsents dans leau [DEGREMONT,2005]. Il peut cependant subsister dans leau quelques germes banals, car la dsinfection nest pas une strilisation. Le principe de la dsinfection est de mettre en contact un dsinfectant une
certaine concentration pendant un certain temps avec une eau suppose contamine. Cette dfinition fait apparatre trois notions importantes : les dsinfectants, le temps de contact et la concentration rsiduelle en dsinfectant. Une bonne dsinfection via les ractifs oxydants demande la combinaison dune concentration C avec un temps de contact T ; cest le facteur C T (mg.min/L). Cette valeur varie avec les microorganismes concerns, le type de dsinfectant et la temprature. Les quatre principaux dsinfectants utiliss en production deau potable sont les suivants : Le chlore Le dioxyde de chlore Lozone Le rayonnement UV La concentration en oxydant est pratiquement le seul paramtre sur lequel loprateur peut intervenir. Il faut retenir que lefficacit de la dsinfection dpend, en partie, du suivi de la concentration en oxydant. Lvolution de la concentration en oxydant est lie la demande en oxydant de leau. Cette demande dpend de la qualit de leau, du pH, des tempratures (diffrentes entre t et hiver), des matires organiques, et de la concentration en ammoniaque. Dans la section 1.5, nous nous focaliserons davantage sur laspect physico-chimique de la dsinfection, et en particulire sur la chloration de leau.
11
1.2.5 Affinage
Le traitement final traite de la mise lquilibre calco-carbonique. Leau suit un cycle naturel dans lequel les lments chimiques quelle contient voluent [DEGREMONT,2005]. Leau de pluie contient naturellement du dioxyde de carbone (CO2). Quand celle-ci traverse les couches dhumus, riches en acides, elle peut senrichir fortement en CO2. Lors de sa pntration dans un sol calcaire, cest--dire riche en carbonate de calcium (CaCO3), elle se charge en calcium CaO2 et en ions bicarbonates HCO3 . En fait, le calcium est dissous par leau charge en CO2. On dit quelle est entartrante ou incrustante. En revanche, quand leau de pluie traverse une roche pauvre en calcium (rgion granitique), elle reste trs charge en CO2 dissous. Cette eau est, en gnrale, acide. On dit quelle est agressive. Il y a typiquement deux problmes distincts : corriger une eau agressive et
corriger une eau incrustante. La correction dune eau agressive peut seffectuer de plusieurs faons. Premirement, on peut liminer le CO2 par aration. Du fait de llimination du CO2, le pH augmente et se rapproche du pH dquilibre. Deuximement, on peut ajouter une base leau. Lajout de base permet daugmenter le pH et datteindre le pH dquilibre. La correction dune eau incrustante peut se faire soit par traitement direct soit en rduisant le potentiel dentartrage par dcarbonatation. Le traitement direct correspond un ajout dacide.
1.3
Coagulation-Floculation
Le mot coagulation vient du latin coagulare qui signifie agglomrer
[MASSCHELEIN,1999]. La couleur et la turbidit dune eau de surface sont dues la prsence de particules de trs faible diamtre : les collodes. Leur limination ne peut se baser sur la simple dcantation. En effet, leur vitesse de sdimentation est extrmement faible. Le temps ncessaire pour parcourir 1 m en chute libre peut tre de plusieurs annes. La coagulation et la floculation sont les processus qui permettent llimination des collodes. La coagulation consiste les dstabiliser. Il sagit de neutraliser leurs charges lectrostatiques de rpulsion pour permettre leur rencontre. La floculation rend compte de leur agglomration en agrgats limins par dcantation et/ou filtration [CARDOT,1999].
12
66 a
0,2 sec
0,2 sec
10 nm
10 m 20 m
1 m 2 m
100 m 200 m
100 nm
Dimension de la particule
1 nm
1 mn 2 mn
Matires dissoutes
Sables moyen
gros>
Brumes
Pluies
On observe qu densit gale, les particules plus petites ont une dure de chute plus longue. Cela conduit limpossibilit pratique dutiliser la dcantation seule pour liminer le maximum de particules. Cette remarque est surtout valable pour les collodes, cest--dire les particules dont la taille est comprise entre 10-6 m et 10-9 m.
1 cm
13
La chute dune particule dans leau est rgie par la loi de Stokes :
V =
avec :
g ( s l ) d 2 18
(1.1)
V : vitesse de dcantation de la particule, g : acclration de la pesanteur, : viscosit dynamique, s : masse volumique de la particule, 1 : masse volumique du liquide, d : diamtre de la particule
Il apparat clairement que plus le diamtre et la masse volumique de la particule sont grands, plus la vitesse de chute est importante. Le but va tre daugmenter la taille et la masse volumique des particules pour que le temps de dcantation devienne acceptable.
Coagulant +
Floculation
Coagulation
Figure 1. 3 Coagulation-Floculation
14
1.3.3 La coagulation
Les particules collodales en solution sont naturellement charges
ngativement. Ainsi, elles tendent se repousser mutuellement et restent en suspension. On dit quil y a stabilisation des particules dans la solution. La coagulation consiste dans la dstabilisation des particules en suspension par la neutralisation de leurs charges ngatives. On utilise, pour ce faire, des ractifs chimiques nomms coagulants. Le procd ncessite une agitation importante. Les coagulants sont des produits capables de neutraliser les charges des collodes prsents dans leau. Le choix du coagulant pour le traitement de leau de consommation doit tenir compte de linnocuit du produit, de son efficacit et de son cot. Le type de coagulant et la dose ont une influence sur :
La bonne ou la mauvaise qualit de leau clarifie, Le bon ou le mauvais fonctionnement de la floculation et de la filtration, Le cot dexploitation. Il existe deux principaux types de coagulant [LIND,1995]: Les sels de fer (chlorure ferrique) et Les sels daluminium (sulfate daluminium) La mise en solution se droule en deux tapes. Le cas du sulfate daluminium est trs significatif [CARDOT,1999]. Les ractions peuvent tre reprsentes de la faon suivante :
(1.2)
Ltape 1 est une phase dhydrolyse. Des intermdiaires polychargs positifs se forment. Ces composs assez fugaces prsentent un atome daluminium dont le nombre doxydation est trs grand. Les formes Al IV, V et VII sont rencontres. Conformment la rgle de SCHULZE-HARDY, ces intermdiaires polychargs positifs sont trs efficaces pour neutraliser la charge primaire ngative des collodes. Il sagit de la vritable forme coagulante qui dstabilise les particules charges ngativement. Ltape 1 dpend de la temprature et ncessite un pH compatible avec lexistence de ces intermdiaires polychargs. Le temps de formation de ces composs est de lordre de 0,5 s. Ltape 2 permet la formation du prcipit Al(OH)3. Elle dpend de lagitation du milieu. Ce prcipit est llment qui assure le pontage et la coalescence entre les collodes dstabiliss : cest la forme floculante. Tout coagulant
15
prsente successivement les deux formes actives coagulante et floculante. Le maintien de cette dernire dpend du pH du milieu. Cette notion de pH permet de dfinir les zones optimales de coagulation-floculation. Le choix du coagulant peut varier avec la temprature et la saison. Le sulfate daluminium, par exemple, est un coagulant utilis pour une temprature deau suprieure 10-12 oC. On peut rappeler galement que plus un coagulant a de charges positives, plus son efficacit est grande. Par la suite, nous allons numrer lensemble des paramtres influenant le bon fonctionnement du procd de coagulation [LIND2,1994 ;LIND3,1994 ;CIDF-LdesEaux,2000].
a) Linfluence du paramtre pH
Le pH a une influence primordiale sur la coagulation. Il est dailleurs important de remarquer que lajout dun coagulant modifie souvent le pH de leau. Cette variation est prendre en compte afin de ne pas sortir de la plage optimale de prcipitation du coagulant. La plage du pH optimal est la plage lintrieur de laquelle la coagulation a lieu suffisamment rapidement. En effet, une coagulation ralise un pH non optimal peut entraner une augmentation significative du temps de coagulation. En gnral, le temps de coagulation est compris entre 15 secondes et 3 minutes. Le pH a galement une influence sur llimination des matires organiques.
16
de leau. La dose optimale est donc dtermine en fonction de la qualit des diffrentes eaux compares. Linconvnient de cette mthode est de ncessiter lintervention dun oprateur. On voit ici tout lintrt de disposer lavenir dun moyen automatique pour effecteur cette dtermination.
c) Linfluence de la temprature
La temprature joue un rle important. En effet, une temprature basse, entranant une augmentation de la viscosit de leau, cre une srie de difficults dans le droulement du processus : la coagulation et la dcantation du floc sont ralenties et la plage du pH optimal diminue. Pour viter ces difficults, une solution consiste changer de coagulant en fonction des saisons.
d) Linfluence de la turbidit
La turbidit est, elle aussi, un paramtre influant sur le bon fonctionnement du procd de coagulation. Dans une certaine plage de turbidit, laugmentation de la concentration en particules doit tre suivie dune augmentation de la dose de coagulant. Quand la turbidit de leau est trop faible, on peut augmenter la concentration en particules par addition dargiles. Dans le cas de fortes pluies, laugmentation des MES favorise une meilleure dcantation. Enfin, pour grossir et alourdir le floc, on ajoute un adjuvant de floculation.
1.3.4 La floculation
Aprs avoir t dstabilises par le coagulant, les particules collodales sagglomrent lorsquelles entrent en contact. Cest la floculation. Le floc ainsi form,
17
peut dcanter, flotter ou filtrer (coagulation sur filtre), suivant le procd de rtention choisi. Lexpression de SMOLUCHOWSKY permet de comprendre ce phnomne [CARDOT,1999]. La formulation est la suivante :
Ln
avec :
N 4 = Gt N0
(1.3)
t : temps de contact. Si le paramtre est gal 1, un choc interparticulaire donne une agglomration donc une floculation. Llment est constant, sauf intervention extrieure, car il ny a ni cration ni disparition de matire. Le gradient de vitesse G nest quune valeur moyenne des vitesses spcifiques des particules dans la solution. La floculation est de qualit si le rapport Ln( N / N 0 ) est petit. Dans ce cas, N est infrieur N0. Il y a donc moins de particules libres au temps t quau temps to. augmentation des paramtres noncs entrane une diminution de ce rapport. La stratgie pour obtenir une bonne floculation se rsume en une augmentation des facteurs temps de contact t, du volume de particules et du gradient de vitesse G. La floculation est le phnomne de formation de flocs de taille plus importante (agglomration des collodes dchargs dans un rseau tridimensionnel). On utilise, pour ce faire, des coagulants ou adjuvants de floculation. Contrairement ltape de coagulation, la floculation ncessite une agitation lente. Les floculants ou adjuvants de floculation sont, dans leur grande majorit, des polymres de poids molculaire trs lev. Ils peuvent tre de nature minrale, organique naturelle ou organique de synthse. Comme pour la coagulation, il existe un certain nombre de paramtres prendre en compte pour le bon fonctionnement de ce procd. Le mlange doit tre suffisamment lent afin dassurer le contact entre les flocs engendrs par la coagulation. En effet, si lintensit du mlange dpasse une certaine limite, les flocs risquent de se briser. Il faut galement un temps de sjour minimal pour que la floculation ait lieu. La dure du mlange se situe entre 10 et 60 minutes. Toute
18
Les temps dinjection du coagulant et du floculant sont en gnral espacs de 1 3 minutes, cette dure tant fonction de la temprature de leau. Les boues formes pendant la coagulation-floculation aboutissent aprs
dcantation dans des concentrateurs. Des floculants de masse molaire importante permettent lobtention de boue ayant une vitesse dpaississement plus grande, et donc un volume de boues final rduit. Les boues purges de dcanteurs sont plus concentres dans ce cas, ce qui conduit une perte deau rduite. Lemploi de floculants de synthse, combin des mthodes modernes de sparation, peut permettre la production des boues trs concentres, traitables directement par une unit de dshydratation. Dans les autres cas, on passe dabord par un paississement avant lunit de dshydratation. Une fois le floc form, il faut le sparer de leau. Cest ce quon appelle la
sparation solide-liquide. Elle peut seffectuer par diffrents moyens : Coagulation sur filtre, Dcantation, Flottation.
1.3.5 La dcantation-flottation
Ces procds sont des mthodes de sparation des matires en suspension et des collodes rassembls en floc, aprs ltape de coagulation-floculation. Si la densit de ces flocs est suprieure celle de leau, il y a dcantation. Leau clarifie situe prs de la surface est dirige vers des filtres sable. Dans le cas de particules de densit infrieure celle de leau, le procd de flottation doit tre appliqu. Dans la dcantation, toute particule prsente dans leau est soumise deux forces. La force de pesanteur qui est llment moteur permet la chute de cette particule. Les forces de frottement dues la trane du fluide sopposent ce mouvement. La force rsultante en est la diffrence [CARDOT,1999]. La flottation est un procd de sparation liquide-solide bas sur la formation dun ensemble appel attelage, form des particules liminer, des bulles dair et des ractifs, plus lger que leau. Cette technique convient principalement pour liminer les particules de diamtre compris entre 1 et 400 m. La flottation est suprieure la dcantation dans le cas de clarification deaux de surface peu charges en MES, riches en plancton ou en algues et produisant un floc lger dcantant mal. Elle est prconise dans le traitement des boues. Ce procd est trs souple demploi. Il permet un paississement simultan des boues directement
19
dshydratables. Lefficacit de la flottation et de la dcantation peut tre value par le pourcentage de boues retenues, la quantit de matires organiques limines et par la mesure de la turbidit.
1.4
La filtration
La filtration est un procd destin clarifier un liquide qui contient des MES en
le faisant passer travers un milieu poreux constitu dun matriau granulaire [CARDOT,1999]. En effet, il subsiste de trs petites particules prsentes lorigine dans leau brute ou issues de la floculation. La rtention de ces particules se droule la surface des grains grce des forces physiques. La plus ou moins grande facilit de fixation dpend troitement des conditions dexploitation du filtre et du type de matriau utilis. Lespace intergranulaire dfinit la capacit de rtention du filtre. Au fur et mesure du passage de leau, cet espace se rduit, le filtre se colmate. Les pertes
de charge augmentent fortement. Il faut alors dclencher le rtrolavage. La filtration permet une limination correcte des bactries, de la couleur et de la turbidit. Tout filtre est compos de trois parties. On retrouve le fond, le gravier support et le matriau filtrant. Le premier lment doit tre solide pour supporter le poids de leau, du sable et du gravier. Il doit permettre la collecte et lvacuation de leau filtre, le plus souvent par des buselures incorpors, et la rpartition uniforme de leau de lavage. Le gravier a pour rle de retenir le sable et damliorer la distribution de leau de lavage dans le filtre. Le lavage des filtres est ralis en inversant le sens dcoulement de leau. Cest pourquoi cette opration est souvent appele : rtrolavage. Le sable est mis en expansion et les impurets, moins denses que les grains de sable, sont dcolles par les phnomnes de frottement intergranulaires. La vitesse de leau de lavage contrecourant est limite du fait des pertes possibles de matriau. On injecte donc de lair pour augmenter les turbulences afin de dcoller efficacement les particules de flocs fixes sur les grains. Durant la filtration, le filtre sencrasse et, par consquent, la perte de charge augmente. Il faut veiller ne pas dpasser la perte de charge maximale admissible dtermine lors de sa conception. Pour conserver un encrassement acceptable du filtre, il faut augmenter la hauteur de couche de celui-ci. Le temps pendant lequel on maintient un filtrant clair (eau filtre) est proportionnel cette hauteur de couche . La graphique de la figure 1.5 reprsente, de manire schmatique, lvolution de la turbidit de leau filtre en fonction de temps. La premire phase est la maturation du filtre (a), suivie de la priode de fonctionnement normal (b). Lorsque la turbidit de
20
leau filtre augmente, cela correspond un dbut de crevaison de la masse filtrante (c) et lon atteint alors rapidement la limite de turbidit acceptable (d) ne pas dpasser.
1.5
Dsinfection
La dsinfection est un traitement visant liminer les micro-organismes
pathognes, bactries, virus et parasites ainsi que la majorit des germes banals moins rsistants. Cest le moyen de fournir une eau bactriologiquement potable, tout en y maintenant un pouvoir dsinfectant suffisamment lev pour viter les reviviscences bactriennes dans le rseaux de distribution. Leau potable, suivant les normes, contient toujours quelques germes banals, alors quune eau strile nen contient aucun.
Turbidit eau filtre
c a 0
Figure 1. 5 Evolution de la turbidit de leau filtre dun filtre
b Temps
La dsinfection est une post-oxydation. En eau potable, elle est assure par des oxydants chimiques tels que le chlore, le dioxyde de chlore ClO2, lozone O3 et dans un certain nombre de cas, par un procd chimique comme le rayonnement UV. Le principe de la dsinfection est de mettre en contact un dsinfectant une certaine concentration pendant un certain temps avec une eau suppose contamine. Cette dfinition fait apparatre trois notions importantes : les dsinfectants; le temps de contact et la concentration en dsinfectant.
21
Le chlore est un gaz jaune-vert. Cest le plus connu et le plus universel, mais il ncessite pour des raisons de scurit, le respect rigoureux de conditions particulires demploi [DEGREMONT,2005]. En dehors de son utilisation en prtraitement, il est employ en dsinfection finale. Son introduction dans leau conduit sa disparition suivant la raction :
Cl 2 + 2 H 2 O
HClO + Cl + H 3 O +
(1.4)
HClO est lacide hypochloreux. Cet acide est faible et se dissocie suivant lquilibre :
HClO + H 2 O OCl + H 3 O +
tel-00136157, version 1 - 12 Mar 2007
(1.5)
OCl est lion hypochlorite. Lacide hypochloreux a un effet bactricide plus important que lion hypochlorite. Les deux formes cohabitent en solution suivant les valeurs du pH de leau. Plus le pH est lev, moins il y a dacide hypochloreux pour une dose donne de chlore. Pour la distribution et le dosage du chlore, il faut se reporter la lgislation en vigueur. A partir des rcipients de stockage, la distribution de chlore vers lorgane de dosage (chloromtre) peut tre ralise : - Soit sous forme gazeuse, pour les faibles dbits ; - Soit sous forme liquide pour les dbits importants. A la sortie du chloromtre, le chlore est vhicul gazeux sous dpression jusqu lhydrojecteur o il est dissout dans leau motrice.
2ClO2 + H 2 O
HClO2 + HClO3
(1.6)
et un
22
(1.7)
Ces composs sont problmatiques. Ils ont t reconnus comme potentiellement cancrignes. Ils peuvent apparatre lors de la prparation du dioxyde de chlore en cas de mauvais dosage, mais galement lors de lutilisation de loxydant pour la dsinfection par raction sur les matires organiques.
1.5.3 Lozone
Lozone a t dcouvert en 1840 [CARDOT,1999]. Lozone est un gaz extrmement instable et un oxydant trs puissant. Il est fabriqu sur place partir doxygne au travers dun champ lectrique cr par une diffrence de potentiel entre
3O2
2O 3
(1.8)
Loxygne provient soit dair sec, soit doxygne pur du commerce. Lozone est loxydant le plus efficace sur le virus, le fer et le manganse. Il ne donne pas de got leau, contrairement au chlore, et oxyde fortement les matires organiques. Pour obtenir un effet dsinfectant, le temps de contact doit tre suffisamment long, do la ncessit douvrages adapts (tour dozonation).
1.5.4 Le rayonnement UV
La dcouverte des effets bactricides des radiations solaires date de 1878 [CARDOT,1999]. La production dUV est ralise par des lampes contenant un gaz inerte et des vapeurs de mercure. Le passage dun courant lectrique provoque lexcitation des atomes de mercure qui mettent en retour des rayons de longueur donde comprise entre 240 et 270 nm. Lirradiation par une dose suffisante de rayonnement UV permet la destruction des bactries, virus, germes, levures, champignons, algues, etc. Les rayonnements UV ont la proprit dagir directement sur les chanes dADN des cellules et dinterrompe le processus de vie et de reproduction des micro-organismes. Comme pour lozone, elle nest pas caractrise par un effet rmanent.
23
1.6
Conclusion
Ce premier chapitre a servi dintroduction au domaine li notre tude. Nous
avons dcrit les diffrentes tapes dune chane de traitement deau potable en nous basant sur la chane la plus complte possible et la plus courante. Nous avons dtaill, plus particulirement, les procds de coagulation et de filtration, sur lesquels porte spcifiquement notre tude. Nous avons dcrit les diffrents paramtres physicochimiques influenant le bon fonctionnement du procd de coagulation. Le chapitre suivant est consacr aux aspects fondamentaux de la supervision, des mthodes de diagnostic et lvolution de la fonction maintenance dune station de production deau potable. Nous verrons en dtail les diffrentes techniques existant pour le contrle automatique des diffrents procds.
2.1
Introduction
En raison de la complexit des phnomnes biologiques, physiques et chimiques
mis en jeu dans les procds impliqus dans les units de production de leau potable, il est souvent trs difficile de quantifier les interactions et les relations qui existent entre les entres et les sorties des procds. Les modles des procds, lorsquils existent, sont souvent spcifiques un site et sont incapables de traiter simultanment des variations continues sur plus dune ou deux variables cls du procd. Diffrents travaux de recherche ont t raliss, la plupart concerne des tudes doptimisation, de commande et destimation des paramtres [VILLA et al., 2003 ; DEMOTIER et al., 2003]. Ils sont bass, explicitement ou implicitement sur un modle mathmatique qui est exprim gnralement sous la forme dquations diffrentielles ou aux diffrences. De tels travaux montrent alors lintrt et les avantages de lutilisation dalgorithmes destimation et de commande bass sur des modles analytiques. Les procds de production deau potable ont un fonctionnement complexe qui ne peut pas tre mesur, modlis et interprt que dune faon partielle cause du fait de la complexit des phnomnes mis en jeu mais aussi par leur nature nonstationnaire et alatoire : ils peuvent donc avoir des fonctionnements diffrents dune
26
exprience lautre, pour les mmes conditions exprimentales. Lutilisation de techniques issues du domaine de lintelligence artificielle apparat, comme la principale alternative pour aborder ces problmes lorsquil est ncessaire de prendre en compte lintervention des experts du domaine ou de traiter de linformation de nature qualitative. A ce titre, un certain nombre de travaux sur la mthodologie de modlisation par rseaux de neurones artificiels des procds impliqus dans la production de leau potable ont t effectus [FLETCHER et al., 2001 ; BAXTER et al., 2002 ; PEIJIN et COX,2004]. Des tudes rcentes ont t ralises [LAMRINI et al., 2005] sur la supervision des procds impliqus dans la production de leau potable en utilisant une mthode de classification floue, mthode que nous prsenterons ultrieurement. Gnralement, un niveau suprieur comme la supervision, est superpos la boucle de commande afin dassurer des conditions dopration pour lesquelles les
algorithmes destimation et commande sont efficaces. Parmi les tches spcifiques de la supervision se trouvent la dtection des dfaillances, le diagnostic, le changement des consignes et la reconfiguration de la loi de commande. Ces tches sont ralises typiquement par des oprateurs humains qui prennent des dcisions aprs avoir valu la situation du procd partir des variables observes, en utilisant leur connaissance dexpert, leur habilit naturelle pour rsoudre des situations complexes et probablement aussi quelques rgles heuristiques. Quelle que soit la branche de lindustrie concerne, les procds industriels sont de nos jours coupls un ou plusieurs calculateurs numriques qui ne se contentent pas de faire lacquisition des donnes mais qui sont chargs de la mise en uvre de lautomatisation. Diverses architectures sont possibles, la plus classique consiste en une hirarchie entre des boucles de rgulation locales et une supervision globale qui fixe les consignes des boucles locales. Automatiser peut avoir des objectifs diverses, les plus frquent sont daugmenter les performances du systme de production, de garantir la qualit du produit, de diminuer les cots de production et damliorer la scurit de linstallation industrielle et de son environnement [BOILLEREAUX et FLAUS,2003]. Le diagnostic de systmes technologiques a suscit et continue de susciter un grand intrt de la part du monde industriel : savoir dtecter un mode de fonctionnement anormal suffisamment tt peut permettre de produire une commande susceptible de revenir un mode de fonctionnement plus adapt la mission pour laquelle ce systme a t conu. Le diagnostic automatique est donc maintenant un lment essentiel dun systme de production ou dun systme conu pour tre utilis par un tiers [DUBUISSON,2001].
27
Dans la premire partie de ce chapitre, nous introduisons quelques dfinitions utiles dans le domaine de la supervision et du diagnostic, puis nous donnons quelques aspects fondamentaux de la supervision de procds et des mthodes de diagnostic. Ensuite, nous prsentons une approche pour la surveillance base de mthodes de classification. Finalement, nous dcrivons lvolution de la fonction maintenance qui a connu une forte mutation depuis quelle est considre comme un des facteurs majeurs dans la matrise de loutil de production et qui a dsormais un rle prventif dans le maintien de ltat de fonctionnement des systmes de production.
2.2
terminologie utilise dans le monde des systmes industriels provient du fait que lon peut aborder le diagnostic de diffrentes manires selon lorigine et la formation des
intervenants.
De
plus,
les
diffrences
sont
trs
subtiles
et
subjectives
[ZWINGELSTEIN,1995]. Fonctionnement normal dun systme. Un systme est dit dans un tat de fonctionnement normal lorsque les variables le caractrisant (variables dtat, variables de sortie, variables dentre, paramtres du systme) demeurent au voisinage de leurs valeurs nominales. Le systme est dit dfaillant dans le cas contraire. Une dfaillance est la cause dune anomalie. Une dgradation dun procd caractrise le processus qui amne un tat dfaillant du procd. Un dfaut se dfinit comme une anomalie du comportement dun systme sans forcment remettre en cause sa fonction. Une panne caractrise linaptitude dun dispositif accomplir une fonction requise. Un systme est toutefois gnralement considr en panne ds lapparition dune dfaillance. Un symptme est lvnement ou lensemble de donnes au travers duquel le systme de dtection identifie le passage du procd dans un fonctionnement anormal. Cest le seul lment dont a connaissance le systme de surveillance au moment de la dtection dune anomalie. La distinction entre ces dfinitions est tablie en considrant les aspects comportementaux et fonctionnels [PLOIX,1998]. Ainsi, un dfaut (comportement)
28
nentrane pas forcment une dfaillance (fonctionnelle), cest--dire une impossibilit pour le procd daccomplir sa tche. Le dfaut ninduit pas ncessairement une dfaillance mais il en est la cause, et cest donc bien la caractrisation de ces dfauts qui nous intresse ici afin de prvenir toute dfaillance. Ainsi, une panne rsulte toujours dune ou de plusieurs dfaillances qui elles-mmes rsultent dun ou de plusieurs dfauts. Enfin, on utilise aussi le terme plus gnrique danomalie pour voquer une particularit non-conforme une rfrence comportementale ou fonctionnelle. Les dfauts, dfaillances et pannes sont des anomalies. On conoit aisment les progrs apports lindustrie par des mthodes automatiques de surveillance, de diagnostic et de supervision. Il est clair aussi que pour sattaquer ce problme, il faut des connaissances approfondies sur linstallation : connaissances de son comportement normal, mais aussi de son comportement anormal. Souvent, un dfaut est modlis avec les mmes outils que ceux utiliss pour prsenter
le procd en tat normal. Il est bien clair aussi que si lon a une bonne connaissance des anomalies possibles, il faut lutiliser pour amliorer la surveillance et le diagnostic. Les outils classiques de supervision doivent tre complts par des outils de surveillance, de diagnostic et daide la dcision qui sintgrent la supervision [TRAVE-MASSUYES et al.,1997](figure 2.1). La supervision consiste grer et surveiller lexcution dune opration ou dun travail accompli par lhomme ou une machine, puis proposer des actions correctives si besoin est. La surveillance est une opration de recueil en continu des signaux et commandes dun procd afin de reconstituer ltat de fonctionnement rel. Ainsi, la surveillance utilise les donnes provenant du systme pour reprsenter ltat de fonctionnement puis en dtecter les volutions. Le diagnostic identifie la cause de ces volutions, puis le module daide la dcision propose des actions correctives.
Surveillance
Diagnostic
Aide la dcision
Supervision
Figure 2. 1 Introduction doutils de surveillance, de diagnostic et daide la dcision au niveau de la supervision
Limpratif de sret de fonctionnement, li aux enjeux conomiques en cas dincidents ou de pannes, impose une matrise importante de ces techniques de surveillance et de diagnostic. En effet, en raison de la complexit des systmes
29
industriels, du principe de disponibilit maximale et de comptitivit des entreprises, la surveillance, le diagnostic et laide la dcision sont devenus des techniques trs importantes et sinsrent dans toute la chane de production dun produit, de la conception la maintenance.
2.3
conditions dopration pour lesquelles les algorithmes de commande sont efficaces. Lorsque la fonction de surveillance est ralise par un oprateur humain,
viennent sajouter au problme du choix des mthodes et architecture de cette fonction, des concepts lis lergonomie des systmes dvelopps [MILLOT,1988]. Il est apparu entre autre, que les dfauts les plus difficiles dtecter sont les dfauts qui sinstallent lentement, sous forme de drive, car on peut mettre un certain temps voir leurs effets apparatre clairement. Les alarmes sont des symptmes de comportement anormal souvent utilises pour faciliter la surveillance et la supervision. Dans un systme traditionnel, il sagit de surveiller simplement que les variables restent lintrieur dun domaine de valeurs caractristiques du fonctionnement normal. Les mthodes avances de surveillance et de diagnostic de dfauts sont ncessaires, pour rpondre aux exigences comme lanticipation de la dtection de dfauts avec variations brutales du comportement, le diagnostic de fautes dactionneurs, de comportement du procd et du capteur, la dtection de dfauts dans les boucles fermes et la supervision de procds lors dtats transitoires. Lobjectif de lanticipation de la dtection de dfauts et du diagnostic est d'avoir assez de temps pour traiter des actions, comme la reconfiguration du processus ou la maintenance. Plusieurs schmas gnraux de supervision appliqus diffrents domaines ont t proposs [AGUILAR-MARTIN, 1996 ; DOJAT et al., 1998]. Toutefois, dun point de vue gnral, les architectures prsentes sont similaires et, globalement, peuvent tre dcrites par le schma prsent sur la figure 2.2. Ce schma inclut les fonctions principales suivantes : la dtection des dfaillances, le diagnostic, la reconfiguration du processus et la maintenance [ISERMAN,1997 ; COLOMER et al.,2000].
30
Dtection des dfaillances Decision Fault evaluation Faults Fault diagnosis Change detection Signal processing Features
Hazard-classes Diagnostic
Symptoms
Alarm
Reconfiguration
Control
Process
2.4
Mthodes de diagnostic
Les nouvelles technologies ont grandement augment la complexit des
systmes conus par lhomme. De nos jours des systmes technologiques complexes sont embarqus, cest--dire quils contiennent des lments matriels et logiciels fortement coupls. Le maintien de la scurit, et dun fonctionnement ininterrompu de ces systmes est devenu un enjeu important. Le but du diagnostic est didentifier les premires causes (fautes) dun ensemble de symptmes observs (dviations par rapport un fonctionnement normal) qui indiquent une dgradation ou une panne de certains composants du systme conduisant un comportement anormal du systme. Une revue de ces diffrentes mthodes est donne dans [DASH, 2000]. Un certain nombre de mthodes existent, parmi lesquelles il est parfois difficile de dterminer laquelle faut-il mieux utiliser [BISWAS, 2004]. Les mthodes de diagnostic diffrent non seulement par la faon avec laquelle la connaissance sur le processus est utilise mais aussi sur la nature de la connaissance requise. Une classification des ces mthodes reposant sur la nature de la connaissance requise est donne sur la Figure 2.3. De manire gnrale, les mthodes sont spares en deux catgories suivant quelles ncessitent explicitement un modle du procd ou quelles sont bases sur la possession dhistoriques de fonctionnement du procd. La premire catgorie repose sur une connaissance en profondeur du systme incluant les relations causales entre les
Control + Process
Reconfiguration
Supervisory
31
diffrents lments tandis que la deuxime sur de la connaissance glane partir dexpriences passes (on parlera aussi de connaissance superficielle, apparente base sur lhistoire du processus). Une comparaison dtaille des diffrentes mthodes peut tre trouve dans [HIMMELBLAU, 1978; MYLARASWAMY, 1996; VENKATASUBRAMANIAN et al.,1995; KEMPOWSKY,2004a]. Nous ne dcrivons cidessous que les principales caractristiques de ces deux familles : les mthodes base de modles et celles base dhistoriques du procd.
Mthodes de diagnostic
Mthodes quantitatives
Mthodes qualitatives
Mthodes quantitatives
2.4.1.1
La stratgie employe ici est ltablissement de relation de cause effet pour dcrire le fonctionnement du systme. Parmi les mthodes les plus populaires, citons les arbres de fautes et les digraphes. Les arbres de faute [LAPP and POWERS, 1977] utilisent le chanage arrire ou simulation arrire jusqu trouver un vnement primaire qui serait une des possibles causes de la dviation de comportement du procd observe. Les digraphes signs sont une autre reprsentation dune information causale [IRI et al.,1979] dans laquelle les variables du processus sont reprsentes par des nuds de graphes et les relations causales par des arcs.
32
Une limitation importante de ces mthodes rside dans la gnration dun grand nombre dhypothses pouvant conduire une rsolution errone du problme ou une solution trs incertaine. Ceci est d en partie aux ambiguts de nature qualitative qui y sont manipules.
2.4.1.2
Elles reposent sur les relations mathmatiques qui existent entre les variables. Un modle essaie dexprimer ces relations sous une forme compacte. Les modles sont dvelopps en utilisant les lois fondamentales de la physique (bilan de masse, dnergie, de quantit de mouvement, ) ou des relations de type entre-sortie. Ils peuvent tre dynamiques, statiques, linaires ou non-linaires. En gnral, ces mthodes utilisent la structure gnrique suivante :
dx = Ax + Bu + Ed + Ef dt
(2.1)
y = Cx + Du
avec : les tats (x), les entres (u), les sorties (y), les perturbations (d) et les fautes (f). Les mthodes quantitatives les plus connues sont les mthodes dites des rsidus et de tests dhypothses. Les premires incluent gnralement deux grandes tapes : la gnration de rsidus et le processus permettant didentifier la cause. Lorsque quil y a faute, les quations de redondance ne sont plus vrifies et un rsidu r0 se produit. De manire simplifie, r reprsente la diffrence entre diffrentes fonctions des sorties et les valeurs de ces fonctions sous des conditions normales (en absence de faute). La procdure pour gnrer les rsidus peut aller de la redondance matrielle lutilisation de mthodes complexes destimation des tats et des paramtres du modle. Les mthodes destimation dtat ncessitant la reconstruction des sorties (y) du systme, grce par exemple un filtre de Kalman, couvrent la fois les approches de type espaceparit et les observateurs. Les mthodes destimation de paramtres font lhypothse que les fautes survenant dans un systme dynamique se manifestent par un changement des paramtres de ce systme. La seconde tape est le processus de dcision : les rsidus gnrs sont examins en tant que signatures de faute. Les fonctions de dcision sont des fonctions de ces rsidus auxquelles ont t adjointes des rgles de dcision logiques.
33
Les mthodes dites de tests dhypothses attribuent les rsidus une violation de certaines hypothses lies au comportement normal du systme. Cest le principe de Diagnostic model processor (DMP) [PETTI et al., 1990].
composantes principales (ACP) et les mthodes de classification ou de reconnaissance de formes constituent une composante majeure des mthodes dextraction des caractristiques statistiques [NONG et McAVOY, 1996].
2.4.2.1
ont t
Mthodes qualitatives
celles bases sur des systmes bases sur de rgles pour la slection
Les applications laide de systmes experts ralises avec le plus de succs structure ou la perspective de classification heuristique du diagnostic. Un systme expert est un systme informatique destin rsoudre un problme prcis partir dune analyse et dune reprsentation des connaissances et du raisonnement dun (ou plusieurs) spcialiste(s) de ce problme. Ils sont composs de deux parties indpendantes : (a) une base de connaissances (base de rgles) qui modlise la connaissance du domaine considr et dune base de faits qui contient les informations concernant le cas trait, et (b) un moteur dinfrences capable de raisonner partir des informations contenues dans la base de connaissances. Au fur et mesure que les rgles sont appliques des nouveaux faits se dduisent et se rajoutent la base de faits. Les principaux avantages des systmes experts pour le diagnostic sont leur capacit donner des rponses en prsence dincertitude et leur capacit apporter des explications aux solutions fournies. Leur difficult spcifique est la capture de la connaissance (faits et rgles) cest--dire la dfinition et la description du raisonnement associ partir dune situation donne.
34
Lanalyse de tendance qualitative (QTA) utilise linformation de type tendance prsente dans les mesures issues des capteurs. Il y a deux tapes de base, lidentification de tendances dans les mesures, et linterprtation de ces tendances en terme de scnarios de fautes. Le processus didentification doit tre robuste par rapport aux variations momentanes du signal (dues au bruit) et capturer seulement les variations importantes. Le filtrage peut altrer le caractre qualitatif essentiel contenu dans le signal. On peut par exemple utiliser un systme base de fentrage pour identifier des tendances des niveaux divers (cest--dire des niveaux de dtail diffrents) et cette reprsentation peut alors tre utilise pour le diagnostic et la commande supervise. Ces tendances dans le processus peuvent tre transformes en fautes pour ainsi construire la base de connaissance utilise pour le diagnostic.
2.4.2.2
Mthodes quantitatives
dveloppement dun modle de connaissance du procd est impossible, lutilisation de modles dits bote noire peut tre envisage. Cest le cas de lutilisation de Rseaux de Neurones Artificiels (RNA) dont lapplication dans les domaines de la modlisation, de la commande et du diagnostic a largement t reporte dans la littrature. Un rseau de neurones ralise une fonction non linaire de ses entres par composition des fonctions ralises par chacun de ses neurones. Nous reviendrons plus en dtails sur la description des RNAs utiliss comme mthode de classification pour le diagnostic. ( 2.5.3). Les techniques statistiques multi-variables comme lanalyse en composantes principales (ACP) ont t utilises avec succs dans le domaine du diagnostic. Cest un outil capable de compresser des donnes et qui permet de rduire leur dimensionnalit de sorte que linformation essentielle soit conserve et plus facile analyser que dans lensemble original des donnes. Le but principal de lACP est de trouver un ensemble de facteurs (composantes) qui ait une dimension infrieure celle de lensemble original de donnes et qui puisse dcrire correctement les tendances principales. Une limitation importante de la surveillance base sur lACP est que la reprsentation obtenue est invariante dans le temps, alors quelle aurait besoin dtre mise jour priodiquement. Nous retournerons plus en dtails sur la description des ACPs ( 2.5.2).
2.5
dans lequel il se trouve. Lobjectif de notre travail est de dvelopper une approche qui
35
permettre de construire un modle de comportement du processus de la station SMAPA de production deau potable. Ce modle doit permettre didentifier des situations anormales issues des dysfonctionnements et les dfaillances du processus surveill, pour aider loprateur humain dans sa prise de dcisions. Loprateur doit aussi pouvoir avec ce modle, dtecter les besoins de maintenance des diffrentes parties de la station. Un type de connaissance exploitable des fins de diagnostic est constitu par lensemble des historiques de fonctionnement de la station. Si cet ensemble dhistoriques recouvre des modes de fonctionnement en prsence de dfaillances connues et rpertories, notamment grce aux actions de maintenance, il peut tre un moyen pour obtenir une reprsentation de la relation inconnue symptmes/dfaillance. Les proprits dapproximation des rseaux de neurones ou des systmes dinfrences floues peuvent alors tre mises profit pour obtenir une telle reprsentation. Le
problme rsoudre, alors consiste valuer la ressemblance du vecteur des symptmes observs, un vecteur des symptmes de rfrence que lon sait associer au dfaut. En fait, quelle que soit la mthode utilise, le diagnostic sapparente implicitement ou explicitement un problme de reconnaissance de formes, dans le but dassocier un ensemble de symptmes observs au dfaut qui en est la cause.
36
llaboration dun classificateur permettant laffectation dune forme observe lune des classes.
Frontires entre classes
x3
11 1 1 1 1 Classe: C5 2 5 5 5 5 55 44 4 4 4
22 2 2
x2
Forme observe
x1
33 3 3 3 3
La dmarche expose prcdemment, peut tre applique avec profit au diagnostic dune installation industrielle. Dan ce cas, les n paramtres du vecteur forme rsultent de mesures ralises sur le systme surveiller et des observations ralises par les oprateurs en charge de linstallation. Une bonne connaissance de linstallation permettra de choisir les paramtres le plus adapts. Ces paramtres, une fois choisis, sont mesurs en permanence sur linstallation surveiller. Par suite des bruits de mesure et des diverses perturbations auxquelles le systme est invitablement soumis, une suite dobservations du vecteur forme X, rsultant dun mme tat de fonctionnement du systme, ne va pas se retrouver en un seul point, mais occupe une zone de lespace n dimensions. Si les n paramtres ont t bien choisis, une forme correspondant un fonctionnement normal appartiendra une certaine zone ou classe, alors quune forme correspondant un autre mode de fonctionnement appartiendra une autre classe. Ainsi, chaque mode de fonctionnement peut tre reprsent au moyen dune classe de lespace de reprsentation. La figure 2.5 prsente la structure simplifie dun systme de diagnostic par reconnaissance des formes. La fonction dobservation a pour rle dlaborer le vecteur forme partir des mesures et observations ralises sur linstallation. La forme ainsi gnre est applique au bloc de classification permettant de raliser son affectation lune des classes connues et au mode de fonctionnement correspondant. La construction dun dispositif de diagnostic par reconnaissance de formes se droule en trois tapes principales : (a) la cration dune base dapprentissage qui regroupe un certain nombre de classes, chacune correspondant un mode de
37
fonctionnement particulier du systme, (b) le choix dun classificateur que permettra de dcider de lappartenance dune nouvelle observation lune des classes existantes, et (c) lutilisation effective du classificateur en phase dexploitation qui consiste implmenter le systme afin de proposer une dcision pour toute forme nappartenant pas une classe dj dfinie (mise en uvre du classificateur destin un fonctionnement en ligne).
Base de connaissances Si x(t) ? C1 ? Dfaillance 1 Si x(t) ? C2 ? Dfaillance 2 . . Si x(t) ? C k ? Dfaillance k Perturbations bruits Mesures ym(t)
Entres u(t)
Systme surveiller
y(t) Sorties
Fonction dobservation
x(t)
Fonction de Classification
Dfaillance 1 2
. .
Nous allons dans la suite explorer diffrentes mthodes de classification pour le diagnostic dans le cadre de systmes complexes. Les mthodes analyser sont : les rseaux de neurones artificiels, lapproche floue et la mthode de classification LAMDA qui peut tre considre comme intermdiaire entre ces deux approches.
2.5.1.1
Lapproche floue
Dans la thorie des ensembles classiques, la notion dappartenance est fondamentale, mais elle est de type tout ou rien, un lment appartient ou nappartient pas un ensemble [TOSCANO, 2005]. Un tel outil savre alors difficilement utilisable lorsquil sagit de manipuler des donnes vagues, imprcises, contradictoires ou lorsquil sagit de classer des informations suivant des catgories aux frontires mal dfinies. La thorie des ensembles flous, par un assouplissement de la notion dappartenance, permet datteindre de tels objectifs. Elle savre alors plus adapte pour la reprsentation des connaissances qualitatives. Les applications floues sont nombreuses, on peut citer la gestion financire, la mdecine, le diagnostic, la commande automatique de processus et bien dautres. Lide de lapproche floue est de construire un dispositif, appel systme dinfrences floues, capable dimiter les prises de dcision dun oprateur humain partir des rgles verbales traduisant ses connaissances relatives un processus donn. La relation mathmatique existant entre un dfaut et ses symptmes est le plus souvent difficile obtenir. Toutefois, les oprateurs humains ayant en charge la
38
maintenance et la conduite du systme sont souvent capables, de par leur exprience, de dterminer, sur la base de leurs observations, llment dfaillant qui est lorigine dun comportement quils ont jug anormal. Ce type de savoir peut tre exprim laide de rgles de la forme : SI condition ALORS conclusion o la partie condition comporte les symptmes observs et la partie conclusion llment dfaillant. Ce type de connaissances peut alors tre utilis pour construire un systme daide au diagnostic de linstallation. La notion de sous-ensemble flou introduite par Zadeh en 1965, est fonde sur le degr dappartenance, qui gnralise les fonctions caractristiques. Chaque classe en relation avec les modes de fonctionnement du systme peut tre interprte comme un sous-ensemble dun espace multidimensionnel, la classification se rsume alors la recherche des proprits caractristiques de ces ensembles. Finalement, chaque classe peut tre modlise au moyen dun sousensemble flou caractris par une fonction dappartenance multidimensionnelle quil sagit de dterminer. Dans la figure 2.6 le vecteur des symptmes x du classificateur, labor partir des grandeurs mesures sur le systme, peut tre vu comme une forme, quil sagit de classer parmi lensemble des formes correspondant un fonctionnement normal ou non.
12 (x 2 ,12 )
x1 x2
1 1 (x1 , 11 )
f1(x,1)
+
max
+1
C1
-1
+1
(x ,
2 2 2
1 1 2 (x1 , 2 )
2 2
f2(x,2)
max
C2
-1
i2 (x 2 , i2 )
i1 (x1 , i1 )
fl(x,l)
+ -
+1 -1
Cl
La classification est ralise au moyen des fonctions de vrit et de dcision, dont le paramtrage ralise la frontire entre les classes. Lensemble dapprentissage permet, dune part de gnrer la base de rgles et dautre part de raliser le paramtrage des fonctions dappartenance.
39
Cette
approche une
consiste classe,
sur
rechercher chacune
les des
projections dimensions
de de
la
fonction de
dappartenance
lespace
reprsentation. La fonction dappartenance au sous-ensemble flou global est alors obtenue au moyen dun oprateur de conjonction, ce qui se traduit symboliquement par lcriture dune rgle dappartenance la classe considre. Le classificateur ainsi comporte un nombre de rgles gales au nombre de classes. La base de rgles du classificateur est compose dune liste de propositions conditionnelles, de la forme,
Ri : Si x 1estAi1
q i
(2.2)
i j (x j , i j )
ij
Soit
i ( x ) = i j (x j , i j )
j =1
nx
(2.3)
lobservation x, (2.4)
Lobservateur x doit tre affecte la classe C i permettant dobtenir le plus grand degr dappartenance, do la rgle de dcision : Lobservation x est affecte la classe C i telle que
i ( x ) max 0
La structure correspondante du classificateur est alors celle de la figure 2.6. Les sorties dlivres par ce classificateur sont :
C i = +1 si x C i C i = 1 si non
(2.5)
La rgle de dcision doit tre complte afin doffrir la possibilit de rejets dambigut et dutilisation de distance. Il y a ambigut lorsquune observation appartient un domaine commun plusieurs classes. Dans ses conditions, les degrs
40
dappartenance
i ( x ) correspondants
2.5.1.2
LAMDA (Learning Algorithm for Multivariate Data Analysis) est une stratgie de classification avec apprentissage propose par Joseph Aguilar-Martin [AGUILAR-MARTIN et al.,1980]. La mthode a t dveloppe par plusieurs chercheurs [AGUILAR-MARTIN et al.,1982; DESROCHES,1987 ; PIERA et al.,1989]. Cest un algorithme danalyse de donnes multidimensionnelles par apprentissage et reconnaissance de formes. La formation et la reconnaissance de classes dans cette mthode sont bases sur lattribution dun objet une classe partir de la rgle heuristique appele adquation maximale. LAMDA a t utilis en domaines trs diverses : en analyse biomdicale [CHAN et al., 1989], pour les bio-procds [AGUILAR-MARTIN et al., 1999], pour ltude des processus de dpollution des eaux uses [WAISSMAN-VILANOVA et al. 2000], pour la psychologie [GALINDO,2002]. Plus rcemment, des capteurs) [ORANTES,2005] et Atine [ATINE,2005] dans les travaux de dimages thse de Kempowsky [KEMPOWSKY,2004a] (procds industriels), Orantes (placement (segmentation biologiques). LAMDA a t mise en uvre pour la premire fois dans le logiciel SYCLARE [DESROCHES,1987], puis dans le logiciel LAMDA2 [AGUADO,1998] et plus rcemment dans le logiciel SALSA [KEMPOWSKY,2004b].
41
classe agit comme une limitation ou un seuil : aucun lment ne sera assign une classe si son degr dadquation globale nest pas suprieur celui de la classe non informative. Degr dadquation avec connectifs : Le degr dappartenance une classe est calcul partir des valeurs de ses descripteurs. Ces valeurs contribuent au calcul de l'adquation chaque classe au moyen de degrs d'adquations marginales fournis par des fonctions de distribution floue. Connectifs : L'agrgation des adquations marginales se fait partir de connectifs de la Logique Floue, c'est--dire d'une t-norme et de son dual la t-conorme ou s-norme.
42
Mthodologie gnrale
On considre quun objet ou situation x est dcrit par un nombre fini et fix
dattributs nots x1,x2,xn. Afin dobtenir une confrontation entre x et les diffrentes classes Cj, une fonction dadquation Mi,j : Di C [0,1] nomme Degr dAdquation Marginale (DAM) est calcule pour chaque attribut xi et la forme dans laquelle lespace de description correspondant est reprsent de faon gnrale dans la classe Cj. Le DAM est une fonction dappartenance issue de la Logique Floue. Cette fonction peut exprimer un degr entre ladquation dun attribut une classe et linadquation de lattribut cette classe. Entre ces deux valeurs extrmes, il existe une valeur de lattribut telle que, si on se limitait cette unique information, il serait impossible de dcider de lappartenance de cet objet une classe. Ceci est quivalent une adquation neutre. Le concept dadquation neutre est ncessaire dans la reprsentation d'information insuffisante pour la classification. Lexpression dune adquation neutre, pour toute valeur dans lespace de description, est quivalente lindistingibilit dune certaine classe. Lune des spcificits importantes de la mthode LAMDA rside dans la prise en compte de ce manque d'information au moyen d'une classe non informative NIC. La classe NIC quivaut donc considrer indistingables tous les attributs.
43
quon a appel le degr dadquation marginale DAG . Pour chaque lment, on dtermine un vecteur des degrs dappartenance marginale. Linformation de ces degrs devra tre agrge afin dobtenir un indicateur qui permettra de savoir comment un objet satisfait les conditions propres la classe Cj. Cet indicateur est modlis par un oprateur logique dagrgation L : [0,1]n [0,1] Le rsultat est appel le Degr dadquation Globale (DAG) qui est fonction des appartenances marginales. DAG(X/C) est le degr dappartenance globale dun lment X une classe C, j=DAM(xj/C) est le degr dappartenance marginale (ou partielle) par rapport au descripteur j, et [1, j P] est le vecteur des appartenances marginales. Dans lannexe B de cette thse, on peut trouver un exemple simple du dveloppement de lalgorithme en utilisant des donnes quantitatives, permettant de mieux comprendre cette mthode. Dans ce qui suit, nous donnons de faon dtaille les diffrentes tapes de lalgorithme de classification. Soit un lment X et les classes C0, C1,,CK, une classification se droule de la faon suivante: Calculer les degrs dappartenance globale DAG de llment X chacune des classes C1,,CK et C0 la classe vide ou rsiduelle, nots [1,,P]. Pour ce faire, on calcule des degrs dappartenance marginale (j) par rapport chaque descripteur. Le calcul du degr dappartenance marginale ou partielle dpend du type de descripteur correspondant. Dans la logique propositionnelle, la faon dagrger les informations se fait par le biais doprateurs de conjonction. Si nous utilisons loprateur dintersection (conjonction logique), un objet aura une adquation leve une classe seulement si tous les attributs de lobjet ont un degr dadquation lev pour cette classe. Au contraire, dans le cas de loprateur dunion (disjonction logique), le fait que lun des attributs prsente un degr dadquation marginale lev sera suffisant pour considrer cet objet adquat la classe correspondante. Cependant, il est normal de rencontrer des situations o nous ne pouvons pas tre assez exigeant pour utiliser loprateur dintersection, mais pour lesquelles loprateur dunion serait trop permissif. Pour ces situations, des oprateurs mixtes dagrgation linairement compenss ont t proposs. Ces oprateurs ont un comportement rglable allant de lunion lintersection. Nous sommes alors capables dajuster lexigence de la mthode. Le schma gnral du calcul de ladquation dun objet une classe est reprsent sur la figure 2.7.
44
x1
attribut
r x
x2
attribut x2 en Cj
M2,j(x2)
xn
attribut xn en Cj
Bien qu'on soit oblig en pratique d'assigner une seule classe chaque lment, le rsultat final de la classification nest pas une partition classique de lunivers de description mais une partition floue, o chaque objet dans lunivers de description a une
valeur dappartenance chacune des classes existantes. Afin dobtenir une partition classique de lunivers de description, une fois le DAG calcul pour toutes les classes, x sera attribu, selon le critre dadquation maximale, la classe o la valeur du DAG est maximale. Pour des raisons algorithmiques, et pour assurer que lassignation dun objet une classe soit unique, une deuxime rgle de dcision FF (first found) est prise en considration : lorsque la valeur maximale du DAG est trouve dans plus dune classe, lobjet sera plac dans la premire classe laquelle il a t confront et qui prsente une valeur dappartenance maximale. On peut aussi envisager une variante appele LF (last found) dans laquelle c'est la dernire classe qui est retenue. Lapprentissage consiste extraire, partir de linformation contenue dans une base de donnes connue dapprentissage, les caractristiques qui dcrivent le mieux chaque concept. Dans LAMDA, ceci est traduit par lestimation des paramtres dfinissant les fonctions dappartenance des DAM. Dans notre approche, les fonctions dappartenance de chaque attribut sont estimes indpendamment de linformation disponible sur les autres attributs. Les paramtres reprsentant une classe sont estims partir uniquement des donnes de lensemble dapprentissage appartenant cette classe. Ceci implique que, dans LAMDA, lapprentissage dun concept (ou classe) est ralis partir uniquement de linformation dont nous disposons sur celui-ci, et non par opposition aux autres concepts tablis. Aprs la prsentation des principes et des bases de la mthodologie de classification LAMDA, on va dvelopper prsent les deux parties essentielles de cette mthodologie : les fonctions dappartenance qui dfinissent le Degr dAdquation Marginale et les oprateurs logiques dagrgation qui dterminent le Degr dadquation
45
Globale. Dterminer les fonctions dappartenance partir de donnes est une opration trs importante de lapplication de la logique floue des situations relles. Toutefois, il nexiste pas de guide ou rgle qui puissent tre utiliss afin de choisir la meilleure mthode pour obtenir ces fonctions. De plus, il nexiste pas de mesure pour valuer la qualit dune fonction dappartenance.
les valeurs, minimale et maximale, possibles dune fonction (0 et 1) signifient une totale inadquation de lattribut la classe et une totale adquation, respectivement. Parmi les valeurs extrmes de la fonction dappartenance, une valeur dadquation doit tre reprsente par un degr dappartenance bien dfini et connu. C'est--dire, les fonctions dappartenance utilises dans LAMDA, sont plutt une gnralisation floue dune logique trois valeurs (0,1, ?) que dune logique binaire. Afin de modliser la classe NIC, pour des paramtres prcis, la fonction dappartenance doit montrer une adquation neutre dans tout lespace de description. Cas des descripteurs qualitatifs Un descripteur qualitatif est caractris par un ensemble non ordonn de modalits. Lors de la classification, on procde au calcul des frquences de chaque modalit lintrieur dune classe. Le calcul de la fonction dappartenance marginale dun lment est la frquence de la modalit observe dans cette classe. Cas des descripteurs quantitatifs Les descripteurs quantitatifs sont tels que les valeurs associes peuvent se mettre dans un ensemble ordinal discret ou continu. Cet ensemble se prsente donc comme un intervalle [xmin, xmax] et peut tre rduit l'intervalle [0,1] par la formule de normalisation suivante :
xj =
2.6
46
Il existe plusieurs fonctions pour reprsenter lappartenance dun descripteur. Dans ce qui suit, nous donnons les 3 fonctions que nous avons utilises dans notre travail. Binomiale floue. Cest une extension floue de la fonction binomiale [AGUILARMARTIN,1980]:
(x j C i ) = i, jj (1 i, j )
x
(1 x j )
2.7
Binomiale floue Centre. Cette fonction permet une partition autour des centres des classes (WAISSMAN-VILANOVA,2000]. Le DAM est calcul alors par la proximit entre la valeur xj observe pour le descripteur j et le centre cij du mme descripteur pour la classe i :
1 x j x par = j 1 i, j i, j
2.8
des = x j j (1 x j )
x
(1 x j )
(x j C i ) =
par des
Gauss: Dans ce cas, les relations utilises sont rapprocher de celles donnant la moyenne et lcart type dune distribution gaussienne non normalise:
1
( x j / C ij ) = e
du descripteur j pour la classe i.
2 2 ij
( x j ij ) 2
2.9
Une fois que les DAMs ont t obtenus pour une classe, le DAG doit tre calcul, le DAG est obtenu par lagrgation des DAMs en utilisant les connectifs choisis, [PIERA,1991]. Ltape suivante consiste, laide du connectif, dterminer le degr dappartenance globale DAG de llment X la classe Ci. Les connectifs mixtes linairement compenss que nous avons cits prcdemment effectuent une interpolation entre loprateur logique dintersection (T-norme) et celui de lunion (Tconorme), par le biais du paramtre , par la formule :
2.10
Les appartenances marginales pour chaque descripteur, permettent de calculer lappartenance dun lment chacune des classes. Cet lment est assign la classe dont le degr dappartenance globale correspondant est maximal. Le paramtre
est
47
l'indice dexigence et 0,1 , Pour = 0 , la classification est peu exigeante dans lattribution dun individu une classe. Lexigence plus forte est obtenue pour = 1 . L'organigramme gnral de lalgorithme de classification LAMDA est donn sur la figure 2.8. Ce schma illustre lalgorithme LAMDA dans le cas de lauto-apprentissage ou bien dans le cas de la reconnaissance. Dans le cas de lapprentissage, sachant quil seffectue de faon squentielle, la reprsentation dune classe varie aprs quun lment ait t attribu. La mise jour de la classe seffectue en prenant en compte les caractristiques du nouvel lment ainsi que la description de la classe linstant prcdent.
[ ]
ELEMENT X n = (x 1, x2 ,, xP )
ENSEMBLE de CLASSES C 0: Classe Non-Informative
j = 0,,P
Cl
NON
C0 = Cl
OUI
Affectation de X n la classe l
AUTO-APPRENTISSAGE
i = 0,,K RECONNAISSANCE
i, j = i, j +
o
x j i, j N +1
2.11
squentiellement, il est ncessaire de connatre le nombre dlments ayant servi au calcul des paramtres de la classe correspondante. On peut crer aussi, laide de la classe (NIC) une nouvelle classe qui va tre caractrise par laffectation dun lment cette classe. X est le premier lment dune nouvelle classe CK+1 et la reprsentation de cette nouvelle classe dpendra de cet
48
i0 = i0 +
xi i 0 N0 +1
2.12
Dans le cas de l'auto-apprentissage, toute classe a d tre initialise par la classe NIC, c'est pourquoi la formule de la mise jour doit contenir ce paramtre fictif
N 0 et elle devient:
ik = ik +
Le paramtre
xi ik N0 + N +1
2.13
tre choisie arbitrairement mais elle influe sur le pouvoir d'absorption de chaque classe
nouvelle, plus
lment; par contre en apprentissage dirig ce paramtre n'a pas d'influence sur le rsultat de la classification. Dans le cas de la reconnaissance de formes, llment est attribu une classe significative ou rejete dans la classe rsiduelle NIC. Dans le cas de lapprentissage, sil est affect une classe significative il y a modification des paramtres de cette classe. En revanche, si la classe vide a la plus grande adquation, une nouvelle classe doit tre cre pour contenir cet lment. Il y a rejet si la classe vide est la plus proche et quil ny a pas possibilit de cration de nouvelle classe parce que le nombre maximum des classes cres est atteint.
49
est la reconnaissance dun comportement en temps rel, en utilisant le modle de comportement obtenu durant la phase hors ligne. Lavantage de loutil Salsa pour faire le diagnostic est quil na pas besoin dun modle initial ni analytique ni issu de lintelligence artificielle (logique floue, rseau neuronal). En revanche, il ncessite lavis dun expert pour valider laffectation des tats de fonctionnement du processus des classes et obtenir ainsi, le modle de comportement. Les caractristiques principales qui ont guid le choix vers SALSA, sont celles de LAMDA (information qualitative que quantitative, algorithme squentiel) plus la facilit d'installation et de configuration, ainsi que l'aide au dialogue avec l'oprateur. Il permet indiffremment lapprentissage non supervis et lapprentissage supervis, ncessite un nombre minimum de paramtres rgler par loprateur et est facile pour linstallation et la configuration.
50
Le 2e axe concentre le maximum de linformation restante, il est orthogonal au premier et cest le meilleur rsum dans un espace deux dimensions. Mais, de mme il laisse aussi des rsidus. Le 3e axe prend encore une part dinformation moindre, il est orthogonal au deux premiers. Et ainsi de suite, pour les axes suivants tant que lon pense quils apportent encore de linformation. Le nombre de composantes en thorie est gal au nombre de variables
originelles. Mais, en pratique, les premires directions permettent de couvrir un pourcentage lev (80%, 90%) de toutes les donnes originelles et sont donc utilises pour restreindre lespace dobservation.
propres de la matrice de variance. Les vecteurs propres avec les plus grandes valeurs propres seront utiliss comme les vecteurs de la base sur lesquels les donnes seront projetes [JOLLIFFE, 1986 ; OJA et al., 1992]. Pour un groupe de donnes, X le calcul de la matrice de covariance :
CO =
1 N
X
i =1
X iT
2.14
On utilise ensuite n'importe quel algorithme de dtermination des vecteurs propres pour trouver les valeurs propres de la matrice de covariance des donnes :
COU = U
2.15
o est la valeur propre, et U est le vecteur propre correspondant. Les m composantes principales des donnes n sont les directions orthogonales m dans les espaces de n qui capturent la plus grande variation des donnes. Comme nous le verrons dans la partie consacre aux rsultats, dans cette tude, on constate que 4 composantes principales ont la capacit de maintenir linformation exige pour la prdiction de la dose de coagulant de la station SMAPA de production deau potable. La figure 2.9 montre la projection dans lespace des variables et des individus, et aussi la dcomposition ces vecteurs propres et valeurs propres.
51
X1 I3 I2 X3 X2
(a)
I1
X3
I1 X2 X1 I3
I2
(b)
X Z
(c)
ZTZ U
Figure 2. 9 Projection (a) dans lespace des variables, (b) dans lespace des individus et (c) dcomposition de lACP
52
u i = win x n
n =1
(2.16)
y i = f (u i )
x1 wi1
(2.17)
. .
xin win ui f yi
. .
xN wiN
Figure 2. 10 Neurone formel
Chaque nud i calcule la somme de ses entres xi,,xN, pondres par les poids synaptiques correspondants wi1,,wiN ; cette valeur reprsente ltat interne du neurone ui. Ce rsultat est alors transmis une fonction dactivation f (figure 2.11). La sortie yi est lactivation du neurone. Linterconnexion de plusieurs neurones formels ralise un rseau de neurone.
(a)
(b)
(c)
(d)
Figure 2. 11 Principales fonctions dactivation : (a) fonction seuil, (b) fonction linaire, (c) fonction sigmode, (d) fonction gaussienne
La
proprit
principale
des
RNA
est
leur
capacit
dapprentissage.
Cet
apprentissage permet alors, sur la base de loptimisation dun critre, de reproduire le comportement dun systme modliser. Il consiste dans la recherche dun jeu de paramtres (les poids) et peut seffectuer de deux manires : supervis et non supervis. Dans lapprentissage supervis le rseau utilise les donnes dentre et la (ou les) sortie (s) du systme modliser [BISHOP,1995]. De cette faon, lalgorithme
53
didentification des paramtres du rseau va modifier ses poids jusqu ce que le rsultat fourni par le rseau soit le plus proche possible de la sortie attendue, correspondant une entre donne. Lidentification des poids du rseau est effectue en optimisant un critre de performance du RNA. Ce critre dans le cas de cet algorithme est calcul sur la base de la diffrence entre le rsultat yi obtenu par le rseau et la sortie attendue di,. Loptimisation seffectue en ajustant les poids par une technique de gradient. Chaque fois quun exemple est prsent au RNA, lactivation de chaque nud est calcule. Aprs avoir dterminer la valeur de la sortie, la valeur de lerreur est calcule en remontant le rseau, cest--dire de la couche de sortie vers la couche dentre. Cette erreur est le produit de la fonction derreur E=1/2(yi-di)2 et de la drive de la fonction dactivation f. Lerreur est une mesure du changement de la sortie RNA provoqu par un changement des valeurs des poids du rseau. Dans lapprentissage non supervis des RNA, contrairement au rseau
prcdent, on utilise des donnes qui ne sont pas tiquetes a priori (cest--dire que les sorties ne sont pas explicitement connues). Le rseau sauto-organise pour extraire lui-mme les donnes et les regrouper automatiquement. Lapprentissage a lieu souvent en temps rel avec des rseaux qui peuvent tre ventuellement boucls. Il est ralis laide des informations locales contenues dans les poids synaptiques et dans lactivation de neurones lmentaires. Il existe un grand nombre des RNA apprentissage supervis et non supervis. Les plus utiliss sont le perceptron, le perceptron multicouche et les rseaux base radiale (RBF) pour lapprentissage supervis et le rseau de Hopfield et les cartes topologiques de Kohonen dans le cas de lapprentissage non supervis. Larchitecture du RNA la plus tudie est le rseau de neurones multicouche (ou Multi-Layer Perceptron MLP en anglais) (Figure 2.12). Il se compose de neurones distribus sur plusieurs couches, dont les neurones sont tous relis aux neurones des couches adjacentes. Les couches autres que celles dentre et de sortie sont appeles couches caches . Il a t montr quune seule couche cache tait ncessaire pour modliser toute fonction continue avec une prcision donne, moyennant un nombre suffisant de neurones dans cette couche. La fonction principale des neurones dentres est dassocier les valeurs aux neurones et de les transmettre la couche cache. Les neurones de la couche cache ont la capacit de traiter l'information reue. Chacun d'eux effectue deux oprations diffrentes : la somme pondre de ses entres (en utilisant les poids associs aux liens existant entre ce neurone et les autres de la couche prcdente), suivi d'une transformation non linaire (appele fonction d'activation). La sortie de ces deux actions est alors envoye la couche suivante qui en est loccurrence
54
la couche de sortie dans notre cas. Mathmatiquement, si la transformation non linaire f est identique pour tous les neurones, l'expression de la sortie du perceptron multicouche est donne par :
x0 x1 x2 1 wj1 wj2 1
W1
xi
xn-1 xn
W2
y(x)
wjn hj Wj
h j = w ji xi + w j 0
i =1
et
y(x ) = f (
W j h j + W0 )
j =1
(2.18)
w ji sont les poids entre la couche dentre et la couche cache et W j sont les poids
entre la couche cache et la couche de sortie. La fonction dactivation f peut tre quelconque, mais en pratique, et en particulier lorsque lon effectue un apprentissage supervis, il est ncessaire d'avoir une fonction continue et compltement drivable. Il existe beaucoup de fonctions d'activation [DUCH et JANKOWSKI, 1999].
2.5.3.1
Le choix de la fonction derreur utilise pour lapprentissage des rseaux de neurones multicouches a une certaine influence sur la rapidit dapprentissage et sur la qualit de gnralisation du rseau. Cette question a t tudie par plusieurs chercheurs [VALENTIN,2000 et MOLLER,1993]. Lapprentissage supervis consiste dterminer les poids du rseau qui minimisent sur lensemble des donnes de la base dapprentissage, les carts entre les valeurs de la sortie (appeles aussi valeurs cibles) et les valeurs de la sortie prdites calcules par le rseau. Mathmatiquement ceci consiste trouver le minimum du critre quadratique :
55
C ( w ,W ) =
1 N
(ti yi ) 2
i =1
(2.19)
o N est le nombre dexemples de la base dapprentissage, w, W sont les vecteurs des poids des deux couches. La procdure de la minimisation MSE par lui-mme n'assure pas l'entranement du rseau. La sur-adaptation du rseau arrive quand le rseau est excessivement entran et/ou l'architecture du rseau a davantage de neurones occultes que ce qui est ncessaire. Il existe diffrentes procdures pour obtenir une architecture de rseau optimal [NANDI et al., 2001]. L'annexe C dcrit la procdure itrative MSE/ME que nous utilisons. Cest un problme doptimisation non-linaire classique. La mthode
traditionnellement employe pour effectuer lapprentissage supervis du rseau est l'algorithme de rtropropagation [RUMELHART et McCLELLAND,1993], appel ainsi cause de la faon typique de calculer les drives des couches successives en partant de la couche de sortie pour remonter la couche dentre. Initialement, lalgorithme utilisait la mthode doptimisation non-linaire du gradient (appele aussi mthode de la plus grande pente). Cette mthode est bien connue pour avoir un comportement oscillatoire proche de la solution. Cest pourquoi, actuellement les mthodes dites du 2nd ordre (base sur une approximation du Hessien) sont prfres car elles fournissent de bien meilleurs rsultats. Parmi les plus connues, citons la mthode Quasi-Newton et de Levenberg-Marquardt [NRGAARD et al.,2000].
2.5.3.2
La gnralisation concerne la tche accomplie par le rseau une fois son apprentissage achev [GALLINARI, 1997]. Elle peut tre value en testant le rseau sur donnes qui nont pas servi lapprentissage. Elle est influence principalement par : la complexit du problme, lalgorithme dapprentissage, la complexit de lchantillon, et la complexit du rseau (nombre de poids). La Complexit du problme. Il est dtermin par sa nature mme. Lalgorithme dapprentissage. Il influe par son aptitude trouver un minimum local assez profond, sinon, le minimum global. La complexit de lchantillon. Il trouve la reprsentativit dans une certaine rgion partir de la slection dun certain nombre dexemples pour lapprentissage du rseau.
56
La complexit du rseau. Pour bien cerner cet aspect, on fait lanalogie avec un problme de rgression polynomiale classique. Si on dispose dun nuage de points issus dune fonction F dune variable relle inconnue. Les exemples notre disposition sont des couples (xi, yi) bruits de la forme :
y i = F (xi ) + i
o les
(2.20)
modliser la fonction F par un modle polynomial en utilisant les exemples dapprentissage. Les Figures 2.13(a)-(c) reprsentent la modlisation de F par trois modles qui diffrent par leur nombre de paramtres. On peut constater que le modle ayant trs peu de paramtres na pas assez de flexibilit pour raliser un apprentissage correct des exemples dapprentissage. Les erreurs dapprentissage et de test sont toutes deux importantes: cest la situation de sous-apprentissage (Figure 2.13(c)). En revanche, le modle constitu de nombreux paramtres, lisse parfaitement les exemples dapprentissage. Il commet donc une erreur faible sur ces donnes, mais probablement une erreur plus importante sur les donnes de test. Cest la situation de surapprentissage (Figure 2.13(a)). Finalement, le modle possdant un nombre de paramtres modr ralise un bon compromis entre prcision dapprentissage et bonne gnralisation (Figure 2.13(b)).
x x x x x x x x x
x x x x
x x x x x x x x
x x x x
(a)
(b)
(c)
Figure 2. 13 (a) Surapprentissage : lapprentissage est parfait sur lensemble dapprentissage (x), et vraisemblablement moins bon sur le point de test (o) ; (b) Apprentissage correct : un bon lissage des donnes ; (c) Sous-apprentissage : apprentissage insuffisant.
2.5.3.3 Mesure de la qualit de la prdiction du rseau de neurones par gnration dintervalle de confiance
Ce paragraphe est consacr au problme destimation de lincertitude attache la prdiction. Le rchantillonnage par Bootstrap a t utilis pour gnrer un intervalle de confiance sur la prdiction.
57
La technique sappuie sur le fait de pouvoir, par rchantillonnage dans lensemble dapprentissage, estimer les caractristiques du phnomne alatoire qui a engendr ces donnes. Pour le cas des rseaux de neurones, la totalit de l'ensemble d'apprentissage est nanmoins utilise grce la formation de nombreuses partitions de l'chantillon. L'ouvrage dEfron et Tibshirani [EFRON et TIBSHIRANI, 1993] dtaille de nombreuses applications des techniques de rchantillonnage. Soit un chantillonnage X = x , x , K , x
1 2
nA
en fonction de
Elle prsente
notion dchantillon de Bootstrap. Il sagit dune technique d'infrence statistique qui cre un nouvel ensemble dapprentissage par rchantillonnage de lensemble de dpart avec possibilit dintroduire plusieurs fois des exemples. Soit F la distribution empirique, donnant la probabilit 1/nA toute observation xi, i=1,2,,nA. Un chantillon de bootstrap est dfini comme un chantillon alatoire de
A taille nA issu de F : X boot = xboot , xboot , K , xboot . Lchantillon de bootstrap X boot nest pas
}, un chantillon de bootstrap pourra tre form de sont issues du fichier original, certaines X = {x , x , x , x , x }. Les donnes de X ) sont B chantillons de apparaissant zro fois, dautres deux fois, etc. Si (x , K , x ),K, s(x ) approxime la bootstrap gnrs partir de X , la distribution de s (x
si X = x , x , x , x , x
1 2 3 4 5
effectue un tirage quiprobable avec remise sur tous les points de lchantillon X . Ainsi,
boot
boot
1 boot
B boot
1 boot
B boot
58
Lestimation par intervalle est souvent plus utile que lestimation par un seul point
Pris ensemble, ces deux types destimation indiquent quel est le meilleur
candidat pour
Lapplication de cette technique de rchantillonnage la gnration dintervalle de confiance pour les rseaux de neurones est dcrite par Lipmann [LIPMANN et al.,1995]. Elle est illustre dans la Figure 2.14. Dans cette approche, B chantillons de bootstrap sont gnrs partir de lensemble dapprentissage de dpart. Ensuite, B perceptrons multicouches sont gnrs en utilisant la procdure dapprentissage dcrite prcdemment. On utilise comme ensemble dapprentissage chacun des B ensembles de bootstrap. Quand un nouveau vecteur est prsent au B perceptrons multicouches on calcule les B sorties correspondantes. Ces sorties nous donnent une estimation de la distribution de la prdiction du rseau de neurones. Ensuite, ces valeurs sont classes par ordre croissant. En se fixant un seuil 10% et 90%, on peut dterminer un intervalle de confiance. Par exemple, si on prend B = 50, lestimation du point 10% est la 5me plus grande valeur et lestimateur du point 90% est la 45me plus grande valeur. On estime que les autres valeurs ne sont pas plausibles, elles ne sont donc pas prises en compte pour la gnration de lintervalle de prdiction.
Bootstrap perceptron multicouche 1 Bootstrap perceptron multicouche 2 Limite suprieure Limite infrieure
Paramtres entres
59
2.6
dapplication tels que les systmes de production manufacturire, la robotique, les systmes de transport, linformatique, etc., en incluant aussi les procds de production de leau potable. Plusieurs concepts (techniques, thories, mthodes, outils, modles et langages) ont t labors afin damliorer la qualit et de matriser la complexit croissante de la conception et du dveloppement de ces systmes. Un systme vnements discrets est un systme dynamique dfini par un
espace dtats discrets et des volutions, nommes trajectoires, bases sur une succession des tats et des transitions. Les transitions sont tiquetes par des symboles, appels vnements, dfinis avec les lments dun alphabet. Une approche courante pour ltude de ces systmes consiste ignorer la valeur explicite du temps et sintresser uniquement lordre doccurrence des vnements [ZAYTOON,2001]. Les modles non temporiss ainsi obtenus sont gnralement labors laide des automates tats finis, du grafcet, des rseaux de Petri, etc. Les automates tats finis constituent le modle de base pour la reprsentation des SED [HOPCROFT et ULLMAN,1979]. Un automate tats finis peut tre dcrit par le quadruplet (Q, , A, qo) avec :
Q un ensemble fini de sommets reprsentant les tats discrets, un ensemble fini de symboles (vnements) appel alphabet, A lensemble des transitions entre tats. Une transition est dfinie par un triplet (sommet source, vnement, sommet but) pour traduire le passage du systme dun tat un autre, suite loccurrence dun vnement appartenant .
qo ltat initial.
La figure 2.15, prsente le modle dune machine simple trois tats : arrt (a), marche (m) et panne (p). Ltat initial a est dsign par la flche entrante, et il y a quatre transitions associes, chacune lun des quatre vnements. Le comportement global dun systme vnements discrets est classiquement dcrit par lensemble des trajectoires dvnements qui peuvent tre excutes en parcourant lautomate partir de ltat initial. Cet ensemble correspond un langage issu de lalphabet , exprim par une expression permettant dagrger les squences dvnements rptitives. Ainsi, lexpression :
( + )* ( + + )
2.21
60
correspond lautomate de la figure 2.15 ; est une squence de longueur nulle qui correspond un vnement vide et
( + )*
indique
que
chacune
des
squences ou
a m
m: marche p: panne
: dbut du travail
: fin du travail : panne de la machine : rparation de la machine
Figure 2. 15 Automate dcrivant une machine simple : a) modle formel, b) reprsentation graphique
Un des objectifs de notre travail est de mettre en place, partir des rsultats de la classification, un modle des tats fonctionnels et des transitions entre ces tats. Pour llaboration de ce modle tats discrets nous devons dterminer les tats fonctionnels et identifier les transitions entre ces tats. Nous prsentons dans le chapitre 5, les rsultats de lapplication de la mthode de construction de lautomate.
2.7
considres comme des sites industriels part entire, ce titre, la maintenance y tait traite de faon accessoire, au risque parfois dtre nglige. Le besoin de matriser ce patrimoine la complexit technique croissante alli au souhait dune fiabilit toujours plus grande font que la maintenance est maintenant devenue une activit stratgique pour garantir : La continuit du service et donc la qualit du traitement ; La rentabilit des investissements, en augmentant la dure de vie des quipements. Lobjectif est simple : optimiser la disponibilit fonctionnelle tout en minimisant le cot dexploitation global [DEGREMONT, 1995]. Dans la norme AFNOR-NF-X60-010 [AFNOR,1994], la maintenance industrielle peut se dcliner sous diffrentes formes selon les situations. La figure 2.16 montre les diffrentes formes de maintenance. Elles sont rpartis en deux catgories, selon la
61
prsence ou non dune dfaillance au moment considr. On parle de maintenance corrective si une dfaillance est a priori prsente et de maintenance prventive sinon.
Maintenance
OUI
Dfaillance?
NON
Maintenance corrective
Maintenance prventive
Maintenance palliative
Maintenance curative
62
des interventions est conserv, mais le remplacement des composants est conditionn par la comparaison du rsultat de vrifications permettant dvaluer le niveau de dgradation un critre dacceptation pr-tabli. Enfin, la dernire forme de maintenance prventive est connue la fois sous le nom de maintenance prvisionnelle et de maintenance prdictive. Certains auteurs associent parfois tort la dnomination de maintenance prdictive la maintenance prventive conditionnelle, or en maintenance prdictive, le principe consiste assurer un suivi continu, et non plus priodique, de ltat de fonctionnement de loutil de production. Lobjectif de la maintenance prdictive est alors de matriser au mieux les comportements passs et prsents du systme afin de prvoir les dfaillances futures, et donc de matriser la globalit du processus de dgradation et de rduire les temps dindisponibilits. Pour la maintenance dun outil de production, diffrentes stratgies de maintenance sont envisageables. Chaque forme de maintenance dispose toutefois de ses avantages et de ses inconvnients. Cependant, en raison de la complexification des systmes industriels, la tendance actuelle est davantage au dveloppement de la maintenance prventive et surtout de la maintenance prdictive [CART et al.,2001], mme sil y a toujours un compromis tablir en fonction du systme surveill, de la complexit des techniques mettre en uvre, et de leurs cots. Le dveloppement dune politique de maintenance prdictive ncessite la mise en uvre dun systme de diagnostic industriel. Linterprtation du mot diagnostic possde de nombreuses significations suivant les interlocuteurs. Les dfinitions utilises ici sont celles tablies au sein de la norme AFNOR-NF-X60-010 [AFNOR,1994], qui sont
63
probable de la (ou des) dfaillance(s) laide dun raisonnement logique fond sur un ensemble dobservations provenant dune inspection, dun contrle ou dun test. Il sagit donc de travailler sur les relations de causalit liant les effets (symptmes observs sur le systme) et les causes (dfauts du systme). L'objectif d'un systme de diagnostic est alors de rendre compte de l'apparition d'un dfaut le plus rapidement possible (c'est--dire suivante : la dtection : dterminer la prsence ou non dun dfaut affectant le procd en se basant sur lanalyse des effets sur le systme (symptmes), avant qu'il n'entrane des dommages importants au travers de dfaillances). Les trois fonctions du diagnostic peuvent alors tre dcrites de la manire
la localisation : dterminer le type de dfaut affectant le procd en donnant des indications relatives llment en dfaut, lidentification : dterminer exactement la cause de ses symptmes en identifiant la nature du dfaut.
2.8
Conclusion
La complexit actuelle des processus et des systmes lance des dfis
considrables dans la conception, lanalyse, la construction et la manipulation pour atteindre les objectifs souhaits dans leur opration et leur utilisation tout au long de leur cycle de vie. Dans les processus industriels de production d'eau potable, le contrle et la matrise de ses processus complexes jouent un rle crucial pour assurer la scurit du personnel de lunit et la conservation de l'environnement, ainsi que la fourniture de la quantit d'eau ncessaire la population. Dans ce chapitre, nous avons prsent un schma gnral de la supervision qui inclut la dtection des dfaillances, le diagnostic, la reconfiguration du processus et la maintenance. Une description des mthodes de diagnostic a t faite en les classant en deux catgories : les mthodes base de modles et les mthodes base de donnes historiques. Le choix dune de ces mthodes dpend essentiellement des connaissances disponibles sur le procd. Notre travail porte sur le dveloppement dun outil daide pour la caractrisation et lidentification du comportement de lunit de production deau potable, partir des donnes disponibles et qui prenne en compte les connaissances de loprateur ou expert. Devant le manque flagrant de modles mathmatiques de lensemble des
64
procds fonctionnant sur la station, notre choix sest port sur des techniques qui permettent danalyser des historiques de ce fonctionnement. Nous nous sommes donc intresss un outil pour lidentification des dfaillances de processus bas sur des mthodes de classification et reconnaissance de formes. Connaissant les diffrents travaux effectus au pralable dans le groupe DISCO, nous avons adopt une approche qui utilise la mthode de classification LAMDA pour la construction du modle pour la supervision. Nous avons prsent le logiciel SALSA qui lui est associ et qui permet deffectuer un apprentissage hors ligne et qui donne loprateur un support pour la prise de dcision en temps rel. Le chapitre 3 est consacr linstrumentation de la station ainsi quau traitement des donnes qui seront utilises par la mthode de diagnostic. Parmi ces traitements, nous proposons de dvelopper un capteur logiciel permettant de prdire en temps rel la dose de coagulant injecter et qui sera de plus une information supplmentaire
utilise comme donne dentre dans la procdure de diagnostic de lensemble de la station SMAPA.
3.1
Introduction
Dans ce chapitre, nous nous intressons au recueil des diffrentes donnes et
mesures
ncessaires
pour
tablir
une
mthodologie
de
diagnostic
base
sur
linterprtation des informations obtenues sur lensemble du procd de traitement de leau potabiliser. Dans la premire partie, nous dtaillons la mesure des diffrents paramtres spcifiques de leau, en particulier ceux relatifs au procd de coagulation. Ensuite, nous dcrivons les diffrents automatismes mis en uvre dans une station de traitement deau potabiliser. Finalement, nous prsentons la mthodologie dveloppe pour la prdiction de la dose de coagulant, mthodologie utilisant des RNAs. Linformation issue de ce capteur logiciel sera ensuite utilise comme donne dentre dans la procdure de diagnostic de la partie amont de la station de production deau potable. Les rsultats concernant la construction du module de prdiction de la dose de coagulant, illustrent les deux phases de la conception : lapprentissage et la reconnaissance ainsi que la qualit de la prdiction par la gnration dintervalles de confiance.
66
3.2
en ligne [DEGREMONT,2005]. Les paramtres usuels sont principalement les dbits, les niveaux de liquide ou de solides, les pressions, les tempratures. Dans toute installation de production deau potable ou de traitement deaux pollues, la connaissance du dbit est imprative. De plus, le traitement de leau conduit lui ajouter un certain nombre de ractifs. La bonne conduite dune installation de filtration ncessite la connaissance permanente de ltat des filtres. La mesure de la temprature est essentielle, elle est souvent utile pour les racteurs biologiques, et quelque fois pour lopration de coagulation-floculation. La majeure partie des mesures de dbit seffectue en tuyauterie ferme. Elle est
ralise diffremment suivant le type de fluide (eau brute ou eau traite) et selon la gamme de dbit. La mesure de perte de charge est cruciale pour la conduite du procd de filtration. La temprature de leau est gnralement mesure laide dun thermomtre rsistance afin de pouvoir tre transmise distance. La mesure en continu dun certain nombre de paramtres spcifiques permet de librer loprateur de lastreinte danalyse de routine et doptimiser les traitements en rduisant le temps de rponse. La turbidit est le paramtre le plus important dans le procd. Elle permet de rendre compte de la transparence dun liquide due la prsence de matires en suspension non dissoutes. En plus, elle permet de connatre le degr de pollution physique des eaux traiter ainsi que la qualit dune eau destine la consommation humaine. Des corrlations sont souvent tablies entre turbidit, matires en suspension, solides totaux et couleur. La mesure en continu du pH dune eau, est en particulier utilisable pour le contrle de la coagulation-floculation, de la dsinfection, etc. La mesure de lalcalinit et de la duret de leau permet de rester lquilibre calco-carbonique de leau et donc dviter la corrosion des canalisations. Le contrle habituel de la dsinfection se fait par mesure de la quantit rsiduelle de lagent dsinfectant : chlore, ozone, etc. Dans les appareils utiliss pour la mesure des paramtres spcifiques de leau, les diffrentes mthodes danalyse sont mises en uvre de faon automatique [DEGREMONT,2005]. On peut classer ces diffrentes appareils en deux grandes catgories : celle des capteurs physiques et celle des analyseurs chimiques qui ralisent pralablement toute mesure, une ou plusieurs ractions chimiques. Le tableau 3.1, montre des exemples dutilisation de mesure dans une station de traitement deau potabiliser [DEGREMONT,2005].
67
Par rapport la qualit de capteurs, il est essentiel dassurer le fonctionnement correct de lensemble dune boucle de mesure en continu. Linformation ainsi dlivre, surtout si elle est utilise dans une rgulation automatique ou comme entre dun modle, doit tre la plus reprsentative mesur et tre trs fiable [VALIRON,1990].
Tableau 3.1 : Exemples dutilisation de mesure dans une station Paramtres Prleveur automatique Mesure du pH Mesure de lozone Mesure du chlore Mesure de la turbidit Domaine dapplication Sur eau brute et eau traite tout niveau du traitement Dsinfection par lozone Dsinfection par le chlore tout niveau du traitement Aprs filtration Dcarbonatation Objet de la mesure Contrle de la qualit en entre et sortie Rgulation du pH Rgulation de linjection dozone Rgulation de linjection de chlore Contrle de la qualit en entre et sortie Contrle de la qualit en sortie dusine Contrle de la qualit de leau
3.3
matire premire quest leau brute est gnralement relativement lente. Les variations des quantits traiter, qui dpendent de la demande en eau potable, sont en revanche souvent importantes et le dbit est gnralement un paramtre cl dans lautomatisation des installations. Linertie de la plupart des traitements biologiques mis en uvre, la complexit des phnomnes de coagulation-floculation rendent parfois difficile la rgulation des procds. Mais la progression des connaissances ainsi que des technologies de mesure permettent daccrotre graduellement tels procds fortement non linaires. Lusine entirement automatise sans intervention humaine nexiste pas les possibilits de modlisation grce lapparition des techniques connexionnistes trs bien adaptes pour la modlisation de
cependant. Mme si aucun personnel dexploitation nest prsent en continu sur certains sites, des agents sont ncessaires pour assurer la maintenance, certaines tches de rglage, ltablissement de diagnostic sur des priodes plus ou moins longues. Toutefois, un grand nombre de fonctions automatiques sont dj ralises couramment dans les installations de production deau potable. Les plus courantes sont prsentes dans le tableau 3.2. On constate que la majorit des rgulations sont lies au dbit deau. En particulier, pour la rgulation du pompage de leau traite, un modle expert
68
bas sur la prvision de la consommation permet doptimiser les niveaux des rservoirs. Dans le paragraphe suivant, nous nous intressons plus particulirement au procd de coagulation qui a fait lobjet de ltude rapporte dans ce chapitre.
Tableau 3.2 : Principaux automatismes dans une station de production deau potable Fonction automatise Pompage eau brute Pompage eau traite Paramtres de Rfrence Mesure du niveau de la bche deau traite Niveaux des rservoirs et prvision de la consommation Dbit eau Moyen Variation du dbit (dbit maximum la nuit) [DAGUINOS et al.,1998] Modle mathmatique pour dterminer les consignes en fonction de la prvision de la consommation [FOTOOHI et al.,1996] Proportionnalit au dbit, la dose tant gnralement fixe pour la coagulation par essai Jar-Test Algorithme spcifique Observations
Relativement complexe.
Dose de ractifs (dbit de ractif/dbit deau brute) Extraction des boues de dcantation Lavage des filtre Rgulation Filtre Dsinfection chlore
Divers paramtres de qualit de leau brute : turbidit, pH, temprature, etc. Dbit deau et concentration des boues extraites Perte de charge et temps de filtration Niveau deau dans le filtre. Concentration rsiduelle de chlore
Etude spcifique
Dsinfection ozone
Extraction continue avec arrt si seuil bas de concentration de boue Automate programmable avec gestion des priorits Rgulation spcifique avec dmarrage lent Rgulation spcifique pour maintenir une consigne de concentration en chlore constante [RODRIGUEZ et al.,1996] Rgulation spcifique
3.4
essai exprimental appel Jar-Test . Il consiste mettre dans une srie de bchers, contenant la mme eau brute, des doses croissantes de coagulant et de faire lessai de coagulation [BOMBAUGH et al.,1967; BRODART et al.,1989]. Aprs quelques instants, on procde sur leau dcante, toutes les mesures utiles de qualit (turbidit, matires organiques, pH, etc.,). La dose optimale est dtermine en fonction de la qualit des diffrentes eaux compares. La frquence de ces Jar-Tests est souvent irrgulire. En gnral, sur les usines importantes un seul essai est effectu par jour.
69
Loprateur fera un nouvel essai entre temps pour changer la dose de coagulant uniquement si la qualit traite se dgrade. Linconvnient de cette technique est quelle ncessite lintervention de loprateur. De plus, les problmes rencontrs sont souvent soit un sur-dosage (ajout dune quantit excessive de coagulant, qui, si elle a le mrite de permettre la coagulation, augmente cependant le cot de lopration et dgrade fortement lenvironnement) soit un sous-dosage qui est synonyme dun mauvais respect des spcifications imposes la station. On voit ici tout lintrt de disposer dun contrle efficace de ce procd pour assurer une meilleure efficacit du traitement et une rduction des cots dexploitation mais surtout une protection de lenvironnement par la matrise des quantits de coagulant ajoutes (ne rajouter que le ncessaire). Pour ce faire, la modlisation du procd en utilisant la mesure en ligne des paramtres descripteurs de la qualit de leau brute peut tre la rponse comme mthode pour la dtermination automatique de la dose de coagulant injecter.
70
que
les
caractristiques
apportant
rellement
une
information
pertinente.
La
mthodologie que nous proposons dutiliser pour la conception du capteur logiciel bas sur les rseaux de neurones avec lanalyse en composantes principales est reprsente sur la figure 3.1.
ACP
3.4.3 Application de la mthodologie pour la prdiction de la dose de coagulant 3.4.3.1 Mesures disponibles sur la station SMAPA
La station SMAPA de production deau potable Chiapas, est alimente principalement par les fleuves Grijalva et Santo Domingo. Ils apportent 1200 l/s qui reprsentent 87% du total de la captation. Il existe actuellement deux pompes et trois lignes avec une longueur approximative de 11 kilomtres chacune. La station a une capacit de production de 800 l/s et alimente, via un rseau interconnect, prs dun million dhabitants. Pour chaque chantillon ou individu, on possde les rsultats de la mesure en ligne de diffrentes caractristiques de leau brute mais aussi danalyses chimiques et physiques effectues hors-ligne qui constituent un ensemble de 9 descripteurs de la qualit de l'eau brute: temprature (TEMP), couleur (C), turbidit (TUR), solides totaux (ST), matire organique (MO), pH, bicarbonate (B), chlorure (CL), duret totale (DT). De plus, nous disposons de la dose de coagulant (DOSE) optimale injecte sur lusine en continu. Cette dose de coagulant est dtermine par des essais jar-test effectus en laboratoire, elle est ractualise par loprateur une fois par jour. Elle peut galement tre ractualise plus frquemment sil y a une forte variation de la qualit de leau brute.
71
Des statistiques descriptives simples des donnes brutes sont prsentes dans le tableau 3.3. Il faut noter que ce jeu de donnes couvre une priode de cinq ans (20002004) et reflte de manire acceptable, les variations saisonnires de la qualit de leau brute. Nonobstant, il sera sans doute ncessaire deffectuer un rapprentissage priodique du systme pour prendre en compte les diffrentes situations susceptibles dtre rencontres, et pour permettre ladaptation continue du systme toute volution de la qualit de leau brute.
Tableau 3.3 Rsum statistique des paramtres de leau brute sur SMAPA
Proprit Temp ( C) Maximum Minimum 30 19 24,96 2
o
Moyenne Ecarttype
La figure 3.2 prsente lvolution des diffrents paramtres mesurs en continu, de la qualit de leau au cours du temps. Les mesures sont affiches en fonction de leur date dacquisition. Lvolution de la dose optimale de coagulant au cours du temps est galement prsente sur la Figure 3.3. On constate de fortes variations de la turbidit durant la saison dt. On remarque aussi que la turbidit, le pH, la couleur, et la dose de coagulant sont fortement dpendants des phnomnes saisonniers. On voit ici tout lintrt de disposer dau moins un an darchives de donnes pour dterminer un modle de prdiction fiable capable de fonctionner sur une anne complte. Une premire analyse a consist effectuer une ACP afin de dterminer quelles sont les variables qui influent le plus sur la dose de coagulant. neurones pour la prdiction du taux de coagulant. Cette analyse nous permettra de slectionner les variables pertinentes utiliser en entre du rseau de
3.4.3.2
Le prtraitement des donnes en utilisant lAnalyse en Composantes Principales consiste recueillir les diffrentes informations suivantes : la matrice de corrlations, les valeurs et lhistogramme des valeurs propres et le cercle de corrlation. La matrice de corrlations (voir tableau 3.4). Dans le tableau 3.4, ont t reportes les corrlations entre variables pour les 4 premires composantes principales. On peut observer quil
72
existe une forte corrlation entre des variables de deux groupes diffrents. Un groupe de 5 variables (la turbidit, la couleur, les solides totaux, la matire organique et la dose de coagulant) et lautre de 3 variables (le bicarbonate, le chlorure et la duret total). Le pH et la temprature ne sont pas corrls avec dautres variables. La dose de coagulant est une variable passive.
30
400
Tem p (C)
25
Couleur (u Pt-Co)
0 150 300 450 600 750 900 jours 1050 1200 1350 1500 1650 1800
300
200
20
100
15
1050
1200
1350
1500
1650
1800
2000
1000
500
0 0 150 300 450 600 750 900 jours 1050 1200 1350 1500 1650 1800
200 0 150 300 450 600 750 900 jours 1050 1200 1350 1500 1650 1800
8.5
8.25
20 10 0 0 150 300 450 600 750 900 jours 1050 1200 1350 1500 1650 1800
8 7.75
7.5 0 150 300 450 600 750 900 jours 1050 1200 1350 1500 1650 1800
200
Bicarbonate (ppm)
Chlorure (ppm)
0 150 300 450 600 750 900 1050 1200 1350 1500 1650 1800 jours
150
100 50
100
0 0 150 300 450 600 750 900 1050 1200 1350 1500 1650 1800 jours
400
300
200
100 0 150 300 450 600 750 900 jours 1050 1200 1350 1500 1650 1800
73
200 100
0 0 150 300 450 600 750 900 jours 1050 1200 1350 1500 1650 1800
Les valeurs et lhistogramme des valeurs propres LAnalyse en Composantes Principales applique sur lensemble de ces donnes a fourni le tableau et lhistogramme donns sur la figure 3.4. On peut remarquer la dcroissance rapide des valeurs propres (figure 3.4). Seules les quatre premires composantes reprsentent une prise en charge de plus de 88.00 % de linertie. Lensemble des 10 variables est susceptible dtre simplifi et remplac par les 4 nouvelles variables reprsentes par les 4 premiers axes principaux. En rsum, laxe 1 qui reprsente 54,45% de linertie totale est dfini positivement et dune faon nette par 5 variables trs groupes Couleur, Turbidit, Solides Totaux, Matires Organiques et Dose de Coagulant. Laxe 2 (18,11%) est dfini par 3 variables fortement corrles: Duret Totale, Chlorure et Bicarbonate. Laxe 3 (10,09%) reprsente la temprature qui lui est lie positivement. Laxe 4 (5,35%) reprsente la variable pH (les autres variables tant regroupes dans les 3 premires directions car fortement corrles entre elles).
74
Le cercle de corrlation Il est plus intressant de visualiser les corrlations entre variables et les composantes principales sur le cercle de corrlation montr sur la figure 3.5. Il permet de comparer le comportement dune variable vis--vis de lensemble des
autres variables. La reprsentation dans le cercle laisse apparatre deux groupes de descripteurs dont le comportement du point de vue de leur variation est trs proche vis--vis de lensemble des autres variables (duret totale chlorure Bicarbonate et couleur turbidit - solides totaux - matire organique - dose). La temprature et le pH prsentent un comportement indpendant vis vis des autres variables et devraient, en toute vigueur, ne pas tre limines pour expliquer parfaitement les variations du systme.
Variables (axes F1 et F2 : 72.57 %)
1
Bicarb Duret T B icarb Chlorures Chlo rures Duret
0.5
Temp
Temp
Turbidit Co uleur
MatOrg Do se M atire O So lides t Dose
0 pH pH -0.5
75
De cette tude, on peut conclure que pour prdire la dose de coagulant en fonction des caractristiques de leau et que celles-ci soient en plus facilement mesurables en continu, on peut ne garder que les variables Turbidit, Duret Totale, Temprature et pH.
3.4.3.3
Pour la construction de la base dapprentissage du perceptron multicouche nous avons un ensemble de donnes, couvrant 2 annes de fonctionnement, constitu de 725 chantillons (de janvier 2002 fin dcembre 2003), correspondant aux 4 descripteurs ((TUR, DT, TEMP et pH) en plus de la dose de coagulant applique. Lanalyse prliminaire en composantes principales a permis dj de restreindre le nombre de neurones de la couche dentre 4 (figure 3.6).
Lensemble des 725 chantillons a t spar en deux. Un total de 363 chantillons a ont t utilis pour lapprentissage afin de dterminer le modle (donnes dapprentissage) par minimisation des critres MSE/ME. Le reste (362 chantillons) a t utilis comme ensemble de test.
Lapprentissage a t ralis sur le premier jeu de donns couvrant la premire anne (2002).
Pour dterminer le nombre de neurones de la couche cache (critre MSE/ME), on a augment progressivement le nombre de neurones dans cette couche jusqu atteindre la prcision voulue et en mme temps pour viter un sur-apprentissage qui dtriorerait les performances en gnralisation (prdiction pour des valeurs des entres autres que celles utilises dans la base dapprentissage), nous avons arrt lapprentissage lorsque les valeurs des critres MSE/ME calcules sur des donnes de test sont les plus petites. Cette procdure est dcrite dans lannexe C.
76
Sur la figure 3.7a, nous donnons les rsultats des volutions des deux critres MSE et erreur moyenne (ME) pour une valeur du nombre de neurones dans la couche cache (20) et en fonction du nombre ditrations. Sur la figure 3.7b, nous donnons les rsultats de la mthodologie en terme de valeurs des critres en fonction du nombre de neurones dans la couche cache pour un nombre ditrations fix. De la figure 3.7, il ressort que le rseau offrant le meilleur compromis est celui qui possde 20 neurones dans la couche cache et dont les valeurs des poids des connections sont celles trouves aprs 50 itrations.
10
25
50
100
200
10
25
50
100
200
(a)
10
15
20
50
100
10
15
20
50
100
(b)
Figure 3. 7 Valeurs des critres (MSE) et de lerreur moyenne pour la dtermination du nombre ditrations (a) et du nombre de neurones dans la couche cache (b)
Les
rsultats
de
prdiction
ponctuelle
obtenus
sur
lensemble
de
test
indpendant sont illustrs sur la figure 3.8. Il montre la sortie calcule par le rseau neuronal et la dose rellement applique (valeur cible) dans le cas du test du rseau pour lanne 2003. On remarque que la rponse du rseau (ligne pointille) est trs proche de la sortie cible.
77
Lerreur moyenne (ME) reprsente par le critre C calcul par le rseau est de 0.210 lors de lapprentissage, alors que celle calcule sur les donnes de test (anne 2003) est 0.84.
Figure 3. 8 Dose de coagulant applique et dose de coagulant prdite (ligne pointille et +) avec le perceptron multicouche sur lensemble de test
LAnalyse en Composantes Principales permet de calculer la dose de coagulant comme une fonction linaire des 4 entres slectionnes. Il est en effet possible de dvelopper un modle de rgression linaire partir des rsultats de cette analyse afin de comparer ses prdictions celles provenant du modle par perceptron multicouche. La figure 3.9 montre la sortie du modle linaire dtermine sur le mme ensemble dapprentissage que le perceptron multicouche. La prcision de la prdiction est clairement infrieure celle du perceptron multicouche ce qui confirme la forte nonlinarit du procd.
Figure 3. 9 Dose de coagulant applique et dose de coagulant prdite (ligne pointille et +) avec le modle de type linaire sur lensemble de test
78
Tableau 3.5 : Rsultats de la comparaison modle par rseaux de neurones et modle par rgression linaire Indices de comparaison R sur les donnes dapprentissage R2 sur les donnes de test Critre MSE sur les donnes dapprentissage
2
Un volet important du dveloppement dun capteur logiciel est de pouvoir quantifier ses capacits de prdiction. Cette qualit de prdiction pourrait tre mesure en terme de robustesse aux diffrentes erreurs de modlisation. Pour estimer cette incertitude de prdiction, nous utilisons une approche base sur le rchantillonnage de la base dapprentissage par bootstrap ( 2.5.3.3). Nous gnrons 50 ensembles de bootstrap partir de lensemble dapprentissage (363 chantillons). 50 perceptrons multicouches sont ensuite gnrs en utilisant la procdure dapprentissage dcrite prcdemment en utilisant comme ensemble dapprentissage chacun des 50 ensembles de bootstrap. Ensuite, pour chaque vecteur dentre on calcule la sortie ponctuelle prdite ainsi que les 50 sorties de chaque perceptron multicouche. Ces diffrentes sorties nous donnent une estimation de lincertitude lie la prdiction que lon peut exprimer sous forme dintervalle. La Figure 3.10, montre les rsultats de la prdiction ponctuelle et lintervalle de confiance ainsi obtenus sur lensemble de test.
200 Dose de coagulant (mg/l)
A ce stade, il est intressant de comparer les rsultats que nous avons obtenus avec ceux prsents par [VALENTIN,2000] et [LAMRINI et al.,2005]. Dans les deux
79
cas, les rseaux de neurones dvelopps sont du type Perceptron Multicouche. Leur architecture est similaire celle que nous avons propose. Il est intressant de sattarder sur cette structure. En particulier, on remarque que les entres des rseaux sont trs similaires. Valentin [VALENTIN,2000] a choisi comme entres de ce rseau : la turbidit, la conductivit, le pH, la temprature, loxygne dissous et labsorption UV. Dans ltude mene par [LAMRINI et al.,2005] on retrouve la turbidit, la conductivit, le pH, la temprature, loxygne dissous. On voit donc quil y a 5 entres communes. La seule diffrence est dans la mesure de labsorption UV. Si on reprend ltude mene par [LAMRINI et al.,2005], il apparat que cette grandeur ntait pas disponible dans les donnes initiales de la base dapprentissage. Dans notre cas, nous avons comme variables dentre : la turbidit, la duret totale, la temprature et le pH. Nous ne disposions pas de lenregistrement de la conductivit dans les donnes fournies par la station SMAPA, nanmoins on peut la rapprocher de la variable duret totale. Il manque donc la mesure de loxygne dissous commune aux deux autres rseaux. Comme prcdemment nous ne disposons pas de cette information sur la station SMAPA. Il serait donc intressant de pouvoir quiper cette station de ce capteur. Nanmoins, avec une information en moins, le capteur logiciel dvelopp donne des rsultats satisfaisants. Le plus intressant dans ces rsultats est quils montrent quil existerait une structure gnrique pour ce type de capteur lie plus au type dopration (la coagulation) qu lunit elle-mme puisque ces capteurs ont des architectures similaires alors quils ont t dvelopps pour des units situes en France, au Maroc et au Mexique donc pour des eaux brutes relativement diffrentes. Une tude intressante serait de dvelopper un capteur logiciel laide de donnes dun site et de le tester sur les donnes provenant dun autre site. Ceci na pu tre effectu ici car les entres bien que similaires ntaient pas totalement identiques. Les tudes futures dans ce domaine devraient viser dvelopper une sorte de capteur universel car la possession dun capteur gnrique serait un atout important pour les industriels de la production deau potable.
3.5
Conclusion
Dans ce chapitre nous avons abord les aspects lis linstrumentation dune
usine de production deau potable. Aprs avoir expos les caractristiques du procd de coagulation, il est apparu clairement que pour pallier les dficiences humaines, les retards et la non reproductibilit des analyses effectues hors ligne, il tait souhaitable de possder un moyen de dtermination automatique de la dose de coagulant injecter. Devant un
80
manque cruel de modle de connaissance relatif aux diffrents mcanismes mis en jeu lors de la coagulation, notre choix sest port sur le dveloppement dun modle comportemental. La relation entre la dose de coagulant et les diffrentes caractristiques de leau brute, de nature non linaire, nous a conduit adopter un rseau de neurones multicouche. La slection des entres du rseau a t effectue en utilisant la technique statistique par Analyse en Composantes Principales qui permet dliminer les informations redondantes et de restreindre le nombre des variables dentre celles les plus pertinentes. La construction du perceptron multicouche a obi lobjectif qui est de dterminer la meilleure architecture possible et le meilleur jeu de poids au sens dun critre donn tout en conservant les capacits de gnralisation du rseau. Nous avons pour ce faire adopt une procdure itrative qui permet daugmenter progressivement le nombre de neurones dans la couche cache jusqu obtention de la prcision voulue, tout en maintenant la capacit de gnralisation du rseau et en arrtant la procdure dapprentissage, lorsque les valeurs des poids conduisaient des performances moins bonnes en test. Le test du rseau ainsi obtenu, sur des donnes exprimentales provenant des historiques de la station a dmontr l'efficacit de cette approche [HERNANDEZ et LE LANN, 2006]. La comparaison des rsultats obtenus par ce rseau avec ceux issus dune rgression linaire a dmontr que le choix dun RNA au lieu dune rgression linaire tait amplement justifi. Dailleurs, le capteur logiciel est bien adapt diffrentes variations de la qualit de leau brute (cas de fortes variations de la turbidit). Cette tude permettra terme de remplacer les dosages manuels effectus par loprateur de la station SMAPA. Il faut cependant noter, que la confirmation dfinitive de cette approche pourra tre obtenue quau terme dune validation sur site, sur une priode suffisamment longue. Dans les chapitres suivants, nous allons propos dtablir une mthodologie de diagnostic base sur linterprtation des informations obtenues sur tout lensemble du procd de production deau potable en y incluant la valeur de la dose de coagulant calcule par le capteur logiciel prsent prcdemment.
4.1
Introduction
La maintenance prventive des usines industrielles et des ressources de
production exige une surveillance et une localisation des dfaillances afin de prvoir et doptimiser un arrt de production d un dfaut critique. Plusieurs mthodes de diagnostic permettent de rsoudre ce problme de dtection et d'isolement. Certaines d'entre elles sont bien adaptes un type de processus et d'autres sont inadaptes. Un systme de surveillance doit permettre de rendre compte de ltat dun procd tout moment. Notre objectif principal est de dvelopper une mthode de diagnostic partir des donnes historiques et des donnes enregistres en ligne lors de lexploitation du procd. Cette mthode doit tre capable didentifier des situations anormales issues des dysfonctionnements et de dtecter des besoins de maintenance, pour aider loprateur de la station dans sa prise de dcisions. Cest--dire, quelle doit permettre didentifier clairement, les dfaillances du processus surveill en diminuant le nombre de fausses alarmes et prdire la maintenance des diffrentes units de la station de production de leau potable. Pour assurer cette fonction, il est vident que lon doit disposer dun certain nombre dinformations sur le systme dont on assure le fonctionnement.
82
Dans la premire partie de ce chapitre, nous prsentons la description de la mthodologie de diagnostic qui se compose de trois parties : le prtraitement des donnes, ltablissement du modle de comportement hors ligne et le diagnostic en ligne. Ensuite, nous dcrivons une stratgie pour la validation des transitions des diffrents tats du modle propos.
4.2
proposons. Elle est base sur lanalyse dinformations disponibles issues des capteurs quipant le processus de production deau potable. Cette mthode est base sur lanalyse de donnes historiques et renferme
quatre tapes diffrentes : deux tapes hors ligne dans lesquelles les donnes sont prtraites et analyses pour lobtention du modle comportemental de la station SMAPA, une troisime tape est lanalyse du comportement du processus obtenu o les donnes en ligne sont utilises pour dterminer ltat courant attendu. La dernire tape est celle consacre la validation des transitions entre tats fonctionnels. Une stratgie a t dveloppe partir de lanalyse des Degrs dAdquation Globale (DAGs) issus de lapprentissage et de la reconnaissance permettant de valider ces transitions. Dans la suite, nous prsentons une description dtaille de chaque tape.
83
Ajustement du seuil
Reconnaissance
Donnes en ligne
84
Lanalyse des donnes par labstraction vise extraire des informations significatives partir des donnes issues dun procd quelconque qui seront ensuite utilises dans diffrentes tches telles que supervision et diagnostic. Cette abstraction est base sur le concept de la fentre glissante comme un lment de base des diffrents analyseurs de signaux. Nous avons utilis deux techniques pour le prtraitement des donnes issues de travaux effectus au sein du groupe DISCO du LAAS-CNRS, le filtrage et lhistogramme [SARRATE,2002]. Ces analyseurs sont prsents comme des blocs SIMULINK de MATLAB [MATLAB,2001] rassembls dans une librairie nomme ABSALON. Avant dexpliquer sous forme dtaille ces analyseurs, revenons sur le concept de fentre glissante, laquelle ralise la tche dabstraction dinformation.
4.2.1.1
Le concept est bas sur la gnration dune base pour lanalyse du signal chantillonn dans le but dextraire des informations utiles. La base dchantillonnage temporelle sexprime normalement par la formule suivante :
t (i ) = t 0 + iT
avec T : priode dchantillonnage t0 : linstant initial t(i) : linstant de mesure Sous forme matricielle :
(4.1)
t (i ) = (1
t i ) 0 T
(4.2)
= {t (i ) t (i ) = t 0 + iT }
Dfinition 1 : Gnrateur de fentre [SARRATE,2000] Un gnrateur de fentre GENFEN est un quadruplet :
GENFEN = (S E , F , , f )
avec SE : le signal dentre du gnrateur de fentre
(4.4)
85
F : lunivers de la fentre : paramtres caractrisant la fentre : fonction de renvoi des donnes de la fentre Tel que :
a f : S E +1 F
F ( j ) = f ( E (i ),K, E (i a )) F ( j ) = { E (i a ),K, E (i )}
avec : (4.5)
t E (i ) :
t F ( j ) = t F 0 + jTF = (1
avec :
t j ) F 0 T F
(4.6)
t F = t E 0 + aTE TF = dTE
(4.7)
Ce modle est reprsent comme un bloc S-FUNCTION de SIMULINK dans la librairie ABSALON (Figure 4.2):
86
SE
TE
GENFEN
TF
(b)
(a)
ANAFEN = (S S , F , , )
Tel que :
avec :
: F m S v S ( j ) = (F ( j ), (w1 , K , wm ))
v S ( j ) : lamplitude de la jme donne de sortie de la jme fentre,
(4.8)
La figure 4.3 montre lvolution des variables dans une fentre temporelle dobservation. Cette fentre permet l'valuation des situations effectues par un oprateur dans un systme de visualisation. Un signal physique peut montrer des zones interdites, des zones souhaites, et n'importe quelle autre zone laquelle une signification peut tre attribue. L'valuation se ralise dans la fentre dobservation. L'exemple illustre les trois zones suivantes : acceptable, satisfaction et conflit. L'histogramme est construit de sorte qu'il constitue une des bases de l'interprtation.
87
Dominance Mode
4.2.1.3
Filtrage
La conversion du signal analogique en un signal numrique fait intervenir deux oprations : lchantillonnage du signal, cest--dire le prlvement de sa valeur intervalles rguliers, et sa discrtisation, cest--dire sa reprsentation par un nombre. Que le rgulateur envisag soit de type discret ou continu, le modle de comportement va tre calcul sous forme discrte. Le choix de la priode dchantillonnage dacquisition doit donc tre fait de faon ce que le signal chantillonn donne une reprsentation correcte du signal continu. Pour ce faire, la priode dchantillonnage Te doit respecter la condition de Shannon [FLAUS,1994] :
Te =
o
1 2 f max
4.9
fmax est la frquence maximale contenue dans le signal. Pour satisfaire ce critre, il
fmax
Soit dacqurir les signaux avec une frquence multiple de la frquence dchantillonnage
88
chantillonnage Ta
chantillonnage Te=k.Ta
Mesure
Filtre analogique
Filtre numrique
Mesure discretise
En gnral, avec les automates et les systmes de conduite actuels, la seconde solution est la plus facile mettre en uvre car leur temps de cycle est nettement infrieur aux constantes de temps des divers signaux rencontrs sur le procd. Par contre, une telle approche gnre un nombre de points important. Nous verrons dans la suite comment rduire ce nombre en ralisant un filtrage numrique du signal. Le filtrage des donnes consiste sassurer que la condition de Shannon est
respecte une frquence plus faible. Si Te est la nouvelle priode dchantillonnage, que nous prendrons gale un multiple de la priode dacquisition pour simplifier Te =m Ta, le filtrage doit liminer toutes les frquences suprieures Te. Les donnes tant sous forme numrique, ce filtre ne peut tre que numrique. Le plus souvent cest un filtrage du premier ordre du type :
x f (k ) = x f (k 1) + (1 ) x(k )
4.10
Le filtrage est dautant plus fort que le coefficient est proche de 1. On peut aussi prendre une moyenne glissante sur m termes :
x f (k ) =
4.11
Cette seconde approche donne des rsultats corrects ds que m est suprieur ou gal 4. Pour choisir la constant de temps
du
comme frquence de coupure (attnuation de -3 dB, cest--dire un gain de 0,7) la valeur suivante :
f 1 f f c = 1 e = e 3 2 2
o le coefficient
4.12
=e
Dans le cas o m=5,
Ta
=e
2Ta f c
=e
Ta f e
=e
4.13
=0,3, on a =0,8819.
89
faire la reconnaissance partir des donnes disponibles en ligne. Ainsi, il ne dfinit pas a priori ces tats pour la reconnaissance, ce qui implique une perte importante dinformation. Lexpert considre quun tat fonctionnel peut tre identifi partir des variables en ligne, mais la mthode nest pas capable de lidentifier partir des signaux disponibles en ligne. Alors, des tats fonctionnels imposs non reconnaissables introduiront des erreurs de classification importantes dans lapprentissage supervis. Lexpert ne peut pas identifier les tats fonctionnels de manire prcise, pour les inclure dans la surveillance. Les spcialistes de production deau potable sont principalement intresss par lvolution des variables de la qualit de leau, qui peuvent aussi tre mesures hors ligne au moyen d'analyse de prlvements. Ainsi, la dtermination des tats fonctionnels, qui peuvent tre dtects partir des variables denvironnement, peut constituer aussi une tape de dcouverte pour les experts de leau. A titre illustratif, dans le comportement du pH de leau, lentre du processus, les spcialistes formulent des rgles expertes qui, thoriquement, reconnaissent ltat fonctionnel qui correspond des besoins en quantits importantes de coagulant pour des valeurs du pH suprieures 8.3. Nanmoins, ces rgles ne prennent pas en compte dautres phnomnes en mesure de changer le comportement du signal sans aucune influence sur ltat fonctionnel, tel que lajout dacide sulfurique pour prtraiter leau et baisser la valeur du pH et ainsi effectuer plus efficacement le processus de coagulation avec moins de coagulant. Ce raisonnement amne lexpert dterminer, par ses
90
connaissances thoriques du procd, des tats qui ne sont pas reconnaissables en ligne partir des signaux disponibles et des abstracteurs dvelopps. La seule analyse des enregistrements de fonctionnements passs, afin de dterminer les tats fonctionnels, reprsente en elle-mme une problmatique de production deau potable par le biais de la classification par apprentissage non supervis. En gnral, les techniques dacquisition de connaissances expertes nincluent la dcouverte de nouvelles relations que comme une tape antrieure danalyse. Ceci est d principalement au fait que les mthodes de formalisation ne prvoient gnralement pas la cration de nouveaux liens entre connaissances modlises. En outre, la dcouverte de nouvelles relations dpend aussi de la reconnaissance humaine de phnomnes jusqualors inattendus. Ces dcouvertes doivent tre valides, puisquun expert unique a typiquement une perception restreinte du systme analys. Afin de rduire le biais et limprcision de cette nouvelle connaissance, celle-ci doit tre
4.2.2.1
Choix du contexte
Il sagit du choix de lintervalle de fonctionnement du processus, trs souvent fait par lexpert. Dans le cas de la mthode de classification LAMDA, ce contexte est dfinie par : Les valeurs minimale et maximale pour la normalisation des descripteurs quantitatifs et, Toutes les modalits pour chacun des descripteurs qualitatifs.
4.2.2.2
Modes dapprentissage
La classification LAMDA peut raliser trois diffrents modes dapprentissage selon la sparation de lensemble des observations utiliser pour lapprentissage. Lapprentissage supervis. Il est impos par lexpert, qui connat a priori les modles rels de fonctionnement contenus dans lensemble dapprentissage. En effet, lexpert tiquette les observations qui daprs lui, reprsentent le mieux les diffrentes situations. Lapprentissage non supervis, nomm auto-apprentissage, il nest pas toujours possible de disposer des connaissances a priori sur les caractristiques de fonctionnement et lexpert ne peut pas affecter chaque observation une situation. Il consiste crer, partir des informations contenues dans un ensemble de donnes, des classes ou groupes de classes caractrisant les diffrents modes de fonctionnement.
91
Lapprentissage supervis-actif, o lexpert na pas besoin dtiqueter toutes les observations de lensemble dapprentissage. Il peut laisser des lments sans classe soit parce (a) quil considre que certains ne sont pas assez reprsentatifs, ou (b) quil ne possde pas les connaissances pour dterminer si ces lments correspondent un type de comportement. Ainsi, lalgorithme dapprentissage peut effectuer une premire classification pour obtenir les paramtres des classes. Postrieurement, les observations qui nont pas t attribues une classe seront utilises, soit pour faire voluer les classes existantes, soit pour en crer de nouvelles.
4.2.2.3
La mthode de classification LAMDA considre trois paramtres rgler : La fonction dadquation marginale pour les descripteurs quantitatifs
Les connectifs mixtes dassociation pour lagrgation des contributions de chaque descripteur et Lindice dexigence, pour rendre plus ou moins stricte lattribution dun individu une classe.
4.2.2.4
Lexpert laide des donnes qui sont disponibles hors ligne, associe des classes des tats fonctionnels. Dans cette opration, trois situations sont possibles : Une classe est quivalente un tat fonctionnel Un groupe de classes est quivalent un tat fonctionnel Une classe nest quivalente aucun tat fonctionnel Il est possible dobtenir deux situations qui sont diffrentes par leur donnes mais avec la mme signification.
92
nouvelles situations. Pour cela, deux principes dapprentissage sont prvus : un apprentissage hors ligne (modle du comportement du procd) et une reconnaissance en ligne. La reconnaissance en ligne permet de dtecter en continu un dfaut en se basant sur le modle de comportement, afin de dtecter, localiser et identifier une dfaillance. La figure 4.5 montre le diagramme de blocs associ au diagnostic en ligne.
En ligne
Processus
LAMDA Reconnaissance
Modle de comportement
Nous avons divis la phase de diagnostic en trois parties : lespace de mesure, lespace de reconnaissance et lespace de diagnostic. Lespace de mesure est lensemble des descripteurs de leau potable slectionns lentre du systme de diagnostic en ligne. Lespace de reconnaissance consiste dterminer dans quel tat fonctionnel se trouve le procd lorsquune nouvelle observation est prsente et il est bas sur le modle de comportement construit hors ligne. Lespace de diagnostic explique le type de dfaillance qui a caus le dfaut sur le procd. Si un nouveau dfaut dtect arrive, alors il faut actualiser le modle de comportement, en ajoutant une nouvelle classe qui reprsente cette dfaillance. Il est possible que, des oprations anormales dans un procd naient pas t dtectes, cause dun manque de descripteurs pour en faire le diagnostic. Ceci veut dire que, le systme de diagnostic nest pas capable de dtecter le dfaut (il confond ce dfaut avec lopration normale du procd) mais que la dtection a t ralise par loprateur. Dans ce cas, il faut crer une nouvelle classe qui reprsente le dfaut non dtect. Le plus important dans lidentification dun nouveau dfaut est de ne pas le confondre avec un autre dysfonctionnement connu. Dans le cas dune confusion, il faut refaire la conception du modle en modifiant les paramtres du systme de diagnostic.
93
pralablement t associ avec un tat fonctionnel du systme. Cest pourquoi dans la phase dexploitation, il sagit de dcider chaque instant de mesure quel est ltat de fonctionnement. Cette dcision est particulirement dlicate prendre lors des transitions, c'est--dire lorsquil y a un changement dans la classe laquelle lensemble des mesures (individu classer) est attribu. Nous prsentons dans ce qui suit une mthode permettant la validation des transitions entre tats qui est base sur la mesure dinformation obtenue chaque instant du procd. partir des classes obtenues par un algorithme de classification floue, et dans l'tape de reconnaissance de donnes, nous proposons de valider le changement d'tat pour viter de fausses transitions ou des transitions des tats mal conditionns. Normalement, un individu est class dans l'tat pour lequel il a le plus grand degr dappartenance, mais on considre une dcision "mal conditionne" quand les degrs dappartenance toutes les classes sont semblables ou proches d'un niveau
d'incertitude. Dans ce cas la dcision n'est pas sre et on ne doit pas valider la transition. Pour tablir la certitude de la transition d'tat, nous proposons un indice de fiabilit qui a t inspir de la mesure d'information floue (entropie floue). Le rsultat des techniques de classification du type flou fournit des degrs dappartenance de lindividu analys chaque classe. Dans la plupart des algorithmes la dcision de classement est obtenue par la recherche de la classe pour laquelle lindividu prsente le maximum dappartenance, ou dadquation. En prsence dincertitudes causes par limprcision dans les mesures, ou par les possibles perturbations peu significatives du fonctionnement du procd, la transition dun tat lautre, peut avoir peu de justification relle. Dans ce cas, nous disons quil y a un mauvais conditionnement pour prendre la dcision de changement dtat. Cest pourquoi lintroduction dun critre de validation des transitions a t considre comme un apport important la surveillance effective des processus. Des travaux antrieurs remarquent limportance de valider les transitions dtat pour tablir un automate qui permette d'identifier ltat actuel du systme [KEMPOWSKY et al.,2006]. Toutefois lanalyse de la signification des transitions na pas t tudie en profondeur. Pour notre approche, nous avons considr que le critre essentiel associ une dcision est lvaluation de linformation qui a t ncessaire pour la prendre. Cest dans cette optique que nous avons cherch mesurer cette information. tant donn que nous sommes en prsence dune partition floue fournie par les degrs dadquation de chaque instant de fonctionnement (individu) toutes les classes, nous pouvons chercher analyser linformation instantane sur laquelle une attribution est faite ;
94
alors la transition ne sera valide que dans les cas o cette information est considre comme suffisante. Gnralement, la quantit d'information est associe l'entropie des donnes. Dans le cas des ensembles flous, la formule de lentropie non probabiliste propose par De Luca et Termini [De LUCA et TERMINI,1972] a t largement utilise. Pour la validation des transitions, il est ncessaire d'utiliser l'information instantane de lindividu qui a produit le changement d'tat. Par consquent l'analyse est base sur l'ensemble (vecteur) des degrs dappartenance de cet individu chaque classe. Le vecteur des degrs dappartenance peut tre considr comme un ensemble flou. Si pour la validation des transitions base sur la quantit dinformation, on utilise une mesure classique dentropie floue [De LUCA et TERMINI,1972 ; SHANNON,1948], la dcision est considre bien conditionne quand la quantit dinformation est grande. Toutefois, une dcision qui a t prise avec de faibles valeurs de degrs dappartenance donne une valeur importante de l'information. C'est pourquoi nous proposons dutiliser un indice de dcision qui est bas sur l'entropie de De Luca et Termini [De LUCA et TERMINI,1972]. Cet indice permet de mesurer linformation instantane qui a provoqu le changement dtat et permet de tenir compte du rapport entre les faibles degrs dappartenance et lincertitude sur la dcision.
4.2.4.1
Indice de dcision
Indices de degr de flou (fuzziness)
Les fonctions dentropie non probabilistes reprsentent le degr de flou d'un ensemble flou discret () vis--vis des lments qui le composent [De LUCA et TERMINI,1972 ; TRILLAS et ALSINA, 1979 ; TRILLAS et RIERA, 1978]. faite en fonction des degrs dappartenance (xi) de chaque lment (xi). Daprs lapproche propose par De Luca et Termini, les fonctions entropie floue H Lanalyse est
()
H ( ) = 0 ( xi ) {0,1}
i
: max H ( )
( xi ) =
(4.14)
P3 : La relation d'ordre
ensemble flou est considr comme plus "aigu" (sharp) que lensemble flou si :
95
x E
(4.15)
Les fonctions qui respectent ces axiomes peuvent tre exprimes par la formule gnrale :
C H ( ) = h wi T ( ( xi )) i
(4.16)
C correspond au nombre dindividus dans lunivers de discours (E) o est dfini lensemble flou . Selon [De LUCA et TERMINI,1972 ; PAL et BEZDEK, 1993] :
(i) wi +
tel-00136157, version 1 - 12 Mar 2007
et est
(4.17)
S ( ( xi )) = ( xi ) ln ( xi ) + (1 ( xi )) ln(1 ( xi ))
Alors l'expression de l'entropie de De Luca et Termini est donne par:
(4.18)
H DLT ( ) = K S ( ( xi ))
i
(4.19)
o K
De nombreuses tudes ont montr la validit de cette expression comme mesure de linformation floue [AL-SHARHAN et al.,2001]. Cependant, dautres familles de fonctions avec la mme forme de base que celle de De Luca et Termini peuvent tre utilises surtout dans le domaine de la prise de dcisions et la classification [De LUCA et TERMINI,1972 ; De LUCA et TERMINI,1974]. Elles sont toujours bases sur les axiomes prsents en (4.14) et sous la forme de lquation (4.16), o wi = K et la fonction T est donne par :
96
T ( ( xi )) = f ( ( xi )) + f (1 ( xi ))
Indice de validation pour la transition dtats
(4.20)
Le degr dappartenance d'un individu exprime son adquation une classe. En revanche, dans le cas dune prise de dcision entre plusieurs groupes ou classes, les degrs dappartenance expriment ladquation dun individu plusieurs classes. Dans le cas de la surveillance de systmes dynamiques, lindividu est reprsent par lensemble des variables qui dfinissent ltat actuel du systme et les classes sont les tats possibles. Ltat avec le degr dappartenance le plus grand est considr comme celui dans lequel le systme volue ce moment l. La fiabilit du choix de ltat linstant prsent est directement proportionnelle la capacit dlection parmi les degrs dappartenance.
Au contraire des indices de degr de flou (e.g. entropie floue), le problme qui nous concerne dans ce cas nest plus lanalyse dappartenance de plusieurs individus une classe, mais le choix entre plusieurs classes (tats) auxquelles un individu peut appartenir. Pour ceci, nous dfinissons un nouvel ensemble flou o lunivers de discours E est dfini par le nombre de classes C et les degrs dappartenance correspondent aux valeurs dappartenance de chaque individu chaque classe. Plus un ensemble est ordonn, plus il est informatif et alors son entropie est plus faible. Lensemble que nous considrons le plus informatif dans le cas d'un choix est celui qui assigne lindividu dans une classe avec le degr maximum dappartenance tandis que le degr dappartenance aux autres classes est nul. Par contre, lentropie de dcision de lensemble devient maximale si tous les degrs dappartenance sont gaux, en consquence, linformation fournie par lensemble sera alors nulle, vis vis de la fiabilit de la dcision. Dans ce contexte, comme indice de validation nous utilisons le complment de lentropie de la dcision propos dans [DIEZ et AGUILAR-MARTIN,2006] qui est bas sur lentropie floue de De Luca et Termini. Nous considrons toujours que le choix correspond au maximum d'appartenance, ou d'adquation, ainsi nous aurons M = max ( xi ) . Ensuite, les indices flous de dcision sont dfinis comme la diffrence entre cette valeur maximale et chacun des degrs dappartenance de lensemble (pour le cas de validation dtats ces valeurs correspondent aux degrs dappartenance de lindividu a chaque classe) :
97
i = M ( xi ) i M
[DIEZ et AGUILAR-MARTIN, 2006] reprsente par lquation (4.22):
(4.21)
H D ( ) = 1 I D ( )
correspond :
(4.22)
Linformation utile fournie par lensemble flou pour la prise de dcisions ID()
I D ( ) = K i e
i
( i )
o K =
1 C *M e
M
(4.23)
Cette entropie est base sur des axiomes qui suivent la philosophie de ceux proposs par De Luca et Termini et en relation avec lentropie floue comme indice de degr de flou. Ces axiomes sont les suivants : R1: H ( ) = 0 i R2: max H ( )
M ; ( xi ) = 0
(4.24)
i, j ; ( xi ) = ( x j )
R3: H ( ) H ( ) F La relation
laffectation un ensemble. Cet oprateur est dfini de faon similaire celle de loprateur de sharpeness ( S ) propos par De Luca et Termini. Une dcision base sur un ensemble non probabiliste flou est considre plus fiable quune autre base sur l'ensemble flou si l'indice de fiabilit de est plus grand que celle de .
FIA( ) FIA( )
(4.25)
FIA( ) = M + card [ ( )]
4.2.4.2 Mthode de validation des transitions
(4.26)
Lorsquune transition entre linstant t-1 et linstant t est propose par lalgorithme de reconnaissance, le systme analyse lindice dinformation du nouveau vecteur des appartenances de lindividu x(t ) , si celui-ci dpasse un certain niveau dincertitude la transition est valide. Dans le cas contraire, la transition est mise en attente, tant que lalgorithme de reconnaissance continue proposer la mme classe,
98
elle sera valide si un instant postrieur t+r la quantit dinformation est considre fiable. Comme mesure dinformation nous utilisons lindice dinformation ID() donn par l'quation 4.23. Il peut arriver, soit quune transition ne soit jamais valide et reste ignore du systme, soit quelle soit valide avec un retard r par rapport linstant o lalgorithme de reconnaissance lavait dtecte. Lintroduction de ce retard permet dliminer les effets de bruits ou perturbations qui fournissent une apparence de transition. Dans certains cas, on observe des oscillations entre deux classes qui sont uniquement causes par les imprcisions dans les mesures et ces oscillations seront alors limines de manire automatique, ainsi que les fausses alarmes. Niveau dIncertitude Il est ncessaire de dfinir une valeur dinformation instantane, qui permet de
considrer la dcision comme suffisamment fiable pour valider le changement dtat. Pour ceci nous constatons que, dans la mthode LAMDA [AGUILAR et LOPEZ,1982 ; KEMPOWSKY et al.,2006], linformation apporte par lattribution une des classes informatives, (diffrente de la classe de Non Information, NIC), est gale lincertitude de cette classe NIC, puisque lunion des classes informatives est exactement le complment de la classe NIC. La valeur dappartenance de nimporte quel individu la classe NIC est une constante fournie par lalgorithme qui joue le rle de valeur minimum dadquation. Il est donc naturel dutiliser comme niveau dincertitude donne par l'quation 4.27. la formule dinformation totale en incluant le degr dappartenance la classe NIC,
I NIC = K ( ( i ) e + ( NIC ) e
i i
NIC
) i M
(4.27)
o K =
1 C *M e
M
En analysant lquation 4.27, si la dcision de changement de classe a t prise avec un degr dappartenance significativement plus lev que le degr dappartenance minimal (NIC), le rapport entre 4.28 : les quantits dinformation correspond lquation
(4.28)
Pour prendre la dcision de validation nous avons ajout une marge de dcision .
99
Cette valeur permet de garantir linformation pour le changement dtat ID et le niveau dincertitude minimal de telle manire qu'on valide la transition uniquement si :
I NIC > I D +
conditionne.
(4.29)
Plus la marge de dcision est grande, plus la transition sera valide et mieux
Avec cette approche nous validons uniquement les transitions qui ont un degr dinformation suffisant par rapport linformation globale, en incluant la classe dadquation minimale, qui dans le cas de LAMDA correspond la NIC.
4.3
Conclusion
Dans ce chapitre, nous avons abord le prtraitement des donnes comme un
lment indispensable pour extraire les informations les plus reprsentatives au moyen de lanalyse du signal par labstraction dinformations significatives (ABSALON). Nous avons dvelopp une mthodologie base sur la technique de classification floue LAMDA, qui permet deffectuer la surveillance des procds de production deau potable, en utilisant une stratgie qui cherche modliser un certain type de raisonnement humain au moyen de donnes historiques du processus. Sachant que la connaissance experte est toujours ncessaire pour la construction du modle de rfrence, il faut apporter loprateur des moyens pour faciliter lanalyse et linterprtation des rsultats obtenus lors de lapprentissage au travers dune interphase graphique. Nous avons propos une mthode de validation des transitions qui permet de manire automatique, pendant ltape de reconnaissance, de ne pas tenir compte des classes mal conditionnes. Cette approche permet denlever les fausses alarmes ce qui amliore linterprtation des classes pour la surveillance. Un avantage de la mthode est que lanalyse de linformation se ralise uniquement par rapport aux degrs dappartenance instantans et ne demande pas une analyse des attributs des donnes elles mmes, ce qui dans de nombreux cas rduit considrablement la dimension des vecteurs en prsence. Dans le chapitre 5, nous allons mettre en place le systme de surveillance des procds de production deau potable bas sur la classification. Nous dtaillerons les lments prendre en compte et aussi nous rappellerons les prestations que doivent apporter les outils de supervision pour aider loprateur dans la prise de dcisions.
5.1
Introduction
Aprs avoir prsent la mthodologie gnrale pour la surveillance de la station
SMAPA de production deau potable, nous donnons les rsultats obtenus partir des descripteurs caractristiques de leau brute du diagnostic hors-ligne et en ligne. Pour obtenir ces rsultats nous avons appliqu la stratgie compose des quatre tapes diffrentes : le prtraitement des donnes, lanalyse du modle comportemental de la station sous forme dautomate, lanalyse avec des donnes en ligne et la validation des transitions. Dabord, nous prsentons les caractristiques gnrales de la station SMAPA de production deau potable. Nous exposons les aspects oprationnels par rapport la consommation de ractifs chimiques et la turbidit ainsi que le comportement saisonnier de la station (saison des pluies et saison dtiage) et ses caractristiques particulires en terme de maintenance et de ncessit de drivation du courant deau de certaines parties de la station. Ensuite, nous prsentons les rsultats obtenus grce la mthodologie dveloppe au cours de nos travaux concernant la surveillance des procds de production deau potable. Pour chaque saison, les rsultats obtenus dans
102
ltape dapprentissage hors ligne seront prsents. Nous allons illustrer la stratgie pour la validation des transitions et finalement nous prsentons la reconnaissance enligne qui permet de valider lensemble de la stratgie propose. Nous montrerons en particulier, comment des classes mal conditionnes sont dtectes et caractrises pour permettre la mise jour du modle de comportement.
5.2
mlangeur ; un systme de dosage de sulfate daluminium et polymre ; un systme de dosage du chlore (pr-chloration lentre des dcanteurs, chloration intermdiaire la sortie des dcanteurs et post-chloration lentre du rservoir de sortie) ; un canal de distribution vers les rservoirs de floculation ; 4 floculateurs ; 4 dcanteurs avec un systme dextraction des boues ; 12 filtres ; un canal collecteur et un rservoir de sortie.
ENTREE Temp Turbidit Couleur MatOrg SolTot pH Bic Chlorures DurTot DOSE COAG Grijalva Mlange
(Sulfate de Al)
Coagulant
Polymre
Chlore
Dcantation 4 dcanteurs
Entre
1 Coagulation Floculation 2 3
Mesure du dbit
Santo Domingo
Chlore
Filtration 12 filtres
Pompage
12
vers rservoir (nov-avril) AvF et ApF Temp Turbidit Couleur MatOrg Chlore rsiduel Nombre rtrolavages Stockage Dsinfection
Sortie
Distribution
Rseau
SORTIE Temp Turbidit Couleur MatOrg Chlore rsiduel SolTot pH Bic Chlorures DurTot
103
Pour la caractrisation de la station, la qualit et la quantit dinformation dont le responsable de la station dispose sont fondamentales. Lensemble des donnes sont des mesures qui sont obtenues par lanalyse de prlvements journaliers. Dans la base de donnes que nous utilisons dans cette tude, toutes les donnes ont t ramenes un chantillonnage journalier pour rendre homogne leur suivi.
Jan Fv Mars Avril Mai Juin Juill Aot Sept Oct Nov Dc
2000 2050 1600 1650 1350 40250 120540 83379 71265 91616 35150 29661 13550
2001 5950 2000 700 1550 21120 99910 112430 85010 80320 51250 11700 12000
2002 5440 800 4160 8050 5500 113263 148960 149910 150982 79275 37215 9550
2003 4800 3050 4400 2250 13500 213130 277480 182100 150134 95525 56330 17150
104
Milliers
Les annes o ont t utilises de plus grandes quantits de ractifs chimiques (par exemple, septembre 2003) concident avec les forts niveaux de turbidit. Lanne 2003 concide avec la prsence d'ouragans.
5.2.2.1
L'objectif principal de ces drivations est de maintenir une production d'eau en quantit constante pendant toute l'anne. Drivation de lentre vers les filtres Cette drivation explique le comportement qui peut paratre anormal lorsque la valeur de la turbidit avant les filtres est plus leve que celle l'entre du processus de potabilisation. Cette drivation concide avec une accumulation de boues dans les dcanteurs ce qui correspond la ncessit de travaux de maintenance sur ceux-ci. Tandis que dans les filtres il n'y a pas d'excs du nombre de rtrolavages, on peut donc effectuer cette drivation. Drivation des dcanteurs vers le rservoir de sortie Cette drivation est toujours normalement ouverte sauf si la dose de coagulant ajouter devient suprieure 250 mg/l. Drivation directe vers le rservoir de sortie Cette drivation de lentre est maintenue ouverte seulement durant la saison d'tiage, si l'eau est maintenue des valeurs de turbidit de 5 NTUs et des valeurs de
105
couleur de 20 u Pt-Co, permises par la norme ; ou bien lorsque certains dcanteurs se trouvent en maintenance.
5.2.2.2
Besoins de maintenance
Maintenance des dcanteurs
Le signal principal pour savoir quand la maintenance des dcanteurs est ncessaire est donn par les valeurs de la turbidit et les valeurs de la couleur l'entre qui dans ce cas sont infrieures celles en sortie des dcanteurs (avant les filtres). Ce comportement que lon pourrait qualifier danormal est d l'accumulation de boues dans des dcanteurs : en dautres termes leau sort plus sale quelle ne rentre !. Parfois la maintenance des dcanteurs peut tre avance lorsque le systme aspirateur de boues clarivacs ne fonctionne pas de faon adquate, cause de
laccumulation de solides pendant la saison des pluies. Quand ce systme aspirateur de boues se bloque, les boues s'accumulent et une partie des solides passe l'tape de filtration au lieu dtre vacue. La dure de la maintenance des dcanteurs est d'un mois approximativement et elle est effectue pendant la seconde quinzaine de fvrier et la premire quinzaine de mars de chaque anne. La maintenance des dcanteurs 2 et 3 (ceux du centre) seffectue simultanment, pour prserver la structure physique du dcanteur. Maintenance des filtres La programmation de la maintenance des filtres est effectue en considrant la frquence des rtrolavages de chacun. Par exemple, le filtre 1 ncessite un rtrolavage chaque deux jours, tandis que le filtre 7, au moins 5 rtrolavages par jour ; par consquent le filtre 7 demande au moins deux priodes de maintenance dans l'anne. Ces rtrolavages sont effectus de manire automatique et intgrs dans le fonctionnement des filtres (par mesure de la diffrence de pression entre-sortie). La priode de maintenance des filtres se situe juste avant la saison des pluies, afin que les filtres se trouvent dans les meilleures conditions de fonctionnement lors des fortes pluies. Pendant l'tiage, lextraction des solides est difficile effectuer car les valeurs de la turbidit sont faibles, et les ractifs (coagulant et polymre) sont ajouts en faibles proportions. Ce dosage doit tre prcis pour permettre la formation de flocs. Si on n'obtient pas une floculation adquate, il ny a plus assez de prcipitation dans ltape de sdimentation et ces solides arrivent jusqu'aux filtres en provoquant un accroissement de la frquence de rtrolavages, et par consquent, une diminution de la
106
production d'eau potable. Pendant la saison de pluies, la concentration de solides par unit de volume d'eau est plus leve. Dans ces conditions, la formation du floc est plus facile ; les flocs forms sont plus grands et plus lourds, et donc il existe une meilleure prcipitation dans l'tape de sdimentation. Ainsi, l'eau qui nourrit les filtres a une plus petite concentration de solides do une frquence de rtrolavages qui diminue cette priode.
20
20
10
10
0 0 30 60 90 120 150 180 210 240 270 300 330 360 jours
1000
Turb sortie (NTU)
4 3 2 1 0
500
0 0 30 60 90 120 150 180 210 240 270 300 330 360 jours
300 Couleur entre (u Pt-Co)
30
60
90
120 150 180 210 240 270 300 330 360 jours
200
100
0 0 30 60 90 120 150 180 210 240 270 300 330 360 jours
0 0 30 60 90 120 150 180 210 240 270 300 330 360 jours
8.25
8.25
7.75
7.75 0 30 60 90 120 150 180 210 240 270 300 330 360 jours
Figure 5. 3 Descripteurs de la qualit de leau brute ( lentre et la sortie) pour lanne 2001
107
De plus, nous disposons de la dose de coagulant optimale injecte sur lusine en continu. Cette dose de coagulant est dtermine par des essais jar-test effectus en laboratoire ( 1.3.3 b, Figure 1.4). Rappelons que dans le chapitre 3, nous avons montr le dveloppement du capteur logiciel permettant la dtermination automatique de la dose de coagulant. Nous donnons pour mmoire, sur la figure 5.4 la dose de coagulant applique et la dose de coagulant dtermine par le capteur logiciel.
40 Dose de coagulant (mg/L)
30
20
10
30
60
90
120
150
180
150
100
50
Figure 5. 4 Dose applique et dose calcule par le capteur logiciel pour la saison dtiage et la saison des pluies (anne 2000-2001)
Nous observons sur la figure 5.4 (pour ltiage), la diffrence d entre la dose applique et la dose calcule par le rseau de neurones. Elle reprsente une conomie sur la quantit de coagulant ajoute donc une conomie en terme de cot mais aussi en terme de respect de lenvironnement.
5.3
raison de la forte dpendance vis vis de la saison : la priode dtiage et la priode de pluie. Nous avons dvelopp la mthode pour la surveillance de la station SMAPA telle que dcrite dans le paragraphe 4.2 et montre sur la figure 4.1.
108
On dispose dun historique des donnes denviron 5 ans. Ce jeu de donnes couvre une priode refltant, dans une certaine mesure, les variations saisonnires de la qualit de leau brute. Dans la suite, nous prsentons lanalyse et linterprtation des rsultats. Ici, nous fournissons lexpert des outils visuels avec des informations utiles relatives la classification ralise. Lobjectif est de donner lexpert des moyens pour mieux exploiter les rsultats de la classification lors de linterprtation et la validation des classes.
5.3.1 Priode des pluies 5.3.1.1 Lapprentissage hors ligne et choix de descripteurs
diffrentes variables et avec laide de lexpert. Pour cette analyse on a accs quatre paramtres descripteurs de leau : la turbidit ( la sortie des filtres et lentre de la station), la dose de coagulant applique et le nombre de rtrolavages des filtres, la diffrence entre la mesure de la turbidit la sortie de la station et la turbidit la sortie des filtres et le pH. Nous avons pris comme descripteur, la diffrence entre les valeurs de la turbidit la sortie des filtres et celles la sortie de la station, pour connatre les situations la sortie de la station. Dans le cas o la valeur de cette diffrence est ngative ceci signifie une accumulation des boues la sortie de la station. La figure 5.5 montre lvolution des donnes dapprentissage, la turbidit dentre, la diffrence entre la turbidit de la sortie des filtres et la sortie de la station, le nombre de rtrolavages et le pH. Concernant le pH, comme le montre les figures 5.3 et 5.5, celui-ci volue beaucoup plus durant cette priode que dans le cas de ltiage. De plus, nous pouvons dtecter des caractristiques intressantes sur le fonctionnement de la station durant cette priode, comme la formation dalgues souvent rvle par laugmentation des valeurs de pH. Pour mettre en vidence cette caractristique, avec lexpert nous avons choisi dutiliser non pas la valeur brute du pH mais des valeurs qualitatives qui permettent de rendre compte des zones de fonctionnement. Cette valeur de pH a t prtraite au moyen de lutilisation de la mthode ABSALON ( 4.2.1).
109
1000
Turbidit (NTU)
750
500
250
0 0 30 60 90 jours
TurbDFS (Sortie-Aprs Filtrage) (NTU)
120
150
180
-2
jours
15
nombre de rtrolavages
10
8.5
8.25
pH (u pH)
7.75
Figure 5. 5 Ensemble des donnes brutes (saison des pluies, phase dapprentissage Mai-Octobre 2000)
110
Le type de prtraitement le mieux adapt a t lhistogramme (figure 5.6) avec trois modalits, pHBas, pHNormal et pHHaut. Les valeurs caractristiques sont : pHBas (pH < 7,5), pHNormal (7,5> pH <8,4) et pHHaut (ph >8,4).
Pour lanalyse de cette priode, nous avons donc utilis comme espace de reprsentation tableau 5.2.
Tableau 5.2 Lespace de reprsentation des donnes brutes ou prtraites (saison des pluies, phase dapprentissage 2000) Descripteur TurbE TurbDFS pH Type quantitatif quantitatif qualitatif Valeurs Min=0 Min=-2,5 Max=600 Max= 2,5
DoseApp Retrolavag
quantitatif quantitatif
Min=0 Min=0
Pour suivre la mthodologie prsente au chapitre prcdent, lidentification des tats fonctionnels de la station SMAPA prsents dans lensemble dapprentissage a t ralise laide dun auto-apprentissage, cest dire que le nombre de classes nest pas tabli a priori. Seule la classe NIC existe. La classification reprsente sur figure 5.7 (b) a t obtenue en utilisant la fonction binomiale (quation 2.7, 2.5.1.2) pour le calcul des adquations marginales (DAM). La famille des connectifs choisie pour obtenir ladquation globale (DAG) est le Minimum-Maximum avec un indice dexigence de
111
Alfa=0,9. A partir de ces paramtres, 5 classes ont t obtenues. Ces classes ont t interprtes laide du profil de classes de la figure 5.7 (c). Elles ont t associes aux 5 situations prsentes dans le tableau 5.3. Il y a 2 classes qui correspondent au fonctionnement normal et trois classes dalarme (Algae pH-, turbidit haute, augmentation des rtrolavages).
DoseApp
Rtrolav
TurbE OCT
(a)
MAI
JUIN
Normale
(b)
pHN Descripteur pH avec 3 modalits: pHB -> pHBas ( <7,5 ) pHN -> pHNormale ( 7,5 > pH < 8,4 ) pHH -> pHHaut ( pH > 8,4 )
DoseApp Rtrolav
pHB
TurbE TurbDFS
pHN
pHH
pHN
pHN
pH Bas
pH Haut
(c)
Figure 5. 7 (a)Lensemble des donnes prtraites (saison des pluies, phase dapprentissage Mai-Octobre2000), (b) classification pour lidentification des tats de la station SMAPA lors de la saison des pluies (autoapprentissage), (c) Profil des classes
112
SITUATION
DESCRIPTION
CLASSE
Nous avons la prsence de pluie modre ou il ny a pas de pluie. Les valeurs des descripteurs se trouvent dans des zones normales de fonctionnement de la station Si le pH diminue ceci signifie une diminution du dosage. Il sagit dune situation dsirable pour la station Valeurs maximales de la turbidit. Si la turbidit est suprieure 1500 NTU nous avons la prsence douragans Des valeurs maximales du pH provoquent la prolifration des algues. Augmentation des rtrolavages des filtres cause de laugmentation des particules pendant la saison des pluies
C1
C2 C3
C4 C5
5.3.2 Priode dtiage 5.3.2.1 Lapprentissage hors ligne et choix des descripteurs
Pour lanalyse du fonctionnement de la station, on a accs trois paramtres descripteurs de leau : la turbidit ( lentre et la sortie des dcanteurs, avant les filtres), la dose de coagulant applique et le nombre de rtrolavages des filtres. On remarque que la turbidit et la dose sont fortement dpendantes de la saison. On voit ici tout lintrt de disposer dau moins un an darchives de donnes pour dterminer un modle de comportement fiable. Nous avons pris comme descripteur, la diffrence entre les valeurs de la turbidit lentre de la station et celles la sortie des dcanteurs. Dans le cas o la valeur de cette diffrence est ngative ceci signifie quil y a une accumulation de boues avant les filtres. Nous pouvons dtecter des aspects de fonctionnement intressants dans cette partie, comme laugmentation de travail des filtres ou la maintenance des dcanteurs. Contrairement la priode des pluies, le pH nest plus utilis comme descripteur, car comme le montre la figure 5.3 il varie trs peu en priode dtiage. La figure 5.8 montre lvolution des donnes qui seront utilises comme base dapprentissage pour la classification : la turbidit, la diffrence de la turbidit lentre et avant les filtres, la dose de coagulant et le nombre de rtrolavages. Ces donnes sur la qualit de leau brute sur la priode de novembre 2000 avril 2001, reprsentent une anne typique de fonctionnement de la station. Cette priode est reprsentative par ses valeurs et peut donc tre considre pour dvelopper ltude.
113
15
Turbidit (NTU)
10
0 0 30 60 90 jours
10
TurbEAF (Entre-Avant Filtrage)
120
150
180
-10 jours
30
Nombre rtrolavages
20
10
Figure 5. 8 Ensemble des donnes brutes (priode dtiage, phase dapprentissage NovDec2000-JanAvril2001)
Avant dappliquer la mthode de classification LAMDA, en utilisant le logiciel SALSA, aux donnes dapprentissage de la priode dtiage 2000-2001, les donnes peuvent tre remplaces par des donnes prtraites au moyen de lutilisation de la mthode ABSALON ( 4.2.1) [HERNANDEZ et LE LANN, 2004]. Le type de prtraitement le mieux adapt a t le filtrage de type passe-bas Butterworth dordre 2, afin dliminer toutes les variations de type hautes frquences. Pour lanalyse de cette priode, nous avons utilis comme espace de reprsentation les descripteurs et les valeurs pour la normalisation donns sur le tableau 5.4. La figure 5.9 (a), prsente lensemble des donnes pour lapprentissage utilises pour lidentification du modle de comportement de la station SMAPA.
114
Tableau 5.4 Lespace de reprsentation des donnes brutes prtraites (priode dtiage, phase dapprentissage 2000-2001) Descripteur Type Valeurs Maximale Minimale 15 5 33 15
0
-5 5 0
DoseApp
TurbE Retrolav
TurbEAF
(a)
(c)
Figure 5. 9 (a)Lensemble des donnes brutes prtraites (priode dtiage, phase dapprentissage NovDec2000-JanMiFev2001), (b) classification pour lidentification des tats de la priode dtiage de la station SMAPA (autoapprentissage), (c) Profil des classes
(b)
115
Comme prcdemment, pour lidentification des tats fonctionnels de la station SMAPA prsents dans lensemble dapprentissage, nous avons ralis un autoapprentissage. La classification reprsente sur figure 5.9 (b) a t obtenue en utilisant les mmes fonctions et valeurs de paramtres que celles utilises pour la saison des pluies cest--dire la fonction binomiale (quation 2.7, 2.5.1.2) pour le calcul des adquations marginales (DAM) et le Minimum-Maximum avec un indice dexigence de Alfa=0,9 pour le calcul de ladquation globale (DAG). A partir de ces paramtres, 6 classes ont t obtenues. Ces classes ont t interprtes par lexpert selon ses connaissances et laide du profil de classes de la figure 5.9 (c). Elles ont t associes aux 5 situations prsentes dans le tableau 5.5. Il y a 2 classes qui correspondent au fonctionnement normal, une classe dalarme et deux classes de mauvais fonctionnement (boue haut, et tape critique). Lobjectif est dtablir une alarme pour pouvoir effectuer la maintenance du systme de manire prventive et dviter les tats de mauvais fonctionnement. La classe 6 nest pas associe a priori avec un tat du systme.
Tableau 5.5 Description des situations durant la priode dtiage
SITUATION
DESCRIPTION
CLASSE
(fin
Les valeurs des variables suivent les conditions normales stables typiques la fin de la saison des pluies Les valeurs correspondent la saison sans pluie. Il ny a aucune drivation de leau brute. Les variables sont stables avec des valeurs normales dopration. Laccumulation de boues commence augmenter ainsi que le nombre de rtrolavages des filtres. Cette alarme indique la priode conseille pour la maintenance des dcanteurs. Cet tat correspond des quantits importantes de boues et des valeurs du nombre de rtrolavages des filtres trs leves symptomatiques dun dfaut de maintenance des dcanteurs. Il existe une dcanteurs. accumulation de boues dans les
C1
C2
C3
Critique
C4
Boue Haut
C5 C6
Cette classe nest pas associe priori avec une situation du systme. La validation des transitions montrera que cette classe est mal conditionne.
Selon lvolution des DAGs reprsents sur la figure 5.10 et en considrant la matrice de transition, lautomate de la figure 5.11 a t construit.
116
C4 NIC C2 C1 C6 C5
C3
C1
C2
C3
C4
C5
C6
Une fois le modle construit, le suivi des diffrentes situations attendues, peut tre ralis. Ce suivi est identifi comme tant la phase de reconnaissance, qui vise associer toute nouvelle observation lune des classes dtermine au pralable.
5.3.2.2
Pour valider les classes et dterminer les transitions qui sont mal conditionnes nous avons appliqu la mthode que nous avons propose au 4.2.4.2 sur la validation des transitions. Pour mettre en uvre cette mthode, il convient de choisir une valeur de seuil. Ce choix a t effectu la suite de diffrents tests. Comme il sera montr plus tard, cette valeur est reprsentative du systme et non pas a priori de la base dapprentissage. Cette valeur de seuil est =0.0018 et permet d'invalider la classe 6. Le rsultat de la validation des transitions correspond la Figure 5.12. On peut observer que toutes les autres transitions sont parfaitement valides.
117
Figure 5. 12 Validation des transitions obtenues lors de la phase dapprentissage (ltiage 20002001)
Phase de test Pour la reconnaissance, nous avons utilis le modle de comportement obtenu avec lensemble des donnes dapprentissage. On a appliqu deux jeux de donnes de test, correspondants deux priodes dtiage diffrentes : (a) lensemble des donnes pour la saison dtiage 2001-2002 et (b) lensemble des donnes pour la saison dtiage 2003-2004. (a) Lensemble des donnes de test pour la saison dtiage 2001-2002 Cette validation seffectue comme dans le cas dun fonctionnement en-ligne : les donnes sont traites de manire squentielle au fur et mesure quelles se prsentent. Sur la figure 5.13 (a et b), nous observons les volutions des variables et des classes pour cette priode au fur et mesure que des observations sont traites. Cette figure prsente les classes lors de la reconnaissance et la situation dalarme quindique la ncessit de maintenance des filtres de la station SMAPA. La figure 5.14 montre la validation des transitions correspondantes cette priode. La classe 6 a t invalide. Cette classe est considre comme mal conditionne. On peut observer que les autres transitions sont parfaitement valides. (b) Lensemble des donnes de test pour la saison dtiage 2003-2004 La validation a t effectue de la mme manire que celle effectue pour la priode 2001-2002. Nous observons les volutions des variables et des classes reconnues pour cette priode sur la figure 5.15 (a et b). De la mme faon que prcdemment, on peut voir sur cette figure la reconnaissance de lalarme qui indique la ncessit de maintenance des filtres. Comme prcdemment, nous avons reconnu et valid les tats du systme et ce qui est important sans modification de la valeur du
118
paramtre de la mthode de validation (figure 5.16). Ici aussi, la classe 6 a t invalide car elle est considre comme mal conditionne. Les autres classes sont en revanche valides.
DoseApp
(b)
Figure 5. 13 Identification en ligne des tats de la station SMAPA lors de la priode dtiage 2001-2002. (a) Ensemble de test. (b) Classes identifies lors de la reconnaissance (alarme dtecte)
119
DoseApp
TurbE
Retrolav TurbEAF
(b)
Figure 5. 15 Identification en ligne des tats de la station SMAPA lors de la priode dtiage 2003-2004. (a) Ensemble de test. (b) Classes identifies lors de la reconnaissance (alarme dtecte)
Figure 5. 16 Validation des transitions pour la priode dtiage 2003-2004 Aprs ltape de validation des transitions, lautomate qui sera utilis lors de la phase de reconnaissance est donc celui prsent sur la figure 5.17.
120
C1
C2
C3
C4
C5
Figure 5. 17 Lautomate pour la station SMAPA durant ltiage aprs validation des transitions
5.3.2.3
Pour la reconnaissance en ligne, nous avons utilis le modle de rfrence obtenu avec lensemble des donnes pour la priode dtiage 2000-2001 et avec la validation des transitions montre dans le paragraphe 5.3.1.2. La figure 5.18 montre les rsultats de la reconnaissance des donnes de test pour les deux priodes 2001-
2002 et 2003-2004. Dans les deux cas, nous pouvons observer que la classe 6 nest pas prsente et que toutes les autres ont t correctement identifies. Donc, la procdure de validation des transitions a bien jou son rle en invalidant la transition mal conditionne et en conservant les autres.
boue
Individuals
(a)
boue
Individuals
(b)
Figure 5. 18 Reconnaissance en ligne des donnes de test : (a) pour la priode dtiage 2001-2002, (b) pour la priode dtiage 2003-2004. Revenons sur lalarme qui indique un besoin de maintenance des dcanteurs. Si on compare le dbut de lalarme et la date planifie par la station pour cette
121
maintenance, il savre que cette alarme intervient trs tt. En effet, pour la priode dtiage 2000-2001, cette alarme se dclenche 87 jours avant la date planifie. Un cart encore plus grand peut tre observ pour les annes de tests : 115 jours pour la priode 2001-2002 et 100 jours pour la priode 2003-2004. Il apparat donc trs important de disposer de cette alarme pour permettre deffectuer une maintenance prventive et non plus planifie. Il est en effet possible de faire de telles maintenances car la priode dalarme est longue et on peut donc prendre la dcision de by-passer la totalit ou une partie des dcanteurs trs tt.
5.4
Conclusion
Dans ce chapitre nous avons prsent la mise en uvre de la mthodologie
base sur la technique de classification LAMDA permettant de dterminer les tats fonctionnels de la station de production deau potable et de construire un automate
caractrisant le fonctionnement de ce procd. Nous avons appliqu la mthode propose une base de donnes issue des historiques dopration de la station de production deau potable de Tuxtla au Mexique. Cette base de donnes est reprsentative du fonctionnement de ce type de station puisquelle couvre 4 annes dopration et prsente des variations importantes des diffrentes variables mais aussi imprcises lies aux mthodes analytiques de mesure. Nous avons choisi de concevoir deux modles de comportement suivant la saison de fonctionnement. Le comportement de la station est en effet trs diffrent suivant ces deux saisons: la saison de pluie et ltiage. Dans chaque cas, nous avons conu le modle de comportement en partant dun apprentissage hors ligne non-supervis. Il est noter que les mmes fonctions et paramtres de la mthode de classification ont t utiliss dans les deux cas. Pour la saison des pluies nous avons identifi les diffrents comportements de la station selon les caractristiques de la qualit de leau brute (ex. comportement normal, dtection de la prsence dalgues, augmentation des rtrolavages et des niveaux de turbidit cause des pluies fortes). Cependant, ce nest pas au cours de cette priode que le systme est le plus intressant car les fortes variations des variables sont souvent caractristiques en elle-mme dun tat prcis de la station. Lutilisation dune mthode de classification nest pas dans ce cas pleinement justifie, condition bien sr de porter une attention accrue sur les bonnes variables. Concernant la priode dtiage, les rsultats sont plus intressants car ils nous ont permis de trouver le priode conseille pour la maintenance des dcanteurs afin dviter ltat critique de la station. Cet tat de fonctionnement doit tre dtect au plus
122
tt ; ceci participe la notion de maintenance prventive qui soppose la maintenance planifie telle quelle est opre aujourdhui sur cette station. La diffrence entre les dates de dbut dalarme et la date planifie est trs importante, de 87 115 jours. Les temps entre le dbut de lalarme et ltat dit critique de la station sont trs longs : on peut donc effectivement faire de la maintenance prventive car on a le temps de le faire en planifiant les oprations non plus de manire arbitraire mais en relation avec les observations recueillies sur lunit. Concernant cette priode de fonctionnement, nous avons aussi effectu la validation des transitions, et finalement la reconnaissance en ligne des situations apprises. Nous avons confirm que la mthode de validation des transitions diminue les effets de bruits ou de perturbations qui peuvent conduire une apparence de transition entre deux classes. Nous avons ainsi invalid deux classes mal conditionnes sur la priode dtiage (pour lapprentissage lors de lanne 2000 et pour la
CONCLUSION ET PERSPECTIVES
Dans notre travail nous avons propos un outil de supervision/diagnostic de lensemble dune station de production deau potable. Ces travaux ont t bass sur lexploitation des donnes acquises sur le systme surveill. Cette stratgie suppose deux tapes : la premire consiste dans le dveloppement dun capteur logiciel bas sur un rseau de neurones permettant de prdire en ligne la dose de coagulant, sur la base des caractristiques mesures de leau brute. La deuxime tape consiste laborer un modle de rfrence des tats fonctionnels, partir dun apprentissage hors ligne. Cet apprentissage utilise des donnes historiques et, grce un dialogue avec les experts et les oprateurs, un ajustement des paramtres du classificateur pour fournir la meilleure reprsentation a t possible. Ensuite, lidentification en ligne, au moyen de la reconnaissance des tats de fonctionnement connus, doit fournir limage la plus informative et la mieux comprhensible par les oprateurs du fonctionnement de la station. La mthodologie que nous avons adopte pour dvelopper le capteur logiciel a permis la construction dun modle capable de prdire en temps rel la dose optimale de coagulant partir dun ensemble de paramtres descripteurs de la qualit de leau brute (turbidit, pH, temprature, etc.). Devant le manque de modle de connaissance permettant de traduire le fonctionnement de ltape de coagulation, et la non-linarit de la fonction modliser, notre choix sest porte sur des RNAs (rseau de neurones artificiels). La dtermination de larchitecture du rseau a t effectue en faisant appel
124
Conclusion et perspectives
lanalyse en composantes principales pour dterminer les entres pertinentes de ce rseau tout en limitant leur nombre et donc la complexit du rseau rsultant. Dans une deuxime phase nous avons adopt une procdure itrative pour dterminer le nombre de neurones de la couche cache. Lavantage du systme propos, par rapport aux autres systmes existants, est sa robustesse. En effet, la stratgie itrative MSE/ME (erreur quadratique moyenne mean square error / erreur moyenne) pour dterminer larchitecture dun PMC (perceptron multicouche) permet de dterminer le nombre de neurones pour viter un sur-apprentissage qui dtriorerait les performances en gnralisation. Nous avons montr, dans ce mmoire, que les donnes du procd peuvent tre employes pour construire par apprentissage un capteur logiciel sous la forme dun RNA qui permet de prvoir prcisment la dose de coagulant en fonction des caractristiques physico-chimiques de leau brute. Les rsultats exprimentaux utilisant des donnes relles ont montr lefficacit et la robustesse de cette approche. Une comparaison des rsultats obtenus avec ceux issus dune fonction linaire (issue de lACP) a montr tout lintrt du choix dun RNA. La validation sur site est en cours afin de finaliser le systme avant son dploiement grande chelle sur la station SMAPA de production deau potable au Mexique. Le systme se rvle dj trs utile comme outil daide la dcision pour les oprateurs. En particulier, cet outil peut tre utilis comme simulateur dessais de jar-test par loprateur. Nous avons propos lutilisation de lapprentissage automatique, partir de la mthode de classification floue LAMDA, comme base pour lidentification dun modle comportemental de la station de production deau potable adapt aux exigences de la supervision automatique. Cette mthode repose sur le concept de degr dappartenance dun objet aux classes existantes, qui remplace les critres classiques de distance. Elle se diffrencie dautres techniques par la notation de ladquation nulle et lincidente de celle-ci sur la classification. La mthode comporte deux oprations principales : le calcul du degr dadquation marginal (DAM) et le degr dadquation global (DAG). Le DAM est calcul partir dun choix parmi plusieurs fonctions dappartenance ayant des proprits spcifiques, et laide dune fonction dadquation paramtrable. La slectivit de lalgorithme peut tre module par le paramtre dexigence de cette fonction. Dailleurs, nous avons la possibilit de traiter squentiellement les donnes et de pouvoir mlanger des informations quantitatives et qualitatives. La reprsentation des fonctionnements laide de classes a t complte par la construction dune machine tats finis ou automate, partir de lestimation des fonctions de transition. Cet automate peut tre utilis pour le suivi des tats fonctionnels connus, ainsi que pour la dtection des dfaillances et pour la dtection de
Conclusion et perspectives
125
ncessites de maintenance des diffrentes units de la station de production deau potable. Nous avons dvelopp une mthode de validation des transitions qui permet de manire automatique, pendant ltape de reconnaissance, de ne pas tenir compte des classes mal conditionnes. Cette approche permet denlever les fausses alarmes favorisant ainsi linterprtation des classes pour la surveillance. Une avantage de la mthode est quelle sapplique aux degrs dappartenance instantans et ne demande pas une analyse des attributs des donnes elles mmes, ce qui dans de nombreux cas rduit la dimension des vecteurs en prsence. Enfin, nous avons montr lapplication de la mthode propose et la faisabilit de lapproche propose pour le fonctionnement de la station SMAPA de production deau potable sur les deux saisons (ltiage et la saison des pluies).
De manire gnrale, plusieurs perspectives peuvent tre envisages, dune part concernant la mthode de classification floue LAMDA, qui peut tre complmente avec lutilisation dautres algorithmes en parallle pour permettre damliorer les rsultats ; dautre part dans le dveloppement dune mthodologie permettant doptimiser la partition obtenue en termes de compacit et de sparation des classes en jouant sur les diffrents algorithmes disponibles pour calculer les degrs dappartenance ainsi que les paramtres qui y sont associs comme lexigence. Ces travaux devraient amliorer fortement lapplication de cette mthodologie dans le domaine du diagnostic de procds complexes. De plus, la formalisation dune mthode pour la dtermination de la dynamique entre tats fonctionnels est une tche indispensable pour que lapproche puise voluer vers la construction de modles dans le domaine du diagnostic de procds complexes. La suite immdiate ce travail est la mise en uvre in situ du capteur logiciel mais aussi de la procdure de diagnostic dveloppe. Grce aux contacts fructueux que nous avons eu avec le responsable de la station SMAPA, il semble que cette possibilit devienne tout fait envisageable.
BIBLIOGRAPHIE
[AFNOR,1994] AFNOR Norme exprimentale X60-010. Maintenance - Concepts et dfinition des activits de maintenance. AFNOR, premier tirage, Paris, 1994. [AGUADO,1998] AGUADO, J.C. A mixed qualitative quantitative self learning classification technique applied to situation assessment in industrial control. Thse de doctorat, Universitat Politcnica de Catalunya, 1998. [AGUILAR et LOPEZ, 1982] AGUILAR J., LOPEZ R. The process of classification and learning the meaning of linguistic descriptors of concepts Reasoning in Decision Analysis p. 165-175. North Holland, 1982. [AGUILAR-MARTIN et al., 1999] AGUILAR-MARTIN J., WAISSMAN-VILANOVA J., SARRATE-ESTRUCH R., et DAHOU B. Knowledge based measurement fusion in bio-reactors, IEEE EMTECH, 1999. [AGUILAR-MARTIN et al.,1980] AGUILAR-MARTIN, J., M. BALSSA M., LOPEZ DE MANTARAS R. Estimation rcursive dune partition. Exemples dapprentissage et auto-apprentissage dans Rn et In. Rapport technique 880139, LAAS/CNRS, 1980. [AGUILAR-MARTIN et al.,1982] AGUILAR-MARTIN, J., R. LOPEZ DE MANTARAS. The process of classification and learning the meaning of linguistic descriptors of concepts. Approximate reasoning in decision analysis, north-Holland, 1982. [AGUILAR-MARTIN,1996] AGUILAR-MARTIN, J. Knowledge-based real time supervision. Tempus-Modigy workshop. Budapest, Hongrie, 1996. Approximate
128
Bibliographie
[AL-SHARHAN et al., 2001] AL-SHARHAN S., KARRAY F., GUEAIEB W., BASIR O. Fuzzy Entropy: a Brief Survey, IEEE International Fuzzy Systems Conference 2001. [ATINE, 2005] ATINE J.C.Mthodes dapprentissage floue : Application la segmentation dmages biologiques. Thse de doctorat Institut National des Sciences Appliques, Toulouse, France, 2005. [BABA et al.,1990] BABA K., ENBUTU I., YODA M., Explicit representation of knowledge 155-160. [BAXTER et al., 2002] BAXTER C.W., STANLEY S.J., ZHANG Q., SMITH D.W. Developing artificial neural network process models of water treatment process: a guide for utilities. Eng. Sci./Rev. gen. sci. env. 1(3): pp 201-211, 2002. [BERGOT et GRUDZIEN,1995] BERGOT M., GRUDZIEN L. Sret et diagnostic des systmes industriels. Principaux concepts, mthodes, techniques et outils , Diagnostic et sret disfonctionnement, Vol. 5 n3, pp317-344, 1995. [BISSHOP,1995] BISHOP C. Neural networks for pattern recognition, Oxford University Press, New York, USA, 1995. [BISWAS et al.,2004] BISWAS G., CORDIER M.O., LUNZE J., TRAVE-MASSUYES L., STAROSWIECKI M. Diagnosis of complex systems : Bridging the methodologies of the FDI and DX comunities. IEEE transactions on systems, man, and cybernetics-Part B: Cybernetics, Vol 34 No. 5, pp 2159-2162, octobre 2004. [BOILLEREAUX et FLAUS,2003] BOILLEREAUX L., FLAUS J.M. Comande et supervision. Les procds agroalimentaires 2. Lavoisier ISBN 2-7462-0755-9, 2003. [BOMBAUGH et al.,1967] BOMBAUGH K. J., DARK W. A., COSTELLO L. A., Application of the Streaming Current Detector to Control Problems, in Proceedings of 13th National ISA Analysis Instrument Symposium, Houston, USA, 1967. [BRODART et al., 1989] BRODART E., BORDET J., BERNAZEAU F., MALLEVIALLE J. et FIESSINGER F., Modlisation stochastique dune usine de traitement de leau potable. 2me Rencontres Internationales Eau et Technologies Avances. Montpellier, 1989. [CARDOT,1999] CARDOT C. Les traitements de leau. Procds physico-chimiques et biologiques. Ellipses Edition Marketing S.A., 1999. [CART et al.,2001] CART B., GOSSEAUNE V., KOGUT-KUBIAK F., TOUTIN M-H. La maintenance industrielle. Une fonction en volution, des emplois en mutation. Centre dEtudes et Recherche sur les Qualifications. Bref n174, Avril 2001. acquired from plant historical data using neural network. International Joint Conference on Neural Networks. Washington, D.C., 1990,
Bibliographie
129
[CHAN et al., 1989] CHAN, M., AGUILAR-MARTIN J., J. CARRETE, N., CELSIS, P., et VERGNES, J. M., Classification techniques for feature extraction in low resolution tomographic evolutives images :application to cerebral blood flow estimation. In 12th Conf. GRESTI, 1989. [CHEM,2006] Projet CHEM disponible sur : http://www.chem-dss.org/ [CIDF-LdesEaux,2000] CIDF Centre International De Formation. Principes gnraux de traitement des eaux, Lyonnaise des Eaux, 2000. [COLLINS et al.,1992] COLLINS G., ELLIS G., Information processing coupled with expert systems for water treatment plants. ISA Transactions. Water and Wasterwater Instrumentation, 1992. [COLOMER et al.,2000] COLOMER J., MELENDEZ J., AYZA J. Sistemas de supervisin : introduccin a la monitorizacin y supervisin experta de procesos : mtodos y herramientas. Barcelona : Cetisa Boixareu, 83 p, 2000. [COX et al.,1994] COX C., GRAHAM J., Steps toward automatic clarification control.
Computing and Control Division Coloquium on Adv in Control the Process Ind. IEE Coloquium Digest, 81, 6/1-6/4, 1994. [DAGUINOS et al.,1998] DAGUINOS T., KORA R., FOTOOHI F., Emeraude: Optimised automation system for water production plants and small networks, in Proceedings of IWSA, Amsterdan,1998. [DASH et VENKATASUBRAMANIAN, 2000] DASH S., VENKATASUBRAMANIAN V. Challenges in the industrial applications of fault diagnostic systems. Computers and chemical engineering 24, pp 785-791, Elsevier, 2000. [De LUCA et TERMINI, 1974] De LUCA, TERMINI S. Entropy of L-fuzzy sets. Information and control, 24, pp.55-73 1974. [De LUCA et TERMINI,1972] De LUCA, TERMINI S. A Definition of Non Probablilistic Entropy in the Setting of Fuzzy Set Theory. Information and Control, 20:301312,1972 [DEGREMONT,2005] DEGREMONT, Mmento technique de leau : Tome 2. Lavoisier SAS Lexique technique de leau, Paris, dixime edition, 2005. [DEMOTIER et al.,2003] DEMOTIER S., DENOEUX T., SCHN W., ODEH K. A new approach to assess risk in water treatment using the belief function framework. IEEE 0-7803-7952-7/03, pp 1792-1797, 2003. [DESROCHES,1987] DESROCHES, P., Syclare : Systme de classification avec apprentissage et reconnaissance des formes. Manuel dutilisation. Centre dEtudis Avanaits de Blanes, 1987. [DIEZ et AGUILAR-MARTIN, 2006] DIEZ E., AGUILAR-MARTIN J. Dcisions, submitted CCIA2006. Proposition dEntropie non Probabiliste comme Indice de Fiabilite dans la Prise de
130
Bibliographie
[DOJAT et al., 1998] DOJAT M., RAMAUX N., FONTAINE D. Scenario recognition for temporal reasoning in medical B., domains. Diagnostic, Artificial intelligence Intelligence artificielle in et Medicine,tome14,pp139-155,1998. [DUBUISSON,2001] DUBUISSON reconnaissance des formes. Hermes science ISBN 2-7462-0249-2, 2001. [DUCH et JANKOWSKI, 1999] DUCH W., JANKOWSKI N., Survey of neural transfer functions. Neural Computing Surveys, 1999, 2,163-213. [EFRON et TIBSHIRANI, 1993] EFRON B. et THBSHIRANI R.J. An introduction to the Bootstrap. New York. Chapmann & Hall, 1993. [EISEMBERG,1969] EISENBERG D., and KAUZMAN W. The structure and Properties of Water. Oxford University Press, New York and London, 1969. [FLAUS,1994] FLAUS J.M. La rgulation industrielle: Rgulateurs PID, prdictifs et flous. Hermes Sciences Publications. Srie automatique. ISBN 2866014413, 21 octobre 1994.
[FLETCHER et al., 2001] FLETCHER I., ADGAR A., COX C.S., BOEHME T.J. Neural Network applications in the water industry. The Institute of Electrical Engineers IEE pp 16/1-16/6, London, UK, 2001. [FOTOOHI et al.,1996] FOTOOHI F., KORA R., NACE A., Saphir: an optimising tool on a drinking water distribution networks, Proceedings of Hidroinformatics96, Zurich, 1996. [GAGNON et al.,1997] GAGNON C.,GRANJEAN B., THIBAULT J., Modelling of coagulant dosage in a water treatment plant. Engineering. 1997, 401-404. [GALINDO,2002] GALINDO M., AGUILAR-MARTIN J., Interpretacin secuencial de encuestas con aprendizaje LAMDA. Aplicacin al diagnstico en psicopatologa IBERAMIA02-Iberoamerican Espagne, 2002. [GALLINARI,1997] GALLINARI P. Heuristiques pour la gnralisation. THIRIA S., LECHEVALLIER Y., GASCUEL O., CANU S. (Editeurs). Statistiques et Mthodes neuronales, Chapitre 14, pp 230-243, Dunod, Paris, 1997. [HERNANDEZ et LE LANN, 2004] HERNANDEZ H., LE LANN M-V. Application of classification method by abstraction of signals to the coagulation process of a drinking water treatment plant unit, 11th International Congress on Computer Science Research (CIICC'04), Mexico (Mexique), pp.105-112, 29 Septembre 1er Octobre 2004. [HERNANDEZ et LE LANN, 2006] HERNANDEZ H., LE LANN M-V. Development of a neural sensor for the on-line prediction of coagulant dosage in a potable water treatment plant in the way of its diagnosis, accepted IBERAMIA 23-27 October 2006. Conference on Artificial Intelligence, Seville, Artificial Intelligence in
Bibliographie
131
[HIMMELBLAU,1978]
HIMMELBLAU,
D.M.
Fault
diagnosis
in
chemical
and
petrochemical process. Elsevier Predd, Amsterdan, 1978. [HOPCROFT et ULLMAN,1979] HOPCROFT J., ULLMAN J. Introduction to automata theory, languages, and computation, Addison-Wesley, New York, USA, 1979. [IRI et al.,1979] IRI M., AOKI K., OSHIMA E., MATSUYAMA H. An algorithm for diagnosis of system failures in chemical processes. Computers and Chemical Engineering, 3, pp 489-493, 1979. [ISERMAN,1997] ISERMAN R. Supervision, Fault Detection and Fault Diagnosis methods an introduction. Control Eng Practice, Vol 5, No. 5, pp 639-652, Elsevier, 1997. [JOLLIFFE, 1986] JOLLIFFE I.T. principal components analysis. Springer-Verlag Press, 1986. [KAVURI et VENKATASUBRAMANIAN, 1994] KAVURI S.N., VENKATASUBRAMANIAN V. Neural network decomposition strategies for large
scale fault diagnosis. International journal of control 59 (3), pp 767-792, 1994. [KEMPOWSKY,2004a] KEMPOWSKY T. Surveillance de procds base de mthodes de classification : Conception dun outil daide pour la dtection et le diagnostic des dfaillances . Thse de doctorat, Institut National des Sciences Appliques, Toulouse, France, dcembre 2004. [KEMPOWSKY, 2004b] KEMPOWSKY T., SALSA users manual. Rapport LAAS-CNRS no. 04160, 2004. [KEMPOWSKY et al.,2006] KEMPOWSKY T., SUBIAS A., AGUILAR-MARTIN J. Process situation assessment: From a fuzzy partition to a finite state machine, Engineering Applications of Artificial Intelligence, In Press, Corrected Proof, Available online 11 April 2006. [KOSKO,1986] KOSKO B. Fuzzy entropy and conditioning. Information Sciences, vol. 40, pp.165-174, 1986. [LAMRINI et al.,2005] LAMRINI B., BENHAMMOU A., LE LANN M-V., KARAMA A., A neural software sensor for on-line prediction of coagulant dosage in a drinking water treatment plant. Transactions of the Institute of Measurement and Control, 2005. [LAMRINI et al.,2005] LAMRINI B., LE LANN M-V., BENHAMMOU A., , LAKHAL K., Detection of functional states by the LAMDA classification technique: application to a coagulation process in drinking water treatment. Elsevier, C.R. Physique 6 pp1161-1168, 2005. [LAPP and POWERS, 1977] LAPP S.A., POWERS G.A. Computers-aided synthesis of fault-trees. IEEE Transactions on Reliability, 37, pp 2-13, 1977. [LEONARD et KRAMER,1990] LEONARD J.A., KRAMER M.A. Lilitations of backpropagation approach to fault diagnosis and improvements with radial basis functions. AIChE annual meeting, Chicago, USA, 1990.
132
Bibliographie
[LIND,1994a] LIND C., Coagulation Control and Optimization: Part 1, Public Works,Oct. 1994. [LIND,1994b] LIND C., Coagulation Control and Optimization: Part 2, Public Works, Nov. 1994. [LIND,1995] LIND C., A coagulant road map, Public Works, 36-38, March 1995. [LIPMANN et al.,1995] LIPMANN R.P., KUKOLICH L. et SHAHIAN D. Predicting of complications in coronary artery bypass operating using neural networks, In G. Tesauro et al. (Eds), advances in neural information processing systems 7, Menlo park, CA: MIT press, 1055-1062, 1995. [MASSCHELEIN,1999] MASSCHELEIN W.J., Processus unitaires du traitement de leau potable. Editeur : Cebedoc (novembre 5, 1999). [MATLAB,2001] MATLAB, Neural Networks Toolbox, Userguide, Inc., 2001. [MCCULLOCH et PITTS,1943] MCCULLOCH W.S., PITTS W., A logical calculs of the ideas immanent in nervous activity. Bulletin of Math. Biophysics, 5, 1943. [MILLOT, 1988] MILLOT P. Supervision de procds automatiss et ergonomie. Hermes, Paris, 1988. [MIRSEPASSI et al.,1997] MIRSEPASSI A., CATHERS B., DHARMAPPA H., Predicted of chemical dosage in water treatment plants using ANN and Box-Jenkings models. Preprints of 6th IAWQ Asia-Pacific Regional Conference. Korea, 1997, 16-561-1568. [MOLLER, 1993] MOLLER M., Efficient training of feed-fordward neural networks. PhD thesis, Computer Science Department, Arthus University, Denmark, december 1993. [MONTGOMERY,1985] MONTGOMERY J. Water Treatment Principles and Design. John Wiley & Sons, ISBN 0-471-04384-2, USA, 1985. [MYLARASWAMY,1996] MYLARASWAMY D. Dkit: a blackboard-based, distributed, multi-expert environment for abnormal situation management, PH Thesis, School of chemical engineering, Purdue University, USA ,1996. [NONG et McAVOY, 1996] DONG D., McAVOY T.J. Back tracking via nonlinear principal component analysis. American Institute of chemical enginners journal, 42(8), pp 2199-2208, 1996. [NORGAARD et al.,2000] NRGAARD M., RAVN O., POULSEN N., Neural networks for modelling and control of dynamic systems. Springer-Verlag limited 2000. [OJA et al., 1992] OJA E., OGAWA H., WANGVIWATTANA J. Principal component analysis by homogeneous neural networks, part I & part II: the weighted subspace criterion. IEICE Transactions INF & Syst, Vol E75-D, 3, pp 366-381, 1992. [ORANTES, 2005] ORANTES A. Mthodologie pour le placement des capteurs base de mthodes de classification en vue de son diagnostic . Thse de
Bibliographie
133
doctorat, Institut National des Sciences Appliques, Toulouse, France, octobre 2005. [PAL et BEZDEK, 1993] PAL N. R., BEZDEK J.C. Several new classes of measures of fuzziness, Proc. IEEE Int. Conf. on Fuzzy Syst., 928-933, Mar. 1993. [PEIJIN et COX,2004] PEIJIN W., COX C. Study on the application of autoassociative neural network. IEEE ICSP04 Proceedings, pp 1570-1573, 2004. [PETTI et al., 1990] PETTI T.F., KLEIN J., DHURJATI P.S. Diagnostic model processor: using deep knowledge for process fault diagnosis. American Institute of Chemical Engineering Journal, 36(4), pp 565-575,1990. [PIERA, et al.,1989] PIERA N., AGUILAR-MARTIN J. LAMDA: An incremental conceptual clustering method. Rapport Technique LAAS-CNRS No. 89420, dcembre 1989. [PIERA, et al.,1991] PIERA N., AGUILAR-MARTIN J. Controlling selectivity in nonstandard pattern recognition algorithms . IEEE transactions on systems, man
and cybernetics, Vol 21, No. 1, 1991. [PLOIX,1998] S. Ploix. Diagnostic des systmes incertains. Approche bornante. Thse de lUniversit Henri Poincar, CRAN, Nancy 1, France, 1998. [PNSE,2005] PNSE Plan National Sant-Environnement. France, 2006. Disponible sur : http://www.sante.gouv.fr/htm/dossiers/pnse/sommaire.htm [RODRIGUEZ al.,1996] RODRIGUEZ M., SERODES J., Neural network-based modelling of the adequated chlorine dosage for drinking water disinfection, Canadian journal of civil engineering, Vol 23, 621-631, 1996. [RUMELHART et McCLELLAND,1993] RUMELHART D., McCLELLAND J., Parallel distribution processing: exploration in the microstructure of cognition, Cambridge, MA,1986, MIT Press, 1. [SARRATE,2002] SARRATE, R. Supervisi Intelligent de Processos Dinmics Basada en Esdeveniments (ABSALON: Abstraction Analysis on-line). Thse de doctorat, Universitat Politcnica de Catalunya. Terrassa, mar (2002) [SHANNON, 1948] SHANNON C. A mathematical theory of communication. Bell Syst., Tech., 27 :379-423, 1948. [SMAPA,2005] SMAPA, Sistema Municipal de Agua Potable y Alcantarillado de Tuxtla. Manual de procedimientos, Tuxtla Gtz., Chiapas, Mxico, 2005. [TOSCANO, 2005] TOSCANO R., Commande et diagnostic des systmes dynamiques: Modlisation, analyse, commande par PID et par retour dtat, diagnostic. Ellipses dition Marketing, S. A., 2005. [TRAVE-MASSUYES et al.,1997] L. Trav-Massuys, P. Dague, F. Guerrin. Le raisonnement qualitatif. Herms, France, 1997.
134
Bibliographie
[TRILLAS et ALSINA, 1979] TRILLAS E., ALSINA C. Sur les mesures du dgre du flou. Stochastica, vol.III pp. 81-84, 1979. [TRILLAS et RIERA, 1978] TRILLAS E., RIERA T. Entropies in finite fuzzy sets. Information Sciences 15, 2, pp. 159-168, 1978. [TRILLAS et SANCHIS, 1979] TRILLAS E., SANCHIS C. On entropies of fuzzy sets deduced from metrics. Estadistica Espaola 82-83, pp. 17-25, 1979. [VALENTIN,2000] VALENTIN N. Construction dun capteur logiciel pour le contrle automatique du procd de coagulation en traitement deau potable. Thse de doctorat, UTC/Lyonnaise des Eaux/CNRS, 2000. [VALIRON,1989] 1989. [VALIRON,1990] VALIRON F., Gestion des eaux : automatisation-informatisationtlgestion, Presses de lcole national de ponts et chausses, 1990. VALIRON F., Gestion des eaux : alimentation en eau assainissement, Presses de lcole nationale des ponts et chausses, Paris,
[VEDAM et al., 1997] VEDAM H., VENKATASUBRAMANIAN V. A wavelet theorybased adaptive trend analysis system for process monitoring and diagnosis. American Control Conference, pp 309-313, 1997. [VENKATASUBRAMANIAN et al.,1995] VENKATASUBRAMANIAN V., KAVURI S.N., RENGASWAMY R. A review of process fault diagnosis. CIPAC Technical report, Department of Chemical Engineering, Purdue University, USA, 1995. [VILLA et al.,2003] VILLA J.L.,DUQUE M.,GAUTHIER A.,RAKOTO-RAVALONTSALAMA N.Modeling and control of a water treatment plant. IEEE 0-7803-7952-7/03, pp171-180, 2003. [WAISSMAN-VILANOVA, 2000] Waissman-Vilanova J., Construction dun modle comportemental pour la supervision de procdes : application une station de traitement des eaux. Thse de doctorat, Institut National Polytechnique de Toulouse, France, 2000. [WEBER, 1999] WEBER P. Diagnostic de procd par lanalyse des estimations paramtriques de modles de reprsentation temps discret. Thse de lInstitut National Polytechnique de Grenoble, France, 1999. [YU et al.,2000] YU R., KANG S., LIAW S., CHEN M., Application of artificial neural network to control the coagulant dosing in water treatment plant. Water Science & Tech 2000, Vol 42 No., 403-408. [ZAYTOON,2001] ZAYTOON J. Systmes dynamiques hybrides, HermesScience Publications, Paris, 2001. [ZWINGELSTEIN,1995] G. ZWINGELSTEIN. Diagnostic des dfaillances Thorie et pratique pour les systmes industriels. Trait des Nouvelles Technologies, srie Diagnostic et Maintenance. Herms, Paris, 1995.
137
Les pouvoirs publics ont soulign les enjeux sanitaires lis une distribution deau potable de bonne qualit en dfinissant des objectifs ambitieux dans la loi de politique de sant publique daot 2004 et dans le Plan National Sant Environnement (PNSE) 2004-2008 [PNSE,2005]. Parmi les objectifs annexs la loi no 2004-806 du 9 aot 2004 relative la politique de sant publique, un objectif quantifi visant diminuer par deux jusqu 2008 le pourcentage de la population alimente par une eau de distribution publique dont les limites de qualit ne sont pas respectes pour les paramtres microbiologiques et les pesticides a t fix. Le PNSE adopt par le gouvernement le 21 juin 2004, en application de la loi relative la politique de sant publique du 9 aot 2004, comprend trois objectifs prioritaires : Garantir un air et une eau de bonne qualit ; Prvenir les pathologies dorigine environnementale et notamment les
cancers ; Mieux informer le publique et protger spcialement les populations sensibles (enfants et femmes enceintes). Le tableau A.1 rassemble les valeurs adoptes par lorganisation mondiale de la sant (OMS), la communaut europenne (CEE), la France et le Mexique sur la rglementation de la qualit de leau potable [DEGREMONT,2005 ; SMAPA,2005]. La directive de la CEE regroupe 62 paramtres regroups en cinq catgories : Paramtres organoleptiques Paramtres physico-chimiques Paramtres concernant des substances indsirables Paramtres concernant des substances toxiques Paramtres microbiologiques Pour chaque paramtre, il est dfini un Niveau-Guide (NG) : cest la valeur qui est considre comme satisfaisante et quil faut chercher atteindre. Pour certain paramtres, il est galement fix une concentration maximale admissible (CMA) : leau distribu doit alors avoir une valeur infrieure ou gale cette valeur. Lorsque la concentration dans leau brute est suprieure cette valeur, il emporte de mettre en uvre le traitement correspondant.
138
Tableau A.1 Rglementation concernant la qualit de leau la consommation Directive CEE Paramtres Couleur (mg/l Pt-Co) Turbidit unit JACKSON (NTU) Temprature (oC) pH (u pH) Conductivit (S/cm) 20oC Sulfate (mg/l SO4) Chlorure (mg/l Cl) Directive CEE Mexique France 15 2 25 6,5-9 250 25 200 60 0,5 250 300 0,1 150 50 0,2 25 0,2 40 250 500 0,2-1,50 200 15 0,5
[NOM127,1994]
NG
1 0,4 12 6,5-8,5 400 25 200 60 0,1 100 30 0,05
CMA
20 4 25
20 5 30 6,5-8,5
Duret totale doF (mg/l CaCO3) Chlore rsiduel (ppm) Calcium (mg/l Ca) Magnsium (mg/l Mg) Aluminium (mg/l Al)
141
Pour mieux comprendre la mthode LAMDA, nous donnons dans ce qui suit un exemple de classification en utilisant des descripteurs quantitatifs et un apprentissage avec 2 classes prdfinies initialement (mode dapprentissage supervis), classes aussi appeles classes professeurs. Nous utilisons la fonction Binomiale pour calculer les GADs et le produit comme oprateur logique pour le calcul du MAD. Nous prsentons dans le tableau B.1 le contexte de la classification et les valeurs normaliss des descripteurs pour chaque lment en utilisant lquation B.1. Soit : nd = Nombre de descripteurs = 3 ni = Nombre dlments dj classs = 5 pcl = Nombre de classes professeur (classes dj cres) = 2 (trois lments dans la
classe 1, deux lments dans la classe 2) nec = nombre dlments dans la clase
Tableau B.1 Valeurs brutes et valeurs normaliss di pour chaque lment
d1
d2
d3
0 2 16 3 2 5 10 1 20 4 6 10 5 6 0 Contexte 10 6 20 0 1 0
xi =
(B.1)
Ltape suivante est le calcul des paramtres des classes professeur et de la classe NIC, en valuant la moyenne des valeurs normaliss : Pour la classe 1 : Pour la classe 2 : Pour la classe 0 (NIC) :
(x1/C1) = (0 + 0.3 + 0.5) / 3 = 0.27 (x2/C1) = (0.2 + 0.2 + 1) / 3 = 0.47 (x3/C1) = (0.8 + 0.4 + 0) / 3 = 0.4
nec = 3 Paramtres classe 1 : C1=[0.27, 0.47, 0.4]
(x1/C2) =
0.7
142
N0
dfinit
linitialisation
de
lapprentissage,
sa
valeur
peut-tre
choisie
arbitrairement, il ninflue pas sur le rsultat de la classification. Notre objectif est de classer un nouvel lment X6 sur la base des paramtres des classes dj existantes. Soit cet lment avec les valeurs normaliss (0.1,0.1,0.9). Nous calculons : 1. Les degrs dappartenance marginale (MAD) par rapport chaque
descripteur :
i ( xi / C k ) kx,i (1 k ,i )(1 x )
i i
(B.2)
i ( xi / C k )
Le degr dappartenance sera toujours de 0.5 Le rsultat des calculs des MADs par rapport llment X6 sont les trois vecteurs suivants : (X6/C1) = [0.66, 0.52, 0.37] (X6/C2) = [0.33, 0.5, 0.67] (X6/C0) = [0.5, 0.5, 0.5]
2. Les degrs dappartenance globale (GAD) de llment X6, en utilisant le connectif produit :
GAD( X / C k ) = i ( xi / C k ) i ( x 2 / C k ) i ( x3 / C k )
GAD( X / C k ) = ind1 i ( xi / C k ) =
(B.3)
o nd est le nombre de descripteurs. Nous obtenons ainsi les trois degrs dappartenance globale :
GAD( X 6 / C1 ) = 0.27 0.10.730.9 0.47 0.10.530.9 0.4 0.9 0.6 0.1 = 0.1442 GAD( X 6 / C 2 ) = 0.1097 GAD( X 6 / C 0 ) = 0.125
)(
)(
143
Llment X6 appartient la classe dont le GAD est maximal, cest--dire, la classe C1 : C1 (GAD (X6/C1) = 0.1442) 3. cause de lincorporation du nouvel lment la classe 1 (C1), lactualisation des paramtres associs aux descripteurs quantitatifs de cette classe est faite par la formule itrative de la moyenne :
k ,i k , i +
(x
k ,i )
(B.4)
Ni + 1
o k,i est la nouvelle valeur du paramtre du descripteur i de la classe k et N le nombre dlments dans la classe. Ainsi,
1,1 = ( x1 / C1 ) = 0.27 +
k ,i k , i +
(x
k ,i )
(B.5)
N0 +1
k , i 0 .5 +
( x i 0 .5 )
N0 +1
3,1 = ( x1 C 3 ) = 0.5 +
3, 2 3,3 = ( x3 / C 3 ) = 0.7
147
Dans la figure C.1 nous prsentons la procdure itrative RMSE/ME (moyenne quadratique erreur/moyenne erreur) pour obtenir une architecture du rseau de neurones optimale et ses valeurs du poids. Ce procd assure qu'il n'existe pas sur apprentissage. Description de la procdure : 1. Partition de lensemble des exemples en deux sous-ensembles, nomms, le sous-ensemble dapprentissage et le sous-ensemble de test [DREYFUS et al.,2004] 2. 3. 4. Initialisation du nombre de neurones dans la couche cache (ex 1) Fixer le nombre ditrations vers une certaine valeur (ex 100) Choix dun ensemble de nombres de neurones de la couche cache (HN) (ex 10,15,20,25, ) 5. Apprentissage du rseau de neurones (en utilisant MATLAB, p.e.), prennent en compte le nombre ditrations dans 3 et le nombre de couches caches dans 4. Sauvegarde des valeurs des critres RMSE et ME les plus bas. 6. Rpter 4 et 5 plusieurs fois (en changeant le nombre de couches caches). Ceci assure que le poids du rseau soit initialise chaque apprentissage, lequel aide en explorant la surface d'erreur 7. Choix du nombre de couches caches optimal (HNopt1) par analyse des valeurs RMSE et des valeurs EM 8. Choix dun nouvel ensemble du nombre de couches caches autour de la valeur HNopt1 (ex. 25, 30, 35 si HNopt1 = 30) 9. Systmatiquement augmenter en 1 le nombre de neurones dan la couche cache 10. Aller 5 et rpter 8, jusqu toutes les nouvelles valeurs du nombre de couches caches soient explores 11. Choix de la meilleure architecture par analyses des valeurs des critres RMSE et valeurs ME les plus bas 12. 13. Choix dun ensemble de nombres ditrations (ex. 50,100,150) Apprentissage du rseau de neurones, prennent en compte le nombre ditrations dans 12 et le nombre de couches caches dans 11. Sauvegarde des valeurs des critres RMSE et ME les plus bas
148
14.
Rpter 12 et 13. Larchitecture du rseau de neurones et les poids optimales soient les correspondants les valeurs des critres RMSE et ME les plus bas.
Choix dun nouvel ensemble de HN autour de la valeur HNopt1 (ex. 25,30,35 si HNopt1=30)
HN=HN+1
Non 3
Fixer le nombre ditrations (ex.100)
10
Choix dun ensemble de nombres de neurones de la couche cache (HN) (ex. 10,15,20,25,..)
Oui
Choix de la meilleure architecture par (RMSE/EM)
11
12
Non
13
Non
Ensemble parcouru?
14
Liste de Figures
tel-00136157, version 1 - 12 Mar 2007
Figure 1. 1 Station de production deau potable..................................................... 7 Figure 1. 2 Temps de dcantation des particules.................................................. 12 Figure 1. 3 Coagulation-Floculation.................................................................... 13 Figure 1. 4 Essai Jar-Test ........................................................................... 16 Figure 1. 5 Evolution de la turbidit de leau filtre dun filtre ................................ 20 Figure 2. 1 Introduction doutils de surveillance, de diagnostic et daide la dcision au niveau de la supervision ........................................................................ 28 Figure 2. 2 Schma gnral de la supervision..................................................... 30 Figure 2. 3 Classification des mthodes de diagnostic [DASH, 2000] ..................... 31 Figure 2. 4 La forme observe X est ici associe la classe C5............................... 36 Figure 2. 5 Structure dun systme de diagnostic par reconnaissance des formes ..... 37 Figure 2. 6 Structure gnrale du classificateur ................................................... 38 Figure 2. 7 Schma gnral du calcul de ladquation dun objet une classe ......... 44 Figure 2. 8 Algorithme gnral de LAMDA........................................................... 47 Figure 2. 9 Projection (a) dans lespace des variables, (b) dans lespace des individus et (c) dcomposition de lACP ...................................................................... 51 Figure 2. 10 Neurone formel............................................................................. 52 Figure 2. 11 Principales fonctions dactivation : (a) fonction seuil, (b) fonction linaire, (c) fonction sigmode, (d) fonction gaussienne ................................... 52 Figure 2. 12 Perceptron multicouche.................................................................. 54 Figure 2. 13 (a) Surapprentissage : lapprentissage est parfait sur lensemble dapprentissage (x), et vraisemblablement moins bon sur le point de test (o) ;
150
Liste de figures
(b) Apprentissage correct : un bon lissage des donnes ; (c) Sous-apprentissage : apprentissage insuffisant. ........................................................................... 56 Figure 2. 14 Rchantillonnage par bootstrap pour la gnration dintervalle de prdiction. ................................................................................................ 58 Figure 2. 15 Automate dcrivant une machine simple : a) modle formel, b) reprsentation graphique............................................................................ 60 Figure 2. 16 Les diffrentes formes de maintenance ........................................... 61 Figure 3. 1 Mthode pour le contrle automatique du procd de coagulation.......... 70 Figure 3. 2 Evolution des paramtres descripteurs de leau brute au cours de temps 72 Figure 3. 3 Evolution de la dose de coagulant applique sur la station au cours de temps ...................................................................................................... 73 Figure 3. 4 Valeurs et histogramme des valeurs propres des composantes .............. 74 Figure 3. 5 Cercle de corrlation dans le plan 1-2. ............................................... 74 Figure 3. 6 Architecture du Perceptron multicouche ............................................. 75 Figure 3. 7 Valeurs des critres (MSE) et de lerreur moyenne pour la dtermination du nombre ditrations (a) et du nombre de neurones dans la couche cache (b) 76 Figure 3. 8 Dose de coagulant applique et dose de coagulant prdite (ligne pointille et +) avec le perceptron multicouche sur lensemble de test............... 77 Figure 3. 9 Dose de coagulant applique et dose de coagulant prdite (ligne pointille et +) avec le modle de type linaire sur lensemble de test............... 77 Figure 3. 10 Dose de coagulant applique et dose de coagulant prdite avec le perceptron multicouche sur lensemble de test (oct-Minov 2003) et lintervalle de confiance (MAX et MIN) .............................................................................. 78 Figure 4. 1 Description gnrale de la mthode pour la surveillance de la station SMAPA ..................................................................................................... 83 Figure 4. 2 (a) Gnrateur de fentre et (b) du bloc S-FUNCTION......................... 86 Figure 4. 3 Lvolution des variables dans une fentre temporelle d'observation ..... 87 Figure 4. 4 Filtrage analogique et numrique des signaux ..................................... 88 Figure 4. 5 Schma du diagnostic en ligne du procd ........................................ 92 Figure 5. 1 Schma gnral de la station SMAPA de production deau potable........102 Figure 5. 2 Dosage de ractifs (sulfate daluminium) en millier de tonnes .............104 Figure 5. 3 Descripteurs de la qualit de leau brute ( lentre et la sortie) pour lanne 2001............................................................................................106 Figure 5. 4 Dose applique et dose calcule par le capteur logiciel pour la saison dtiage et la saison des pluies (anne 2000-2001) .......................................107
Liste de figures
151
Figure 5. 5 Ensemble des donnes brutes (saison des pluies, phase dapprentissage Mai-Octobre 2000) ................................................................................... 109 Figure 5. 6 Le descripteur pH lentre de la station SMAPA avec 3 modalits ....... 110 Figure 5. 7 (a)Lensemble des donnes prtraites (saison des pluies, phase dapprentissage Mai-Octobre2000), (b) classification pour lidentification des tats de la station SMAPA lors de la saison des pluies (autoapprentissage), (c) Profil des classes ................................................................................................... 111 Figure 5. 8 Ensemble des donnes brutes (priode dtiage, phase dapprentissage NovDec2000-JanAvril2001) ....................................................................... 113 Figure 5. 9 (a)Lensemble des donnes brutes prtraites (priode dtiage, phase dapprentissage NovDec2000-JanMiFev2001), (b) classification pour lidentification des tats de la priode dtiage de la station SMAPA (autoapprentissage), (c) Profil des classes ............................................................................................. 114 Figure 5. 10 volution des DAGs pour la classification rsultante ........................ 116 Figure 5. 11 Lautomate pour la station SMAPA durant ltiage (donnes prtraites) ............................................................................................................. 116 Figure 5. 12 Validation des transitions obtenues lors de la phase dapprentissage (ltiage 2000-2001) ................................................................................ 117 Figure 5. 13 Identification en ligne des tats de la station SMAPA lors de la priode dtiage 2001-2002. (a) Ensemble de test. (b) Classes identifies lors de la reconnaissance (alarme dtecte) .............................................................. 118 Figure 5. 14 Validation des transitions pour la priode dtiage 2001-2002........... 118 Figure 5. 15 Identification en ligne des tats de la station SMAPA lors de la priode dtiage 2003-2004. (a) Ensemble de test. (b) Classes identifies lors de la reconnaissance (alarme dtecte) .............................................................. 119 Figure 5. 16 Validation des transitions pour la priode dtiage 2003-2004........... 119 Figure 5. 17 Lautomate pour la station SMAPA durant ltiage aprs validation des transitions .............................................................................................. 120 Figure 5. 18 Reconnaissance en ligne des donnes de test : (a) pour la priode dtiage 2001-2002, (b) pour la priode dtiage 2003-2004. ......................... 120 Figure C. 1 La procdure itrative RMSE/ME..................................................... 148
RESUME Lobjectif des ces travaux est le Dveloppement dun outil de supervision/diagnostic dune station de production deau potable dans son ensemble. Avant de sintresser la station dans son ensemble, il est apparu que lunit de coagulation-floculation tait une tape cl dans la production de l'eau potable. La premire partie de la thse a donc consist dvelopper un capteur logiciel permettant de prdire en ligne la dose de coagulant, sur la base des caractristiques mesures de leau brute, laide de rseaux de neurones. La deuxime partie de la thse qui prsente un aspect plus novateur rside dans lutilisation de cette information dans une structure de diagnostic de lensemble de la station de traitement. A partir des mesures en ligne classiquement effectues, un outil de supervision et de diagnostic de la station de production deau potable dans son ensemble a t dvelopp. Il est bas sur lapplication dune technique de classification et sur linterprtation des informations obtenues sur tout lensemble du procd de production avec comme finalit lidentification des dfaillances et une aide la maintenance prdictive/prventive des diffrentes units de la station. Une technique base sur la lentropie floue et la dfinition dun indice de validation a t dveloppe pour permettre de valider ou non une transition entre tats fonctionnels (cest--dire entre classes) permettant ainsi dliminer les classes mal conditionnes ou encore les fausses alarmes. Ces travaux de recherche ont t raliss en collaboration avec la station de production d'eau potable SMAPA de la ville de Tuxtla Gutirrez, de Chiapas, au Mexique. MOTS CLES : supervision, diagnostic, classification floue, capteur maintenance prventive, production deau potable, unit de coagulation neuronal,
ABSTRACT The water industry is under an increasing pressure to produce a potable water of a better quality at a lower cost. The aim of this work is the Development of a tool for the monitoring/diagnosis of a whole potable water production plant. Before being interested in the whole plant, it appeared that the coagulation-flocculation was a key step in the potable water production process. The first part of the thesis consisted in developing a software sensor enabling to predict on-line the coagulant dosage, on the basis of the measured raw water characteristics, using neural networks. The second part which presents a more innovative aspect lies on the use of this information in a structure of diagnosis of the whole treatment plant. From the on-line measurements commonly performed, a tool for monitoring and diagnosis of the processes of the whole plant has been developed. It is based on the application of a classification technique and on the interpretation of the obtained information on all the processes with the aim of the identification of faults and a help for the preventive/predictive maintenance of the different plant units. A technique based on the fuzzy entropy and the definition of a validation index has been developed to allow the validation or not of a transition between functional states (i.e. between classes) enabling thus the elimination of illconditioned classes or false alarms. These works have been performed in collaboration with the potable water production plant of SMAPA in the town of Tuxtla Gutirrez, Chiapas, Mexico. KEYWORDS: monitoring, diagnosis, fuzzy classification, neural sensor, preventive maintenance, potable water production, coagulation process.