Hydrologie Statistique PDF

HYDROLOGIE
STATISTIQUE
Elments dHydrologie Statistique par R.Ababou,
daprs le cours profess lINP-ENSEEIHT (Toulouse),
Dpartement de Formation Hydraulique & Mcanique des Fluides .
R. ABABOU
Document PDF en couleur disponible sur site web.

Dcembre 2006 / Janvier 2007 (version v1)
HYDROLOGIE STATISTIQUE
R. Ababou
Sommaire
CH.0. INTRODUCTION, BIBLIO, DONNEES HYDROLOGIQUES

CH.1. ANALYSE STATISTIQUE UNIVARIEE EN HYDROLOGIE
Ch.1-A.
Analyse univarie Moments et lois de probabilit
Ch.1-B.
Analyse univarie (suite) Crues annuelles et

valeurs extrmes ; crues rares et loi de Poisson.
TD 1.
CRUES GARONNE (LOI DE GUMBEL & LOI DE POISSON)
CH.2. ANALYSE STATISTIQUE MULTIVARIEE EN HYDROLOGIE

TD 2.
COVARIANCES, REGRESSION, ACP (6 stations pyrnes)
CH.3. ANALYSE STATISTIQUE DE PROCESSUS HYDROLOGIQUES

Ch.3-A. Chroniques hydrologiques & Processus alatoires (Bases)
Ch.3-B. Analyse croise de chroniques hydrologiques (pluie-dbit)
TD3 IDENTIFICATION STATISTIQUE DUNE FONCTION DE TRANSFERT
PLUIE P(t) DEBIT Q(t) : HYDROGRAMME UNITAIRE
(avec jeux de donnes : pluies-dbits bassins karstiques, etc)
REFERENCES
ANNEXES
HYDROLOGIE STATISTIQUE
R. Ababou
Table des Matires

Plan du Cours et des Travaux Dirigs
CH.0. INTRODUCTION, BIBLIO, DONNEES HYDROLOGIQUES

0.0.
Bibliographie (voir liste des rfrences)
0.1.
Donnes hydrologiques (bases de donnes, illustrations)
0.2.
Objectifs, mthodes et modles en hydrologie statistique
0.3.
Objectifs types dapplications de lhydrologie statistique
CH.1. ANALYSE STATISTIQUE UNIVARIEE EN HYDROLOGIE

Analyse univarie Moments et lois de probabilit
Ch.1-A.
1A.0. Bases lmentaires de probabilit(s) et statistique(s)
Probabilit axiomatique , theorme de Bayes, exemples

Gnration de variables (pseudo)-alatoires
Densit de Proba & Fonction de Rpartition (v.a. continues)
Estimateurs statistiques (DdP, FdR, Moments)
1A.1. Lois de proba classiques, moments, et ajustements
Cf. ANNEXE Lois de proba univaries : relations moments-paramtres .
1A.2. Exemples dajustements de lois de proba (pluies, dbits)

1A.3. Types de lois de proba (pluies, dbits) selon le pas de temps t
1A. ANNEXES
ii
Histogrammes de frquences lis la morphologie des bassins

Algorithmes de calcul dune Fonction de Rpartition empirique
Intervalle de confiance et bande de confiance ( erreurs gaussiennes)
Analyse univarie (suite) Crues annuelles et

valeurs extrmes ; crues rares et loi de Poisson.
Ch.1-B.
1-B.Notion de crue
1-B.Crues annuelles et loi(s) des valeurs extrmes
1-B.Evnements rares et loi de Poisson
Dfinition axiomatique de la loi de Poisson

Application de la loi de Poisson lestimation de crues rares
Note sur la fiabilit de lestimation dune crue dcennale
1-B.ANNEXE : Crues, temps de retour, vnements rares et loi de Poisson .
TD 1.
CRUES GARONNE (LOI DE GUMBEL & LOI DE POISSON)
CH.2. ANALYSE STATISTIQUE MULTIVARIEE EN HYDROLOGIE

2.0.
Introduction, objectifs, mthodes
2.1.
Loi de proba multivarie dun vecteur de v.a.s (X1, X2,)
Fonction de Rpartition & Densit de Proba multivaries (jointes)

Loi de Gauss multivarie : cas dun vecteur alatoire gaussien de taille N
2.1.
Cas de 2 v.a.s : covariance, corrlation, et rgression linaire
2.2.
Utilisation de la rgression linaire pour la critique de donnes
2.3.
TD 2.
EXERCICE/EXEMPLE : Reconstitution de donnes par rgression linaire :

pluies mensuelles en deux stations alpines .
Test dhomognnit par la mthode des rsidus cumuls (ellipse de
confiance) : exemple de trois stations pluviomtriques au Sri Lanka.
Gnralisations
analyses
statistiques
multi-stations :
analyse corrlatoire multivarie, rgression multiple, et A.C.P.
Matrice de covariance K+1 variables (K explicatives, 1 explique)
Exercice sur une matrice de covariance 3x3 (exemple de pige viter)
Rgression linaire multiple K+1 variables (K explicatives, 1 explique)
Analyse en Composantes Principales (A.C.P) : cf. TD2
COVARIANCES, REGRESSION, ACP (6 stations pyrnes)
CH.3. ANALYSE STATISTIQUE DE PROCESSUS HYDROLOGIQUES

Ch.3-A. Chroniques hydrologiques & Processus alatoires (Bases)
3-A. Structure temporelle des chroniques hydrologiques (exemples)
3-A. Les processus alatoires auto-corrls (t-continu ; t-discret)
iii
Introduction aux fonctions alatoires X(t)

Processus alatoire X(t), stationnarit, ergodicit
Fonctions dauto-corrlation de processus stationaires
Interprtations de fonctions dauto-corrlations

(exemples : chroniques de dbits journaliers et bi-mensuels au Sri Lanka)
3-A. Modlisation et reconstruction de chroniques hydrologiques :

tude du modle AR1 (Auto-Rgressif du 1er ordre).
Les quations du modle AR1 pour un processus X(t(n))

Relation dquivalence entre X(t)-Langevin et X(t(n))-AR1
Extension : le modle AR1 saisonnier de Thomas-Fiering
Identification statistique des paramtres du processus AR1 (stationnaire)
Exercice de cours : pour une squence dobservations X(t(n))en dduire un
critre et une mthode dajustement des paramtres du modle AR1.
Ch.3-B. Analyse croise de chroniques hydrologiques (pluie-dbit)

.
Thorie des modles

cf.TABLEAU SYNOPTIQUE
de
convolution
pluie-dbit
(P(t)Q(t)) :
Dterministe vs. Statistique

Causal vs. Non-causal
Temps continu Temps discret
TD3 IDENTIFICATION STATISTIQUE DUNE FONCTION DE TRANSFERT

PLUIE P(t) DEBIT Q(t) : HYDROGRAMME UNITAIRE
(avec jeux de donnes : pluies-dbits bassins karstiques, etc)
REFERENCES
ANNEXES
Lois de probabilit univaries :
relations moments-paramtres et mthodes dajustement.
NB : dautres annexes sont insres directement dans chaque chaptre
iv
Cours Hyd.Stat. 3Hy 2005-06

Identifiant = HY3ASE303
Titre : Hydrologie Statistique
Sous-titre :
Traitements de donnes hydrologiques :
analyses univaries, temps de retour, vnements extrmes,
vnements rares, analyses corrlatoires multivaries et
ACP, chroniques hydrologiques et processus alatoires,
donnes spatialises et gostatistique.
R. Ababou : ababou@imft.fr
Enseignants 2005-06 : R.Ababou, A. Al-Bitar.

Documents en ligne:
http://rachid.ababou.free.fr/
( \\CRI\spi_com\be\hy\... )
Documents polycopis imprims:
Pour les bases statistiques, voir le polycopi intitul :
Cours dHydrologie 1 : Statistique (R.Gaudu).
Cours Hydro.Stat. 3Hy : Plan / Syllabus

PLAN / SYLLABUS HYDRO. STAT.
ID : HY3ASE303
DATE DE MISE JOUR : 27/06/2005
TITRE : HYDROLOGIE STATISTIQUE (STOCHASTIC HYDROLOGY)

COURS : 12 H
TD : 8 H
TP : H TRAVAIL PERSONNEL : H
OBJECTIFS
Approfondir le cours d'hydrologie gnrale l'aide d'une approche
statistique et probabiliste des processus pluies-dbits, avec des
mthodes de traitement de donnes spatio-temporelles adaptes aux
problmes de l'hydrologie.

PROGRAMME (COURS & TD)

Introduction, donnes, et modlisation statistique en hydrologie;
1. A. Analyse statistique univarie, moments et lois de probabilit ;
B. Evnements rares, loi de Poisson, estimation de crue de projet.
2. Analyse statistique multivarie : rgression linaire, rgression
multiple gnralise, corrlation multiple, et analyse en
composantes principales (ACP). Applications la critique,
reconstitution, et/ou cartographie de donnes hydrologiques.
3. Analyses statistiques de sries chronologiques provenant de
rseaux de mesures hydro-mtorologiques et hydro-gologiques.
Analyse et reconstruction de chroniques pluies-dbits ;
hydrogramme unitaire statistique. [Estimation gostatistique (x,y)].
NB : Une tude de cas sera traite dans le cadre dun projet (selon les annes), soit sur
une problme destimation gostatistique (variables rgionalises), soit sur la
modlisation ou la reconstruction de chroniques hydrologiques (processus alatoires).
4

PLANNING DES TRAVAUX DIRIGS ( TITRE INDICATIF)

Date
No. TD
TD 1/4
I.A & I.B Crues annuelles, crues rares, temps de retour
TD 2/4
II.
TD 3/4
III.
TD 4/4
III.
Chaptre
Intitul & contenu du TD

(Garonne ; Oued Mdez).
Reconstitution et critique de donnes
pluviomtriques
par
corrlation
et
rgression entre stations ; et/ou :
Corrlations multiples & Analyse en
Composantes Principales pour ltude des
redondances entre stations hydrologiques.
Identification statistique de la fonction de
transfert pluie-dbit en temps discret, dure
finie (formulation algbrique et application
de la thorie dveloppe en cours).
Mini Bureau dEtude.
Utilisation de
programmes Matlab en salle informatique
pour la dconvolution numrique pluie-dbit
(Hydrogramme Unitaire statistique).
5
RAPPEL : Une tude de cas sera traite en projet (selon les annes), soit sur une problme destimation gostatistique
(variables rgionalises), soit sur la reconstruction de chroniques hydrologiques (processus alatoires).
Cours Hydro.Stat. 3Hy: Plan / Syllabus

BIBLIOGRAPHIE :
Bras R. et I.Rodriguez-Iturbe:
Random Functions in Hydrology, Dover, NY.
Chow, Maidment, et al : Applied Hydrology , 1988.
SUPPORTS DE COURS :
Polycopis et documents en ligne :
(\\CRI\spi_com\be\hy\...) ; http://rachid.ababou.free.fr/
Polycopi imprim :
Pour les bases statistiques, cf. le polycopi intitul :
Autres documents :
Diapositives de cours distribus chaque anne.
Documents de TD et Projet distribus chaque anne.
Cours Hydro.Stat. 3Hy: Plan / Syllabus

DTAILS ORGANISATIONNELS :
Evaluation 1 :
Ecrit :
Evaluation 2 :
Ecrit : 2 h
BE :
ou BE : week-end
Oral :
Oral :
Enseignants :
R. Ababou Cours : 12 h
A. Al-Bitar Cours :
Semestre :
TD :
TD : 8 h
TP : h
TP : h
3 Hy Semestre E
Chronologie: 1re sance 22 Nov.2005 / dernire sance 24 Jan.2006
CHAP. 0
(INTRO)

Sous-titre :
R.Ababou et al., INP/ENSEEIHT:
Enseignants 2005-06 : R.Ababou,

A. Al-Bitar.
Hydrologie Statistique
2005-06

Documents en ligne:

R.Ababou et al., INP/ENSEEIHT:Web

A. Al-Bitar.
2005-06
local R.A. free
Cours Hydro.Stat. 3Hy : Sance 1


1. A. Analyse statistique univarie, moments et lois de probabilit ;

A. Al-Bitar.
2005-06
Cours Hydro.Stat. 3Hy : Sance 1 (Ch.0)

0. INTRODUCTION
Contenu: bibliographie, donnes hydrologiques, modlisation statistique, exemples
0.0.
BIBLIOGRAPHIE (EN CONSTRUCTION)
R.Ababou 2004: Hydrologie Statistique - Cours et exercices (lments) :

documents lectroniques sur le site web : http://rachid.ababou.free.fr
Gaudu R.: Cours d'Hydrologie 1 : Hydrologie Statistique (Polycopi, circa 1990).
Chow V.T., Maidment, Mays : Applied Hydrology, 1988.
Bras R., I.Rodriguez-Iturbe : Random Functions in Hydrology, Dover, New York.
Miquel J. : Guide pratique d'estimation des probabilits de crues.
Eyrolles (EDF-DER), 1984, 160 pp.
Rmniras G., 1965 : Hydrologie de l'ingnieur. Eyrolles (EDF-DER).
Duband D., 1972: Hydrologie statistique approfondie.

Cours polycopi (EDF-DER & ENS d'Hydraulique de Grenoble).
Yevjevich:
Delleur:
Guides de lOMM
B.Cautrot et al.: Les mthodes de prvision. PUF "Que Sais-Je?".

H.Ventsel : Thorie des probabilits. Editions Mir, Moscou.
Ph.Tassi : (Proba-stat)
J.Bass: Elments de calcul des proba
Blanc-Lapierre : (Thorie des focntions alatoires)
W.Feller: An introduction to probability theory and applications.
M.Kendall: Advanced theory of statistics (2 vols.)
Hydrologie Statistique 2005-06
0.0.
BIBLIOGRAPHIE (EN CONSTRUCTION)
Contenu: Etude bibliographique : les donnes hydrologiques,

la modlisation statistique, les tudes et applications. Voir
liste de rfrences (prliminaire) la fin de ce document

0. INTRODUCTION
Contenu: bibliographie, donnes hydrologiques + exemples, modlisation statistique
0.1.
DONNES HYDROLOGIQUES
Sources de donnes ( BD =Banque de Donnes)

RNDE : Rseau National des Donnes sur lEau : http://www.rnde.tm.fr/
BD HYDRO : Banque HYDRO, SCHAPI, Avenue Gaspar Coriolis, 31057 TOULOUSE. Tl.:
+33 (0)5.34.63.85.57. Email: hydro@environnement.gouv.fr Web : http://hydro.rnde.tm.fr
Etc
Types de donnes
Chroniques hydrologiques horaires, journalires, mensuelles, annuelles.
Exemples : prcipitations P(t) mm/h avec t = 1 h; dbit Q(t) m3/s avec t =1 j.
Rgimes hydrologiques : dbits de la 1re dcade du mois de Juin des annes 1981-2005.
Donnes spatialement distribues : pluies en 23 stations pluviomtriques
Exemples de donnes et de rseaux de mesures

Voir figures suivantes
Bulletin Hydro

Dtails: BD Hydro

Exemples de donnes (et rseaux de mesures)
Voir figures suivantes
Rseau de mesure pluviomtriques dans le bassin versant dEel River
Drive des prcipitations annuelles sur 80 ans (Tabucaya, D.F., Mexique)
Reconstitution de prcipitations sur plus de 2000 ans (Mexique) : dendro-hydrologie .
Observations sur les crues historiques toulousaines sur 700 ans
Dbits de crues annuelles du Rhne
Dbits de crues annuelles de lOued Mdez (Moyen Atlas)
Module annuel de la Loire Blois
Rgime de dbits mensuels - cartographie par rgions (U.S.A)
Rgime des pluies et dbits par quinzaine traitement statistique (Gin Ganga, Sri Lanka)
Chroniques pluies-dbits semi-horaires et journalires (sources karstiques)
Etc
Bulletin Hydro

Dtails: BD Hydro
Figures: exemples de donnes & rseaux de mesures


Facteur de fluctuations climatiques a

lchelleR.Ababou
pluri-annuelle:
El Nino South
et al., INP/ENSEEIHT:
Pacific Oscillation
Prcipitations extrmes dans le

monde (P
en fonction de la dure D (h ou mn):
R.Ababou
et en
al.,mm)
INP/ENSEEIHT:
Hydrologie
Statistique
2005-06
P(mm) 388.6*D0.486(h) . NB:
sur le graphique
log-log,
P est en mm et D en mn.
10

11

Source: C Thirriot daprs R Lambert et al (cf Atlas Hydraulique Garonne)
12
Hydrologie
Statistique
Source karstique dAliou
(Pyrnes):
pluie 2005-06
et dbit semi-horaires (t=0.5h).
13
Pluie P(t) et dbits

Q(t) journaliers
pour2005-06
3 source karstiques (Pyrnes).
Hydrologie
Statistique
14
R.Ababou
Rgime des dbits spcifiques bimensuels
(t=15j)
la station dAgaliya (Sri Lanka): analyse 15
Hydrologie
Statistique
2005-06
statistique des donnes interannuelles
par quantiles,
et courbe
du dbit moyen interannuel.
Comparaison de 2 annes de chroniques

deet
pluie
(histogramme bleu) et de dbit spcifique
R.Ababou
al., INP/ENSEEIHT:
Hydrologie
Statistique
2005-06 / Q-Jesmin (Sri Lanka).
(courbe rouge) agrges sur t=15j
(bimensuelles)
: P-Talawama
16
Comparaison de 2 annes de chroniques

de et
pluie
R.Ababou
al., (histogramme
INP/ENSEEIHT:bleu) et de dbit spcifique
Hydrologie
Statistique
2005-06
(courbe rouge) agrges sur t=15j
(bimensuelles)
: P-Anningkanda
/ Q-Jesmin (Sri Lanka).
17
et jaugeage
al., INP/ENSEEIHT:
Stations pluviomtriques en bleu;R.Ababou
stations de
de dbits en rouge. Bassin versant
de la Gin Ganga (Sri Lanka). Etude D.E.A. de Karine DESNOS 2001 (IMFT/R.Ababou).
18

19

The PDSI is obtained
from precipitation, air
temperature, and local
soil moisture, along with
prior values of these
measures.
PDSI values range from
-6.0 (extreme drought) to
+6.0 (extreme wet
conditions), and have
been standardized to
facilitate comparisons
from region to region
(USA).
This drought index has
been used to evaluate
drought impact on
agriculture.
The animation [shown to the left]

demonstrates the distribution of drought
from instrumental data for the
-1933-1940 Dust Bowl Drought (top),
-1951-1956 Drought (bottom).
Both droughts affected much of the U.S.
Southwest & Southern Great Plains.
Red indicates areas of extreme drought,
while blue indicates very wet conditions.
Notice how extensive an area is under
severe drought as the 1930s decade
progresses. Texas is a key area for the
1950s drought.
Cartographie animee du PDSI

(Palmer Drough Severity Index)
Source: USGS (lgendes

modifies -- R.A.)
20

0. INTRODUCTION
Bibliographie, donnes hydrologiques (exemples),
modlisation statistique en hydrologie (exemples)
0.2.
OBJECTIFS, MTHODES & MODLES STATISTIQUES EN HYDROLOGIE
Etape 0: Choix d'une approche de type statistique

Supposons que nous ayons traiter un problme hydrologique tel que :
prdire le rgime des dbits en diffrents points d'un bassin,
pour l'implantation de microcentrales hydro-lectriques,
prdire les crues extrmes sur le futur site de construction d'un barrage (par exemple en Asie).
Aprs examen du problme pos, des donnes et des moyens disponibles, l'hydrologue peut avoir
reconnatre l'utilit (ou mme la ncessit) d'une description probabiliste / statistique des
phnomnes. La raison en est lextrme complexit des situations et mcanismes physiques :
processus hydro-mtorologiques et hydrodynamiques spatio-temporels (prcipitations, dbits
de ruissellements,);
les milieux gophysiques htrognes (proprits de surface des bassins hydrologiques:
permabilit, topographie, vgtation, sols,).
Par exemple, il peut sembler trs difficile de proposer une modlisation purement hydrodynamique
pour estimer les chroniques de dbits en un point d'un cours d'eau non jaug (). Une "modlisation
statistique" est alors propose, en adaptant celle-ci troitement aux donnes et moyens disponibles.
21

0. INTRODUCTION
Exemples:
Le terme "modlisation" s'applique aussi bien l'approche statistique que mcaniste. Dans les deux
cas, la modlisation est utilise pour la prdiction, l'interpolation, ou l'extrapolation, par exemple
lorsqu'il s'agit de connatre les dbits non observs (scnarios climatiques; crues de projet; etc).
Voici 2 exemples spcifiques justifiant le terme "modlisation" dans l'approche statistique.
Ex.1 : Interpolation d'un modle statistique : rgression linaire simple (donc corrlation)
permettant d'estimer ou reconstituer une donne (dbit de Mai 1976 la station S6), une srie de
donnes (dbits mensuels de 1976 la station S6), ou mme une variable ("dbit mensuel de Mai
la station S6"), non directement observe.
Ex.2 : Extrapolation d'un modle statistique : estimation du dbit d'une crue extrme non observe
(e.g. crue dca-millnale) par extrapolation de sa loi de probabilit, estime par ajustement des
donnes crues annuelles.

22

0. INTRODUCTION
Etape 1: Mise en forme et critique des donnes
Choix des variables hydrologiques pertinentes.

Formattage, numrisation (analogique digitale) et condensation de l'information.
Choix d'un pas de temps ou, plus gnralement, tests de rsolution spatio-temporelle.
Transformations pralables des donnes (log, puissance) : e.g., log-dbits Y=ln(Q).
Relations dterministes ou mcanistes entre variables : courbe de tarage Q=T(H).
Visualisations graphiques prliminaires : chroniques X(t), nuages de poinst (X,Y), etc.
Analyses statistiques prliminaires : moyennes, carts-types, coefficients de variation.
Reconstitution statistique de donnes manquantes : par rgression linaire.*
Critique de donnes aberrantes : limination des "horsins" (anglais : outliers).*
*Remarque : En fait, les tapes reconstitution de donnes manquantes et critique de donnes aberrantes
peuvent tre considres comme analyses statistiques part entire, faisant partie intgrante du modle statistique.

23

0. INTRODUCTION
Etape 2: Analyse statistique des donnes / modlisation des variables
Cette tape consiste en l'application d'une analyse statistique aux donnes disponibles, ou mme,
l'application d'un modle probabiliste vis--vis des variables inconnues ou incertaines (les variables
"expliquer", modliser).
Le modle probabiliste formalise l'information contenue dans les donnes (cf. Duband 1982), mais
aussi, le modle probabiliste propose une estimation prdictive de variables/donnes non directement
observes (c'est le point de vue adopt ici).
Exemples:
Ajustement d'une fonction de rpartition au donnes de pluies annuelles Agadir: application pour
prdire les "scheresses" de temps de retour dcennal et centennal.
Rgression linaire entre deux variables hydrologiques: la variable expliquer est Y=Q2, le dbit
mensuel de Mars la station S2; la variable explicative est X=Q1, le dbit mensuel de Mars la station
S1 dans le mme (petit) bassin versant. La modlisation porte sur l'estimation de Y connaissant X. Ce
peut tre un problme de reconstitution de donnes manquantes en S2.
Plus gnralement, la corrlation multiple et l'ACP (Analyse en Composantes Principales) est utilise
pour analyser les relations entre variables hydrologiques observes en plusieurs stations de mesures.

24

0. INTRODUCTION
Etape 3: Exploitation du modle statistique (modlisation, estimation, interprtation)
Aprs des tests de validation ventuels du modle statistique, la dernire tape consiste en l'exploitation du
modle (avec au pralable des tches de post-traitement), en vue de rpondre aux objectifs (questions poses
par les "dcideurs").
Exemples (questions poses):
quelles stations de mesures sont redondantes?
quel est le dbit de la crue de projet dca-millnale?
gnrer une chronique de dbits journaliers ou horaires, et sa bande de confiance,
sur le site S d'une rivire non jauge;
proposer une cartographie optimale de la pluviomtrie sur le bassin versant B;
etc

25

0.3.
EXEMPLES DAPPLICATIONS DE LHYDROLOGIE STATISTIQUE,
Rationalisation, optimisation, redondances d'un rseau de stations de mesures

Reconstitution totale ou partielle d'une srie de donnes manquantes
Prdiction statistique de dbits d'tiage (en liaison avec le Dbit Objectif dEtiage)
Prdiction statistique de dbits de crues extrmes (dca-millnal)
Par exemple, estimer le dbit de la crue de projet dca-millnale (Q10 000). Celle-ci peut tre dfinie
comme le dbit journalier (moyenne ou pointe journalire) de la crue annuelle (maximum des 365
dbits journaliers sur l'anne calendaire) de temps de retour dix mille ans. Par dfinition, la
probabilit de retour d'une crue annuelle plus forte que Q10 000 est seulement de 1/10 000me; la
probabilit de dpassement de la crue dca-millnale est donc de 10-4 seulement. Application la
protection d'ouvrages d'art tels que ponts, digues de protection, barrages (vacuateurs de crues).
Gestion de retenues usages multiples

Gestion de rservoirs en tenant compte des inputs ("offre"), des outputs ("demande") des
contraintes (e.g. Dbit Objectif d'Etiage), et de fonctions objectifs, tenant compte de tarifications
en vigueur (eau irrigation, eau potable, lectricit). Les inputs de la retenue peuvent tre modliss
par une approche stochastique / processus alatoires (e.g. processus ARMA : cf. Box & Jenkins).
Prvision hydromto et alerte de crues en temps rel

Protection de l'environnement, tudes d'impact, tudes de risques
Inondations (altitudes, pentes).
Erosion (gomorpho, pentes).
Pollution distribue agricole : non point source

Pollution accidentelle, industrielle : point source .
_ETUDE_PQ_BV-GinGanga-Sri_7pp.pdf
26
0.4.
EXEMPLES DE MODLES STATISTIQUES EN HYDROLOGIE
Types de modles statistiques (ou probabilistes, stochastiques, gostatistiques)

Tout d'abord, voir la remarque ci-dessous sur la terminologie(*).
Ici, on a choisi de regrouper les diffrents types de modles en trois grands groupes, qui
correspondent grosso modo au plan d'ensemble de ce cours:
i. Les modles statistiques univaris (une seule variable hydrologique)
ii. Les modles statistiques multivaris (plusieurs variables multi-corrles)
iii. Les modles statistiques spatio-temporels (processus hydrologiques, etc)
Voici, dans chaque cas, un exemple d'utilisation possible du modle statistique:
Modle univari:
Ajustement et extrapolation d'une loi de probabilit
Modle multivari:
Corrlations multiples et ACP; rgression multiple
Modle (spatio)temporel:
Identification statistique d'un HU(t) pluiedbit.
(*) Terminologie. Statistique" se rfre au traitement statistique de donnes (construction d'une fonction de
rpartition empirique, estimation de moments sur chantillons de taille finie, etc). "Probabiliste" se rfre la
modlisation d'une variable hydrologique vue comme une variable alatoire (loi de probabilit). "Stochastique"
se rfre plutt la modlisation probabiliste de processus temporels (chroniques hydrologiques).
"Gostatistique" se rfrre la modlisation de variables hydrologiques spatialement distribues: thorie de
Matheron (variables rgionalises); thorie Bayesienne de l'estimation (fonctions alatoires).
Autre exemple : un modle dintensit de pluies P(t) mi-statistique, mi-mcaniste :

Le modle dimpulsions rectangulaires de Neyman-Scott gnre un processus dintensit de
prcipitations P(t) (mm/h) qui peut tre ajust de faon satisfaire certaines proprits observes
(intensits, intermittences, dures des averses).
Modele P(t) Neyman-Scott

27

0. INTRODUCTION
Donnes hydrologiques, modlisation statistique en hydrologie, exemples
0.3.
EXEMPLES DETUDES DHYDOLOGIE STATISTIQUE
Rgimes hydrologiques.
Exemple : rgime intra-annuel des pluies et des dbits dans un bassin du Sri Lanka
Problme de la rgionalisation des dbits.
Exemple : extrapolation spatiale des dbits partir de donnes pluies & dbits au Sri Lanka.
Identification de la fonction de transfert pluie-dbit (hydrogramme unitaire statistique)
Exemple : identification de la fonction de transfert pluie-dbit par dconvolution pour des
sources karstiques. Application la reconstitution des dbits, analyse des structures
temporelles des dbits et fonctionnement hydraulique des massifs karstiques.
Fonction de
transfert pluie-dbit
pour de sources
karstiques (MidiPyrnes).
Regimes
hydrologiques et
rgionalisation des
dbits (Sri Lanka)

28
FIN DU CHAP.0 INTRODUCTION

29
CHAP.1-A
Cours Hydro.Stat. 3Hy : Sance 2+3

Sous-titre :
Enseignants 2005-06
: R.Ababou,
2005-06 A. Al-Bitar.

Documents en ligne:
Web local R.A. free



1. A. Analyse statistique univarie, moments, lois de probabilit

A. Al-Bitar.
2005-06

1. ANALYSE STATISTIQUE UNIVARIEE
0. BASES ELEMENTAIRES DE PROBABILITS ET STATISTIQUES
Variables alatoires, lois de probabilit, moments (rappels)
Voir introduction et exercices de bases du cours Probabilit et Statistique (R.Ababou)
sur le site web http://rachid.ababou.free.fr
Voir le polycopi Hydrologie : Tome 1 :Statistique (R.Gaudu) :
o pp.1-3 :
(I.I I.IV)
Fonctions de Rpartition
o pp.7-9 :
(II.III)
Moments
o p.12 :
(II.VII)
Coeff. de corrlation
(voir aussi VI)
o pp.13-31 :
(III.II)
Lois de probabilit Normale, etc (cf. Tableau p.31)
Estimations et ajustements (moments et loi de probabilit)

Voir la mthode des moments dans le cours Probabilit et Statistique (R.Ababou)
sur le site web http://rachid.ababou.free.fr
Voir le polycopi Hydrologie : Tome 1 :Statistique (R.Gaudu) :
o pp.33-36 :
(IV.I IV.III)
Estimateurs statistiques des moments
o pp.41-45 :
(IV.VIII et V.I-V.II)
Estimation dune fonction de rpartition
(Mthode des moments) (Formule de Hazen)

HYD STAT 2005-06 : PLAN DES SEANCE 2+3
( titre indicatif)
1-A. ANALYSE STATISTIQUE UNIVARIEE (A)
1.0. Bases lmentaires de Proba-Stat ... :
Probabilit, V.A.'s, F. d. Rpartition, Moments, Estimateurs
1.1. Lois de proba classiques & ajustements (moments; Khi2)
Loi(s) des valeurs extrmes de type crues (Gumbel...)
1.2. Exemple d'analyse, ajustement &utilisation de lois de proba:
dbits de crues annuelles (Oued Mdez)
1.x. Les lois des pluies et dbits diffrentes chelles de temps;
1-B. ANALYSE STATISTIQUE UNIVARIEE (B) :
EVENEMENTS RARES & LOI DE POISSON
1.3.
Loi(s) des valeurs extrmes de type crues (Gumbel...)
1.4.a
Evnements rares : dpassements de seuils; crues de projet
1.4.b
Evnements rares : loi de Poisson (dfinition; proprits)
1.5. Exemples d'applications : estimation d'une crue de projet
(le temps de retour; les probabilits d'occurence...) => cf.TD1


HYD STAT 2005-06 : PLAN DE LA SEANCE 2+ (dtails)
Plan Dtaill de la Section 1.0: Bases Proba-Stat. ...
1.0. BASES LMENTAIRES DE PROBA-STAT ... :
PROBABILIT, V.A.'S, F. D. RPARTITION, MOMENTS, ESTIMATEURS
Notions de probabilits, frquences, incertitudes, th. de Bayes
(axiomatique des probabilits; interprtation; exemples...)
Gnrateurs de Nombres Alatoires & Variables Alatoires...
Dfinition d'une loi de proba pour une V.A continue: FdR/DdP
Estimation d'une Densit de Proba (histogramme frquences)
Estimation d'une Fonction de Rpartition :
1) par histogramme
2) par points (Hazen)
Estimateurs statistiques de moments (*)
moyenne; variance; covariance; coefficient de corrlation...
(*) NB: On trouvera des aspects de la thorie de l'estimation (Bayesienne) dans les Chap.2 "Analyse
Multivarie" et Chap.3 Processus Hydrologiques . Voir par ex. les modles de rgression linaire simple
et multiple, dont diverses gnralisations pourront tre utilises en TD : estimation Bayesienne d'un vecteur
d'tat reprsentant un processus alatoire; estimation go-statistique d'une variable spatialise 2D...


Introduction proba-stat. et axiomatique des probabilits :
probabilits ensemblistes, interprtation frquentiste, incertitudes, Bayes
Exemple 1
Un ensemble discret infini (dnombrable) dvnements dans un jeu de pile ou face non truqu,
de dure infinie :
= {Ralisation dune squence de n piles successifs, nIN}
Exemple 2
Hydromtorologie un ensemble continu dvnements valeurs sur IR+ ; voici un exemple
dvnement :
= { La lame deau prcipite Toulouse le 21 Mars ( anne) Toulouse est P (mm) }
tant entendu que P IR+

Introduction proba-stat.
Soit maintenant A une tribu de parties de : A ( ) .

Dfinition
Une tribu est un ensemble de parties de stable par les oprations de passage au
complmentaire, de runion, et dintersection dnombrable. Une tribu A peut tre en particulier
(mais pas ncessairement) constitue de lensemble de toutes les parties de , soit A = ( ) .
Exemple Dans lexemple de pile ou face simple, on obtient la tribu engendre par :
A = {, pile, face, pile ou face}.

La tribu A engendre par ={pile, face} est constitue de 4 vnements. Le premier
est vide , et le dernier, (pile ou face), est un vnement composite constitu de
lunion de deux vnements lmentaires, ce qui quivaut ici lensemble tout
entier.
Enfin, une loi de probabilit est dfinie par une mesure de probabilit, qui est une mesure
positive P sur lespace probabilisable (, A), telle que la mesure de lensemble tout entier est
lunit. Cel se traduit formellement par les proprits suivantes (mesure de probabilit) :
P()=1,
P(AB)=P(A)+P(B),
pour tout couple dvnements (A,B) mutuellement exclusifs ou incompatibles, cest--dire
encore disjoints, tels que A B = . Comme tous les vnements lmentaires sont par
dfinition disjoints (mutuellement exclusifs deux deux) on a donc aussi :
P(i) = P(i) = P() = 1,

pour tout ensemble fini, ou infini dnombrable, dvnements lmentaires i.

Introduction proba-stat
P()=1,
P(AB)=P(A)+P(B),
P(i) = P(i) = P() = 1,
Exemple Par exemple, pour le jeu de pile ou face non truqu, on a pour chaque jet :
Proba{}
= 0
Proba de navoir aucun vnement (ni pile ni face)
Proba{pile}
= 1/2
Proba du premier vnement lmentaire (pile)
Proba{face}
= 1/2
Proba du second vnement lmentaire (face)

Proba davoir lun des vnements (soit pile soit face)
Proba{pile ou face} = 1


Exemple - un problme de probabilit frquentiste :
tirage de boules & application du thorme de Bayes.
A
PO
PA
PB
AB
PAB
Figure Tirage de boules avec remise & probabilits conditionnelles de Bayes

Un sac contient quatre types de boules : non marques, marques A, marques B, marques AB. La
proportion du nombre de boules de chaque type est donne par P0, PA, PB, PAB. Ces proportions sont
interprtes comme des probabilits. Lorsquon puise des boules dans le sac, on identifie chaque
boule tire du sac et on la replace dans le sac avant de tirer la boule suivante. Il sagit dun tirage
avec remplacement : il y a bien rptition , les rpliques multiples sont toutes tires de la mme
population . Et lon a P0+PA+PB+PAB = 1 comme il se doit.
Question. Dans cette interprtation frquentiste des probabilits, quelle est la probabilit de
tirer une boule contenant la marque A si on sait que la boule tire contient la marque B ?

10

Exemple - un problme de probabilit frquentiste :
tirage de boules & application du thorme de Bayes.
A
PO
AB
PA
PB
PAB
Figure. Tirage de boules avec remise & probabilits conditionnelles de Bayes

Rponse. La rponse est obtenue par les probabilits conditionnelles (thorme de Bayes) :
Pr oba{A I B}
Pr oba{B}
PAB
Pr oba{AB}
Pr oba {A B} =
=
Pr oba{B ou AB} PB + PAB
Pr oba {A B} =
o Proba{A|B} dnote la probabilit conditionnelle que A se produise si B sest produit (de faon
dterministe, sans incertitude). Le signe signifie et, AND. Le signe signifie ou
non exclusif (OR) ne pas confondre avec le ou exclusif (XOR).

11

Introduction proba-stat. et axiomatique des probabilits :
probabilits ensemblistes, interprtation frquentiste, incertitudes, Bayes

Quelques thormes de convergence
(NB : les Xi sont N v.a.s i.i.d.)
Loi additive des grands nombres (convergence vers la moyenne) :
lim
X 1 + ... + X N
=m
N
Thorme central limite (convergence additive vers la loi de Gauss):
lim
X 1 + ... + X N
= Z o Z : 0, 2 suit une loi de Gauss
X
N
La somme dun grand nombre de V.A.s relles Xi a donc tendance suivre une loi de Gauss.
Remarque sur les processus multiplicatifs ( partir des processus additifs ci-dessus) :
Il suffit de poser Xi = ln(Yi), avec Yi positive, pour voir apparatre le produit des Yi (Yi=exp(Xi)) au
lieu de la somme des Xi. Noter que, si Z est gaussienne, la variable exp(Z) est dite log-normale. Le
produit dun grand nombre de VAs Yi relles positives a donc tendance suivre une loi log-normale.
12

0. BASES ELEMENTAIRES DE PROBABILITS ET STATISTIQUES -- SUITE
GNRATEURS DE NOMBRES ALATOIRES & VARIABLES ALATOIRES...
Gnrateurs dentiers alatoires.
Gnrateurs entiers multiplicatifs congruentiels. Ceux-ci permettent de gnrer une squence de nombres
entiers Ni purement alatoires entre [0,M], ce qui permettra ensuite de gnrer une squences de v.a. relles
uniformment distribue dans lintervalle [0,1].
Gnrateurs recommands. Exemples de bons gnrateurs dentiers 32 bits [et 64 bits] bien tests.
Problmes et piges. Cycle du gnrateur. Sous-cycles, auto-corrlations, et autres proprits indsirables.
Un gnrateur particulier dentiers alatoires (entiers 32 bits, avec un cycle de 2**18 million).
Spcifier un grain (seed) N0 :
N0 doit tre ici un entier positif de la forme 4k+1(ex : N0 = 1).
Calculer le produit modulo M :
N i = ( L * N i 1 + C ) mod( M ) ,
avec ici :
Multiplicateur :
L = 3+(2**10)
Constante entire :
C=0
Module :
M = 2**20
Gnration dune variable alatoire relle uniforme dans [0,1] :
(Noter: 2**10 = 1024)
U i = float ( N i / M )
13


GNRATEURS DE NOMBRES ALATOIRES & VARIABLES ALATOIRES...(SUITE)
Gnration de variables alatoires non-uniformes

Objectif. Gnrer une V.A. X ayant une fonction de rpartition FX(x) quelconque donne, par exemple
binaire, exponentielle, gaussienne, ou autre. La plupart des mthodes utilisent les rpliques dune V.A.
uniforme U[0,1], que lon sait gnrer par la mthode vue plus haut.
Diffrentes mthodes.
Mthode de la FdR inverse.
Mthode du cercle (Box-Muller).
Mthode(s) de rejet (Von Neuman).
La mthode de la FdR inverse
On obtient les rpliques dsires X(i) partir des rpliques de la VA uniforme U(i), comme suit :
THORIE (CF. SCHMA)
X (i ) = FX1 U (i )
EXEMPLE : Loi Exponentielle pour x 0 (avec = mX =X )
f X ( x) =
FX ( x) =1 e
X (i ) = ln 1 U (i )
Dsavantages : la fonction rciproque FX-1(u) peut tre difficile expliciter : par ex., pour la gaussienne, FX(x)
scrit en termes dune fonction spciale, erf(x), dont il faut obtenir la rciproque (tables numriques, ou
approximations rationnelles cf. Abramowitz et Stegun).
Gnrateurs disponibles dans les logiciels
Voir par exemple les librairies et les fonctions Fortran, ou encore, les fonctions disponibles dans MATLAB :
la fonction rand de MATLAB gnre une V.A. uniforme U[0,1] ;
la fonction randn de MATLAB gnre une V.A. normale N(0,1), i.e., loi gaussienne centre rduite.
14

LOI DE PROBA DUNE V.A CONTINUE RELLE :
FdR, DdP, & estimations empiriques
Soit une VA (Variable Alatoire) X valeurs dans IR ou IR+.
o Fonction de Rpartition (FdR) Cumulated Distribution Function (CDF)
FdR : FX ( x ) = Pr ( X x ) ,
o X est la VA elle-mme, et x une valeur quelle peut prendre.

o Densit de Probabilit (DdP) Probability Density Function (PDF)
= dFX ( x )
DdP :
f X ( x) =
= FX ( x + dx ) FX ( x )
dFX ( x )
f X ( x )dx =
dx
= Pr ( X x + dx ) Pr ( X x ) .
= Pr ( x X x + dx )
o Note : fX(x)dx reprsente un incrment de probabilit [adimensionnel], tandis que fX(x) est une
densit de probabilit en units inverses de x : [units de x-1]. La relation entre la densit fX(x) et
la frquence f% dun histogramme de frquences est : f% 100 fX(x) x. Utiliser cette
relation pour comparer sur un mme graphe lhistogramme de frquences la densit de proba.
15

1. ANALYSE STATISTIQUE UNIVARIEE : 1.0. BASES
LOI DE PROBA DUNE V.A CONTINUE RELLE : FdR, DdP, & estimations empiriques
Voir algorithmes extraits du programme Matlab STAT_PDF.m

o Estimation empirique d'une Densit de Proba (histogramme de frquences)
1. Choisir une rsolution x (largeur des btonnets dhistogramme) telle que :
Taille x suffisante
pour viter les bruits
2.
Min x j +1 x j << x << xMAX xMIN
Taille x pas trop grande pour

viter un excs de lissage (biais).
Compter le nombre de valeurs de la VA X comprises dans chaque intervalle Ij-1/2 :

Soit les intervalles dfinis par : Ij-1/2 = [(j-1).x , j. x]
Soit xj-1/2 = (j-1/2).x , le centrode de lintervalle Ij-1/2
Soit nj-1/2 le nombre dobservations X(i) [(j-1).x , j. x]
3.
Soit fj-1/2 = nj-1/2 /N , la frquence empirique pour lintervalle Ij-1/2 centr sur xj-1/2
Lhistogramme des frquences et la DdP empirique sobtiennent alors comme suit :
n j 1/ 2
Histogramme des frquences :
f j 1/ 2 =
Densit de proba empirique :
f j 1/ 2
fX ( x )
, x [x j 1 , x j ]
x
NB : Ceci peut encore scrire formellement : f ( x ) =
j=N
(et : f% = 100f).
x x j 1/ 2 n j 1/ 2
x
N , o (x) est la
x
j =1
fonction crneau unitaire (box function) centre sur lorigine, de largeur unit et hauteur unit.
16
Densit de Proba (Q crues Mdez

en m3/s)
o Estimation empirique d'une

Densit de Probabilit (histogramme) :
Nbre doccurences (Q crues

Mdez en m3/s)
Histo de frquences (Q crues

Mdez en m3/s)
NB: Choix de la largeur des

histogrammes (ici): Q=50m3/s.
17

o Estimation empirique d'une Fonction de Rpartition : (1) par histogramme
Voir plus haut lhistogramme des frquences : il suffit de le cumuler
On obtient la courbe des frquences cumules, qui est aussi la FdR empirique
estime, soit :
Frquences cumules :
k= j
k= j
k =1
k =1
F j 1/ 2 = f k 1/ 2 =
nk 1/ 2
N (F% = 100F).
F. de Rpartition empirique : FX ( x ) F j 1 / 2 , x x j 1 , x j
DdP: f
Note. Dans cet

exemple (voir
figures), le x
dhistogramme
est trop petit,
et/ou il ny a
pas assez
dobservations
(N trop petit).
FdR: f

18

o Estimation empirique d'une Fonction de Rpartition :
(2) mthode par points (Hazen)explication de la mthode
NB. Le pb de lestimation dune FdR empirique est distinct du pb de lajustement dune loi de probabilit
thorique cette FdR empirique. On doit dabord disposer dune estimation de la FdR empirique, avant
de proposer lajustement dune FdR modle thorique donne (gaussienne, exponentielle, etc).
La procdure destimation de la FdR par points est dcrite ci-dessous (variante dite mthode de Hazen):
1. Classer les N observations {x1, x2, xN} par ordre croissant (voir algorithme en annexe) :
Ordre
naturel (t)
t1
t2
t3
t25
Fonction de Rpartition Empirique (Formule de Hazen)

1
0.9
0.8
Fonction de Rpartition F(x)
0.7
0.6
ZOOM
0.5
0.4
0.3
0.2
0.1
100
200
300
400
500
600
700
800
900
1000
Courbe empirique F(xj) par points (Q crues Mdez)
Temps t
reclass
tc1 = t7
tc2 = t18
tc3 = t4
tc25= t11
Indices des
donnes classes
jc1 = 7
jc2 = 18
jc3 = 4
jc25 = 11
Donnes
classes
xc1 = x7
xc2 = x18
xc3 = x4
xc25 = x1
ZOOM Exemple fictif: xMIN=x7 x18 x4 x11=xMAX
j 1
2 , ( j = 1,..., N )
(x ) =
F
X
j
2. Appliquer la formule de Hazen point par point :
N
FX (x j ) Pr ( X x j ) , ( j = 1,..., N ) .
NB. Intuitivement, cela donne bien :
19


o Estimation empirique d'une Fonction de Rpartition :
(2) mthode par points (Hazen)exemple des crues de lOued Mdez sur 23 ans (Q m3/s)
Fonction de Rpartition Empirique (Formule de Hazen)
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
100
200
300
400
500
600
700
800
900
1000

20
o Estimation empirique d'une Fonction de Rpartition : (2) par points (Hazen)
Exemple de comparaison Hazen / histogramme (donnes = dbits spcifiques)
21


1.0. BASES ELEMENTAIRES DE PROBABILITS ET STATISTIQUES -- SUITE
o Thorie de l'estimation. On trouvera des aspects de la thorie Bayesienne de lestimation Ch.2 "Analyse
Multivarie" et Ch.3 Processus Hydrologiques . Voir les modles de rgression linaire simple et multiple, et le
modle de convolution pluie-dbit, dont diverses gnralisations pourront faire lobjet de Bureaux dEtudes :
estimation Bayesienne d'un vecteur d'tat, dun processus alatoire; d'une variable spatialise 2D (gostatistique)
o Estimateurs statistiques de moments : moyenne; variance (et : covar.; coeff de corrl. ; etc)
Soit une VA relle X : on observe N ralisations de X, quon notera : {x1, x2, , xN }. On suppose ici
que la population (le nombre de rpliques thoriquement disponibles) est infinie. On dispose donc de
N ralisations (observations) tires dune population thoriquement infinie.
Estimateur de la moyenne dune V.A. relle partir dun chantillon de taille fini N
Estimation :
m X =
1 i= N
xi
N i =1
Erreur destimation :
RMS (m X ) =
Estimation :
X2 =
Erreur destimation :
RMS ( X ) =
RMS=Root-Mean-Square = Erreur Quadratique Moyenne
o (par dfinition) :
X ) Var(m X )
RMS ( m
N
N
Estimateur de la variance dune V.A. relle partir dun chantillon de taille fini N
(estimateur sans biais, en supposant la moyenne connue, pour N grand >>1) :
1 i= N
( xi m X )2 do : X =
N 1 i =1
X
1 i= N
( xi m X )2 ().
N 1 i =1
Ex : X N(0,1) : si N=50, RMS ( X ) 1 10.
2N
R.Ababou 2
etNal., INP/ENSEEIHT:
22

1. ANALYSE STATISTIQUE UNIVARIEE : 1.0. BASES -- SUITE
o Estimateurs statistiques de moments (moyenne, variance,)
Exemple. Prcipitation annuelles Agadir (semi-aride) de 1914/15 1974/75 (N = 58 observations)
Moyenne:
m X =
1 i= N
1 i= N
xi = 230.5 mm
X =
( xi m X )2 = 111.9 mm
Ecart-type
:
N i =1
N 1 i =1
NB : lcart-type est estim ici en prenant la racine carre de lestimateur sans biais de la variance.
Coeff. de Variation estim :
C X X = 0.48 = 48%. .
m X
Le coeff de variation des pluies annuelles est 50% (forte variabilit interannuelle, climat semi-aride).
Intervalle de confiance 80% de la vraie moyenne interannuelle ?
On cherche lintervalle de confiance 80% de la vraie moyenne interannuelle m (inconnue) autour de
moyenne estime m (connue). On utilise pour cela le rsultat suivant. Pour N suffisamment gra
(supposons ici que N=58 est suffisamment grand), la variable m suit une loi gaussienne N(m,2) o
lcart-type derreur dchantillonnage, ou erreur RMS , donne plus haut. On en dduit que :

I 80% (m X ) = [m X 1.28 m ] = m X 1.28 X = 230.5 19.0 mm.
N

23

1.1 LOIS DE PROBA CLASSIQUES, MOMENTS, AJUSTEMENTS
Moments (univaris)
Notations : E(x) = < x > = mX.
Les moments centrs d'ordre n sont dfinis par la relation :

(3)
n=<(x-m)n>,
Le moment centr d'ordre 2, 2 , reprsente la variance 2 :

(4)
2 =2 =<(x-m)2>.
Units physiques de 2 = units de [x2]
do lon dduit lcart-type (cest la racine carre de la variance) :

(4)
= 2
Units physiques de = units de [x].
Le coefficient de variation est quantifie le degr de variabilit d'une variable alatoire positive :
(5)
CV ou C = /m.
Enfin, les moments centrs d'ordre 3 et 4 sont aussi utiles pour les ajustements ; ils sont dfinis par :
(6)
3=<(x-m)3>.
(7)
4=<(x-m)4>

24

1.1 LOIS DE PROBA CLASSIQUES, MOMENTS, AJUSTEMENTS(SUITE)
Moments (univaris) suite : moments dordre lev
A partir des moments centrs dordre 3 et 4, on dfinit les coefficients d'asymtrie (skewness) et
d'aplatissement (kurtosis), ou coefficients de Fisher (Ventsel 1973, Tassi 1989) :
= 3 : coefficient d' asymtrie (Skewness).
= 4 3 : coefficient d' aplatissement (Kurtosis) .
(8)
: On montre que = 0 pour une distribution symtrique, puisque les moments d'ordre impairs sont
alors nuls. Le coefficient est positif pour une loi asymtrique comme la loi log-normale ou la loi
exponentielle (>0: queue de distribution persistante vers les x >> mX). Il est ngatif dans le cas contraire
(exemple : loi suivie par y = x0-x, o x suit une loi exponentielle ou log-normale).
: Le coefficient daplatissement = 0 par construction pour une loi de Gauss ; on a > 0 pour une
densit de probabilit plus pointue que la loi normale, et ngatif pour une densit plus "aplatie".
Exemple : la loi de Laplace densit exponentielle symtrique est trs pointue car elle prsente un
point de rebroussement l'origine ; son coefficient d'aplatissement est fortement positif ( = +6).
25


Lois de proba univaries classiques (et ajustements par les moments)
Loi normale:
La loi normale ou gaussienne est une loi deux paramtres (m,).
Densit de probabilit gaussienne:
(10)
1
f X ( x) =
e
2
Tous les moments dordre impairs sont nuls (loi symtrique)
( x m) 2
2 2
pour x R
3 = 0
Les moments dordre pair de la loi normale (centre rduite) sont (voir par exemple Tassi 1989) :
(9)
x 2 p = 2 p = 2 p
( p + 1 / 2 )
= 1 3 (...) (2 p 1)
(1 / 2)
Les coefficients d'asymtrie et d'aplatissement (dfinis + loin) sont donc nuls : (11)
4 = 3 .
= 0 ; = 0.
La fonction de rpartition (FdR) FX(x) de la loi de gauss, intgrale de fX(x), est une fonction spciale :
1
x
FX ( x ) = 1 + erf
2
2
erf ( x )

e
0
u 2
du ;
erfc( x ) 1 erf ( x ) .
26

Lois de proba univaries classiques (et ajustements par les moments)
Loi de Rayleigh

27

Lois de proba univaries classiques et ajustements par les moments

SUITE :
Dtails dans fichier PDF

MOMENTS
Voir ANNEXE :
Lois de Proba Univaries :
Relations Moments/Paramtres...
28
1.2 EXEMPLES DAJUSTEMENTS DE LOIS DE PROBA

Ajustements par les moments
DEBITS DE CRUES ANNUELLES DU MDEZ / GAUSS
29


Ajustements par les moments
DEBITS DE CRUES DU MDEZ / LOG-NORMALE

(EQUIVALENT A UNE LOI DE GAUSS POUR LES LOG-DEBITS)
Densits de Proba Empirique & Gaussienne ajuste par les moments
F.d.Rpartition Empirique & Gaussienne ajuste par les moments (bis)

1
0.9
0.6
0.5
0.7
Densit de Probabilit f(x), en units de 1/x
0.8
0.4
0.3
0.6
0.5
0.4
0.3
0.2
0.2
0.1
0.1
3.5
4.5
5.5
x
6.5
7.5
3.5
4.5
5.5
6.5
7.5

30

DEBITS DE CRUES DU MDEZ : COMPARAISON DES GRAPHES DE Q(T) ET DE LN
Q(t)
Q(T)
lnQ(t)
x (non classes).
6.5
5.5
4.5
4
1958
1960
1962
1964
1966
1968
t
1970
1972
1974
1976

1.
1.3.
1978
31

ANALYSE STATISTIQUE UNIVARIEE
TYPES DE LOIS DE PROBABILIT SELON LE TYPE DE DONNES

(VARIABLES PLUIES OU DBITS) ET SELON LE PAS DE TEMPS (T)
...en construction...

32
ANNEXES du CH.1-A

33

AUTRES EXEMPLES DHISTOGRAMMES DE FRQUENCES EN HYDROLOGIE
Courbe hypsomtrique et courbe de frquences altimtriques dun bassin.
Cas du BV de lOued Ikkem
(Maroc, cte atlantique nord).
Ci-contre,
la
courbe
hypsomtrique
et
l histogramme de frquences
altimtriques, superposs sur un
mme graphe avec aires en
abscisse, altitudes en ordonnes.
NB : comparer au rectangle
quivalent ci-dessous
Reprsentation du mme bassin

sous forme dun rectangle
quivalent, avec des courbes de
niveau quivalentes qui sont,
dans
cette
reprsentation
simplifie, orthogonales au grand
axe du rectangle. NB : la courbe
hypsomtrique
du
rectangle
quivalent est identique celle du
vrai bassin versant.
34

AUTRES EXEMPLES DHISTOGRAMMES DE FRQUENCES EN HYDROLOGIE
Concept disochrones et histogramme Time Area (TA) en hydrologie des bassins
Une ligne isochrone est un contour reliant les points du bassin caractriss par un mme
temps de transfert () de lcoulements de surface (ruissellement net) jusqu un point
exutoire donn. Lexutoire peut tre par exemple une station de jaugeage dun cours
deau. A partir du trac de diffrentes courbes isochrones, correspondant des dlais de
transferts n = n., on dfinit des tranches de bassins supposes contribuer
uniformment au dbit lexutoire avec un dlai connu (le temps n de lisochrone
correspondante). On peut alors construire lhistogramme Time Area (TA) qui est la
reprsentation graphique des contributions successives de ces tranches, en reportant la
surface comprise entre deux lignes isochrones adjacentes en fonction du temps sur un
graphique. [Voir applications dans le cours dhydrologie des bassins.]
35


ALGORITHME DE CONSTRUCTION DUNE FdR EMPIRIQUE :
exemple en langage MATLAB, tir du programme Stat_PDF.m (R.Ababou)
p.1/2
% On suppose que les dates "t" et les observations "x" sont dj disponibles
% et sont stockes dans une matrice TX=[t x] N lignes et 2 colonnes
% (1re colonne = "t" ; 2me colonne = "x").
% Le 1er vecteur colonne (t) contient les dates des observations,
% ou encore un label numrique associ aux observations, tandis que
% le 2me vecteur colonne x contient les valeurs des observations.
% Voici un exemple pour les crues annuelles de l'Oued Mdez (m3/s):
>>load Q_MDEZ_IN_NOHEADER.txt
(ce fichier contient les 2 colonnes t et x)
>> q_mdez = Q_MDEZ_IN_NOHEADER
(ceci pour simplifier le nom)
>> TX = q_mdez
(autre alias de q_mdez ; rappel : ce tableau contient les 2 colonnes [t x])
>> Excuter alors le programme STAT_PDF.m dont voici des extraits ci-dessous
% PARAMETRES A REGLER EN FONCTION DE L'APPLICATION (ici, cas des donnes crues Mdez)
> Tmin=1955;Tmax=1980;
> Xmin=0; Xmax=1200;
> Xlabel='Crues Annuelles Oued Mdez (m3/s)';
> Tlabel='Annes';
DXbin=input('ENTRER `DXbin`, la largeur des intervalles de l`histogramme : ');
% TX = Matrice Nx2 des dates "t" et des observations "x".
% t = DATES OU LABELS DES OBSERVATIONS (non classes)
% x = OBSERVATIONS (non classes)
% Noter lorganisation des donnes en 2 vecteurs colonnes :
% t
x
% 1956.5 125
1re ligne
%(1957.5) (----)
(anne manquante limine)
% 1958.5
52.7
2me ligne
% ......
...
% 1978.5
85
22me ligne
% 1979.5
1077 23me ligne.

36

ALGORITHME DE CONSTRUCTION DUNE FdR EMPIRIQUE
(p.2/2)
% Tailles des vecteurs et tableaux :

N=size(TX); N=N(1); t(:)=TX(:,1); x(:)=TX(:,2);
% Calcul des valeurs min, max, et premiers moments de la distribution de x (calculs non dtaill ici)
% xc = OBSERVATIONS CLASSEES PAR ORDRE ASCENDANT
% ic = INDICES CLASSES ou TABLE DE CORRESPONDANCE xc(:)=x(ic(:))
% tc= DATES ou LABELS CORRESPONDANTS AUX OBSERVATIONS CLASSEES
[xc ic]=sort(x);
tc=t(ic);
CLASSEMENT DES DONNEES x PAR ORDRE CROISSANT (c = classe),

en r-ordonnant aussi les tiquettes temporelles t par souci de cohrence.
% Fonction de repartition empirique Fx point par point (empirical CDF, computed pointwise)
% Fx = (i-0.5)/N (formule par points de Hazen)
Fx=(0.5/N:1/N:1-0.5/N);
figure; plot(xc,Fx,Style1,xc,Fx,Style2); grid; axis([Xmin Xmax 0 1]);
xlabel(Xlabel);ylabel('Fonction de Rpartition F(x)');
title('Fonction de Rpartition Empirique (Formule de Hazen)');
% Calculs de diffrents histogrammes : nombre doccurrences (ni), frquence (fri=ni/N),
% et frquences cumules (Fi), cette dernire tant galement la fonction de rpartition.
figure; xbins=[Xmin+(DXbin/2):DXbin:Xmax-(DXbin/2)]; hist(xc,xbins);
title('Histogramme du nombre d`occurrences, ni (adimensionnel).');
figure; fri=hist(xc,xbins)/N; bar(xbins,fri);
title('Histogramme des frquences, fri=ni/N (adimensionnel).');
figure; fi=fri/DXbin; bar(xbins,fi);
title('Histogramme de densit de proba, fi=ni/N/DXbin (units=1/x).');
figure; Fi=cumsum(fri); axis([Xmin Xmax 0 1]); bar(xbins,Fi);
title('Histogramme des frquences cumules ou f. de rpartition, Fi (adim.)');

RETOUR
37
ADDENDUM (3 pages)
Intervalle de confiance ( erreur gaussienne)

Bande de confiance (rgression linaire)
Question 1.
En utilisant une table de la loi normale centre rduite1, exprimer pour une
variable alatoire "Z" de loi gaussienne N(mZ,Z2) les intervalles de confiance
80% et 98% centrs sur mZ (qui est la fois la moyenne, mdiane, et valeur la
plus probable de "Z").
Table sommaire :
Fonction de rpartition F(u) d'une variable gaussienne centre rduite ( N(0,1) )

F(0)=
F(0.25)= F(0.52)= F(0.84)= F(1.28)= F(1.64)= F(2.32)= F(2.57)=
0.50
0.60
0.70
0.80
0.90
0.95
0.99
0.995
Question 2.
Soit une rgression linaire Y=aX+b+ entre variables gaussiennes (X,Y).
Obtenir les intervalles de confiance 80% et 98% de Y autour de la droite de
rgression Y=aX+b, connaissant les carts-types : X 1, Y 2, et le
coefficient de corrlation : -0.5 .
On peut consulter une table de la loi normale, ou bien utiliser le tableau sommaire ci-inclus.
Rponse / 1.
Intervalle de confiance (gauss)
L'objectif est de caractriser une rgion (intervalle) t.q. la V.A. ait une
probabilit "P" d'appartenir cette rgion (intervalle). Dans la plupart des
applications, il s'agit de dterminer un intervalle de confiance autour de la
moyenne : c'est ce qu'on demande ici. La procdure est illustre graphiquement
pour l'intervalle I80% (de probabilit P=80%) 2 :
Analytiquement, la procdure suivre peut tre rsume comme suit.
Utiliser la table donnant la FdR normale FU(u) pour U gaussienne centre rduite:
La table donne : FU(u) = Proba(U u) pour une v.a. U de loi normale N(0,1)
Par ailleurs X = mX + X u pour une v.a. X gaussienne de moments (mX , X2).
Dterminer l'intervalle 80% de probabilit (I80%):
Proba(U +1.28) = 0.90 d'aprs la table
Proba(U -1.28) = 0.10 par symtrie de la loi

Proba(-1.28 U +1.28) = 0.80
Rsultat : I80% = [-1.28,+1.28] pour la v.a. U centre rduite N(0,1).
Or on a : X = mX + X u. On obtient donc, pour la v.a. X gaussienne N(mX,X2) :
(et de mme) :
2
I80% = [mX -1.28 X , mX +1.28 X ]

I98% = [mX -2.32 X , mX +2.32 X ]
On a utilis la fonction erreur erf(x) de MATLAB pour tracer la FdR de la loi normale: F(x) = 0.5*(1+erf(x/2)).
Rponse / 2. Bande de confiance (erreur gaussienne de rgression linaire)

Dans le cas d'une rgression linaire Y=aX+b+, la question prcdente revient
estimer une bande de confiance autour de la droite de rgression [cf. schma
ci-dessous].
L'cart-type ( ) du rsidu () donne la largeur de la bande de confiance dans la
direction des ordonnes (Y). En notant I (YX) l'intervalle de confiance pour la
regression de Y par rapport X, on obtient par exemple, 80%:
I80%(YX) = [aX+b 1.28 ]
(etc)
Or :
2 = Y2 (1 - 2) 2 = (2)2 (1 - (-0.5)2) = 43/4 = 3 = 3.
D'o:
I80%(YX) = [aX+b 1.283] [aX+b 2.22]
De mme: I98%(YX) = [aX+b 2.323] [aX+b 4.02]
Schma : bande de confiance d'une rgression
CHAP.1-BB
Cours Hydro.Stat. 3Hy : Sance 3+cf.TD1

Sous-titre :
Enseignants 2005-06
: R.Ababou,

Documents en ligne:
Web local R.A. free


1.
A. Analyse statistique univarie, moments, lois de probabilit
B. Evnements rares, loi de Poisson, crue de projet (cf.TD1)

modlisation ou la reconstructionR.Ababou
de chroniques
hydrologiques (processus alatoires).
3

A. Al-Bitar.
2005-06

1. ANALYSE STATISTIQUE UNIVARIEE :
B. VALEURS EXTREMES (GUMBEL) & EVENEMENTS RARES (POISSON)
PLAN
Notions de crues (G.Rmniras, Hydrologie de lIngnieur, Ch.IX: Etude des crues).
Crues annuelles, prise de maximum, lois de proba suivies par les V.A. extrmes de
type crues annuelles : 1. Gumbel (double-exponentielle) ; 2. Frchet ; 3. Weibull
Dpassements de seuils ; excursions dune chronique alatoire Y(t) au-dessus dun
seuil >> mY ; mergence du processus de Poisson pour le nombre dvnements
dpassement du seuil ; et application de la loi de Poisson pour lestimation des
probabilits de crues rares , dpassant un seuil lev (temps de retour T >> 1 an).
Dfinition axiomatique de la loi de Poisson et/ou du processus discret de Poisson.
Application : estimation dune crue de projet dcennale et fiabilit de
lestimation. Ref. : Guide Pratique de la Mthode Inondabilit , Agences de lEau,
1998 (Agence Rhne-Mditerrane-Corse / Etude CEMAGREF : O.Gilard, P.Givone,
G.Oberlin, N.Gendreau et al.).
Etude des crues annuelles de lOued Mdez : analyse des crues rares observes parmi
les 23 annes de donnes disponibles(application des lois de Gumbel & de Poisson).
TD1 : Etude des probas de retour des crues historiques de la Garonne Toulouse.


PLAN
Notion(s) de crues : voir par exemple G.Rmniras (Hydrologie de lIngnieur :
Chap.IX : Etude des crues).
Crues annuelles, prise de maximum, lois de proba suivies par les V.A. extrmes de
type crues annuelles : 1. Gumbel (double-exponentielle) ; 2. Frchet ; 3. Weibull
Dpassements de seuils ; excursions dune chronique alatoire Y(t) au-dessus dun
seuil >> mY ; mergence du processus de Poisson pour le nombre dvnements
dpassement du seuil ; et application de la loi de Poisson pour lestimation des
probabilits de crues rares , dpassant un seuil lev (temps de retour T >> 1 an).
Dfinition axiomatique de la loi de Poisson et/ou du processus discret de Poisson.
Application : estimation dune crue de projet dcennale , et fiabilit de
lestimation (cf. Guide Pratique de la Mthode Inondabilit , Agences de lEau, 1998).
Etude des crues annuelles de lOued Mdez : analyse des crues rares observes parmi
les 23 annes de donnes disponibles(application des lois de Gumbel & de Poisson).
TD1 : Etude des probas de retour des crues historiques de la Garonne Toulouse.


1.B.
VALEURS EXTRMES (GUMBEL) & VNEMENTS RARES (POISSON)
Notion(s) de crues
NB : Remarques reprises en partie de G.Rmniras (Hydrologie de lIngnieur, Chap.IX : Etude des crues).
Un hydrogramme de crue est une chronique de dbits en forme de monte-descente (crue-dcrue).

Mais le terme crue peut tre associ, plus simplement, un dbit en rivire particulirement
lev, maximum, ou de faible frquence. Cependant, le terme dbit de crue est ambig ;est-ce (?):
le dbit de pointe instantan dun hydrogramme Q(t), e.g., obtenu partir de relevs
limnigraphiques (H(t)) convertis en dbits par une courbe de tarage;
le maximum des 365 dbits moyens journaliers de chaque anne hydrologique (ces dbits journaliers
rsultants parfois dune seule ou de quelques lectures de H lchelle limnimtrique);
ou un dbit de faible frquence de dpassement (fixe selon lapplication, e.g. 5%) ?
Noter que la hauteur deau en rivire (H) est plus facile mesurer que le dbit (Q). Pourtant, dans
bien des applications, cest le dbit de crue qui est requis, et H(t) sert alors uniquement obtenir
Q(t) par une courbe de tarage pr-ajuste Q=f(H). Dans dautres applications, cependant, la hauteur
deau elle-mme peut jouer un rle direct dans les calculs (protections / plaines dinondations).
De plus, la variable dbit ne suffit pas caractriser le phnomne physique crue . Ainsi, si
lon peut considrer chaque crue comme un processus hydrologique clairement identifiable,
alors lhydrogramme de crue est caractris non seulement par le dbit de pointe, mais aussi par le
volume net de la crue (V) et par sa dure (diffrents temps caractristiques : de concentration, de
base, de rponse ou de pointe). Pour un vacuateur de crue, les pointes sont trs importantes (mais le
volume aussi) ; et pour un rservoir de protection contre les crues, le volume de crue est essentiel.
Exemples de records dintensits de pluies et de dbits spcifiques (Pyrnes Orientales):
i = 4 mm/mn en 1 h ; q = Q/A 25000 l/s/km2 .

Crues annuelles et lois des valeurs extrmes
Dbits de crues annuelles : par prise du maximum des 365 dbits journaliers, chaque anne.
Dbits journaliers Q(tJOUR)
10
Dbits de crues annuelles Q(tANS)
9
8
Dbits
1770
1815
1850
1876
1900
1905
1916
1923
1932
1941
1943
1945
1947
1949
1951
1953
1955
1957
1959
1961
1963
1965
1967
1969
1971
1973
1975
1977
1979
1981
1983
1985
1987
1989
1991
1993
Annes
1 an
(365j)


Crues annuelles et lois des valeurs extrmes (suite)
Thorie proba-stat des valeurs extrmes:
{X j }
Dfinition. Une V.A. extrme Y rsulte dune prise de maximum : Y = jMax
=1,..., N
{QJOUR ( j )}
Exemple. Le dbit de crue annuel est dfini, chaque anne, par : QCRUE = j =Max
1,..., 365
Rsultat thorique. Lorsque N (ici on a N=365 >> 1) la V.A. extrme (Y) ne dpend
que faiblement de la loi de proba de (Xj), et on sait que (dans des conditions assez
gnrales) la loi de (Y) tend vers une des trois lois de probabilit suivantes :
1. Gumbel (double-exponentielle)
2. Frchet
3. Weibull


Crues annuelles et lois des valeurs extrmes (suite)
Une loi des valeurs extrmes : la loi de Gumbel (double exponentielle).
Dfinition de la loi de Gumbel
Loi de Gumbel (Fonction de Rpartition)
X
F ( X ) = exp exp
Relation Paramtres-Moments
et ajustement par les moments
Mthode des moments
= m X 0.45 X
= X / 1.28
Ajustement graphique de la FdR
sur papier spcial Gumbel (-log(-log))
Mthode dajustement graphique

(papier graphique double log)


Crues annuelles et lois des valeurs extrmes (exemple :crues de lOued Mdez)
On considre nouveau les dbits de crue annuelle Q de l'Oued Mdez sur 23 annes.
Voici certains des moments empiriques qui ont t obtenus pour Q (m3/s) :
QMIN
QMEDIANE
QMAX
mQ
CVQ
Min:52.7 Med:XXXX Max:1070 Mean:271.3 Sigm:XXXX CV:0.9977 Asym:1.699 Apla:1.881

On dcide dajuster la FdR empirique de Q (m3/s) la loi de Gumbel, i.e., la FdR double-exponentielle :
FQ (q ) = exp{ exp{ a(q q0 )}}
1. Obtenir dabord a et q0 en utilisant la relation paramtres/moments de la loi de Gumbel vue en

cours (voir vos notes de cours et/ou le polycopi).
2. Calculer, partir de la loi de Gumbel, la valeur de FQ(1070 m3/s), qui reprsente la probabilit de nondpassement de la crue annuelle de Juin 1965.
3. Calculez le dbit de crue annuelle de temps de retour TR=25 ans (on choisit exprs ici un TR du mme
ordre que la dure dobservation). Exprimer dabord le rsultat en fonction des paramtres (a,q0,TR) avant
de passer lapplication numrique.
NB: Le dbit Q=1070 m3/s correspond la crue de Juin 1965, qui est la plus grande crue annuelle observe sur 23 ans.

10

1. ANALYSE UNIVARIEE : B. VALEURS EXTREMES, EVENEMENTS RARES
Crues annuelles et lois des valeurs extrmes : crues de lOued Mdezrponses
1. Les relations moments/paramtres de la loi de Gumbel FX(x) sont :
a=
6X
1
0.780 X
x0 = m X
EULER
a
m X 0.450 X
EULER 0.577...
En appliquant ceci aux dbits de crues Q, avec les moments empiriques mQ271.3 m3/s et
Q270.7 m3/s, on obtient :
a 0.00473606 (m3/s)-1 ,
2. Calculons FQ(1070) :
qo 149.485 m3/s.
FQ (1070) = exp{ exp{ a(q q0 )}} = 0.987298
La probabilit de non-dpassement de Q=1070m3/s est donc environ 0.987 .

A linverse, la crue annuelle Q=1070m3/s navait que 13 chances sur 1000 dtre dpasse.
3. Relation entre le temps de retour (TR) et la F.d.R (F) :
1
1
FQ (q ) = 1
TR =
,
1 FQ (q )
TR (TR exprim en annes pour des crues annuelles)
1
1
En insrant la F.d.R double-exponentielle (loi de Gumbel) on obtient : q = q0 a ln ln1 T
R
1
1
Application (TR=25ans) : q = 149.5 0.00473606 ln ln1 25 (m3/s) q = 824.857 825 m3/s.

11

1 ANALYSE STATISTIQUE UNIVARIEE :
B. VALEURS EXTRMES (GUMBEL) & VNEMENTS RARES (POISSON)
Considrons dans tout ce qui suit la chronique des dbits de crues annuelles QCRUE(ti) en
fonction du temps discret ti [annes].
Dpassements de seuils.
Excursions dune chronique alatoire Y(t) au-dessus dun seuil donn bY >> mY.
Emergence du processus de Poisson et de la loi de Poisson

Le processus de Poisson est la squence des temps discrets doccurrences des vnements
(dpassements du seuil). La loi de Poisson exprime la probabilit dobserver un nombre
n dvnements (dpassements du seuil) pendant une dure donne TD.
Suivre le lien vers document annexe :

CRUES ANNUELLES, TEMPS DE RETOUR,
Une dfinition axiomatique de la loi de Poisson est prsente dans la diapo qui suit

12

1.B.
VALEURS EXTRMES (GUMBEL) & VNEMENTS RARES (POISSON)
Dfinition axiomatique de la loi de Poisson et du processus discret de Poisson.

Let n(t) designate the random number of occurences of a discrete event within a time interval [0,t], with n(0)=0.
The integer variable n(t) is a random variable for each fixed value of t, and it describes a random point process (or
counting process) as a function of time. A stationary increment point process is one for which the statistical
properties of the number of events nT within [t,t+T] are the same for all intervals [t,t+T] of length T(t).
A Poisson point process can be defined by three axioms [modified from H.A.Taha, Operations research,
Chap.13: Queueing theory, McMillan Publishing Co., New York, 1976] as follows :
1. The number of events n(t) occuring in [0,t] is a random point process with stationary & independent increments.
Stationary increments: The increments n(t2)-n(t1) and n(+t2)-n(+t1) are identically distributed for all values of .
In other words, the increments depend only on the size of the interval (T=t2-t1), so we can write nT for the
increment n(t2)-n(t1). Note: t1 t2.
Independent increments: Non-overlapping increments are statistically independent. In other words, n(t2)-n(t1) is
independent of n(+t2)-n(+t1) if (t2-t1). For instance, the number of events in [t1,t2] is independent of the
number of events in [t2,t3]. Note: t1 t2 t3.
2. T (0 < T < ) : 0 < Prob{nT = 1} < 1
In other words, for any given interval [t,t+T] of finite non zero size T, there is a non zero (but less than 100%)
probability of having exactly one event within that interval.
Pr{nT 2} = 0
3. Tlim
0 +
That is, in a sufficiently small/infinitesimal time interval, there cannot be more than one occurrence of the random event.
NB: Axiom 1 is used in Axiom 2 and Axiom 3. In particular, we used the fact that Prob{n(t+T)-n(t)=k} does not depend on t, and can be
expressed as Prob{nT = k}, which is is the usual definition of Poissons law (probability of observing k events in time interval of size T).
13


Utilisation de la loi de Poisson pour lestimation des
probabilits de crues rares (TRETOUR10 ans)
Une crue rare est une crue annuelle dont le dbit atteint ou dpasse un dbit seuil
relativement lev, de temps de retour TR >> 1 an (par exemple TR = 10 ans au moins).
.
Exemple (crues de lOued Mdez)
Toujours pour les donnes de crues du Mdez, on veut valuer maintenant la probabilit dobserver au
moins deux dpassements de la crue 25-ennale (temps de retour TR = 25 ans) sur une dure denviron
25 ans (soit TD 25 ans).
k
Rponse :
TD
T
R
{
}
P
Pr
K
k
exp TD
Loi de Poisson des vnements rares : k

TR
k!
Pk est la proba dobserver exactement k vnements

(k dpassements de la crue TR-ennale sur une dure de TD annes).
La probabilit dobserver au moins 2 dpassements est gale la proba de ne pas en observer 0 ou 1 (ni 0 ni 1):
Pr(au moins 2) = 1 - P0 - P1 = 1 exp(-1) exp(-1) = 1 2*exp(-1) = 0.264

Il y a donc en gros 26% de chances dobserver au moins 2 dpassements de la crue 25-ennale sur une
dure de 25 ans. Voir rsultats prcdents la crue 25-ennale du Mdez est de 825 m3/s ; les donnes brutes
(non montres ici) indiquent que ce dbit a t rellement dpass 2 fois sur la dure dobservation de 23 ans.
14

Estimation dune crue de projet dcennale , et fiabilit de lestimation.
Procdure pour lestimation dune crue de projet dcennale
Fiabilit de lestimation de la crue de projet (dcennale)

Rfrence : Guide Pratique de la Mthode Inondabilit , Agences de lEau, 1998 (Agence
Rhne-Mditerrane-Corse / CEMAGREF : O.Gilard, P.Givone, G.Oberlin, N.Gendreau et al.).
Dans cette tude, il est suggr quune estimation fiable du dbit de la crue dcennale
requiert N >> 5 annes dobservations de crues annuelles.
De faon plus gnrale, N >> T/2 annes dobservations seraient ncessaires pour
lestimation dune crue de temps de retour T annes mais noter que lapplication de
ce critre lestimation dune crue de projet dca-millennale conduirait requrir plus
de cinquante sicles de donnes de crues [le contexte applicatif est alors sans doute
trs diffrent, dans ce cas, de celui envisag par les auteurs de ltude pr-cite].

15

Etude des crues de lOued Mdez : analyse des crues rares sur 23 annes de crues
annuelles disponibles (application des lois de Gumbel & de Poisson).
Voir aussi le TD1 : Etude des probabilits doccurrences des crues rares de la
Garonne Toulouse (donnes modernes et historiques , sur plus de deux sicles).
FIN DES DIAPOS DU CHAP.1 (1A+1B)

16
R.Ababou - Annexe Hydro.Stat. (Ch.1.B) 2005/06
ANNEXE
CRUES ANNUELLES, TEMPS DE RETOUR,

Notations.
TR Temps de retour moyen (par exemple, TR = 100 ans pour une crue centennale)
TD Dure dobservation (pour le nombre doccurrencessur une dure donne TD)
n Nombre doccurrences, nombre de dpassements (i.e., nombre dvnements)
Densit de la loi de Poisson (nombre moyen dvnements par unit de temps)
Pn Loi de Poisson : probabilit dobserver exactement n vnements sur une dure TD fixe.
Q Dbit de crue annuelle (variable alatoire de fonction de rpartition FQ(q))
QTR Dbit de crue de temps de retour TR (par exemple, Q100 = dbit de la crue centennale)
Temps de 1re arrive de lvnement (i.e., du dpassement dun dbit QTR).
Crues biennales (TR = 2ans), dcennales (TR = 10ans), centennales (TR = 100ans), millennales (TR = 1000ans)
-1-
Formulation du problme
On a tudi la loi de probabilit de la variable alatoire crue annuelle Q. On
connat sa fonction de rpartition FQ(q) empirique, et on dispose dune loi thorique
ajuste celle-ci, par exemple la loi de Gumbel ajuste par la mthode des moments.
On peut donc utiliser la loi modle FQ(q) pour obtenir la valeur du dbit de crue
annuelle ayant par exemple une probabilit 0.90 de ne pas tre dpasse :
FQ (q10 ) = Pr(Q q10 ) = 0.90 q10 m 3 / s Dbit de crue dcennale

Le dbit de crue dcennale , q10 , a donc 1 chance sur 10 dtre dpass, car sa
probabilit de dpassement est 1-F = 1-0.90 = 0.10. Les vnements dpassements
du dbit q10 ont donc en moyenne un frquence de retour d1 anne sur 10. Comme
il sagit de dbits annuels (t=1 an), ces dpassements ont donc un temps de retour
de 10 ans, en moyenne sur une trs longue priode, thoriquement infinie.
Plus gnralement Temps de retour:
TR =
Dbit TR-ennal qTR :
1 FQ (qTR )
1
1 Pr (Q qTR )
1
1
1
FQ (qTR ) =1
qTR = FQ 1
TR
TR
-2-
Dpassements de seuils de dbits (crues rares)

Considrons maintenant la squence des dbits de crues annuelles Q(ti) avec ti = 1re
anne, t2 = 2me anne, , tN = Nime et dernire anne dobservation. On dfinit,
pour ce processus temporel, lvnement dpassement dun seuil de dbit lev
tel que le dbit de temps de retour 100 ans (q100) ou plus gnralement qTR.
QCRUES
Lvnement dpassement
se ralise chaque fois que
q100
SEUIL
Q(ti) qTR = q100
NB. Ces dpassements sont aussi

appel, en thorie des processus
alatoires, les excursions du
processus alatoire Q(t) audessus du seuil spcifi.
tANS
-3-
Thorie. Les rsultats de la thorie de Rice pour les processus salatoires tationnaires
gaussiens indiquent que les excursions dun processus alatoire Y(t) au-dessus dun seuil
donn YSEUIL, tendent devenir des vnements ponctuels lorsque le seuil est suffisamment
lev. Les zones dexcursion tendent vers des points. Les valeurs du processus au-dessus du
seuil concident avec des maxima locaux isols de Y(t), avec un seul maximum par intervalle
dexcursion. La distribution des points-excursions (dpassements) suit un processus temporel
de Poisson, ou de faon quivalente, le nombre de dpassements ponctuels sur une dure
dobservation donne (TD) suit une loi de Poisson. Enfin, la densit de la loi de Poisson est
donne par = 1-F(YSEUIL), tant le nombre dvnements / unit de temps.
En appliquant ceci aux dbits de crues annuelles Q(ti), on obtient donc le rsultat thorique :
La probabilit davoir n dpassements de la crue TR-ennale (crue de temps de

retour TR) pendant une dure fixe de TD annes, est donne par la loi de Poisson
de densit = 1/TR nombre moyen dvnements <n> = .TD = TD/TR.
La loi de Poisson (loi des vnements rares) permet donc destimer les
probabilits de dpassement des crues rares (dcennales, centennales,)
-4-
Loi de Poisson (avec les notations prsentes) :
Pn Pr{k = n}
( TD )n
n!
exp( TD )
Mais, sachant que la densit de la loi de Poisson (nombre moyen dvnements par
unit de temps) est donne par = 1/TR, la loi scrit aussi,
n
T
D
TR
T
Pn Pr{k = n}
exp D ,
TR
n!
ce qui donne la probabilit davoir
n dpassements de la crue TR-ennale (de temps de retour TR) sur une dure donne TD.
Moments de la loi de Poisson (et du processus associ)

Nombre moyen doccurrences (sur la dure TD):
Ecart-type du nombre doccurrences (sur la dure TD) :
n = .TD
n = Var(n) = .TD

re
re
f
.
e
Densit
de
proba
du
temps
t
de
1
arrive
(1
occurrence)
1
: t1
;
cest une loi exponentielle, de moyenne <t1> = 1/ = TR et dcart-type t1 = <t1> = TR.
Le temps de retour TR est donc, aussi, le temps moyen de 1re occurrence (dun dpassement).
( )
-5-
Exemple 1. Probabilits de dpassements du dbit de crue dcennale sur une dure

de dix ans (TR = TD = 10 ans) la loi de Poisson scrit, dans ce cas particulier :
1
Pn Pr{k = n} exp( 1)
n!
P0 Pr{k = 0}
1 1
e = (2.718) 1 0.368
0!
1
P1 Pr{k = 1} e 1 0.368
1!
1
P2 Pr{k = 2} e 1 0.184
2!
Do les rsultats suivants :
Pr{k 1} 1 P0 = 1 0.368 0.632

Pr{k 2} 1 P0 P1 = 1 2 0.368 0.264
Remarque : la probabilit davoir au moins une crue dcennale en dix ans est de 0.632, soit
environ 63% (ce nest ni 50%, ni 100% comme on pourrait peut-tre le croire) !
Exemple 2. Quelle est la probabilit dobserver au moins une crue suprieure ou

gale la crue millennale (TR =1000 ans) sur une dure dun sicle (TD = 100 ans) ?
On obtient P = 1-exp(-0.1) = 0.0952 10%, ce qui est loin dtre ngligeable
-6-
TD1
Univar :
lois de proba
Gumbel+Poisson:
crues Garonne
(sujet & indications)
HYDROLOGIE STATISTIQUE TD1: ANANLYSE UNIVARIEE GUMBEL & POISSON :

CRUES ANNUELLE & CRUES EXTREMES DE LA GARONNE A TOULOUSE
SUJET TD1 + INDICATIONS + SUJET DU PARTIEL

HYDROLOGIE STATISTIQUE TD1:
ANALYSE UNIVARIEE GUMBEL & POISSON :
ENONCE DU TD 1 :
On propose d'tudier la Fonction de Rpartition (FdR) empirique des
crues de la Garonne Toulouse (Pont-Neuf), en termes de hauteurs H,
comprenant une srie "scientifique" contemporaine (1940-1994), et une
srie "historique" plus ancienne (1770-1940) qui permet de complter la
FdR empirique vers les valeurs extrmes.
Voir la Figure ci-jointe (C.Thirriot 1995), o sont reprsentes la FdR
empirique (point par point) et une FdR ajuste (trait continu). Des
explications supplmentaires sur la mthode utilise pour construire
ces FdR pourront tre fournies en salle. Une courbe de tarage
approche est fournie.
Rpondre aux questions suivantes (y compris graphiquement si
ncessaire).
QUESTIONS.
(+ VOIR INDICATIONS PLUS LOIN)
1. Quelle est la variable hydrologique tudie (expliquez le terme crue) ?

2. Utilisez la FdR propose pour obtenir la crue annuelle centennale
(expliquez). Question subsidiaire: est-ce une loi de Gumbel ?
(paramtres=?)
3. Calculez la probabilit d'observer au moins 1, au moins 2, et au moins 3
crues suprieures la crue centennale pendant une priode
d'observation de 225 annes.
4. A quoi pouvez-vous comparer ces probabilits, et qu'en concluez-vous ?
5. Question supplmentaire
darrive(en salle).
autour
de
lvaluation
des
temps
HYDROLOGIE STATISTIQUE TD1: ANANLYSE UNIVARIEE GUMBEL & POISSON :

ANNEXE : Courbe de tarage Q(H)

La courbe de tarage Q=f(H) permettant de passer des hauteurs d'eau H [m] aux dbits Q [m3/s]
au Pont-Neuf n'est pas disponible pour la priode "historique", mais voici quelques ordres de
grandeurs "contemporains" (valeurs indicatives, pour H 2m) :
H2m
Q 1000 m3/s
7000
6000
H3m
H5m
Q 2000 m /s
Q 4000 m3/s ()
5000
4000
Tarage Q=f(H)
3000
2000
1000
H8m
Q 6500 m3/s ()?
0
0
ANNEXE : Fonction de rpartition empirique des crues annuelles F(H)
TD Hydrologie Statistique
TD 1
Crues annuelles, vnements rares,
et loi de Poisson
Ahmad Al-Bitar
Mesure de hauteur deau : la Garonne Toulouse (Pont-Neuf)
Gar
o
nne
Pont-Neuf
Courbe de tarage Q=f(H)

7000
Courbe de tarage rcente de la

Garonne au niveau du Pont-Neuf
pour des hauteur H>2 m.
6000
5000
Q (m3/s)
Cette courbe nest pas disponible

pour la priode historique (17701941).
La courbe est faiblement quadratique,
presque linaire.
4000
3000
2000
1000
0
0
10
H (m)
Fonction de Rpartition FdP(H)

1,1
Comment obtenir la FdR ?

-Ranger les valeur de la plus
forte la plus faible
valeurs;
-Calculer la frquence.
1
0,9
srie historique
0,8
0,7
0,6
0,5
srie scientifique
0,4
0,3
0,2
0,1
2
2,5
3,5
4,5
5,5
hauteur (m)
6,5
7,5
8,5
Ajustement dune loi de probabilit thorique

Loi de Gumbel (valeurs extrmes)
H
F ( H ) = exp exp
Mthode des moments
= mH 0.45 H
= H / 1.28
Mthode dajustement graphique
-graphique en double log
valuation de lajustement
-Test du Khi-Deux
Test Khi-Deux
daprs Jaque Miquel 2004, Hyd.Stat. ENPC
Tableau
Question 2
Utilisez la FdR propose pour obtenir la crue annuelle
centennale
CHAP. 2
Cours Hydro.Stat. 3Hy :

Sance 5: Ch.2 Hyd.Stat.Multivarie
3Hy 2005-06 (ID = HY3ASE303)

Sous-titre :
Enseignants 2005-06
: R.Ababou,

3Hy 2005-06 (ID = HY3ASE303)
Documents en ligne:
Web local R.A. free


CHAPTRE 2 DU COURS :
Analyse statistique multivarie : rgression linaire,

rgression multiple gnralise, corrlation multiple, et
analyse en composantes principales (ACP). Applications la
critique, reconstitution, et/ou cartographie de donnes
hydrologiques.
VOIR AUSSI LE TD 2 :
Reconstitution et critique de donnes pluviomtriques par corrlation et
rgression entre stations ; et/ou (selon les annes) :
Corrlations multiples & Analyse en Composantes Principales (ACP) :
tude des redondances entre 6 stations hydromtriques (Pyrnes).

A. Al-Bitar.
2005-06

PLAN DU CHAP.2 HYDROLOGIE STATISTIQUE MULTIVARIE (2005-06)
Introduction, objectifs, mthodes. [cf. intro gnrale du cours].
Lois de probabilits multivaries :
FdR et DdP multivaries ;
loi multivarie gaussienne (variables conjointement gaussiennes) ;
matrices de covariance et de corrlation.
Rappels de rgression linaire simple (2 variables X,Y).
Utilisation de la rgression linaire pour la critique des donnes
Utilisation de la rgression linaire avec rsidus gaussiens pour la critique de
donnes aberrantes et la reconstitution de donnes manquantes.
Exemple/Exo : pluies mensuelles en 2 stations alpines [TD ou exo selon anne].
Test dhomognit : mthode des rsidus cumuls et ellipse de confiance.
Exemple : Pluies Gin Ganga (Sri Lanka).
Test dhomognit : mthode des doubles cumuls. Ex : Pluies Sebou (Maroc).

A. Al-Bitar.
2005-06

PLAN DU CHAPTRE 2 (SUITE)
Gnralisation : analyse corrlatoire multi-varie (multi-stations) K+1 variables
Corrlation multiple avec K+1 variables
Rgression multi-linaire avec K+1 variables :
o Formulation / variables (le vecteur [Xk])
o Formulation / variables-observations (matrice rectangulaire [Xk(i)])
Principes de lACP (Analyse en Composantes Principales). voir TD2.
Estimation linaire de vecteurs dtats (estimation optimale Bayesienne)
Exemples dapplications (Bureaux dEtudes, T.D., etc)
TD2. Corrlations multiples & Analyse en Composantes Principales (ACP) :
tude des redondances entre 6 stations hydromtriques (Pyrnes).
ETUDE. Corrlations pluies-dbits et rgionalisation des dbits au Sri Lanka.


A. Al-Bitar.
2005-06

Lois de probabilits multivaries (FdR et DdP jointes)
Rsum - cas de 2 V.A.s (X,Y) :
FX ,Y ( x, y ) = Pr ( X x, Y y )
FdR jointe FX,Y :
2 FX ,Y
DdP jointe fX,Y : f X ,Y ( x, y ) = xy
f X ,Y ( x, y )dxdy = dFX ,Y ( x, y )
= Pr ( x X x + dx, y Y y + dy )
f X ( x) =
DdP marginale fX :
f X ,Y ( x, y )dy
IR
fY|X(y|x) est la densit de proba de la V.A. Y

conditionne ( | ) par la connaissance de X , i.e.,
aprs observation de X ( a posteriori ).
DdP conditionnelle fY|X :

Thorme / proba conditionnelle Bayes
Thorme bis / proba condit. Bayes
fY X ( y x ) =
f X ,Y ( x, y )
f X ( x)
f X ,Y ( x, y ) = fY X ( y x ) f X ( x ) = f X Y ( x y ) fY ( y )
Notations. FdR = Fonction de Rpartition ; DdP = Densit de Probabilit ; V.A.=Var.Alatoire.


Lois de probabilits multivaries (exemples)
Etant donnes deux variables alatoires gaussiennes indpendantes et identiquement
distribues, de mme variance et de moyenne nulle, la densit de probabilit jointe fXY(x,y) est
une colline gaussienne de section circulaire, reprsente Figure X. On peut dire aussi que
[X Y]T est vecteur alatoire gaussien isotrope, et que fXY(x,y) est la densit de probabilit
bivarie gaussienne qui reprsente la loi conjointe de toutes les composantes de ce vecteur.
NB. On sait par ailleurs que la densit de probabilit du module R = (X2+Y2)1/2 est une loi de
Rayleigh : voir Chap.1, courbe et histogramme de la loi de Rayleigh fR(r).
Densit de la loi bivarie gaussienne fXY
Densit de la loi de Rayleigh
f R (r ) =
1 r 2
r exp
2 2
1


Loi de probabilit bivarie gaussienne (proprits)
Soient (X,Y) deux v.a.s gaussiennes centres (de moyennes nulles). Si (X,Y) sont indpendantes
(non corrles) et de variance unit (normalises), leur densit jointe est :
1
1
f X ,Y ( x, y ) =
exp (x 2 + y 2 )
2
2
2
2
Si lon a X : N(0,X ) et Y : N(0,Y ), avec (X,Y) indpendantes, leur densit jointe est :
f X ,Y ( x, y ) =
1 x 2 y 2
exp 2 + 2
2 X Y
2 X Y
1
Enfin, si (X,Y) sont plus gnralement conjointement gaussienne mais corrles, on a :

f X ,Y ( x, y ) =
1
exp
2 X Y
2
2
1
2
x 2
x y y
+

X
X Y Y
NB. Voir plus loin la loi de probabilit gaussienne multivarie gnrale : vecteur multivari gaussien de taille N :
N(mX,Cxx), o mX est le vecteur moyenne de taille (N) et Cxx la matrice de covariance de taille (NN).
Matrice de covariance et matrice de corrlation.

Covariance : Cov ( X , Y ) = ( X m X )(Y mY )
Matrice de covariance 22
X2
Cov( X , Y )
C X ,Y =
Y2
Cov( X , Y )
Coeff de corrl. : X ,Y =
Cov ( X , Y )
XY
Matrice de corrlation 22

1
R X ,Y =

Comment gnrer une paire de V.A.s gaussiennes identiques et indpendantes ?
Soient G1 et G2 deux variables alatoires indpendantes gaussiennes N(0,1). Poser G1 = R.cos et
G2 = R.sin. On montre alors que R et sont 2 V.A.s indpendantes de densits de probabilit :
f R r = r exp r 2 / 2
R : loi de Rayleigh :
()
: loi uniforme dans [0,2] :
f ( ) = U [0,2 ] .
Comment gnrer une paire de V.A.s gaussiennes intercorrles ?

En partant de G1 et G2, deux V.A.s gaussiennes N(0,1) non corrles, on obtient comme suit
2 nouvelles VAs gaussiennes (X,Y) corrles, dcarts-types (X,Y) et de coeff de corrlation :
X = m X + X .G1
Y = mY + Y . G1 + 1 2 G2
Comment diagonaliser la matrice de covariance dune paire de V.A.s gaussiennes ?

Excuter le programme MATLAB Ex_Stat4ACP2000.m (A.C.P. simplifie 2 variables!)
ou encore, ouvrir le document PDF _Ex_mbook_Stat4ACP2000.pdf (listing+input/outputs)


Rappels de rgression linaire simple (2 variables X,Y).
Le point de vue adopt dans cet expos tient compte du fait que la rgression linaire est un
modle destimation optimale et sans biais dune v.a. gaussienne (Y) dite variable explique
( expliquer ), en fonction dune autre v.a. gaussienne (X) considre comme fixe lors de
lestimation, dite variable explicative. Dans un modle de rgression linaire, la relation entre
les variables alatoires Y et X peut s'crire :
Y = a.X+b+e e = Y-a.X-b
Cette dernire quation dfinit du mme coup l'erreur "e", qui est aussi une variable
alatoire. Les coeffs de rgression sont calculs de faon que "e" soit de variance minimale, et
de moyenne nulle ( <e> = 0 ). L'erreur tant sans biais, l'estimation est donc sans biais.
La rgression linaire classique est donc une estimation linaire (optimale et sans biais) de la
variable Y (explique), en fonction de la variable explicative X, qui est alors considre
comme fixe (dterministe).

10

Rappels de rgression linaire simple (2 variables X,Y) [SUITE]
Soit Y* lestimation linaire optimale sans biais de Y.
On montre que Y* est l'esprance mathmatique de Y conditionne par X (qui est alors
considre comme donne), et que Y* sexprime linairement en fonction de X :
Variable expliquer :
Estimation optimale de Y :
Erreur commise sur Y :
Y = a X +b + e
Y* = <Y|X> = a X +b
e = Y - Y*
Formules classiques doptimalit & non biais :
a = Y/X ;
b = <Y> - a <X> ;
e2 = (1-2) Y2 .
Remarques et conclusions :
La relation Y = aX+b+e est alatoire, tandis que lestimation Y* = aX+b est dterministe.
Le modle de rgression linaire permet non seulement d'estimer Y, mais aussi de
quantifier statistiquement l'erreur d'estimation (variance E2).
L'estimation Y* calcule par rgression linaire reprsente la valeur la plus probable de Y
tant donnes les observations de X (thorie Bayesienne).
Tout ceci n'est vrai, en toute rigueur, que si (X,Y) sont conjointement gaussiennes.
11

Utilisation de la rgression linaire pour la critique des donnes
Utilisation de la rgression linaire avec rsidus gaussiens pour la critique de donnes
aberrantes et/ou la reconstitution de donnes manquantes.
EXO/EXEMPLE - Reconstitution de donnes par rgression linaire :
pluies mensuelles en 2 stations alpines (Mens et Roissard).
Question
Reconstituer les pluies mensuelles de mars 1940 et 1946 Mens (P1),
partir des pluies de mars Roissard (P2).
Indications
On utilise la rgression linaire P1P2, en racines de pluies mensuelles (mm1/2), qui est prfre
une rgression directe en terme des pluies (mm), car on pense ici que P est plus gaussienne que P.
Donnes voir TABLEAU ci-joint
Voici les statistiques suffisantes pour traiter le problme (pluviomtries du mois de mars) :
Moments de P1 (Mens) en mars :

m1 6.7 mm1/2 ; 1 2.9 mm1/2
Moments de P2 (Roissard) en mars : m2 7.7 mm1/2; 2 2.8 mm1/2
0.94
Corrlation croise (P1,P2) en mars:

12

TABLEAU DES PLUIES MENSUELLES DE MARS-AVRIL MENS & ROISSARD (BV DU DRAC, ALPES)
Pluies Mensuelles en 2 stations d'un Bassin Versant du Drac (de 1928 1947, et en 1976)
Annes
1928
1929
1930
1931
1932
1933
1934
1935
1936
1937
1938
1939
1940
1941
1942
1943
1944
1945
1946
1947
1976
S1 - MENS
Mars
61
7
109
90
59
33
74
41
56
143
3
53
X
45
19
8
19
19
X
103
57
Avril
84
65
53
40
67
21
135
18
132
56
19
91
X
83
23
25
30
17
X
35
60
S2 - ROISSARD
Mars
44
3
135
116
101
83
88
91
64
188
3
86
50
55
40
12
20
18
60
134
62
Avril
132
79
115
57
89
44
130
131
132
78
7
92
112
117
42
35
30
18
44
31
65

13

Exo/Exemple - Reconstitution de donnes par rgression linaire :
pluies mensuelles en 2 stations alpines (Mens et Roissard).
Statistiques utiles (cf. tableau de donnes)
Moments de P1 (Mens) en mars :

Moments de P2 (Roissard) en mars :
m1 6.7 mm1/2 ; 1 2.9 mm1/2

m2 7.7 mm1/2; 2 2.8 mm1/2
0.94
Corrlation croise (P1,P2) en mars:

Elments de rponses.
On utilise la rgression YX avec Y=P1 et X=P2.
Les donnes de lnonc devraient permettre de calculer (pour les racines de pluies) :
a = Y/X = 1/2 = 0.974 ;

b = (mY-a.mX) = (m1-a.m2) = -0.80 mm ;
= 0.992 mm
Mars 1946 :
Connaissant P2 = 60 mm en Mars 1946 ( Roissard), on cherche donc reconstituer P1 en
Mars 1946 ( Mens).
La rgression linaire de P1P2 (YX) sert destimateur de P1 connaissant
P2 = 60 = 7.746 mm1/2 . La rgression Y = aX+b scrit, ici :
P1 = a P2 + b finalement : P1 45.5 mm.
Mars 1940 :
Mme procdure.
14
Utilisation de la rgression linaire pour la critique des donnes (SUITE)

Test dhomognit bas sur la rgression linaire entre stations :
la mthode des rsidus cumuls (ellipse de confiance ; pont brownien ).
Principe de la mthode.
Soit un rseau de N stations (pluviomtriques ou autres). On considre les stations 2
par 2, et on effectue pour chaque paire de stations une rgression linaire Y|X.
Le test utilise la somme partielle Z(k) des rsidus de la rgression, trace en fonction
de lindice k (nombre de rsidus cumuls) depuis k=1 jusqu k=N (nombre total de
points). Noter que le cumul commence 0 pour k=0 et se termine 0 pour k=N cause
de la condition de non biais (moyenne du rsidu nulle).
On montre thoriquement (voir thorie ci-dessous) que la courbe ainsi trace, Z(k),
doit tre comprise dans une certaine ellipse de confiance. Si la courbe sort de lellipse,
cest que lune au moins des deux variables (X,Y) nest pas homogne : dfaillance
dinstrument ? biais persistant ? sabotage des mesures ? drive thermique ? changement
de courbe de tarage cause de modifications du lit du cours deau ? etc).
Voir exemple ci-dessous (pluies Sri Lanka).

THORIE Test dhomognit rsidus cumuls : dmonstration de lellipse de confiance
Yi = a* Xi + b* + Ei
(i=1,,N)
(Ei = rsidus de rgression linaire)
i=k
Z k = Ei
(Ei = rsidus cumuls analyser)
i =1
Les Ei ont tous les mmes moments univaris : i ce sont des vars gaussiennes de moyenne nulle et d'cart-type E :
<Ei> = 0 i
et
<Ei2> = E2
i
De mme les (Ei,Ej) ont des moments croiss tous gaux (i,j) avec (ij), mais l'esprance <Ei.Ej> n'est pas nulle car les
(Ei,Ej) ne sont pas indpendants cause de la contrainte:
i= N
Z N = Ei = 0 (la moyenne empirique des rsidus de rgression est nulle)

i =1
On peut cependant supposer que <Ei.Ej> est de la forme :

<Ei.Ej> =
E2 si i = j
ou encore <Ei.Ej> = E2 [R+(1-R)ij ] ,
R E2 si i j
o R est le coeff. de corrlation crois (Ei,Ej) d la contrainte ZN=0. On obtient alors, successivement :
i=k
<Zk> =
i=k
< Ei >= 0 = 0
i =1
i =1
i =k j =k
Zk = Var(Zk) = <Zk > = < Ei E j > =

2
i =1 j =1
i =k j =k
i =1 j =1
[R + (1 R) ]
ij
E2 =
i =k
E2
i =1
i =k
j =k
i =1 j =1( j i )
R E2 = 1.k.E2+ R.k.(k-1).E2
Mais on sait par ailleurs que ZN=0 ("contrainte"), d'o ZN2 = 0, ce qui permet de dterminer le coefficient de corrlation
crois des rsidus (R) :
ZN2 = 1.N.E2 + R.N.(N-1).E2 = 0 R = -1 / (N-1).
D'o finalement le rsultat : Zk2 = k [ 1 - (k-1) / (N-1) ] E2
Zk = k 1
k 1
E .
N 1
Conclusions : l'cart-type Zk (k) dcrit une ellipse ; de plus, si les (Xi,Yi) sont gaussiens, les rsidus Ei aussi; et les rsidus
cumuls Zk aussi ; on a donc : Zk = N(0,R.Ababou
[daprs R.Ababou, 2000] 19
Zk).

Gnralisations : analyses corrlatoires multi-varies (multi-stations)
Matrice de covariance et corrlation multiple avec K+1 variables
Exo. Matrice de covariance 3x3

Soit un vecteur alatoire (X1,X2,X3) et sa matrice de covariances Cij = Covar(Xi , Xj ).
Un auteur (anonyme) fournit, dans un document technique, la matrice de covariance :
1 0.5 0.5
C=
0.30 0.10
0.30
Question. Quelles rflexions inspirent cette matrice de covariance ?

Indications. En fait, cette matrice nest pas une matrice de covariance ! Rappeler les proprits
d'une matrice de covariance. Calculer Var(X1+X2) et Var(X1+X2+X3). Conclusions ?

20

Rgression multi-linaire avec K+1 variables
Formulation / variables (le vecteur [Xk])
Formulation / variables-observations (matrice rectangulaire [Xk(i)])
ORGANISATION DES DONNES
Soit Y la variable explique (ou endogne).
On dispose du vecteur de taille (N,1) des N observations de la variable :
Y (1)
(i )
Y = Y
M
(
N
)
Y
Soient X1,..., Xi ,...X p les p variables explicatives (ou exognes).

On dispose de la matrice rectangle de taille (N,p) des observations de chaque variable :
X (1) K X (1)
p
1
M
M
( N)
X (N)
Xet1 al., K
R.Ababou
INP/ENSEEIHT:
p
21

CENTRAGE DES VARIABLES (EN UTILISANT LES MOYENNES ESTIMES)
mX j =
mY =
1
N
1
N
X (ji )
i
Y (i )
x j = X j mX j
y = Y mY
FORMULATION DE LA REGRESSION MULTILINAIRE

On cherche une relation multilinaire entre Y et X = [X1,..., X p ] de la forme :
Y = a 0 + X.a +
Y = a 0 + a jX j +
j=1
a1

avec a = M
a (1.a) Vars brutes
p
(1,1) (1,1) (1, p) (p,1) (1,1)
En crivant ceci pour toutes les observations dont on dispose cela donne :
Y
= a0 . 1 +
. a
(1)
(1)
(1)
Y (1)
1 X1 K X p a1
.M + M
M
= a 0 .M + M
(1.b) Variables-Observations
( N)
( N)
(
N
)
1 X K X (N)
a et al., INP/ENSEEIHT:
R.Ababou
Y
p p
1
22

SOLUTION DU PROBLEME DE REGRESSION MULTIPLE (OPTIMALIT & NON BIAIS)
On applique dabord la condition de non-biais savoir que la moyenne estime du rsidu
est nulle : m = 0 . Or, par dfinition, on obtient ainsi :
0 = m =
1 N (i ) 1 T
= N 1 .
N i =1
1 T
1 .{Y a0 .1 X .a}
N
1
a
1
= 1T .Y 0 1T .1 1T . X .a
N
N
N
= m Y a0 m x .a
a0 = mY m X a (2 )
En insrant cette quation dans lquation (1.a)
on obtient, en variables centres :
y = x.a +
(3) variables centres
Le coefficient a 0 tant maintenant limin , il reste dterminer

minimisant la variance estime du rsidu soit :
en
Mina Var( ) = y - x.a (1re approche)

ou bien
Min a T
= y x.a
( 2me approche)
23


SOLUTION DU PROBLEME DE REGRESSION MULTIPLE (SUITE)
Premire approche : minimisation de variance probabiliste (ensembliste)
Mina Var( ) = y - x.a (1re approche)

Approche probabiliste / calcul desprances mathmatiques moyennes densemble.
Var ( ) = 2 = ( y x.a ) 2 = y 2 2 y x.a + ( x.a ) 2 = y 2 2 y x a + aT xT x
2 = y2 2 C y x .a + aT .C x x .a
Condition doptimalit du 1er ordre
2
Grad a ( ) = L
L = 0
a j
2
2 C xy + 2 C x x .a = 0
Do, aprs calculs :
(p,1) (p, p) (p,1)
a = C x x 1 . C y x T

(4)
24

SOLUTION DU PROBLEME DE REGRESSION MULTIPLE (SUITE)
Seconde approche : Minimisation de lcart quadratique moyen (empirique)
Min a T
= y x.a
( 2me approche)
T = ( y x a )T ( y x a ) = y T y y T x a a T x T y + a T x T x a
( T )
T
Grad
(
)
=
L = 0
L
a
La condition doptimalit du 1 ordre se traduit par :
a j
er
2 xT y + 2 xT xa = 0
(p, N)(N,1) (p, p) (p,1)
Do :
a = ( x T x )-1 x T y
(5)
Pentes de la rgression multiple.
Equivalence entre les deux approches

Les 2 approches sont quivalentes si on estime les covariances C x x & Cy x ainsi :
Cx x =
1 T
x .x
N
Cy x =
et
1 T
y x
N
(6)

25

CALCUL DE LA VARIANCE DERREUR (MINIMALE)
Une fois choisie ces estimateurs des matrices de covariance, on peut calculer, par nimporte
laquelle des deux approches, la variance de lerreur comme suit :
{ }
1 T
1 T
=
y y y T x a a T x T y + a T xT x a
N
N
= y T y y T x( xT x) 1 xT y y T x( xT x) 1 xT y + yT x(( xT x) 1 )T xT x( xT x) 1 xT y
144244
3 14243
N
1
a
Var ( ) =
2 =
{ }
1 T
1
1
1
1
= y T y y T x( xT x) 1 xT y
N
N
N
N
N
Cette formule donne directement la variance derreur (minimale) en fonction des donnes
empiriques. De faon quivalente on peut crire :
2 = y2 C y x C xx1C y x T
2
2y 1 R y x
Rx x R y x
2 = 2y( 1 R 2 )
T
R = R y x Rx x 1 R y x T
o le scalaire R reprsente le coefficient de corrlation multiple.

26

VRIFICATION SUR UN CAS PARTICULIER
On retrouve en particulier, comme il se doit, les rsultats classiques de la rgression simple
une seule variable explicative x (prendre le cas p = 1) :
a = C xx 1C yxT =
x2
cov( x, y ) =
y
x
(4)
2 = y2 (1 2 )
(7)
RSUM SYNOPTIQUE (RGRESSION MULTI-LINAIRE)
Y = a0 + X a +
a0 = mY m X a
Ordonne lorigine :
Vecteur des pentes :
( p ,1)
C X X 1. CY X T
( p, p )
( p ,1)
Variance derreur :
2 = Y2 1 R 2
Coefficient de corrlation multiple :
R = RY X RX X 1 RY X T
(1,1) (1, p ) ( p, p ) ( p,1)

27

Principes de lACP (Analyse en Composantes Principales). TD2.

28
TD2
Matrice covar,
regression, ACP
(sujet & indications)
HYDROLOGIE STATISTIQUE : TD2(1)

TD2-Exo.1 : Analyse Statistique Bivarie
Enonc :
Pour tester un programme d'analyse statistique
multivarie dbouchant sur de l'AC.P, on tudie la
structure de corrlation de 2 vecteurs d'observations
(x1 , x2) reprsentant 2 variables distinctes (non
prcises). Les rsultats de cette analyse sont joints
ce document, et sont dcrits ci-dessous.
On donne ci-joint les valeurs numriques des
matrices/vecteurs reprsentant les Covariances des
observations, et les Composantes Principales (CP),
pour N=1000 paires d' observations de deux
variables (x1,x2) gnres numriquement laide dun
un gnrateur de nombres alatoires gaussien.
Plus prcisment : on a gnr 1000 rpliques dun
vecteur alatoire gaussien bivari de moyenne nulle et
comportant une corrlation croise R(x1,x2) non nulle.
On pourra constater que les moments empiriques
obtenus sont relativement proches des moments
thoriques (e.g., les moyennes empiriques sont
relativement proches de zro, comme il se doit).
Une visualisation du nuage de points dans le plan
(x1,x2), graphique cijoint, illustre les rsultats obtenus
pour un sous-ensemble des 1000 paires dobservations.
Cependant : les axes (x1) et (x2) sont-ils reprsents
la mme chelle sur ce graphique ? ( !).
Les calculs statistiques et algbriques (diagonalisation)
ainsi que les graphiques ont t programms en langage
Matlab. On trouvera en annexe un exemple de miniprogramme Matlab permettant de diagonaliser la
matrice de covariance et de calculer les Composantes
Principalesdans ce cas ultra-simplifi 2 variables.
1
Questions ( titre indicatif) :

Expliquez, commentez et exploitez brivement les
rsultats prsents, comme suit (questions 1 8) :
1. Retrouver les carts-types (1 , 2) des 2 variables,
ainsi que leur coefficient de corrlation .
2. Commentez la diffrence entre "variables brutes" et
"variables normalises" - quelles seraient les
consquences dune normalisation ?
3. Que reprsente la matrice de covariance des
Composantes Principales (CP) ? Pourquoi est-elle
diagonale ? Autres proprits ?
4. Quelle est la diffrence entre CP "brutes" et
"normalises"?
5. Ecrire explicitement le systme de relations entre les
CP et les variables "brutes"
6. Reprsenter graphiquement les axes des CP brutes
dans le plan (x1,x2). [*]
7. Exprimer les rgressions linaires de x1x2 et de
x1x2, respectivement.
8. Tracer les deux droites de rgression dans le plan
(x1,x2). Sont-elles confondues ? (et pourquoi ?).
[*] NB : dans le cas rel, on analyse le nuage de points-observations

dans le plan des premires CP : (CP1,CP2) ou (CP2,CP3)
Total size of gaussian data vectors [x1],[x2]: ...
N= 1000
Input correl coeff of gaussian vectors [x1],[x2]:
rho = -0.5000
Computed correl coefficient of gaussian vectors:
rho = -0.5072
Input means of gaussian vectors [x1],[x2]:
Mu1 = 0
Mu2 = 0
Computed means of gaussian vectors :
mu1 = -0.0138
mu2 = 0.0037
Input std.dev. of gaussian vectors:
Sigma1 = 1.0
sigma2 = 2.0
Computed std.dev. of gaussian vectors:..,
sigma1 = 1.0311
sigma2 = 2.0234
Covariance matrix of raw data [x1 x2] :
CX =
1.0632
-1.0581
-1.0581
4.0943
Covariance matrix of normalized data [x1 x2] : ...
CY =
1.0000
-0.5072
-0.5072
1.0000
Raw data : Rotation matrix=eigenvectors [v1 v2]: ..
VX = -0.9539
-0.3001
-0.3001
0.9539
Norm.data: Rotation matrix=eigenvectors [u1 u2]: ..
UY = -0.7071
-0.7071
-0.7071
0.7071
Raw data: Covar matrix of principal compon.[z1 z2]:
CZ =
0.7303
0.0000
0.0000
4.4271
NormData: Covar matrix of principal compon.[w1 w2]:
CW =
0.4928
-0.0000
-0.0000
1.5072
Pentes des rgressions linaires:
Pente de rgression x2/x1 :(a21) = -0.9952

Pente de rgression x1/x2 :(aa21=1/a12)= -3.8694
CP2
X2| X1
CP1
X1| X2
Nombre total de points utiliss statistiquement : Ntotal=1000 ;

nombre de points tracs ici (symboles o ) : Nplot=100.
4
DIAGONALISATION (2x2) EN MATLAB

(cf. programme STAT4ACP2000.M)
% Donnes bi-varies en 2 vecteurs colonnes
X=[x1 x2];
% Estimated means and standard deviations
mu1=mean(x1);
sigma1=std(x1);
mu2=mean(x2);
sigma2=std(x2);
% Cxx = 2x2 covariance matrix
Cxx=cov(X);
% Estimated correlation coefficient
rho=(Cxx(1,2)/sigma1)/sigma2;
% Eigenvectors & eigenvalues of Cxx
[Pxx,Dxx]=eig(Cxx);
% Extraction & normalisation
des vecteurs propres :Pxx
v1=Pxx(:,1);
v2=Pxx(:,2);
v1=v1./norm(v1);
v2=v2./norm(v2);
Pxx=[v1 v2];
%
Les valeurs propres Lambda(i) sont

stockes dans la diagonale de la matrice Dxx.
Il reste r-ordonner les valeurs propres, et les

vecteurs propres associs, par ordre de valeurs
propres dcroissantes
HYDROLOGIE STATISTIQUE : TD2(2)

TD2-Exo.2 : A.C.P.
(Analyse en Composantes Principales)
Objectifs:
Lobjectif est dutiliser des donnes relles pour sinitier
lAnalyse en Composantes Principales, et rflchir aux
utilisations possibles de lACP. Lexercice propos permet
dillustrer la thorie et dapercevoir les possibilits de lACP
mais on ne cherche pas ici faire un dveloppement exhaustif,
ni de la thorie de lACP, ni de ses nombreuses modalits
dapplications pratiques.
Donnes:
On dispose de donnes hydromtriques en 6 stations
Pyrnennes : coulement mensuel (mm), pour le mois de
mai, entre les annes 1950 1972.
Ces donnes sont (judicieusement) prsentes sous la forme
dune matrice rectangulaire X , appele la matrice
observations-variables (23 lignes 6 colonnes). Ici, les
observations sont les annes {i = 1,, N}, et les variables sont
les stations de jaugeage {j =1,, P}, avec N = 23 et P = 6.
Questions
1. Calculs
1.1 Question pralable : quelle est la signification de la variable
hydrologique analyse (dbit Q -- ou dbit spcifique q ) ? A
quel type de normalisation des dbits cela correspond-il ?
1.2 Moments simples. Calculer la moyenne, la variance et lcart-type
de chaque variable (en utilisant directement les donnes, ou bien
encore, les sommes donnes en annexe).
1.3 Matrice de corrlation. Calculer la matrice de corrlation (i.e., la
matrice de covariance des variables rduites). Remarques ?
1.4 Diagonalisation de la matrice de corrlation. Afin dallger les
calculs, on donne en annexe la matrice diagonale D et la matrice de
passage P. En dduire les valeurs propres, ainsi que les vecteurs
propres ou composantes principales .
Note. Par dfinition, la matrice P transforme le repre initial en un
repre principal, dans lequel la matrice de corrlation devient
diagonale. Les variables hydrologiques transformes, i.e., exprimes
dans le nouveau repre dit principal , y sont donc non corrles.
2. Analyses et applications
2.1 Montrer que, dans le cas prsent, la CP1 reprsente les six
variables avec un poids peu prs gal pour toutes.
Note. On peut en conclure que la CP1 na pas donc de caractre
discriminant trs marqu. De ce fait, bien que son poids explicatif soit
important, on tudiera plutt le comportement et le rle hydrologique
des autres CP condition cependant quelles aient un poids suffisant.
2.2 Calculer le % de variance explique par les K premires CP, en
faisant varier K de 1 6. En dduire que lon ne perd que quelques %
dinformation en liminant les CP4, CP5 et CP6.
2.3 La figure 1 reprsente les 6 stations de jaugeage de dbits
(variables 1,,6) dans le plan des (CP2,CP3). Y a-t-il des
regroupements possibles ? Que pouvez en dduire ?
TABLEAU 1. Ecoulement de Mai (mm) en 6 stations des Pyrnes pour les annes 1950-1972
Anne
Observation
Naguilhes
Lanoux
Izourt
Gnioure
Caillaouas
Bleu
N(j)
X1(j)
X2(j)
X3(j)
X4(j)
X5(j)
X6(j)
1950
232
180
450
450
391
163
1951
228
155
355
337
271
110
1952
416
344
391
376
306
125
1953
479
370
503
490
387
234
1954
323
250
358
334
293
162
1955
379
260
288
269
432
351
1956
423
325
476
505
380
144
1957
154
141
215
197
137
37
1958
523
400
567
590
516
337
1959
10
440
340
337
364
318
137
1960
11
478
370
412
441
518
314
1961
12
431
329
365
386
313
241
1962
13
359
294
313
358
274
160
1963
14
295
271
318
305
208
104
1964
15
464
360
381
415
597
406
1965
16
366
285
451
428
228
139
1966
17
472
353
478
489
377
223
1967
18
383
310
396
404
215
66
1968
19
370
320
423
449
242
95
1969
20
417
359
403
447
372
181
1970
21
334
238
393
400
197
87
1971
22
447
370
471
459
348
170
1972
23
273
242
322
335
205
78
ANNEXE : Rsultats statistiques intermdiaires

(pour faciliter les calculs de moments le cas chant)
Nombre dobservation N=23 (nombre de variables P=6)
X1= 8686
(X1-m1)= 1.9132e+005 (mi est la moyenne de Xi)
X2= 6866
(X2-m2)= 1.1316e+005
X3= 9066
(X3-m3)= 1.3704e+005
X4= 9228
(X4-m4)= 1.6019e+005
X5= 7525
(X5-m5)= 2.9103e+005
X6= 4064
(X6-m6)= 2.1052e+005
Soit Yi la variable rduite de Xi, on donne les sommes suivants :

(Y1 Y2)= 21.1795
(Y3 Y4)= 21.2313
(Y1 Y3)= 13.9988
(Y3 Y5)= 10.4109
(Y1 Y4)= 15.4661
(Y3 Y6)= 6.8623
(Y1 Y5)= 14.7579
(Y4 Y5)= 11.7626
(Y1 Y6)= 14.2007
(Y4 Y6)= 7.8448
(Y2 Y3)= 13.1963
(Y5 Y6)= 20.2260
(Y2 Y4)= 14.9980 (Y2 Y5)= 12.7056 (Y2 Y6)= 11.6087

Soit CY la matrice de covariance de Y.
La matrice diagonale de CY est :
0.021
0.025
0.07
0.554
1.123
4.208
La matrice de passage P est :

0.646
-0.317
0.232
-0.473
0.013
0.452
-0.585
0.167
-0.238
-0.621
-0.066
0.428
-0.340
-0.492
0.325
0.383
-0.489
0.388
0.312
0.648
-0.188
0.283
-0.443
0.414
0.045
-0.313
-0.646
0.350
0.447
0.401
-0.158
0.335
0.575
0.203
0.601
0.360
ACP : ORGANIGRAMME METHODOLOGIQUE (version prliminaire) 1
NB : A gauche : variables centres rduites (moyenne nulle et variance unit) ; et droite : variables centres mais pas rduites (variances brutes).
CHAP. 3

Chaptre 3 (A):
PROCESSUS HYDROLOGIQUES
(Chroniques Hydrologiques et
Processus Alatoires Autocorrls)
Hydrologie Statistique 2005-06 (R.Ababou, A. Al-Bitar)
PLAN du CHAPITRE 3 (PROCESSUS HYDROLOGIQUES)

3.A. Bases de lanalyse statistique des sries chronologiques
considres comme des processus alatoires temporels
autocorrls ; exemples de chroniques issues de mesures hydromtorologiques (et hydrogologiques) ; modlisation de sries
autocorrles (processus AR1, ARMA,).
3.B. Analyse corrlatoire croise, systmes entre/sortie, modle de
convolution statistique, et application lanalyse et la
reconstruction de chroniques pluies-dbits ; voir Travaux Dirigs :
identification statistique dune fonction de transfert pluie-dbit
(Hydrogramme Unitaire Statistique). [Estimation gostatistique
(x,y) : selon les annes(*)].
NB(*) : Selon les annes, on pourra tudier en projet un problme
destimation gostatistique (variables rgionalises), ou encore, de modlisation et
reconstruction de chroniques hydro(go)logiques (pluies, dbits,).
BIBLIO./DOCS :
Bras R. et I.Rodriguez-Iturbe: Random Functions in Hydrology, Dover, NY.
http://rachid.ababou.free.fr Hydro.Stat Proba.Stat.
PLANNING DES TRAVAUX DIRIGES (A TITRE INDICATIF)

Date
No. TD
TD 1/4
TD 2/4
Chap.
I.A ;
I.B
II.
Crues annuelles, crues rares, temps de retour

Chap.3 TD 3/4
III.
Chap.3 TD 4/4
III.
Reconstitution et critique de donnes

pluviomtriques par corrlation et rgression
entre stations ; et/ou :
Corrlations multiples & Analyse en
Composantes Principales pour ltude des
redondances entre stations hydrologiques.
Identification (dconvolution) statistique de
la fonction de transfert pluie-dbit en temps
discret, dure finie : formulation algbrique
et application de la thorie...
Mini Bureau dEtude.
Utilisation de
programmes MATLAB en salle informatique
(Hydrogramme Unitaire Statistique) avec des
donnes relles.
RAPPEL : Une tude de cas sera traite en projet (selon les annes), soit sur un problme destimation gostatistique
(variables rgionalises), soit sur la reconstruction de chroniques hydrologiques (processus alatoires, HU statistique).
CHRONOLOGIE COURS/TD POUR 2005-06 (m..jour : 29 Nov.05 + 9 Jan.06)

Sance=S ; Cours=C ; Travaux Dirigs=TD, Bureau dEtude=BE
S1 : C1 : 22 Nov.2005 :
RA : Intro. hydro. stat : donnes; modles stat.
S2 : C2 :
RA : Ch.0 : Bases proba-stat & Ch.1 : Analyse Univar.
S3 : C3 :
RA : Ch.1 suite/fin: Analyse Univarie + loi Poisson
S4 : TD1 :
AA : Crues historiques Garonne (H) : Gumbel, Poisson
S5 : C4 :
RA : Ch.2 : Analyse Multivarie (tout)
S6 : TD2 :
AA : Analyse multivar & ACP / Q mensuels en 6 stations
S7 : C5 : Mar10JAN06 10-12h : RA : Ch.3 : Bases / Process.Alat. ; Autorgress.

S8 : C6 : Mar17JAN06 10-12h : RA :Ch.3 fin : Covar.croise ; H.U.stat. P(t)Q(t)
S9 : TD3 : Mer18JAN06 8h-10h : AA(RA): Identif HU P(t)Q(t): calculs algbriques
S10: TD4+BE (*): Mar24JAN06 8h-10h : RA&AA : Implmentation numrique en
MATLAB : ident. HU stat. P(t)Q(t) & reconstitutions de chroniques de dbits.
(*) Le dernier TD du 24 Janvier se droulera en salle machine C106, et fera lobjet dun
compte-rendu de BE, titre de contrle, remettre au secrtariat Hydraulique au 31 Janv. 2006.

Chaptre 3 (A):
PROCESSUS HYDROLOGIQUES
(Chroniques Hydrologiques et
Processus Alatoires Autocorrls)
CHAPITRE 3 : PROCESSUS HYDROLOGIQUES

3.A. CHRONIQUES HYDROLOGIQUES, PROCESSUS AUTOCORRELES (BASES)
Exemples de chroniques hydrologiques, mtorologiques,

hydrogologiques : pluies ; dbits ; niveaux deau ; pizomtries ;
pression atmosphrique ; temprature ;
Bases statistiques et probabilistes (thorie) : analyse de processus
physiques temporels comme des processus alatoires autocorrls
(en temps continu ; en temps discret)
Modlisation de sries autocorrles : les processus modles de
type AR, ARMA, etc. Cas particulier : formulation et identification
dun processus AR1 (Auto-Rgressif dOrdre 1) en temps discret.
Biblio de base :
COMPARAISON DE CHRONIQUES PLUIES DEBITS AU SRI LANKA :

Prcipitation (mm) et dbit spcifique (mm) sur 4 annes (1974-77) ; les
chroniques journalires ont t agrges par quinzaine (t = 15 j)
Exemples de Chroniques Hydrologiques

(rappels : revoir introduction du cours Ch.0)
Rsum. Cette section.
Rainfall Rates (Aliou)
60
40
20
0
0
500
1000
1500
2000
2500
3000
3500
4000
3000
3500
4000
time in hours
Runoff Rates (Aliou)

6
4
2
0
0
500
1000
1500
2000
2500
time in hours
Pluies & dbits semi-horaires (Aliou)



Introduction aux Processus Alatoires X(t) ou X(tn)

Rsum. Cette section comporte des schmas et graphiques illustrant qualitativement le
concept de Fonction Alatoire (FA), et les proprits importantes de stationnarit et
dergodicit, travers le cas particulier des processus alatoires, ou processus stochastiques
X(t). Toutes ces dfinitions et proprits seront reprises plus prcisment par la suite.
Introduction aux Processus Alatoires X(t) suite
Processus alatoire X(t) : dfinition

Soit une fonction X(t) (tIR ou IR+) : X(t) est une fonction ou processus alatoire
si pour chaque temps t1 fix X(t1) est une variable alatoire.
Le processus X(t) est entirement caractrise (en probabilit) si l'on connat la
densit de probabilit (d.d.p) jointe multivarie de toute collection finie (vecteur)
X = {X(t1), X(t2),, X(ti),, X(tN)}, ceci le choix des {ti} et N fini.
Processus gaussien : dfinition
Un processus alatoire X(t) est dit gaussien si toute collection finie X = {X(t1),
X(t2),, X(ti),, X(tN)} forme un vecteur alatoire gaussien, ceci le choix des
{ti} et N fini. Le vecteur X a donc une d.d.p (PDF) multivarie gaussienne.
Dans ce cas, le processus est compltement caractris par sa moyenne et sa
fonction d'autocovariance (voir plus loin).
Moments d'un processus X(t)

Moment d'ordre 1 en 1 point :
Moyenne E(X(t)) = mX(t)
Moment d'ordre 2 en 1 point :
Variance Var(X(t)) = X2(t)
Moment d'ordre 2 en 2 points:
Auto-Covar CXX(t',t") = Cov(X(t'),X(t"))
Remarques / Rappels:
Moments dordre 2 :
Var(x)=E((x-mx)2),
Cov(x,y)=E((x-mx)(y-my)) CXX(t,t) = X2(t).
Moments dordre > 2 :
Les prochains moments dfinir sont ceux d'ordre 3 [en 1, 2, et 3 points].
Pour un processus gaussien, il suffit de connatre les moments jusqu' l'ordre 2.
Mme si le processus n'est pas gaussien, on se contente souvent de lordre 2.
Le moment d'ordre 3 en 1 point, normalis par X3, donne le coeff. d'asymtrie
qui quantifie l'asymtrie de la d.d.p en 1 point (fX) de X(t). Le processus X(t) peut
tre gaussien si || <<1 (condition ncessaire, non suffisante).
Processus stationnaire
Un processus alatoire X(t) est dit "stationnaire" ou encore "homogne"
(statistiquement) si ses moments sont invariants par translation du temps
(invariance / t t+to)
Stationnarit stricte
Tous les moments d'ordre 1,2,,N (N fini) sont invariants
Stationnarit d'ordre 2
On se contente souvent de supposer l'invariance (stationnarit) des moments d'ordre 1 et 2.
La stationnarit d'ordre 2 implique :
Moyenne : E(X(t)) = mX constante (t)

Variance : Var(X(t)) = X2 constante (t)
Auto-Covariance : Cov(X(t'),X(t")) = CXX(t"-t') = CXX() , (t', t", t"-t'=)
Ainsi, pour un processus stationnaire d'ordre 2 :
L'autocovariance en 2 instants (t',t") ne dpend que du dlai = t"-t'.

Au dlai nul = 0, lautocovariance se rduit la variance : CXX(0) = X2 constante.
Enfin, si X(t) est gaussien, la stationnarit d'ordre 2 implique la stationnarit stricte.
10
Non-stationnarit : exemples de processus non-stationnaires

Si le processus YS(t) est stationnaire de moyenne nulle, les processus X(t) cidessous sont non-stationnaires :
X(t) = a0 + b0t + YS(t) ;
drive linaire en moyenne
X(t) = m0 + t YS(t) ;
variance croissant linairement
X(t) = m0 + e-btYS(eat) ;
Cependant, dans lexemple ci-dessus, les processus X(t) peuvent tre ramens
des processus stationnaires par un dmoyennage ou un filtrage appropri
11
Hypothse d'ergodicit
Pour un processus stationnaire, l'hypothse d'ergodicit pose l'quivalence entre
moyenne d'ensemble (esprance math.) et moyenne temporelle (ou spatiale)
sur un domaine infini, soit :
T
m X E ( X (t ))
1
m =
0 X (s )ds
X Tlim
T
constante
Plus prcisment, l'quivalence doit tre postule pour chaque moment "utile"
(selon les applications envisages) : ergodicit pour la moyenne mX (ci-dessus),
mais aussi ergodicit pour la variance X2 :
E ( X (t ) m X )
2
X
2
X = Tlim
T
( X (s ) m )
ds
constante
et ergodicit pour l'auto-covariance CXX() (fonction du dlai ) :
C XX ( ) E (( X (t ) m X )( X (t + ) m X ))
1
T T
C XX ( ) = lim
( X (s ) m )( X (s + ) m ) ds
X
= fonction du dlai().
12
Echantillonage dun processus ergodique

Si le processus X(t) est stationnaire et ergodique, les moments peuvent
donc tre estims sans biais partir de prises de moyennes temporelles
sur une ralisation unique du processus - condition de disposer d'une
plage d'observation T suffisamment longue (T) !
En pratique, cest ce quon fait souvent en hydrologie (moyenne temporelle,
variance temporelle, etc)
Limitations de lhypothse dergodicit / processus rels
Pour pouvoir appliquer l'hypothse d'ergodicit, il faut que T >> 0 , o 0
est une chelle caractristique de fluctuation telle que la longueur
intgrale d'autocorrlation (ci-dessous...).
Enfin, pour tester la validit de l'hypothse d'ergodicit, il faudrait
d'abord gnrer ou disposer de multiples ralisations du processus X(t)
13
Fonctions d'auto-corrlation
Fonction d'autocorrlation RXX : dfinition
RXX() = CXX() / X2
Proprits de RXX()
-1 RXX() +1 , IR
RXX() est paire : RXX(-) = RXX(+)
RXX(0)=1 et RXX()0
Exemples de fonctions d'autocorrlation
Exponentielle :
RXX() = exp(-||/o)
Gaussienne :
RXX() = exp(-(/0)2) [trs rgulier & diffrentiable tant quon veut]
Bruit blanc :
RXX() = c0 ()
[irrgulier, non diffrentiable]

[pathologiquemais trs utile ! voir plus loin]
14
Fonctions d'auto-corrlation (suite)

Echelle intgrale d'autocorrlation (*)
* = R XX ( )d
0
Exemple cas dun processus X(t) autocorrlation exponentielle

Pour la fonction d'autocorrlation exponentielle RXX()=exp(-/0), on obtient :
* = 0
On voit que le temps caractristique 0 reprsente dans ce cas lchelle intgrale
dautocorrlation du processus X(t).
Autres chelles de fluctuation
On peut dfinir dautres chelles de fluctuation (voir les processus anti-corrls :
cas de l'autocorrlation gaussienne trou)
15
Processus X(t) en temps continu / Processus X(tn) en temps discret

On a choisi jusquici de prsenter les caractristiques des processus
autocorrls en temps continus, plutt quen temps discret
Pour un processus alatoire temps discret, remplacer toutes les
intgrales temporelles par des sommes discrtes.
Il est cependant parfois trs commode de continuer raisonner en temps
continu avant de passer in fine la formulation en temps discret ().
16
Auto-corrlations de dbits spcifiques journaliers :

station de Jesmin, Gin Ganga, Sri Lanka.
Etude : R.Ababou & K.Desnos, 2000.
50 jours = 2 mois
17
Auto-corrlations de dbits spcifiques bi-mensuels

(dbits journaliers agrgs sur des quinzaines) :
station de Jesmin, Gin Ganga, Sri Lanka.
Etude : R.Ababou & K.Desnos, 2000.
50 quinzaines = 2 ans
18
Interprtation de fonctions dautocorrlation (dbits Sri Lanka)

Les figures ci-dessous reprsentent les fonctions dautocorrlation des dbits journaliers
(t=1j) et des dbits bi-mensuels (t=15 j) en une mme station, les dbits bimensuels tant
obtenus par intgration des dbits journaliers sur des priodes successives de 15 jours.
Cette analyse statistique a t effectue dans le cadre dune tude sur la rgionalisation des
dbits dans un bassin versant du Sri Lanka (ici la station de jaugeage de Jesmin).
1. Commenter et interprter la fonction QQ() journalire

2. Commenter et interprter la fonction QQ() bi-mensuelle
3. Comparer journalire/bimensuelle ; remarques ; conclusions.
NB : Cf. questions de contrle 2004-05.
50 quinzaines = 2 ans
50 jours = 2 mois
Echelle des dlais : -50 +50 jours
Echelle des dlais : -50 +50 quinzaines
Interprtation de fonctions dautocorrlation (dbits Sri Lanka)

Le graphe (xx) montre la fonction dauto-corrlation des dbits agrgs 15 jours (dbits
bimensuels) pour un fleuve du Sri-Lanka. Le pas de temps utilis est gal la priode
dagrgation (t = 15j = 1 quinzaine). On a reproduit ici la fonction dautocorrlation des
dbits sur un dlai total de 50 quinzaines (environ deux annes).
On note que les autocorrlations positives alternent avec les autocorrlations ngatives
(anticorrlation). En fait, la priodicit de la fonction dautocorrlation reflte les
priodicits de la chronique diffrentes chelles de temps (seules les chelles de temps
comprises entre 15 jours et 2 ans sont visibles ici): autocorrlation priodique
intersaison (semestrielle) et interannuelle (annuelle).
Ces priodicits sont imparfaites (car noscille pas entre -1 et +1), mais elles sont
statistiquement significatives : de lordre de 30% annuellement, et de lordre de 15%
en priodicit semi-annuelle (semestrielle). Ces deux priodicits sont dues au rgime
deux moussons qui caractrise la rgion tudie.
En dehors de ces deux priodicits remarquables, on remarque que la corrlation entre
deux dlais successifs (deux quinzaines successives) est relativement forte ( +0.5) mais
diminue trs nettement au troisime dlai : 0 (ou faible) pour un dlai 315 jours
(un mois et demi). Les dbits agrgs bimensuels sont donc peu corrls au pas de temps
15 jours, leur autocorrlation devenant quasi-nulle pour un dlai suprieur ou gal un
mois et 1/2 ceci condition de sparer leffet priodique des moussons discut + haut.
NB: Cette analyse a aussi t applique aux stations pluviomtriques de la mme rgion; elle
permet de tirer des conclusions similaires concernant les pluies agrges bimensuelles.
Modle de processus alatoire

autorgressif du 1er ordre (AR1)
X n +1 = 1 X n + s n +1
t = 0 : X = X 0
= 0; =
m n
mn
n
X n = X (t n );
n = (t n );
t = nt
n
1 = RXX ( 1 ) avec 1 = 1 t ; R XX ( ) =
s = X 1
2
1
C XX ( ) C XX ( )
=
C XX ( 0 )
X2
1
i= N
= Var ( X ) = i =1 ( X i X
N
2
X
Applications possibles : prdictions court terme (alerte crues/inondations); gnration

de chroniques (dbits); reconstitutions de donnes (comblement de lacunes)
Processus alatoires en temps discret :

modles de processus de type ARMA
(auto-rgressif AR, moving average MA)
Introduction diffrents modles de processus alatoires
En construction.
Processus purement alatoire en temps discret : le bruit blanc en temps discret (rappels - voir bruit
blanc en temps continu)
Une classe de processus en temps discret : les processus ARMA. Application au traitement du
signal en lectronique et tlcommunications, gophysique du globe, hydro-mtorologie, etc.
Thorie des systmes dynamiques linaires stochastiques : en temps continu ; en temps discret.
Choix des exemples : le processus AR dordre 1, et le processus MA
Combinaisons AR-MA et gnralisations : les processus de classe ARMA, ARIMA, ARMAX
Approfondissements : voir rfrences (Box & Jenkins ; Gelb ; Bras & Rodriguez-Iturbe ; R.A.).
Etude du modle AR1 : processus Auto-Rgressif dordre 1

Le modle AR1 est dvelopp ci-dessous (analys plus en dtail en classe : Cours ou TD).
21
Etude du modle AR1 : processus Auto-Rgressif dordre 1

Le modle AR1 est dvelopp ci-dessous (analys plus en dtail en classe : Cours ou TD).
Introduction. Le modle auto-rgressif dordre 1 (AR1) consiste supposer que

le processus tudi (par exemple une chronique de dbit ou de hauteur deau) est
rgi en temps discret par une quation de la forme :
X n +1 = 1 X n + s n +1
( n tant le nombre de pas de temps),

ou encore (notation de Box et Jenkins reprise par Bras et Rodriguez-Iturbe) :
Z t = 1 Z t 1 + at
( t tant alors ici le temps discret).
Ce modle gnre un processus Zt qui peut tre stationnaire ou non. Cependant, il

existe une condition initiale telle que le processus soit stationnaire. Dans ce ca, la
variance du processus est ncessairement constante et gale :
a2
=
1 12 ,
2
Z
et de plus, on montre galement que le paramtre 1 est gal lautocorrlation 1

du processus pour un dlai unitaire ( = 1t) :
1 = 1
o, par dfinition : 1 =
Cov(Z (t + t ), Z (t ))
2
Z
CZZ (t )
Z2
= ZZ (t ) .
Noter que 1 est encore appele one-lag correlation .

22
Etude du modle AR1 : processus Auto-Rgressif dordre 1 (SUITE)

AR1 : Relation t-discret (AR1) t-continu (Langevin)
Rappelons que le modle auto-rgressif dordre 1 (AR1) est en temps discret (tn=nt).
On peut montrer (*) en passant la limite t 0, que le processus AR1 est quivalent
au modle de Langevin, selon lequel le processus X(t) est rgi en temps continu a
lquation diffrentielle stochastique :
dX
Langevin : dt + 0 X (t ) = 0 f (t ) pour t 0 ; et X(0) = 0.
Le forage f(t) est un bruit blanc unitaire gaussien dautocovariance : Cff() = ().
Et g(t)=0 f(t) est un bruit blanc non-unitaire dintensit c0 = 02 : Cgg() = c0 ().
La condition initiale dterministe X(0) = Xo = 0 fait que X(t) nest pas stationnaire
aux temps courts ; mais pour t, X(t) tend quand mme vers un processus
stationnaire de moyenne nulle et de covariance :
CXX(t,t+) (02 / 20) exp(-o.||) si t >> o , avec o =1/o ,

o o =1/o est le temps dautocorrlation du processus de Langevin X(t).
Si lon prend comme condition initiale une variable alatoire Xo de moyenne nulle et
2
de variance (0 / 20), le processus de Langevin est alors stationnaire (t).
Ceci est tout fait analogue au cas du processus AR1 en temps discret.
23
dX
Langevin : dt + 0 X (t ) = 0 f (t ) pour t 0 ; et X(0) = 0.
24

AR1 : Relation t-discret (AR1) t-continu (Langevin)
(SUITE)
Dmonstration abrge de lquivalence AR1/Langevin.
Partons dun processus de Langevin en temps continu, et voyons ce quil devient aprs
discrtisation temporelle (intgration de Langevin sur des pas de temps t finis) :
dX
+0 X (t )= 0 f (t )
dt
? ? X n+1 = 1 X n + s n+1
PROCESSUS << AR1>>
PROCESSUS de LANGEVIN
En intgrant donc lq. de Langevin entre t(n) et t(n+1), on aboutit un schma de

type diffrences finies explicites (schma dEuler avant ) :
On peut calculer la variance du 2nd membre de cette quation discrte (le 2nd membre
est le bruit blanc intgr entre t(n) et t(n+1)) : cette variance est gale co/t.
En remaniant lquation aux diffrences obtenue, on voit finalement quelle est bien
de la forme de lquation autoregressive AR1 en temps discret, avec les paramtres :
s = c0 t
1 =
( 2)
1 + (t )
2
1 t
Remarques : (t) le paramtre 1 est toujours compris dans lintervalle [-1,+1].

Ainsi, 1 peut tre interprt comme un lag-one correlation (t) ; de plus, cette
corrlation 1 peut tre positive ou ngative, selon le pas de temps t utilis.
A linverse en faisant maintenant tendre t 0, on voit que le processus AR1 tend
bien vers un processus de Langevin (C.Q.F.D).
25

Extensions (en construction)
Formulation AR1 / Thomas-Fiering. Le modle de Thomas-Fiering est, simplement, le
modle AR1 formul comme suit (formulation quivalente aux prcdentes, sauf que le
processus peut avoir plus gnralement une moyenne non nulle) :
X t = 1.( X t 1 ) + X . 1 12 .Wt
(t est ici le temps discret)
Modle non-stationnaire saisonnier de Thomas-Fiering. Cette gnralisation du modle

AR1 consiste rendre la moyenne, la variance et la corrlation lag-one (1) dpendantes
de la saison : le modle est alors non-stationnaire de type saisonnier.
Lautocorrlation du processus dpend non seulement du dlai (lag-one : = 1t)
mais aussi de la saison (j-me saison de lanne). Ce modle AR1-saisonnier scrit :
X t , j m j = 1, j .(X t , j 1 m j 1 ) + j . 1 12, j .Wt , j
t = n.t
j = 1,..., J
Le paramtre (1,j) est lautocorrlation lag-one entre saisons (j-1) et (j).

Le processus (Xt,j) reprsente le dbit au temps discret (t) dans la saison (j).
Si J est la dernire saison de lanne (J=4), on pose : Xt,J+1 = Xt+1,1.
Anne (t-1)
Anne (t)
Saison j=1 Saison j=2 Saison j=3 Saison j=4 Saison j=1 Saison j=2 Saison j=3 Saison j=4
26

Caractrisation et identification statistique du processus AR1
On tudie ici les proprits statistiques du modle auto-rgressif dordre 1 (AR1),
ce qui mne dmontrer une condition de stationnarit, et obtenir ses proprits
stationnaires (variance, autocovariance). Une fois connue cette caractrisation
thorique, il devient possible, par comparaison/ajustement, dessayer didentifier
une chronique hydrologique relle un processus de type AR1.
X n +1 = 1 X n + s n +1
Equation du processus AR1 :
t = 0: X = X0
X n = X (t n ); n = (t n ); t n = n.t
Notations :
X n +1 = 1 X n + s n +1
Moyenne :
X n +1 = 1 X n + 0
X n +1 = (1 )
n +1
X0
X0 = 0 Xn = 0
(n )
27

Caractrisation et identification statistique du processus AR1 (SUITE)
Covariance :
X n X m = ...
Si m > n, posons m = n+k avec k = m-n > 0 :
X n X m = X n X n+k
Calcul auxiliaire : X n + k =
X n X n+k
j =k
X n + s. j 1 n + k j +1
k
j =1
j =k
= X n X n + s. j 1 n + k j +1
j =1
j =k
X n X n + k = k X n X n + s. j 1 X n n + k j +1
j =1
X n n + k j +1 = 0 (k j + 1) 1
En effet, les Xn ne dpendent pas des m futurs (m>n)
X n X n + k = k X n X n X n X m = m n X n X n m > n
28

X n X m = ...
Covariance (suite):
Si m < n, posons m = n-k avec k = n-m > 0 :

On obtient de mme aprs calculs.
X n X n + k = k X n X n X n X m = m n X n X n m< n
Covariance (fin) :
On obtient donc finalement :
nm
Var ( X (min(t n , t m )))
(m< n) : X n X m =
Variance.
Il reste calculer la variance de Xn.

j =n
X n = X 0 + s. j 1 n j +1
k
R-utilisons la formule :
Var ( X n ) = X n X n
j =1
j =n
= k X 0 + s. j 1 n j +1
j =1
j =n
= 2 n X 0 X 0 + 2 n s. j 1 X 0 n j +1

(R.Ababou, A. Al-Bitar)
j =1
29

Variance.
Il reste finalement calculer la variance de Xn.

j =n
X n = X 0 + s. j 1 n j +1
k
R-utilisons la formule :
Var ( X n ) = X n X n
... =
2n
j =1
j =n
k
= X 0 + s. j 1 n j +1
j =1
j =n
X 0 X 0 + 2 s.
n
j =1
j 1
i =n j =n
X 0 n j +1 + s . i 1 j 1 n i +1 n j +1
2
i =1 j =1
2
Xo
= X0X0
X 0 n j +1 = 0 car Xo ne dpend pas des futurs
n i +1 n j +1 = i , j par construction (ij = symbole de Kroneker)
30

Variance (suite).
Avec n i +1 n j +1 = i , j , la double somme se rduit une simple somme (srie
gomtrique), et tous les autres termes disparaissent.
1 2n
2i
2
En utilisant alors lidentit

1 2 , on obtient :
i =1
i=n
Var ( X n ) =
2n
2
Xo
+s
1 2n
1 2
Condition de stationnarit sur la variance.

On voit que la variance du processus AR1 est en gnral no-stationnairesauf si
lon chosit la variance initiale (Xo2) telle que le processus soit stationnaire. Ce
choix existe ; on peut le voir en cherchant annuler le terme qui dpend de (2n) :
2
1 2
1
1
2
2
Var ( X n ) = 2 n Xo
s2
+
s
=
s
Xo
1 2
1 2
1 2 .
La variance du processus est alors bien cstante :
Var ( X n ) =
2
Xo
s2
=
1 2
31
Exercice de cours : identification dun modle AR1 (AutoRgressif dOrdre 1)

Rappels. Dfinition dun processus AR1 (cf. cours) :
X n +1 = 1 X n + s n +1 .
Ce modle gnre un processus Xn stationnaire de moyenne nulle, si on prend pour
condition initiale X0 une variable alatoire de moyenne nulle et de variance
Xo2 = s2/(1-12). On obtient alors un processus Xn ayant une variance stationnaire
nm
Xn2 = s2/(1-12), n 0, et une autocorrlation stationnaire : XX (n, m ) = (1 )
,
o n et m reprsentent des temps discrets (ici exprims en nombres de pas de temps).
On veut utiliser un modle AR1 pour gnrer des chroniques de dbits (Qn)
journaliers, mensuels, ou mme annuels, en prenant par exemple Xn Qn-mQ. La
1re tape indispensable est lidentification des paramtres du modle AR1.
1. Proposer une procdure simple pour identifier s et 1 partir des
moments empiriques de Qn .
2. Reprsenter graphiquement XX (n, m) dans 2 cas : 1 positif, 1 ngatif
3. Examiner les chroniques de dbits du Sri Lanka (voir figures plus haut) :
peuvent-elles correspondre un modle de type AR1 ? Argumenter la rponse
dans les deux cas prsents : (i) dbits journaliers ; (ii) dbits bi-mensuels.
32
Suite du CHAPITRE 3 (PROCESSUS HYDROLOGIQUES)

3.A. Bases de lanalyse statistique des sries chronologiques
considres comme des processus alatoires temporels
autocorrls ; exemples de chroniques issues de mesures hydromtorologiques (et hydrogologiques) ; modlisation de sries
autocorrles (processus AR1, ARMA,).
3.B. Analyse corrlatoire croise, systmes entre/sortie, modle
de convolution statistique, et application lanalyse et la
reconstruction de chroniques pluies-dbits voir :
Travaux Dirigs : identification statistique dune fonction de
transfert pluie-dbit ( Hydrogramme Unitaire statistique ).
[Estimation gostatistique (x,y) : selon les annes(*)].
NB(*) : Selon les annes, on pourra tudier en projet un problme
destimation gostatistique (variables rgionalises), ou encore, de modlisation et
reconstruction de chroniques hydro(go)logiques (pluies, dbits,).
BIBLIO./DOCS :
33
CHAP.3 : TRAVAUX DIRIGES SUT LANALYSE CROISEE PLUIE-DEBIT

No. TD
Chap.
TD 1/4
I.A ;
I.B
II.
Crues annuelles, crues rares, temps de retour

Reconstitution et critique de donnes pluviomtriques
par corrlation et rgression entre stations ; et/ou :
Corrlations multiples & Analyse en Composantes
Principales pour ltude des redondances entre
stations hydrologiques.
Chap.3 TD 3/4
III.
Chap.3 TD 4/4
III.
Identification (dconvolution) statistique de

la fonction de transfert pluie-dbit en temps
discret, dure finie : formulation algbrique
et application de la thorie...
Mini Bureau dEtude.
Utilisation de
programmes MATLAB en salle informatique
(Hydrogramme Unitaire Statistique) avec des
donnes relles.
Date
TD 2/4
RAPPEL : Une tude de cas sera traite en projet (selon les annes), soit sur un problme destimation gostatistique
(variables rgionalises), soit sur la reconstruction de chroniques hydrologiques (processus alatoires, HU statistique).
34
MODLES PLUIEDBIT :
Identification de Fonction de Transfert - Approches Dterministe et Statistique
Synoptique Abrg
(A)
(B)
MODLE PLUIE-DBIT
DTERMINISTE
MODLE PLUIE-DBIT
STATISTIQUE
HYPOTHSES COMMUNES :
Intgrale de convolution causale.

Systme linaire, causal, invariant (stationnaire).
A0) TYPES DE DONNES
B0) TYPES DE DONNES
Evnement averse-crue
Isol, bien dfini.
Evnements averses-crues
composites, complexes.
A1) MODLE CAUSAL,

FORMULATION FORTE
B1) MODLE CAUSAL,
Convolution causale P(t) Q(t),

n'admettant pas d'erreur ( = 0) :
Q (t ) =
h (t s ) P ( s )ds
FORMULATION FAIBLE

admettant une certaine erreur (t) :
t
Q (t ) = 0 h(t s ) P( s )ds + (t )
= Q (t )
+ (t )
Solution: Inverser le systme Solution : Minimiser lerreur :

2
Noyau exact h(t)
Min Var ( (t )) = E Q (t ) Q (t )
{[
(solution forte).
]}
Noyau optimal h(t) (sol.faible)
A2)INTERPRTATION DTERMINISTE B2) INTERPRTATION STATISTIQUE

P(t),Q(t) processus dterministes P(t),Q(t) process. alatoires stationnaires
h(t) solution dterministe d'un h(t) solution dterministe d'un problme
d'optimisation statistique : minimisation
systme
linaire
exactement
de variance d'erreur (qui reste non nulle).
dtermin (lerreur est nulle).
Hydrologie Gnrale et Hydrologie Statistique / R.Ababou / Jan.1998
MODLES PLUIEDBIT :
A3) RSOLUTION DTERMINISTE B3) RSOLUTION STATISTIQUE

Equation causale
en temps continu [0,T]
(quation de Wiener-Hopf) :
RPQ ( ) =
0 h( s ) RPP ( s )ds , 0<<T,
o T dure des observations de P(t),Q(t).
Equation non-causale
en temps continu [-T,+T] :
RPQ ( ) =
+T
T h( s) RPP ( s)ds , -T<<T,
o T dure des observations de P(t),Q(t).
Solution de l'quation causale
Solution de l'quation non-causale
en temps discret (ti )
en temps discret (i ))
Discrtisation de l'quation de On discrtise l'intgrale de convolution cidessus par sj=(j-1).t, i=(i-1).t, et

convolution avec ti =(i-1)t (i=1,...,N)
T=K.t.
Problme
d'algbre
linaire:
systme matriciel carr P H = Q, o On obtient un systme matriciel carr

la matrice des pluies est triangulaire
symtrique de taille (2K+1)x(2K+1).
infrieure (causale)
La matrice du systme contient les
Solution directe H = P-1 Q par
autocovariances des pluies RPP(-s).
substitution (algorithme rcursif).
Rsoudre par une mthode approprie.
AVANTAGES ET INCONVNIENTS
AVANTAGES ET INCONVNIENTS
Solution trs simple mettre en Solution assez simple, bien que le

oeuvre : systme triangulaire
systme soit non triangulaire et dense.
Mthode peu robuste : mauvais Mthode assez robuste, applicable
conditionnement,
fonctions
de
transfert divergentes ou ngatives.
des vnements complexes et des

chroniques longues de pluies-dbits.
MODLES PLUIEDBIT :
Synoptique Dtaill
(A)
(B)
Modle Pluie-Dbit
Modle Pluie-Dbit
dterministe
statistique
HYPOTHSES COMMUNES AUX DEUX MODLES

La relation pluie-dbit est une intgrale de convolution causale
Le systme est linaire
Le systme est invariant ou stationnaire
Le systme est causal
A0) TYPES DE DONNES
B0) TYPES DE DONNES
1 Evnement averse-crue isol et 1. Srie chronologique comportant un certain

simple, tel que les causes et les effets
nombre d'vnements averses-crues assez
sont clairement discernables.
complexes, toute relation causale devenant
indiscernable
2 Faible nombre de donnes, chronique
courte permettant une
rapide du systme linaire
rsolution 2. Grand nombre de donnes et longues

sries chronologiques favorisant une
approche statistique
A1) MODLE CAUSAL,

FORMULATION "FORTE":
B1) MODLE CAUSAL,

FORMULATION "FAIBLE":

n'admettant pas d'erreur ( = 0) :

admettant une certaine erreur (t) :
Q (t ) =
h(t s ) P ( s )ds
Q( t ) =
h(t s) P( s)ds + (t ) = Q$ (t ) + (t )
On cherche satisfaire "au mieux" l'quation

On impose de satisfaire exactement cette de convolution on cherche minimiser la
quation pour le jeu de donnes dont on norme quadratique ou la variance de l'erreur :
dispose on doit inverser l'oprateur
(t ) 2 ,
intgral ou la matrice correspondante Var ( ( t )) = E Q (t ) Q
pour trouver le noyau h(t).
d'o finalement le noyau optimal h(t).
{[
A2)INTERPRTATION DTERMINISTE
]}
B2) INTERPRTATION STOCHASTIQUE
P(t),Q(t) sont 2 signaux dterministes P(t) et Q(t) sont deux processus alatoires
correspondant un vnement
corrls et stationnaires (statistiquement
averse-crue unique et bien identifi.
invariants par translation).
h(t) est une fonction de transfert h(t) est une fonction de transfert
dterministe, solution d'un systme
dterministe, solution d'un problme
linaire (galit stricte: solution forte).
d'optimisation (min. erreur: solution faible)
A3) SOLUTION DTERMINISTE :
B3) SOLUTION STATISTIQUE :
MODLES PLUIEDBIT :
Solution causale en temps discret (ti )
i) Solution causale, temps continu [0,T]
Minimisation de la variance d'erreur;

Discrtisation
de
l'quation
de application du principe d'orthogonalit entre
convolution avec ti =(i-1)t (i=1,...,N)
inputs (P) et erreur ():
Problme d'algbre linaire: systme
T
R
(
)
=
h( s ) RPP ( s )ds , 0<<T
matriciel carr P H = Q, o la matrice
PQ
0
des pluies est triangulaire infrieure
o T dure totale des observations (P,Q).
(causale)
-1
Solution directe H = P Q obtenue L'quation en temps continu et sa rsolution
par transforme de Laplace sont connues
par substitution (algorithme rcursif).
sous le nom de Wiener-Hopf. La solution est
complique par la contrainte de causalit. (voir
Papoulis 1964).
ii) Solution non-causale, [-T,+T]

Si on relaxe la contrainte de causalit dans
l'expression statistique du problme, on
obtient la mme quation mais avec intgrale
de s=-T s=+T, et [-T,+T] :
RPQ ( ) =
+T
T h( s) RPP ( s)ds , -T<<+T
o T dure totale des observations (P,Q).

ii) Solution non-causale en temps discret i
On discrtise l'intgrale de convolution cidessus par sj=(j-1).t, i=(i-1).t, et T=K.t.
On obtient un systme matriciel carr
symtrique de taille (2K+1)x(2K+1).
La matrice du systme contient
autocovariances des pluies RPP(-s).
les
Rsoudre par une mthode approprie.

iv) Solution non-causale, [-,+]
On peut simplifier encore en faisant tendre la
taille du domaine d'observation vers l'infini,
d'o l'quation quation RPQ() ci-dessus avec
intgrale de s=- s=+, et [-,+].
On obtient alors la solution h() par
Transforme de Fourier en domaine infini :
MODLES PLUIEDBIT :
H ( ) =
1 S PQ ( )
2 S PP ( )
o H() reprsente la TdF de h(), et S() la

TdF ou densit spectrale de R(). Il ne reste
plus alors qu' obtenir h() par TdF inverse.
AVANTAGES ET INCONVNIENTS AVANTAGES ET INCONVNIENTS
Solution simple mettre en

oeuvre : rsolution directe d'un
systme triangulaire infrieur (causal)
par subsitution avant.
Mthode peu robuste. En effet :

Mauvais conditionnement du systme,
d'o impossibilit d'obtenir une solution
numrique dans les cas suivants:
averse non isole, non impulsionnelle,
chroniques de pluies (dbits) longues,
complexes, multimodales, bruites,
non-causales...
Dans certains des cas prcdents, par
exemple averse non-impulsionnelle, on
peut avoir une fonction de transfert
convergente mais comportant des
fluctuations ngatives non physiques.
Enfin, la fonction de transfert obtenue

est relative l'averse tudie, et le
procd doit tre itr afin de prendre
en compte d'autres averses isoles (la
mthode ne dit pas comment).
Solution assez simple, bien que le

systme linaire obtenu soit en gnral
dense, et non-triangulaire mme si le
modle P(t)Q(t) est causal.
Mthode
relativement
robuste,
applicable des vnements composites
ou complexes et (donc) des chroniques
longues.
La fonction de transfert rsulte d'une sorte

de prise de moyenne statistique et ne rend
pas compte en gnral des vnements
extrmes et/ou fortement non-linaires
(crues-tiages).
La fonction de transfert peut prendre en

compte la causalit de faon statistique,
mais elle n'est pas strictement causale au
sens classique (dterministe).
TD 3/4 HU
F.d.Transfert
P(t)Q(t)
Donnes pluies-dbits semi-horaires (source karstique dAliou)
Aliou semi-horaire w/HU-STAT-5_V2.m (R.Ababou, Fev.2006)

HU5_Aliou93_QobsQsim_M337ZOOM3.emf (etc.)

Noms des fichiers images : HU5_Aliou93_QobsQsim_M337ZOOM3.emf (etc)
ALIOU SEMI-HORAIRE 1993 (Pluie-Dbit)
Fonction de transfert H non-causale (non-causal deconvolution) : delais positifs et negatifs)
0.03
0.025
0.02
0.015
0.01
0.005
-0.005
-0.01
-100
-80
-60
-40
-20
0
20
Delai discret (discrete lag)
40
60
80
100
Cut-off : M = 100 (demi-heures)

HU5_Aliou93_QobsQsim_M337ZOOM3.emf (etc.)
Output Y(t) simul (trait fin en rouge) et observ (trait gras en noir) -- Y(t) non centr; temps discret.
5
-1
5500
5600
5700
5800
5900
6000
6100
6200
6300
6400
6500
ZOOM 3
REFERENCES
X.X. LISTE DE REFERENCES (en construction)

POLYCOPIES DHYDROLOGIE STATISTIQUE
ABABOU R.(2004+): Hydrologie Statistique. Polycopi lectronique
lments de cours et exercices. Documents lectroniques sur le site web :
http://rachid.ababou.free.fr
GAUDU R.: Cours d'Hydrologie 1 : lments de polycopi pour
l Hydrologie Statistique (ENSEEIHT, circa 1990).
DUBAND D., 1972: Hydrologie statistique approfondie.
Cours polycopi (EDF-DER & ENS d'Hydraulique de Grenoble).
OUVRAGES DHYDROLOGIE STATISTIQUE

BOX, G.E.P. & G.M. JENKINS. 1976. Time Series Analysis, Forecasting,
and Control. Revised Edition. San Francisco, CA: Holden-Day Publishers.
BRAS R., I.RODRIGUEZ-ITURBE : Random Functions in Hydrology,
Dover, New York.
CHOW V.T., MAIDMENT D.R., MAYS L.W. Applied Hydrology. Mc
Graw-Hill International Editions, Civil Engineering Series, 572 pp.,1988.
DELLEUR:
GELHAR L.W. Stochastic Subsurface Hydrology. Prentice Hall, Englewood
Cliffs, New Jersey, 390 pp., 1993.
REMENIERAS G., 1965 & 1976 : Hydrologie de l'ingnieur. Eyrolles
(Collection EDF-DER), 456pp., 1976.
YEVJEVICH:
OUVRAGES DE GEOSTATISTIQUE
ISAAKS, E. H., R. M. SRIVASTAVA. 1989. An Introduction to Applied
Geostatistics. Oxford: Oxford University Press: 561pp.
GSLIB : Geostatistical Library (.)
JOURNEL, A. G., C. J. HUIJBREGTS. 1978. Mining Geostatistics. New
York: Academic Press: 600pp.
MARSILY, de , G., 1986. Quantitative Hydrogeology (Groundwater
Hydrology for Engineers). Academic Press. New York. 440 pp.
OUVRAGES PROBABILIT-STATISTIQUE
BAIN L.J. Statistical Analysis of Reliability and Life-Testing Models
(Theory and Methods). Marcel Dekker Inc. New-York and Basel. 19xx.
BASS J.: Elments de calcul des proba
BLANC-LAPIERRE : (Thorie des focntions alatoires)
CHEENEY, R.F. 1983. Statistical Methods in Geology. George Allen &
Unwin. London.
CAUTROT B., et al.: Les mthodes de prvision. PUF "Que Sais-Je?".
FELLER W.: An introduction to probability theory and applications.
GASQUET C., P.WITOMSKI, 1990, Analyse de Fourier et Applications
(filtrage, calcul numrique, ondelettes), Masson, Paris, 354 pp.
JENKINS G.M., WATTS D.G., 1968. Spectral analysis ant its applications.
Holden Day. 525 p.
KENDALL M.G., A. STUART A., (1977), "The Advanced Theory of
Statistics", Vol. 1, Distribution Theory, MacMillan, New York, 472 pp.
KENDALL M.G. (1977), "The Advanced Theory of Statistics", Vol. 2,
KENKEL, J.L. Introductory Statistics for Management and Economics. 2nd
Edition. Boston, Massachusetts, Duxbury Press. 1984.
LOVE M., (1963,1978), Probability Theory, Vol. II; Springer-Verlag, 1978.
MAX J., 1980. Mthodes et techniques de traitement du signal et applications
aux mesures physiques, Masson Paris, 379 p. (2 vols.)
MONIN A.S., YAGLOM A.M., (1965), Statistical Fluid Mechanics:
Mechanics of Turbulence (Volume 2), Ed. J. L. Lumley, The MIT Press,
Cambridge, Mass. (874 pp). [Contient un expos dtaill de la thorie des
fonctions alatoires].
PAPOULIS A., 1965 : Probability, Random Variables, and Stochastic
Processes. Mc Graw-Hill Book Company, New York. 1965.
PAPOULIS A., et al. (idem - nouvelle dition augmente)
PRIESTLEY M.B.1981. Spectral analysis and time series. Acad. Press, 890p.
PRIESTLEY M.B., 1988. Non-linear and non-stationnary time series
analysis. Academic Press, 237 p.
TASSI Ph., 1989 : Mthodes statistiques, Economica.
VANMARCKE, E. 1983. Random Fields: Analysis and Synthesis.
Cambridge, Mass.: Massachusetts Institute of Technology Press: 382pp.
VENTSEL H., 1973 : Thorie des probabilits. Editions Mir, Moscou.
[French translation, from Russian, by A. Sokova, MIR, Moscow, USSR]
YAGLOM, A. M. 1962. Stationary Random Functions. R. A. Silverman,
trans. & ed. New York: Dover: 235pp.
ARTICLES & RECHERCHES

ABABOU R., A.C. BAGTZOGLOU, E.F. WOOD, On the Condition
Number of Covariance Matrices Arising in Kriging, Estimation, and
Simulation of Random Fields. Math. Geol., Vol.26, No.1, pp. 99-133, 1994.
ABABOU R., L.W. GELHAR, Self-Similar Randomness and Spectral
Conditioning : Analysis of Scale Effects in Subsurface Hydrology,
Chapter XIV in Dynamics of Fluids in Hierarchical Porous Media,
J. Cushman editor, Academic Press, New York, pp. 393-428, 1990.
DELHOMME, J. P. 1979. Spatial variability and uncertainty in groundwater
flow parameters: a geostatistical approach. Water Resou.Res. 15(2):269-280.
FREEZE, R.A., A stochastic-conceptual analysis of one-dimensional
groundwater flow in nonuniform homogeneous media, Water Resour. Res.,
11, 725-741, 1975.
GELHAR L. W., (1986), "Stochastic Subsurface Hydrology (from Theory to
Applications)", Water. Res. Res., 22(99), 135-145 pp.
LABAT D., R. ABABOU, A. MANGIN, 1999 : Linear and Nonlinear
Models Accuracy in Karstic Springflow Prediction at Different Time Scales.
SERRA - Stochastic Environmental Research & Risk Assessment,
13(1999):337-364, Springer-Verlag.
LABAT, R. ABABOU, A. MANGIN, 2000: Rainfall-runoff relations for
karstic springs Part I : Convolution and spectral analyses. Journal of
Hydrology, 238, Issues 3-4, 5 Dec.2000, pp.123-148.
SHINOZUKA M., C. M. JAN, (1972), "Digital Simulation of Random
Processes and its Applications". J. Sound Vib., 25 (1), p. 111.
ENCYCLOPEDIES, GUIDES, HANDBOOKS

CEMAGREF (O.Gilard, P.Givone, G.Oberlin, N.Gendreau et al.) : Guide
pratique de la mthode inondabilit .
Agence de lEau RhneMditerrane-Corse, 1998.
CHOCAT B., Encyclopdie de lHydrologie Urbaine. Coordonnateur
B.Chocat. Ed. Lavoisier, Collection Tec et Doc.
MIQUEL J. : Guide pratique d'estimation des probabilits de crues.
Eyrolles (EDF-DER), 1984, 160 pp.
OMM : Guide de lOMM ()
PRESS W.H., B.P. FLANNERY, S.A. TENKOLSKY, W.T.
VETTERLONG, 1986 (& 1990), Numerical Recipes : The Art of Scientific
Computing. Cambridge Univ. Press. [with programs in Fortran, Pascal, or C].
SITES, RESEAUX, DONNEES, BASSINS HYDROLOGIQUES

SMEPAG Garonne, 1989 : Monographie des crues de la Garonne -- du
Pont du Roy au Bec d'Ambs . (Schma de protection contre les eaux de la
Garonne, Tome 1). SMEPAG-Syndicat Mixte d'Etude et de Programmation
pour l'Amnagement de la Garonne (CACG, CARA, UTM, UB). Fv. 1989.

HYDROGEOLOGIE STOCHASTIQUE & GEOSTATISTIQUE

DAGAN, G., Flow and Transport in Porous Formations, Springer-Verlag,
465 p., 1989.
GELHAR, L.W., Stochastic Subsurface Hydrology, Prentice Hall, 390 p.,
1994.
KITANIDIS, P.K., Introduction to Geostatistics, Cambridge University
Press, 249 p., 1997.
MARSILY (de) G., Quantitative Hydrogeology. (.)
MATHERON, G., Elements pour une theorie des milieux poreux , Masson et
Cie, Paris, 1967.
RUBIN, Y., Applied stochastic hydrology, Oxford University Press. (2000)
SHVIDLER, M.I., Flow in heterogeneous media (in Russian), Izv. Akad.
Nauk USSR Mekh. Zhidk. Gaza, 3, 185, 1962.
ZHANG, D., Stochastic methods for flow in porous media : coping with
uncertainties, Academic Press, 350 p., 2002.
ANNEXES
PdF(V) Stat-iii_pdf.doc Proba_PDF-Moments.doc VUG
ANNEXE
LOIS DE PROBABILITS UNIVARIES:

Relations Moments/Paramtres et
Mthodes dIdentification
1. IDENTIFICATION (AJUSTEMENT) D'UNE DENSIT DE PROBABILIT

PAR LA "MTHODE DES MOMENTS"
1.1.
Mthode des moments
La "mthode des moments" consiste comparer, pour une loi de probabilit thorique donne, les moments thoriques aux
moments empiriques d'ordres levs, ceci en attribuant aux moments thoriques d'ordre moins levs leurs valeurs
empiriques (rappelons que les moments "empiriques" sont issus du dpouillement statistique des simulations numriques).
On utilisera ici les quatre premiers moments statistiques, ou certains coefficients obtenus partir de ces quatre premiers
moments : coefficients de variation, d'asymtrie, et d'aplatissement. On peut par exemple, pour une loi deux paramtres,
fixer les deux premiers moments, ou la moyenne et le coefficient de variation, pour essayer de prdire/ajuster les moments
d'ordre 3 et 4, ou les coefficients d'asymtrie et d'aplatissement. On prsentera sous forme de tableaux les comparaisons
entre les moments empiriques d'ordre 3 et 4 obtenus pour certains jeux de donnes, et les moments thoriques
correspondants prdits par les modles (les "modles" tant les lois thoriques tester). Le calcul des moments thoriques
(prdits) se fait, si possible, grce des formules analytiques closes, de la forme:
(1)
.
emp.
3thou
, emp. )
4 = f (m
On peut alors calculer une erreur relative, ou cart relatif, dfini par :
(2)
nth. nemp.
=
nth.
Ce critre permet d'valuer l'adquation des modles thoriques la loi empirique, ainsi que la marge de confiance associe.
1.2.
Dfinitions des moments et des coefficients associs
Les moments centrs d'ordre n sont dfinis par la relation :

(3)
n=<(x-m)n>,
o <> reprsente l'oprateur d'esprance mathmatique et m la moyenne, qui est aussi le moment non centr d'ordre 1. Nous
nous intresserons plus particulirement ici, outre la moyenne, aux moments centrs d'ordre 2, 3 et 4, ainsi qu' divers
coefficients adimensionnels pouvant tre forms partir de ces moments.
Le moment centr d'ordre 2 (2) est reprsente la variance, encore note plus couramment 2 . On a donc :
(4)
2 =2 =<(x-m)2>.
A partir de la moyenne (m) et de l'cart-type (), on peut dfinir un coefficient de variation not "CV" ou simplement "C".
Le coefficient de variation est particulirement utile pour quantifier le degr de variabilit d'une variable alatoire positive.
Il est dfini par la relation :
(5)
C = /m.
Les moments centrs d'ordre 3 et 4, et. Les moments centrs d'ordre 3 et 4 sont dfinis par :
(6)
3=<(x-m)3>.
(7)
4=<(x-m)4>
A partir de ces deux derniers moments centrs, on dfinit les coefficients d'asymtrie et d'aplatissement, ou coefficients de
Fisher (Ventsel 1973, Tassi 1989) :
(8)
=
: coefficient d' asymtrie (Skewness).
= 4 3 : coefficient d' aplatissement (Kurtosis) .
Il est facile de montrer que = 0 pour une distribution symtrique, puisque les moments d'ordre impairs sont alors nuls. Le
coefficient est un bon indicateur de symtrie de la loi considre. Ce coefficient est positif pour une loi asymtrique telle
que la loi log-normale, la loi exponentielle, etc. Il serait ngatif, par exemple, pour une variable alatoire x < x0 telle que
(x0-x) suit une loi exponentielle ou log-normale.
La dfinition du coefficient fait rfrence la forme de la loi normale N(0,1). En effet, on obtient pour la loi normale
(voir par exemple Tassi 1989) :
(9)
x2p
1
5
( p + )
( )
2 =4 2 =3
= 2p
4
1
1
( )
( )
2
2
On en dduit que = 0 pour une loi normale. Plus gnralement, est positif pour une densit de probabilit "pointue"
(plus pointue que la loi normale), et ngatif pour une densit de probabilit "aplatie" (plus aplatie que la loi normale). La loi
de Laplace, exponentielle symtrique avec un point de rebroussement l'origine, a un coeff. d'aplatissement positif ( = +6).
On retiendra que les coefficients et sont dfinis de telle manire que la loi de probabilit empirique s'approche d'une loi
normale, du moins en ce qui concerne les moments jusqu' l'ordre 4, ds lors que || et || sont trs infrieurs l'unit.
1.3. Relations entre paramtres et moments de quelques lois

a. Loi normale:
La loi normale, ou gaussienne, est une loi deux paramtres (m,). Sa densit de probabilit est donne par :
(10)
f X ( x) =
1
e
2
( x m) 2
2 2
pour x R
Les coefficients d'asymtrie et d'aplatissement de la loi normale sont nuls, soit :
(11)
= 0
= 0
b. Loi log-normale :
On considre ici la loi log-normale deux paramtres (m,). Il s'agit d'une loi de probabilit support positif, dont la
densit de probabilit est donne par :
(12)
f X ( x) =
1
x 2
( Ln ( x ) m ) 2
2 2
pour x R +
o m et 2 reprsentent la moyenne et la variance du logarithme de x. La loi lognormale est directement lie la loi
normale. En effet, si la variable y = ln(x) suit une loi normale N(m,), alors la variable x = exp(y) suit une loi log-normale
donne par l'quation ci-dessus.
Dsignons plus prcisment par mx et my les moyennes de x et y, et par x2 et y2 les variances de x et y. On a alors les
relations suivantes, extraites de Ababou et Wood (1990), Tassi (1989), et Vanmarcke (1983).
La moyenne (arithmtique) de la variable lognormale x satisfait la relation :
y2
(13)
x = m x = x g e
o xg est la moyenne gomtrique de x, dfinie par

(14)
x g = e ln( x ) = e
my
D'o la relation :
(15)
mx = e
(my +
y2
2
De plus, la variance de la variable lognormale x satisfait la relation :

(16)
x2
xg2
y2
( y2 1)
En combinant ces relations, on obtient alors :
(17)
x2
mx2
y2
(e
y2
1) Cx = (e
1
1) 2
Cette dernire quation donne la variance, et le coefficient de variation, de la variable lognormale x en fonction des deux
premiers moments de la variable normale y = ln(x). On peut montrer que :
(18) x = 3 Cx + Cx 3
(19) x = Cx 8 + 6 Cx 6 + 15 Cx 4 + 16 Cx 2
Ces deux dernires quations donnent les coefficients d'asymtrie et d'aplatissement d'une variable lognormale x en fonction
de son coefficient de variation.
Lorsque y est faible ou au plus de l'ordre de l'unit, on peut en dduire par dveloppement de Taylor que Cx ~ y. En
d'autres termes, on obtient pour une variable lognormale x la relation approche:
(20)
Cx ~ ln(x) ,
Considrons le cas des variables hydrologiques K positives, strictement ou non (dbits Q, prcipitations P, mais aussi
paramtres physiques tels que permabilit, etc). Le dernier rsultat ci-dessus montre que lnK est un bon indicateur
adimensionnel du degr de variabilit du phnomne lorsque K est suppose distribue suivant une loi lognormale.
c. Loi exponentielle :.
On considre ici la loi exponentielle un seul paramtre ().
Cette loi est support positif, et sa densit de probabilit est donne par.
(21)
f X ( x) =
pour x R +
Pour cette loi, il y a identit entre cart-type et moyenne, i.e. = m, d'o :
(22)
CX = 1.
On peut galement montrer les relations suivantes (Tassi 1989) :
(23)
= 2.
(24)
= 6.
Notons que le coefficient de variation d'un variable loi exponentielle est toujours gal un, ce qui permet de dcider
rapidement si une variable est susceptible ou non de suivre cette loi.
Comme cette loi nest qu un seul paramtre, elle nest pas trs flexible. Elle est cependant lie une loi trs intressante,
la loi de Poisson, dite loi des vnements rares (voir la section consacre la loi de Poisson). Elle constitue aussi un cas
particulier de la loi Gamma Incomplte (voir ci-dessous).
d. Loi exponentielle-symtrique (loi de Laplace centre l'origine)

On considre ici une loi exponentielle symtrique, centre autour de l'origine, et un seul paramtre (). Sa densit de
probabilit est donne par :
(25)
f X ( x) =
1
e
2
pour x R .
Pour cette loi symtrique et centre l'origine, on a videmment m = 0 et = 0.

(Abramovitz et Stegun 1965; Tassi 1989) :
(26a)
(26b)
On peut galement montrer que
= 2
= 3.
En gnral, la loi de Laplace symtrique un seul paramtre est peu flexible.

e. Loi -incomplte (loi gamma incomplte)
Il s'agit de la loi gamma incomplte deux paramtres (,) et support positif.
Sa densit de probabilit est donne par :
x
(27)
1 x
f X ( x) =
e
( )
pour x R + .
Pour une telle loi, on obtient (Tassi 1989) :

9
f. Loi de Weibull :
On prsente galement la loi de Weibull deux paramtres (,), qui sera utilise plus loin (cf. test du Khi 2).
La densit de probabilit de la loi de Weibull est donne par :
(31)
f X ( x) = x
1 x
pour x R + .
Pour une telle loi on a (Tassi 1989)

(32)
m=
(1 +
; =
(1 +
) 2 (1 +
On en dduit la relation suivante entre le paramtre et le coefficient de variation C:

1
2
(33)
2
1
2
(
1
)
(
1
+
)

C= =
1
m
(1 + )
= f ( )
Cette relation permet de calculer connaissant le coefficient de variation (C), en rsolvant l'quation f()-C = 0
numriquement, par une mthode de dichotomie. On peut ensuite obtenir le paramtre partir de la relation sur m, en
identifiant m la moyenne empirique connue, soit :
1 + 1
.
=
(34)
m
Cette procdure permet donc finalement de calculer les deux paramtres (,) de la loi de Weibull en fonction des moments
empiriques m et . Elle peut tre utile lors de l'application du test du Khi 2.
11
1.4.
Exemples de rsultats dajustements par les moments
Les rsultats de la mthode des moments sont prsents dans les TABLEAUX (...).
Ces tableaux sont directement utilisables pour une analyse de la loi de probabilit univarie de la variable tudie. Ils
contiennent les valeurs des moments et coefficients empiriques, ainsi que les valeurs thoriques calcules grce aux relations
ci-dessus, et enfin les valeurs des indicateurs d'erreurs dfinis plus haut.
Les indicateurs derreur n'tant pas toujours applicables, par exemple lorsque le moment test s'annulle ( th = 0 ), on
applique alors un critre qualitatif du type : " th << 1 ? " Si la rponse cette question est positive, on inscrit OUI (admis)
dans le tableau; si la rponse est ngative, on inscrit NON (refus).
12
2. IDENTIFICATION DUNE DENSIT P(X) PAR TEST STATISTIQUE : LE TEST DU 2

L'objet de cette section est de complter et de vrifier d'une faon plus rigoureuse les rsultats obtenus prcdemment par la
mthode des moments.
Pour ceci, nous allons calculer l'aide des formules thoriques donnes plus haut les coefficients entrants dans les
expressions des diverses densits de probabilits. Ceci fait, nous effectuerons un test du 2 afin de dterminer si les densits
de probabilits empiriques peuvent tre dduites des modles avec une faible probabilit d'erreur.
Pour l'application pratique du test du Khi 2, voir Press et al. 1986 ("Numerical Recipes" version Fortran : subroutine
CHSONE). On notera galement, comme alternative possible au test du Khi 2, le test de Kolmogorov-Smirnov ou "K-S"
(Press et al. 1986 : subroutine KSONE). C'est exclusivement le test du Khi 2 qui sera utilis ici.
Les FIGURES(...) permettent d'apprhender les rsultats quon peut obtenir par simple comparaison graphique des densits
de probabilits empiriques (observes) avec les densits de probabilits thoriques (modles) :
Dans les pages suivantes, on expliquera plus en dtail la procdure suivie, et on prsentera la fin les rsultats quantitatifs
des tests statistiques. Ceux-ci conduisent dcider de l'acceptation ou le rejet de telle loi de probabilit pour une marge
d'erreur donne (par exemple 5%). Les figures(...) ci-dessus en donnent une vue graphique plus parlante, mais qualitative.
13
2.1.
Calage des paramtres par les moments empiriques
On a dj identifi plus haut les densits de probabilit thoriques des diverses lois proposes comme modles (cf. mthode
des moments). Le test du 2 est utilis ici pour comparer les lois empiriques aux lois thoriques, les paramtres de ces
dernires lois tant calculs partir des valeurs des moments empiriques. *
Ainsi, la loi normale est une loi deux paramtres (m,), dont la densit de probabilit a t donne plus haut. Les deux
paramtres utiliser sont donc tout simplement la moyenne empirique (m), et l'cart-type empirique ().
La loi lognormale est une loi deux paramtres (m,), et support positif, dont la densit de probabilit a t donne plus
haut. Ici, les paramtres (m,) sont la moyenne et l'cart-type de y=ln(x), o x est la variable lognormale en question. Ces
paramtres peuvent tre calculs en fonction de la moyenne empirique mx et du coefficient de variation empirique Cx de la
variable lognormale x, par rsolution du systme suivant [ voir quations (12)-(20) ]:
(35)
2
= ln(C x + 1) 2
m = ln(m x )
Une procdure plus sophistique, mais pas ncessairement plus performante, consisterait ajuster automatiquement les paramtres de la loi modle de faon minimiser les
carts avec la loi empirique, avant d'appliquer le test du Khi 2 proprement dit.
14
La loi exponentielle est une loi un seul paramtre (), et support positif, dont la densit de probabilit a t donne plus
haut. Rappelons que le paramtre est la fois gal la moyenne et l'cart-type. On choisit ici de caler par rapport la
moyenne empirique, soit : = m.
La loi de Laplace, ou exponentielle symtrique centre l'origine, est une loi un paramtre (). Sa densit de probabilit a
t donne plus haut. On utilise ici la relation = /2 [quations (21)-(26)].
La loi -incomplte est une loi deux paramtres (,), et support positif. La densit de probabilit et les relations entre
paramtres et moments ont t donnes plus haut [ voir quations (27)-(30) ].
On examinera galement la loi de Weibull deux paramtres (,), non encore utilise. La densit de probabilit de la loi
de Weibull a t donne plus haut, et l'on a galement dcrit une procdure de calcul des paramtres de cette loi en fonction
des moments [ voir quations (31)-(34) ]. Cette procdure nous permet ici de calculer les deux paramtres (,) de la loi de
Weibull en fonction des moments empiriques m et , et d'appliquer le test du khi 2.
15
2.2.
Application du test statistique (le test du khi-2)
Rappelons que deux tests statistiques ont t considrs initialement : le test du 2 (khi-deux), et le test de KolmogorovSmirnov (ou test de "K-S"). C'est le test du 2 que nous avons retenu dans cet expos.
Le test du 2 va nous permettre d'valuer l'importance de l'cart entre les lois modles (thoriques) et les lois empiriques,
une fois donns les paramtres des lois modles. Ce test est pratiqu sur les valeurs (discrtes) de la fonction de rpartition
empirique et les valeurs (discrtises) de la fonction de rpartition thorique. Rappelons que les fonctions de rpartitions
sont les densits de probabilits intgres; ou, en version discrte, les frquences cumules. La statistique du 2 (dite aussi
"distance du 2") est une mesure de la "distance" entre deux fonctions de rpartitions discrtes (ou discrtises) que l'on
souhaite comparer.
Cette statistique du 2 ou distance du 2 est donne par :
(36)
Ntot
i =1
( N i ni ) 2
ni
o Ni est le nombre d'vnements observs dans le ime intervalle et ni le nombre prvu d'vnements selon la loi modle.
La fonction de probabilit du 2, note :
(37)
2
Q( )
16
[NB: Corrections de certains symboles spciaux :

revoir les 4 relations ci-dessous avec le signe :
vrifier qu'il s'agit bien de multiplication]
(28a)
(28b)
(28c)
m = ;
2 = 2 ;
3 = 23;
(28d)
4 = 3(+2)4 ,
Nous en avons dduit les identits suivantes :
(29a)
(29b)
=2C,
= 6 C2 .
Finalement, en "inversant" les relations prcdentes, nous obtenons les paramtres de la loi gamma incomplte en fonction
de ses deux premiers moments :
(30)
C2
= mC 2
10
est une fonction gamma-incomplte (rsultat thorique classique en statistique). Le paramtre est le degr de libert de
la loi du 2. Pour les cas qui nous intressent -- soit l'valuation de lois dont certains paramtres ont ts pralablement
estims -- le nombre de degrs de libert de la loi du 2 est donn par:
(38)
= Ntot-k-1 ,
si l'on a estim k paramtres de la loi. Dans notre cas (...), le nombre de paramtres estims est variable mais trs infrieur
Ntot (k est faible, gal un, deux, ou trois au plus).
Interprtation. A proprement parler, Q(2/) reprsente la probabilit pour que la somme des carrs de variables
alatoires normales de variance unit soit plus grand que 2 . Or, les termes entrants dans la somme du 2 [quation (36) cidessus] ne sont pas individuellement normaux. Cependant, si l'on considre la fois un nombre lev (>>1) d'intervalles, et
un nombre lev (>>1) d'vnements observs dans chaque intervalle, alors la fonction de probabilit Q(2/) est une bonne
approximation de la vraie distribution de 2.
Utilisation. La fonction Q(2/) peut donc tre utilise pour estimer si le test est significatif ou non, puisque cette
statistique reprsente peu prs la probabilit pour que la somme des carrs des carts entre la loi empirique et la loi modle
ait la valeur 2 observe.
Implmentation numrique. Pour l'application pratique, on a utilis la procdure dcrite dans l'ouvrage "Numerical
Recipes" de PRESS et al. (1986), et en particulier la subroutine Fortran CHSONE.
R.ABABOU
Circa 1994
Partiellement retap en 2004 (eqs.)
17

Hydrologie Statistique PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Hydrologie Statistique PDF

Uploaded by

Copyright:

Available Formats

HYDROLOGIE

Document PDF en couleur disponible sur site web.

CH.0. INTRODUCTION, BIBLIO, DONNEES HYDROLOGIQUES

Analyse univarie Moments et lois de probabilit

Analyse univarie (suite) Crues annuelles et

CRUES GARONNE (LOI DE GUMBEL & LOI DE POISSON)

CH.2. ANALYSE STATISTIQUE MULTIVARIEE EN HYDROLOGIE

COVARIANCES, REGRESSION, ACP (6 stations pyrnes)

CH.3. ANALYSE STATISTIQUE DE PROCESSUS HYDROLOGIQUES

Table des Matires

Plan du Cours et des Travaux Dirigs

CH.0. INTRODUCTION, BIBLIO, DONNEES HYDROLOGIQUES

Bibliographie (voir liste des rfrences)

Donnes hydrologiques (bases de donnes, illustrations)

Objectifs, mthodes et modles en hydrologie statistique

Objectifs types dapplications de lhydrologie statistique

CH.1. ANALYSE STATISTIQUE UNIVARIEE EN HYDROLOGIE

1A.0. Bases lmentaires de probabilit(s) et statistique(s)

Probabilit axiomatique , theorme de Bayes, exemples

1A.1. Lois de proba classiques, moments, et ajustements

Cf. ANNEXE Lois de proba univaries : relations moments-paramtres .

1A.2. Exemples dajustements de lois de proba (pluies, dbits)

Histogrammes de frquences lis la morphologie des bassins

Analyse univarie (suite) Crues annuelles et

Dfinition axiomatique de la loi de Poisson

1-B.ANNEXE : Crues, temps de retour, vnements rares et loi de Poisson .

CRUES GARONNE (LOI DE GUMBEL & LOI DE POISSON)

CH.2. ANALYSE STATISTIQUE MULTIVARIEE EN HYDROLOGIE

Introduction, objectifs, mthodes

Loi de proba multivarie dun vecteur de v.a.s (X1, X2,)

Fonction de Rpartition & Densit de Proba multivaries (jointes)

Cas de 2 v.a.s : covariance, corrlation, et rgression linaire

Utilisation de la rgression linaire pour la critique de donnes

EXERCICE/EXEMPLE : Reconstitution de donnes par rgression linaire :

COVARIANCES, REGRESSION, ACP (6 stations pyrnes)

CH.3. ANALYSE STATISTIQUE DE PROCESSUS HYDROLOGIQUES

Introduction aux fonctions alatoires X(t)

Interprtations de fonctions dauto-corrlations

3-A. Modlisation et reconstruction de chroniques hydrologiques :

Les quations du modle AR1 pour un processus X(t(n))

Ch.3-B. Analyse croise de chroniques hydrologiques (pluie-dbit)

Thorie des modles

Dterministe vs. Statistique

TD3 IDENTIFICATION STATISTIQUE DUNE FONCTION DE TRANSFERT

Cours Hyd.Stat. 3Hy 2005-06

Cours Hyd.Stat. 3Hy 2005-06

Cours Hydro.Stat. 3Hy : Plan / Syllabus

DATE DE MISE JOUR : 27/06/2005

TITRE : HYDROLOGIE STATISTIQUE (STOCHASTIC HYDROLOGY)

Enseignants 2005-06 : R.Ababou, A. Al-Bitar.

Cours Hydro.Stat. 3Hy : Plan / Syllabus

PROGRAMME (COURS & TD)

Cours Hydro.Stat. 3Hy : Plan / Syllabus

PLANNING DES TRAVAUX DIRIGS ( TITRE INDICATIF)

I.A & I.B Crues annuelles, crues rares, temps de retour

Intitul & contenu du TD

Cours Hydro.Stat. 3Hy: Plan / Syllabus

Cours Hydro.Stat. 3Hy: Plan / Syllabus

Chronologie: 1re sance 22 Nov.2005 / dernire sance 24 Jan.2006

Cours Hyd.Stat. 3Hy 2005-06

Enseignants 2005-06 : R.Ababou,

Cours Hyd.Stat. 3Hy 2005-06

Documents polycopis imprims: