You are on page 1of 274

Jean-Nol Roux, Stphane Rodts et Gabriel Stoltz

Introduction la physique statistique et


la physique quantique
6 mai 2014

Cours ENPC - IMI - 2me anne

Avant-propos

La mcanique quantique et la physique statistique, deux domaines essentiels de la physique


moderne, sont la base de nombreux dveloppements actuels la frontire de la science des matriaux, pour lesquels une approche classique macroscopique est inadapte. Ce cours prsente les
concepts fondamentaux de ces disciplines sous un aspect pragmatique, celui de la simulation numrique lchelle molculaire, pour laquelle les mathmatiques appliques apportent des contributions dcisives. La prsentation des techniques de simulation dans une approche multidisciplinaire
constitue une voie pdagogique privilgie pour apprhender concrtement et durablement les notions dlicates qui sous-tendent ces thories ; mais cest galement une ouverture vers des outils
numriques aujourdhui incontournables pour des domaines aussi varis que la physique des hautes
nergie, lingnierie nuclaire, les nanotechnologies et llectronique, la biologie molculaire et la
pharmaceutique, les matriaux poreux et granulaires, les fluides complexes,. . .
Ce cours se veut une introduction motive et motivante la physique contemporaine. Nous insistons sur le terme dintroduction, tant il y a de points que nous naurons pas le temps dvoquer,
ou de traiter avec lattention ncessaire. Cependant, ltudiant intress pourra tout naturellement prolonger, approfondir et sapproprier les lments thoriques enseigns ici par le biais de
stages, dans le milieu acadmique ou industriel (CEA, EDF, Lafarge, pour ne citer que quelques
partenaires privilgis de lEcole des Ponts), dun Master Recherche (par exemple en Analyse
Numrique, en Science des Matriaux, en Physique des Liquides), voire dune thse, ou dune
embauche dans une entreprise dsireuse de souvrir aux nouvelles possibilits offertes par lexprimentation numrique lchelle microscopique !
Lobjectif de la premire partie du cours, consacre physique statistique, est de montrer
comment une approche purement microscopique permet de calculer les grandeurs macroscopiques
usuelles de la mcanique et de la thermodynamique : quations dtats, capacits calorifiques,
compressibilits, nergies libres, potentiels chimiques. . . Cest galement loccasion de donner une
dfinition microscopique de concepts thermodynamiques peu intuitifs tels que lentropie, ainsi que
son rle primordial dans les proprits macroscopiques familires des matriaux. On y illustre enfin
la dynamique des systmes microscopiques sur un exemple simple, en prcisant les relations entre
fluctuations spontanes du systme et rponses aux perturbations extrieures. Ces enseignements
sapprhendent le mieux de manire pratique : cest pourquoi, au-del des sances de travaux pratiques sur ordinateur, des mini-projets orients, fonds sur une technique de simulation et orients
vers une application physique particulire, viennent complter la formation.
La seconde partie du cours introduit les concepts fondamentaux de la mcanique quantique
(dualit onde-particule, fonction donde, quantification, caractre probabiliste et perturbateur de
la mesure, relations dincertitude, indiscernabilit des particules, liaison chimique, thorie des
bandes,. . . ), ainsi que leur formalisation mathmatique rigoureuse (thorie spectrale des oprateurs auto-adjoints), et les mthodes de simulation numrique associes (pour la rsolution pratique
de lquation de Schrdinger). Nous privilgions la comprhension des concepts sur des exemples

VI

Avant-propos

simples traits en profondeur, partir desquels nous donnons des lments de gnralisation.
Cest la seconde anne que ce cours a lieu, et cest donc galement la seconde version seulement
de ce cours crit ! Nous prions davance le lecteur de nous pardonner les erreurs qui ne doivent pas
manquer, et le remercions de nous faire part de toutes les remarques quil voudra bien nous faire
pour amliorer cet ouvrage.

Marne-la-Valle, 1er fvrier 2008


Jean-Nol Roux
Stphane Rodts
Gabriel Stoltz

Table des matires

Partie I Introduction la physique statistique


1

Prliminaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1 Les constituants de la matire et leurs interactions . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Interactions des particules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1 Origines, ordres de grandeur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.2 Modles simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.3 Consquences macroscopiques de la forme des interactions . . . . . . . . . . . . . . .
1.3 Physique statistique et simulation molculaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3
4
4
5
6
8
9

Description microscopique et statistique des grands systmes . . . . . . . . . . . . . . .


2.1 Systme, espace des phases, microtats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 volution des systmes classiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.1 quations de Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.2 Pourquoi adopter le formalisme hamiltonien ? . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.3 Intgration de la dynamique hamiltonienne . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Comportement des grands systmes : observations . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4 Approche statistique des grands systmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4.1 Approche de lquilibre, moyennes et corrlations en temps . . . . . . . . . . . . . .
2.4.2 Limite thermodynamique, moyennes et corrlations dans lespace . . . . . . . . .
2.4.3 Ensembles statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5 Quelques observables courantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5.1 Lnergie et ses fluctuations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5.2 Le tenseur des contraintes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5.3 Microstructure et corrlations de densit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13
13
15
15
16
18
19
22
23
24
25
26
26
27
28
32

Postulat fondamental et ensemble microcanonique . . . . . . . . . . . . . . . . . . . . . . . . . .


3.1 Le postulat de base et ses consquences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.1 Macrotat dquilibre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.2 Cas du gaz parfait . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.3 Distribution de Maxwell (cas gnral) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Entropie, temprature . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.1 Dfinition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.2 Proprits de lentropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.3 Couplage thermique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.4 Les drives de la fonction entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.5 Entropie et fluctuations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.6 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

33
34
34
35
37
38
38
39
40
40
41
42

VIII

Table des matires

3.3 Intgration des quations du mouvement et chantillonnage de la mesure


microcanonique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.1 Dynamique hamiltonienne et symplecticit . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.2 Approximation et flot numrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.3 Schmas dintgration usuels pour les quations diffrentielles ordinaires . . .
3.3.4 Schmas dintgration prservant des proprits de la dynamique
Hamiltonienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.5 Comparaison numrique des diffrents schmas . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.6 Application un systme physique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4

43
43
44
45
48
55
56
59

Lensemble canonique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1 Distribution de Botzmann-Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.1 Couplage avec un thermostat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.2 Distribution de Boltzmann-Gibbs et information manquante . . . . . . . . . . . . .
4.2 nergie libre et grandeurs thermodynamiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.1 Dfinition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.2 Drives de lnergie libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.3 Minimisation de lnergie libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.4 Calculs avec la fonction de partition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Cas de degrs de libert indpendants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3.1 Sous-systmes indpendants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3.2 Indpendance des positions et des quantits de mouvement pour une
collection de particules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3.3 Gaz parfait, grandeurs idales et dexcs dans les fluides . . . . . . . . . . . . . . . . .
4.3.4 Cas des oscillateurs harmoniques indpendants . . . . . . . . . . . . . . . . . . . . . . . . .
4.4 Quelques remarques sur les applications du formalisme canonique . . . . . . . . . . . . . . .
4.4.1 Gaz, solides et liquides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4.2 Approche de lquilibre et thermalisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

61
61
61
62
64
64
64
65
65
67
67
67
68
68
70
70
70
72

chantillonnage de la mesure canonique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


5.1 Le schma de Metropolis-Hastings . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.1 Lalgorithme de Metropolis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.2 Le schma de Metropolis-Hastings . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.3 Quelques raffinements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 La dynamique de Langevin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.1 Brve introduction pratique aux quations diffrentielles stochastiques . . . .
5.2.2 La dynamique de Langevin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3 Tests statistiques de convergence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.1 Vitesse de convergence pour les chanes de Markov . . . . . . . . . . . . . . . . . . . . .
5.3.2 Convergence de certaines observables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.4 Application numrique : fluide de Lennard-Jones . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

75
76
76
79
81
82
82
85
88
89
91
93
96

Un exemple de proprit dynamique : lautodiffusion dans les fluides . . . . . . .


6.1 La diffusion de particules marques dans un fluide . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1.1 chelles de temps et nature du mouvement . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1.2 Mouvement brownien et diffusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2 Proprits des fonctions de corrlation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2.1 Proprits gnrales des fonctions de corrlation dpendant du temps . . . . .
6.2.2 Proprits particulires de la fonction dautocorrlation des vitesses . . . . . . .
6.3 Relation entre corrlation et rponse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3.1 Importance des proprits de rponse linaire . . . . . . . . . . . . . . . . . . . . . . . . . .

97
98
98
99
101
101
103
105
105

Table des matires

IX

6.3.2 Rponse linaire une perturbation du Hamiltonien . . . . . . . . . . . . . . . . . . . . 105


6.3.3 Mobilit dune particule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
6.4 Remarques finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

Partie II Introduction la physique quantique


7

Introduction historique : la rvolution quantique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

La particule quantique isole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


8.1 Description quantique de la particule en translation . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.1.1 La fonction donde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.1.2 Lquation de Schrdinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.1.3 La constante de Planck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.1.4 Remarques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.2 Conservation des probabilits - dynamique de la particule . . . . . . . . . . . . . . . . . . . . .
8.2.1 Equation de Schrdinger et normalisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.2.2 Forme locale de la conservation des probabilits : Courant et Vitesse de
probabilit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.3 La phase de la fonction donde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4 Solutions de lquation de Schrdinger dans le vide . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.1 Etude du Hamiltonien quantique de la particule libre . . . . . . . . . . . . . . . . . . .
8.4.2 Solution gnrale : Le paquet dondes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.5 Quelques solutions particulires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.5.1 Les ondes de De Broglie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.5.2 Le paquet donde quasi-monochromatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.5.3 Le paquet dondes gaussien. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.5.4 Superposition dtats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

115
115
115
116
117
117
117
117

La particule quantique en interaction avec un potentiel . . . . . . . . . . . . . . . . . . . . .


9.1 Dynamique de la particule en interaction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1.1 Lquation de Schrdinger avec potentiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1.2 Caractre bien pos de lquation de Schrdinger . . . . . . . . . . . . . . . . . . . . . . .
9.1.3 Rgularit de la fonction donde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1.4 Le terme potentiel et la normalisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.2 Le paquet donde en interaction : la limite classique . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.3 Etats stationnaires de la particule quantique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.3.1 Que sont les tats stationnaires ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.3.2 Lquation de Schrdinger indpendante du temps . . . . . . . . . . . . . . . . . . . . . .
9.3.3 Energie de la particule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.3.4 Rgularit des tats stationnaires unidimensionnels . . . . . . . . . . . . . . . . . . . . .
9.3.5 Minoration de lnergie des tats stationnaires . . . . . . . . . . . . . . . . . . . . . . . . .
9.3.6 Importance des tats stationnaires en mcanique quantique . . . . . . . . . . . . . .
9.4 Une situation purement quantique : la barrire de potentiel . . . . . . . . . . . . . . . . . . . .
9.4.1 La barrire de potentiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.4.2 Etats stationnaires de la barrire de potentiel . . . . . . . . . . . . . . . . . . . . . . . . . .
9.4.3 Effet tunnel et transmission rsonnante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.4.4 Et la limite classique ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.5 Implmentation numrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.5.1 Schma de Cranck-Nicholson. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.5.2 Dcomposition doprateurs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

131
131
131
132
133
134
135
137
137
137
138
138
139
139
139
140
140
142
145
146
146
148
149

118
119
119
119
121
122
122
124
125
127
129

Table des matires

10 La particule quantique confine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


10.1 Cas des potentiels confinants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.1.1 Puits infini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.1.2 Oscillateur harmonique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.2 Thorie spectrale des Hamiltoniens quantiques - exemple du potentiel coulombien
10.2.1 Caractre auto-adjoint . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.2.2 Spectre essentiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.2.3 Spectre ponctuel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.3 Un exemple quasi-analytique : le trou de potentiel . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.3.1 Dfinition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.3.2 Etats dnergie lis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.3.3 Etats dnergie de diffusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.4 Universalit et implications du phnomne de quantification . . . . . . . . . . . . . . . . . . .
10.4.1 La quantification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.4.2 Caractre gnral du phnomne de pigeage . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.4.3 Quantification et dynamique de la particule . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.4.4 Proprits spectrales des atomes, des molcules, et des corps denses . . . . . . .
10.4.5 La quantification comme lment stabilisateur de la matire . . . . . . . . . . . . .
10.4.6 Et la limite classique ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.4.7 Et ce nest pas tout. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

151
152
152
153
155
155
157
157
159
159
160
162
164
164
164
164
165
167
168
169
170

11 Le formalisme de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.1 Formalisme vectoriel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.1.1 Grandeurs physiques et observables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.1.2 Notations vectorielles : bra-ket . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.1.3 Gnralit du formalisme vectoriel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.2 Construction des observables : principe de correspondance . . . . . . . . . . . . . . . . . . . . .
11.3 Equation de Schrdinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.4 La mesure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.4.1 Observable spectre discret . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.4.2 Observable gnrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.5 Commutation des observables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.5.1 Crochets de commutation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.5.2 Evolution dune observable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.5.3 Relations dincertitude de Heisenberg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.5.4 Commutation et stabilit de latome dhydrogne . . . . . . . . . . . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

173
173
173
174
175
175
176
176
177
178
179
179
180
181
183
185

12 Le moment cintique en mcanique quantique :


Moment orbital et Spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.1 Le moment cintique en mcanique classique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.1.1 Moment cintique dune particule ponctuelle autour dun point . . . . . . . . . . .
12.1.2 Rotation dun objet rigide sur lui-mme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.2 Le moment cintique orbital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.2.1 Relations de commutation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.2.2 Liens avec la mcanique classique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.3 La dfinition tendue du moment cintique en mcanique quantique . . . . . . . . . . . . .
12.4 Quantification du moment cintique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.4.1 Que quantifier ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.4.2 Le rsultat de quantification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.4.3 Elments de dmonstration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.5 Quantification du moment cintique orbital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.6 Le spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

187
187
187
189
190
190
192
193
193
194
194
195
199
203

Table des matires

XI

12.6.1 Dfinition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.6.2 Espace de spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.6.3 Manifestations physiques du spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.6.4 Un exemple despace de spin : lespace du spin 12 . . . . . . . . . . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

203
203
204
205
207

13 Le principe de Pauli : fermions et bosons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


13.1 Systme de plusieurs particules identiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13.1.1 Position du problme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13.1.2 Description quantique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13.1.3 Indiscernabilit des particules et symtrie de la fonction donde . . . . . . . . . .
13.2 Principe de Pauli : spin, fermions et bosons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13.3 Systme de deux particules sans spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13.3.1 Deux particules discernables sans spin dans le fond dun puits quantique . .
13.3.2 Paire de bosons dans le fond dun puits quantique . . . . . . . . . . . . . . . . . . . . . .
13.3.3 Paire de fermions dans le fond dun puits quantique . . . . . . . . . . . . . . . . . . . .
13.3.4 Principe de Pauli et quation de Schrdinger . . . . . . . . . . . . . . . . . . . . . . . . . .
13.4 Paire dlectrons dans un systme deux tats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13.4.1 Etats quantiques spin de llectron unique . . . . . . . . . . . . . . . . . . . . . . . . . .
13.4.2 Etats quantiques accessibles la paire dlectrons . . . . . . . . . . . . . . . . . . . . . .
13.5 Rgles de remplissage des niveaux lectroniques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13.6 Interaction dchange et magntisme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

209
209
209
210
210
211
211
212
213
215
217
217
218
218
220
221
222

14 La liaison chimique : des molcules diatomiques aux corps solides . . . . . . . . . . . 225


14.1 La molcule diatomique : liaison chimique et liaison ionique . . . . . . . . . . . . . . . . . . . 225
14.1.1 Description quantique du systme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
14.1.2 Lapproximation des Combinaisons Linaires dOrbitales Atomiques (CLOA)226
14.1.3 Cas de la combinaison de deux tats : traitement CLOA . . . . . . . . . . . . . . . . . 227
14.1.4 Orbitales liante et antiliante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
14.1.5 Hybridation de deux niveaux atomiques proches en nergie : la liaison
chimique covalente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
14.1.6 Hybridation de niveaux atomiques peu compatibles : liaison ionique . . . . . . 231
14.1.7 Compatibilit des orbitales atomiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
14.1.8 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
14.2 Structure lectronique des corps solides : thorie des bandes . . . . . . . . . . . . . . . . . . . . 235
14.2.1 Approximation CLOA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
14.2.2 Le cas particulier des solides cristallins . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
14.2.3 proprits lectroniques des solides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
Constantes physiques fondamentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
A.1 Constantes physiques les plus utilises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
A.2 Units atomiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
Analyse numrique des schmas dintgration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B.1 Consistance et ordre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B.2 Convergence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B.3 Stabilit linaire en temps long . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

249
249
250
250

XII

Table des matires

Elements de thorie spectrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


C.1 Oprateurs sur des espaces de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C.2 Adjoint dun oprateur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C.3 Spectre dun oprateur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C.4 Diagonalisation des oprateurs autoadjoints compacts . . . . . . . . . . . . . . . . . . . . . . . . .
C.5 Dcomposition des oprateurs auto-adjoints quelconques . . . . . . . . . . . . . . . . . . . . . . .

253
253
254
255
258
258

Quelques relations de commutation entre observables . . . . . . . . . . . . . . . . . . . . . . . . . . . 261


Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263

Partie I

Introduction la physique statistique

1
Prliminaires

1.1 Les constituants de la matire et leurs interactions . . . . . . . . . . . . . . .


1.2 Interactions des particules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1 Origines, ordres de grandeur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.2 Modles simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.3 Consquences macroscopiques de la forme des interactions . . . . . . . . . . .
1.3 Physique statistique et simulation molculaire . . . . . . . . . . . . . . . . . . .

4
4
5
6
8
9

Bien des systmes physiques rencontrs dans la nature sont constitus dun ensemble de particules ou dobjets solides : ainsi les grains de sable, ou les astrodes qui forment les anneaux de
Saturne. Parmi ceux-ci, il est important de bien diffrencier les systmes qui se prtent naturellement un traitement par la physique statistique de ceux qui nen relvent pas. La mcanique
statistique sapplique aux collections dobjets en interaction qui peuvent tre dcrits dans un formalisme hamiltonien. Comme on le verra, ceci demande en particulier que les interactions entre
particules drivent dun potentiel, et que la dynamique du systme conserve lnergie mcanique
totale.
De la conservation de lnergie mcanique dcoule lexistence du phnomne dagitation thermique : dans un chantillon de matire, atomes et molcules ne cessent de se mouvoir, des vitesses
qui semblent leves notre chelle (de lordre de 100 m/s). Ceci contraste bien sr avec lintuition
ordinaire de la matire au repos, et avec lexprience de la dissipation de lnergie mcanique.
une chelle plus grande, les systmes collodaux, composs de particules dont la taille est comprise
entre le nanomtre et le micron (typiquement de petits objets solides immergs dans un fluide),
peuvent parfois tre dcrits par la physique statistique. On peut en effet parvenir dcrire leurs
interactions la manire des forces interatomiques ou intermolculaires, laide dun potentiel, et
il subsiste de plus une forme dagitation thermique, le mouvement brownien.
Macroscopiquement, les collections de particules auxquelles sappliquent la mcanique statistique obissent aux lois de la thermodynamique. Le premier principe de la thermodynamique, qui
affirme la conservation de lnergie, dont les changes prennent la forme soit de travail, soit de
chaleur, est la consquence macroscopique de la conservation de lnergie mcanique au niveau
microscopique. La chaleur est de lnergie distribue dans les degrs de libert microscopiques, de
telle sorte quelle ne se voie pas macroscopiquement.
Adoptant un point de vue statistique, on considrera qu grande chelle le systme est dcrit
par son macrotat, qui est une loi de probabilit sur les microtats, cest--dire sur les valeurs
prises par lensemble des degrs de libert microscopiques du systme, ce qui constitue une simplification considrable par rapport la description de tous les degrs de liberts microscopiques. De
surcrot, les postulats de base de la physique statistique permettront de dterminer le macrotat
correspondant lquilibre thermodynamique, et donc les proprits macroscopiques du systme
en fonction dun petit nombre de grandeurs fondamentales (comme la densit ou la temprature).

1 Prliminaires

Ceci nest pas possible pour tous les ensembles de particules : ainsi, ltat de N grains de sable
(systme pour lequel il ny a pas conservation de lnergie mcanique et agitation thermique),
peut tre caractris mcaniquement, et son tat final (densit, force intergranulaires, etc) peut
tre prdit mais cet tat dpend de tout le dtail du processus par lequel les grains de sable ont
t rassembls et dposs dans la bote !

1.1 Les constituants de la matire et leurs interactions


La matire est constitue de particules charges, noyaux et lectrons, en interaction lectromagntique. La force de Coulomb (ou, dans certains cas, la force de Lorentz) entre particules charges
est linteraction fondamentale lorigine de toutes les forces que lon rencontrera dans le cours.
Elle est en effet responsable de lensemble des proprits de la matire ordinaire. Les autres interactions fondamentales sont la gravitation universelle, qui dtermine les phnomnes lchelle des
astres, et les interactions fortes et faibles, qui rgissent les chelles infrieures la taille des noyaux
atomiques, qui est de lordre du Fermi (1015 m). Nous nous intressons dans ce cours aux chelles
intermdiaires, qui vont de la taille de latome (de lordre de langstrm, 1 = 1010 m) aux dimensions macroscopiques pour lesquelles un chantillon de matire peut tre modlis comme un
milieu continu. Llectron est une particule de masse me ' 9, 11 1031 kg, portant la charge
lectrique e = 1, 602 1019 C. Les lectrons nobissent pas la mcanique classique, cest pour
les dcrire que lon doit recourir la mcanique quantique, qui remet en cause les notions familires
associes au mouvement des particules dans lespace (trajectoire, position, vitesse...) et qui fait
lobjet de la seconde partie de ce cours. Les noyaux, eux, en raison, comme on le verra, de leur
masse beaucoup plus leve (celle du proton tant mp = 1,673.1027 kg, tandis que sa charge est
oppose celle de llectron) restent dcrits par une thorie classique, sauf trs basse temprature
(proche du zro absolu) ou trs haute densit (comme lintrieur des toiles). La structure et
les proprits de latome, difice neutre et stable dont le volume est constitu en quasi-totalit par
le nuage lectronique, sont dtermines par la mcanique quantique (la mcanique classique est
mme incapable dexpliquer la stabilit de latome, voir 11.5.4). Les noyaux sont constitus dun
nombre de protons gal celui des lectrons, auquel correspond le nom dun lment chimique,
et dun nombre de neutrons variable (trs souvent gal ou un peu suprieur celui des protons).
Par dfinition, deux atomes qui ne diffrent que par le nombre des neutrons appartiennent des
isotopes diffrents dun mme lment.
Le nombre dAvogadro, NA = 6, 022 1023 donne une ide de lnorme quantit datomes
prsents dans un chantillon macroscopique de matire. Ainsi, toute leau des ocans de la Terre
contient moins de 1019 moles de H2 O (dont la masse molaire est 18 g/mol, et le volume molaire
environ autant de cm3 dans les conditions terrestres), un nombre infrieur NA /10000 . . .
Les atomes se rencontrent pour la plupart sous forme de molcules, ou dions (les gaz rares,
comme largon ou le krypton, tant une exception). Les molcules qui associent plusieurs atomes
sobtiennent par formation de nuages lectroniques communs entre diffrents noyaux, cest la
liaison chimique (voir le chapitre 14). Les interactions des molcules sont supposes connues et
modlises dans cette premire partie du cours. La physique statistique traite du passage du
niveau microscopique, celui des interactions molculaires, au niveau macroscopique o lon dcrit
le systme par la thermodynamique et la mcanique des milieux continus. On suppose donc dj
accompli un certain changement dchelle, depuis les noyaux et les lectrons jusquaux molcules
ou aux ions et leurs interactions. Le 1.2 prcise les modles simples que lon prendra en exemple.

1.2 Interactions des particules


On verra dans ce cours que toute la physique des systmes dcrits lchelle microscopique est
dtermine par la forme des interactions lmentaires entre les particules constituant le systme.
Nous prsentons donc dans un premier temps le contexte physique , puis prsentons des modles
simplifis dinteraction.

1.2 Interactions des particules

1.2.1 Origines, ordres de grandeur


Les interactions molculaires ou ioniques sont prsentes de manire assez gnrale et pdagogique dans la rfrence [22], et nous ne donnons ici que quelques trs brves indications, en partie
extraites de cet ouvrage.
Les ordres de grandeurs des quantits physiques lchelle atomique sont donnes par les units
atomiques (voir Appendice A.2). Lunit de longueur est le rayon de Bohr a0 = 0, 529 , qui donne
la taille approximative de latome dhydrogne, et lunit dnergie est lnergie lectrostatique
2
correspondante, soit Eua = 4e0 a0 ' 27, 2 eV. En raison de lnergie cintique de llectron, cest
le double de lnergie dionisation de latome dhydrogne (cest--dire lnergie quil faut apporter
pour loigner linfini llectron de son noyau). Les nergies de liaison entre atomes, molcules ou
ions, values de mme en rapprochant une paire initialement trs loigne, sont trs gnralement
infrieures Eua , mais slvent quelques eV pour les plus fortes. On distingue ainsi les diffrentes
catgories dinteraction suivantes :
(i) les liaisons covalentes mettent en jeu des nergies de lordre de quelques eV, soit quelques
centaines de kJ par mole. 1 Les liaisons covalentes dcident de la nature chimique et de la
forme des molcules, fixent trs rigidement les distances entre noyaux, qui sont comprises
entre 1 et 2 et se rompent lors de ractions chimiques : il sagit dinteractions trs
courte porte ;
(ii) les liaisons ioniques impliquent des nergie comparables celles des liaisons covalentes,
mais sont beaucoup plus sensibles aux conditions physiques (voir 14.1.6) ;
(iii) les interactions impliquant des diples permanents sont longue porte, et on les calcule
par les lois de llectrostatique classique. Les diples sont lis lasymtrie de la rpartition
des charges entre les noyaux dans les liaisons comme CH lintrieur des molcules. Les
interactions impliquant des diples permanents peuvent tre attractives ou rpulsives selon
lorientation des diples. Linteraction dune charge lectronique et dun diple permanent
implique des nergies de lordre de 1 eV pour les distances interatomiques typiques (et est
lorigine de lhydratation des ions en solution aqueuse), alors que linteraction diplediple est plus faible, de lordre de 0,1 eV. Leffet de ces interactions dipolaires, de mme
que celui des liaisons ioniques, peut tre considrablement rduit en solution, les nergies
lectrostatiques tant alors divises par la permittivit relative  du solvant ( vaut environ
80 pour leau 25 C) ;
(iv) les interactions les plus faibles font intervenir la polarisation des molcules, dont lorigine
est la capacit du nuage lectronique de se dformer sous laction dun champ lectrique,
tel que celui cr lapproche dune charge ou dun diple. Cette dformabilit fait que
la molcule acquiert un diple induit, mme si elle ne porte pas de diple permanent. Les
nergies mises en jeu sont typiquement de lordre de 102 101 eV. Le mcanisme de
polarisation entrane galement des interactions des diples induits. En effet, les fluctuations de la densit dlectrons autour des noyaux de molcules non dipolaires en moyenne
crent des moments dipolaires instantans. Mme en labsence de tout champ lectrique
permanent, la corrlation des fluctuations des diples instantans quelles portent produit
des interactions attractives entre de telles molcules. Ce mcanisme est lorigine des
forces de dispersion, galement appeles forces de London, ou forces de van der Waals 2 .
Le potentiel attractif est alors de la forme
V(r) =

C
.
r6

(1.1)

1. 1 eV ' 96,5 kJ/mol.


2. On dsigne aussi quelquefois sous le nom gnrique de van der Waals des interactions de diples
permanents avec des diples induits, ou bien encore entre diples permanents si les molcules restent
libres de leur orientation, ce qui nest pas le cas lorsquelles forment une phase condense (liquide ou
solide). Le potentiel attractif dans ces cas est toujours de la forme (1.1). Dans ce cours nous ne nous
intresserons quaux cas les plus simples de particules dnues de diples permanents.

1 Prliminaires

La constante C vaut par exemple environ 1077 J.m6 pour la molcule de mthane CH4
et moiti moins pour latome dargon Ar.
Nous avons voqu les interactions attractives entre molcules (neutres) identiques. Lorsque
deux atomes sapprochent jusqu interpntrer leurs nuages lectroniques, une rpulsion trs forte
se manifeste (dorigine quantique, lie au principe de Pauli, voir le chapitre 13). La description
de cette force, dans les modles simples, est faite en fixant un rayon effectif des atomes et des
molcules (on peut donner plusieurs dfinitions dun rayon, voir [22]) de lordre de 1 2 , puis en
proposant des potentiels dinteraction rpulsifs faisant intervenir ce rayon. On ajuste finalement
empiriquement la forme du potentiel en fonction des proprits thermodynamiques mesures.
Nous verrons dans la suite du cours que lnergie des interactions doit tre compare lnergie
thermique kB T (kB ' 1, 38 1023 J/K tant la constante de Boltzmann 3 ), qui vaut environ
4 1021 J = 2, 5 102 eV la temprature de 300 K. Dune faon trs sommaire, on peut dire
que si kB T reste infrieure lnergie dinteraction qui tend confiner les positions des particules
au voisinage dun minimum du potentiel, alors elles resteront piges, tandis quelles pourront
adopter des configurations varies et conserveront une forte mobilit dans le cas contraire.
1.2.2 Modles simples
Le modles des sphres dures
Le modle le plus simple de molcules, dj considr par Boltzmann, est celui de billes solides
impntrables, qui interagissent par des chocs lastiques. On le connat comme le modle des
sphres dures . Il se caractrise par un seul paramtre, le diamtre des particules. Important
historiquement dans lhistoire de la simulation molculaire (voir 1.3), ce modle est une caricature
des interactions fortement rpulsives entre atomes proches. Sa mise en uvre dans une simulation
numrique du mouvement dun ensemble de particules est assez diffrente du cas gnral dune loi
de force rgulire : au lieu de rsoudre une quation diffrentielle, il faut dterminer la squence des
chocs entre lesquels les particules se dplacent vitesse constante sur des trajectoires rectilignes.
En raison de cette particularit on nen fera pas un objet central dtudes dans la partie thorique
de ce cours (mais diffrentes illustrations feront appel aux proprits de ce modle). En dpit de
la diffrence au niveau de la technique de simulation, les proprits physiques des fluides simuls
avec cette interaction ou des interactions plus rgulires restent toutefois assez proches. Ce modle
demeure utile pour la simulation des fluides, car
ses proprits sont trs bien connues et rpertories, et fournissent une base de dpart pour
aborder celles des systmes avec interactions plus ralistes dans une dmarche perturbative ;
il dcrit assez exactement les interactions effectives entre certains types de particules collodales ;
son tude est instructive en raison mme de son apparente singularit : lnergie interne
du fluide de sphres dures se rduit lnergie cintique, comme celle dun gaz parfait.
Limportance des interactions se manifeste au travers deffets configurationnels et entropiques
(raret des configurations possibles densit leve en raison de la gne strique).
Formellement, les sphres dures peuvent tre considres comme interagissant par le potentiel de
paires donn par :

0
si r ,
VSD (r) =
(1.2)
+ si r < .
Modles interactions continues
Pour dcrire la rpulsion courte distance, on peut aussi adopter le modle dit de sphres
molles avec potentiel en puissance inverse de la distance :
3. Le Kelvin (K) est lunit dnergie que lon utilise le plus souvent pour exprimer la temprature.
La constante de Boltzmann nest pas une constante physique fondamentale mais un simple facteur de
conversion, et apparat chaque fois que cette unit est utilise la place du Joule (J).

1.2 Interactions des particules

VSM (r) = 

 n
r

(1.3)

qui fait apparatre, en plus du diamtre molculaire , une nergie caractristique  > 0 et
lexposant n qui dtermine la raideur du potentiel. On peut sattendre retrouver les proprits
des sphres dures dans la limite n +, puisque daprs (1.2) et (1.3) on a VSM (r; , n) VSD (r)
pour tout  et r 6= .
Ces potentiels purement rpulsifs sont incapables de rendre compte de la tendance la condensation des molcules basse temprature, qui se manifeste par exemple lorsquun gaz est refroidi
dans une enceinte volume constant : on voit apparatre, en refroidissant, une phase liquide, puis
solide (qui coexistent avec la vapeur). De plus on sait que les molcules neutres sattirent grande
distance, en particulier en raison de lomniprsente force de van der Waals (1.1). Le potentiel de
Lennard-Jones combine la rpulsion exprime par (1.3), pour n = 12, avec une telle attraction, et
scrit :
 

12  6
VLJ (r) = 4

.
(1.4)
r
r
La figure 1.1 reprsente les potentiels donns par (1.3) et (1.4). Le potentiel de Lennard-Jones dcrit
bien les interactions entre les atomes de gaz rares, tels que largon, pour lequel les paramtres sont
/kB = 120 K, et = 3, 405 .

Fig. 1.1. gauche : potentiels de sphres molles (1.3), avec la limite des sphres dures (1.2) pour
n +. droite : potentiel de Lennard-Jones (1.4).

Plus gnralement, le potentiel de Lennard-Jones donne la forme gnrale qualitative des interactions entre molcules (non ionises) pour lesquelles la forme du nuage lectronique nest pas
trop anisotrope, avec sa rpulsion courte distance et lattraction plus longue porte.
De nombreux raffinements
Pour modliser plus prcisment les interactions des molcules, on a trs souvent recours
un modle qui somme les interactions des atomes. Les atomes formant une mme molcule sont
considrs comme rigidement lis, ou bien (notamment pour les molcules longues) on admet
des degrs de libert internes (angle de torsion, angle didre). Un cas simple dinteraction entre
deux molcules diatomiques est illustr par la figure 1.2. Dans cet exemple, chaque molcule est un
assemblage rigide, le potentiel intermolculaire est la somme dun terme lectrostatique, qui rsulte
par exemple de linteraction de diples permanents, et des interactions entre paires datomes, soit

1 Prliminaires

B
B

Fig. 1.2. Linteraction entre deux molcules diatomiques AB et AB peut tre modlise en sommant
les potentiels dinteractions des paires datomes nappartenant pas la mme molcule, donnant lieu
aux forces portes par les lignes droites en pointills. Chaque molcule peut galement porter un diple
permanent, ici schmatis par une flche.

ici VAA0 +VAB 0 +VBA0 +VBB 0 . Les potentiels interatomiques dans un tel modle peuvent tre choisis
sous une forme de Lennard-Jones. Bien souvent, le choix des paramtres dun modle de potentiel
intermolculaire se fait en partie par ajustement aux donnes exprimentales (ou numriques de
rfrence) disponibles. Cette tape semi-empirique est rendue ncessaire par le souci de conserver
des interactions faciles traiter, et en particulier additives par paires.
Certains atomes, molcules ou ions, se prtent mal ce type dapproche : ce sont en particulier
ceux qui tendent former des solides covalents, par exemple les atomes de silicium ou de carbone.
Les orbitales lectroniques ont alors des formes trs particulires, une description des atomes par
des particules ponctuelles est trs mal adapte, et les interactions sont plus complexes que la
simple force de van der Waals (1.1). De tels systmes se traitent en incluant explicitement des
effets denvironnement dans les potentiels interatomiques, empiriquement ou par un calcul de
structure lectronique pour obtenir la densit lectronique locale (mthodes ab-initio).
Au niveau de ce cours introductif, on se restreindra au cas simples de particules ponctuelles
avec potentiels additifs par paires, fonctions de la seule distance entre voisins et courte porte
(cest--dire que lon pourra ignorer toutes les interactions des paires de particules plus loignes
lune de lautre quune certaine distance de coupure).
1.2.3 Consquences macroscopiques de la forme des interactions
La consquence la plus remarquable, au niveau macroscopique, de linteraction de particules
modlises comme ponctuelles avec un potentiel de sphre de type (1.4) est sans doute lexistence
de transitions de phase. Le diagramme de phases est la reprsentation, dans lespace dont les
coordonnes sont la densit et la temprature 4 , des frontires de stabilit des phases gaz, liquide
et solide (cristallin) pour les petites molcules et en particulier pour les atomes des gaz rares
interagissant par un potentiel de Lennard-Jones. La figure 1.3 reprsente lallure typique de ce
diagramme pour ces potentiels.
Il est possible de retrouver des aspects qualitatifs du diagramme de phases, et des ordres de
grandeurs de certaines proprits thermodynamiques macroscopiques partir des paramtres du
potentiel dinteraction. Par exemple, en admettant que dans les phases liquide et solide du systme
de Lennard-Jones, chaque particule interagisse essentiellement avec 12 voisines situes la distance
minimisant VLJ (r), on peut grossirement estimer lnergie potentielle par particule ep = 6
(6 tant le nombre dinteractions de paires par particule, chacune ntant compte quune seule
fois). On peut donc estimer la chaleur latente dvaporation ou de sublimation ep . Quant la
temprature dvaporation, elle est de lordre de ep /kB .
4. On reverra au chapitre 3 pourquoi ce sont les deux seuls variables dterminant ltat dquilibre
dun systme fluide. Les solides admettent aussi le tenseur des dformations comme variable caractrisant
localement leur tat.

1.3 Physique statistique et simulation molculaire

T
F

C
G
G+L

L+S

G+S

(a) En coordonnes , T .

P
(b) En coordonnes P , T .

Fig. 1.3. Schma du diagramme de phase dun systme de Lennard-Jones : (a) dans le plan , T (noter
les rgions de coexistence, deux phases en quilibre la mme temprature nayant pas la mme densit) ;
(b) dans le plan P , T . Au point triple T les trois phases sont en quilibre. Au point critique C la diffrence
entre liquide (L) et gaz (G) disparat, et pour les tempratures suprieures la temprature critique TC ,
ou les pressions suprieures la pression critique PC on na plus quune seule phase fluide F.

De telles estimations ne peuvent pas, cependant, expliquer les transitions de phase. Mme si
de simples considrations nergtiques rendent plausibles le passage du solide cristallin basse
temprature au gaz temprature leve, elles ne peuvent exclure un passage progressif plutt
quune transition soudaine une temprature de changement de phase, et restent de plus inaptes
rendre compte de lexistence de la phase liquide. Le passage du microscopique au macroscopique
rvle aussi des surprises, des phnomnes collectifs impossibles dduire dune approche nave
qui ne prend pas en compte la statistique des grands systmes.

1.3 Physique statistique et simulation molculaire


La simulation molculaire, cest--dire la simulation sur ordinateur des modles de la physique
statistique, est un renfort prcieux la thorie et aux exprimentations physiques. On peut lui
voir deux grands objectifs :
(i) la simulation molculaire est en quelque sorte un microscope numrique, qui permet de
comprendre le comportement de la matire aux chelles microscopiques despace et de
temps (pour lesquelles lexprimentation est difficile) ;
(ii) la simulation molculaire est le moyen pratique de calculer les proprits moyennes des
matriaux par les lois prdites par la physique statistique, en particulier dans des rgimes
thermodynamiques difficilement accessibles lexprience (hautes pressions, hautes tempratures), ou pour tester les caractristiques de matriaux innovants avant une coteuse
synthse (mdicaments, alliages,. . .).
Nous donnons par la suite, titre culturel, quelques exemples des avances dans la comprhension
de la physique statistique pour lesquelles lapport des simulations numriques a t dcisif. Ces
exemples sont centrs sur la simulation des fluides (denses), qui est historiquement le domaine
dmergence de la simulation molculaire.
Transition de phase entropique
Un des premiers systmes simuls fut le fluide de sphres dures, ds la fin des annes 1950 (on
trouvera les rfrences dans [20]). Ceci permit rapidement dclaircir un point alors controvers,
lexistence ou non dune phase cristalline pour de telles interactions. En effet, on ne peut pas

10

1 Prliminaires

justifier larrangement cristallin par la minimisation dune nergie potentielle (comme ce serait le
cas avec un potentiel dinteraction continu comme le potentiel de Lennard-Jones), celle-ci tant
toujours nulle pour le fluide de sphres dures. Cest en fait lentropie qui est responsable de la cristallisation dans ce cas. Cette grandeur est directement lie au nombre de configurations possibles
pour rpartir N sphres dans un volume donn, sans recouvrement. La cristallisation des sphres
dures manifeste donc quau-del dune certaine densit limmense majorit des configurations possibles est constitue darrangements rguliers cristallins (de type cubique faces centres). La
figure 1.4 donne le diagramme de phases des sphres dures, qui ne dpend que de leur densit.
Dune faon gnrale, ce sont souvent les effets entropiques, lies la statistique dans les grands
systmes, qui rservent des surprises.

Fig. 1.4. Diagramme de phases des sphres dures, en coordonnes ,T , o = 3 /6 est la compacit.
La temprature T nayant aucune influence dans ce cas, les frontires sont verticales sur ce graphe. Noter
la zone de coexistence entre fluide et cristal.

Dautres formes dordres, intermdiaires entre le fluide, dont la structure moyenne est isotrope,
et le cristal, apparaissent avec des particules de forme allonge. Ce sont les phases de type cristal
liquide (ou msophases). L aussi, la simulation numrique a rvl limportance des effets entropiques, puisque des particules en forme de btonnets, sans autre interaction que leur mutuelle
exclusion strique, passent densit croissante par plusieurs transitions de phases. Ainsi, celles 5
de la figure 1.5 se prsentent basse densit dans une phase fluide ordinaire, isotrope, sans ordre
dorientation ni de position. densit plus leve apparat la phase nmatique, dans laquelle, les
positions restant sans corrlation longue distance, les grands axes des particules choisissent prfrentiellement une orientation commune. Vient ensuite une phase smectique dans laquelle apparat
en plus un ordre partiel de positions : les centres des particules se concentrent sur une famille de
plans parallles, mais lintrieur de chacune de ces couches on ne trouve pas dordre longue
distance. Enfin la phase de plus haute densit est un solide cristallin. Les limites et les zones de
coexistence dans le diagramme de phases dpendent du rapport daspect des particules

5. Simulations par mthode de Monte-Carlo, dues Peter Bolhuis et Daan Frenkel, de lInstitut de
Physique Atomique et Molculaire, Amsterdam.

1.3 Physique statistique et simulation molculaire

11

Fig. 1.5. Diffrentes phases des sphrocylindres durs (cylindres ferms par deux hmisphres) : de
gauche droite et de haut en bas, phases isotrope, nmatique, smectique, cristalline.

Proprits dynamiques des fluides


La simulation numrique a galement contribu la comprhension de lorigine microscopique
des proprits dynamiques des fluides, comme la viscosit. Dans les phases denses, solide ou liquide,
les mouvements dune particule sont a priori fortement limits par la gne strique occasionne
par ses proches voisines. Dans les annes 1950 on pensait que lcoulement dun fluide, ou bien
le mouvement diffusif dune particule au sein dun fluide, rsultait dvnements localiss dans
lespace et dans le temps, dans lesquels une particule parviendrait exceptionnellement schapper
de la cage forme par ses voisines. Ce mcanisme est illustr schmatiquement par la figure 1.6.

Fig. 1.6. Reprsentation schmatique du modle de viscosit ou de diffusion molculaire par sauts. Ici
un vnement de saut exceptionnel a eu lieu entre les deux configurations reprsentes, avant ( gauche)
et aprs ( droite) un bref intervalle de temps. Alors que la plupart des particules, comme le disque gris,
oscillaient lintrieur de la cage formes par leurs voisines, lune dentre elles est parvenue schapper,
dans un mouvemement brusque, figur par la flche.

Cest effectivement le mcanisme de la diffusion molculaire dans les solides cristallins, dans
lesquels les atomes quittent parfois leur site du rseau pour occuper des positions exceptionnelles,
dites interstitielles, ou bien sautent brusquement sur un site cristallin voisin, qui se trouve inoccup
(mouvement de lacune), ce qui est fort rare dans les conditions thermodynamiques usuelles.
Toutefois, ltude des mouvements molculaires dans les liquides, par la simulation numrique,
a rvl que lon ne pouvait pas isoler des vnements de sauts, au moins pour la description de la
dynamique des liquides ordinaires : la diffusion est lie des mouvements collectifs et permanents,

12

1 Prliminaires

dans lesquels les dplacements prsentent une structuration spatiale analogue aux champs de vitesses macroscopiques dans les fluides continus. Conjointement, grce aux informations nouvelles
que lon a acquises sur la dynamique des liquides, on a pu comprendre comment une version gnralise de lhydrodynamique macroscopique pouvait sappliquer jusquaux chelles molculaires.
Une manifestation indirecte en est la validit remarquable, dans les liquides, de la relation de
Stokes-Einstein jusquaux chelles molculaires. Cette relation concerne normalement les particules collodales (de taille msoscopique), et exprime le coefficient de diffusion D dune particule
sphrique de rayon R en suspension dans un liquide de viscosit par :
D=

kB T
.
6R

(1.5)

Lquation (1.5) fournit une bonne approximation du coefficient de diffusion D, dans les liquides
constitus de petites molcules, grossirement assimilables des objets sphriques, si on prend
pour R une valeur infrieure de 30% au rayon molculaire.

2
Description microscopique et statistique des grands systmes

Dans ce chapitre nous dfinissons les objets dtude essentiels du cours de physique statistique.
Nous considrons le cas de N particules ponctuelles en interaction, et introduisons les notations et
proprits de base ncessaires la description statistique de leur mouvement. Nous rappelons aussi
quelques observations sur le comportement des grands systmes et indiquons comment certaines
grandeurs macroscopiques peuvent y tre mesures, et comment caractriser leur structure.

2.1 Systme, espace des phases, microtats . . . . . . . . . . . . . . . . . . . . . . . . . .


2.2 volution des systmes classiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.1 quations de Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.2 Pourquoi adopter le formalisme hamiltonien ? . . . . . . . . . . . . . . . . . . . . . .
2.2.3 Intgration de la dynamique hamiltonienne . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Comportement des grands systmes : observations . . . . . . . . . . . . . .
2.4 Approche statistique des grands systmes . . . . . . . . . . . . . . . . . . . . . . .
2.4.1 Approche de lquilibre, moyennes et corrlations en temps . . . . . . . . . .
2.4.2 Limite thermodynamique, moyennes et corrlations dans lespace . . . . .
2.4.3 Ensembles statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5 Quelques observables courantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5.1 Lnergie et ses fluctuations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5.2 Le tenseur des contraintes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5.3 Microstructure et corrlations de densit . . . . . . . . . . . . . . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13
15
15
16
18
19
22
23
24
25
26
26
27
28
32

2.1 Systme, espace des phases, microtats


On considre un systme form de N particules (typiquement, des atomes), dcrit par une
configuration Q = (q1 , ..., qN ) (avec qi Rd , o d = 1, 2, 3 est la dimension de lespace ambiant).
Chaque particule, de masse mi , a une impulsion pi = mi q i . On note P = (p1 , ..., pN ), et M la
matrice de masse du systme, cest--dire M = Diag(m1 , . . . , mN ) 1 . Les positions des particules
sont des variables valeurs dans un domaine D Rd , de volume |D|, alors que les impulsions
peuvent prendre toutes les valeurs a priori. Ainsi, le systme est dcrit par le couple (Q, P), qui
volue dans lespace des phases E = DN RdN .
Dfinition 2.1 (Microtat ou configuration microscopique). On appelle microtat (ou
configuration microscopique) un lment (Q, P) E. Lespace des phases E est par dfinition
lespace de tous les microtats possibles du systme.
1. Toutefois, les particules auront bien souvent la mme masse, car on considrera des particules identiques.

14

2 Description microscopique et statistique des grands systmes

Le N-uplet Q volue dans lespace des configurations DN , dont la dfinition dpend des conditions de bord utilises :
si les particules sont libres dexplorer tout lespace, on a D = Rd ;
les particules peuvent tre assujetties demeurer lintrieur dun volume fixe. Il faut alors
se donner un modle physique de ce confinement, par exemple avec des forces drivant dun
potentiel qui crot trs rapidement la traverse de la frontire de D, ou avec des conditions
de bord spculaires (rflexion des impulsions au niveau de linterface) ;
si les particules explorent une bote avec des conditions aux limites priodiques, lespace des
configurations est un tore TdN . Cest trs souvent le cas pour la modlisation numrique
des solides et des fluides : les conditions aux limites priodiques permettent de reprsenter
plus fidlement une portion du matriau entour du mme matriau, alors que si on a des
conditions de bord libres, ou bien encore faisant intervenir une paroi idale impntrable, les
effets de surface ne sont pas ngligeables, voire dominent le comportement du systme.

4
A

1
A

Fig. 2.1. Systme bidimensionnel avec conditions aux limites priodiques.

La figure 2.1 illustre les conditions aux limites priodiques dans un espace de dimension d = 2.
Neuf copies de la cellule de simulation centrale (numrote 1) y sont reprsentes. La distance
entre les particules marques A et B est la plus petite entre leurs images les plus proches par
lune des translations qui transforment la cellule de simulation une collection de rpliques. Notant
Ai la copie de la particule A dans la cellule i, cest la distance entre A1 et B2 (ou entre A5 et
B4 , ou entre A7 et B8 ) qui dtermine la force entre A et B. Cette remarque est importante car
nous nous limiterons dans ce cours aux potentiels de courte porte, pour lesquels il suffit dvaluer
linteraction entre les images les plus proches. 2 On peut noter aussi que la position des frontires
de la cellule de simulation na aucune importance, chacune des parties du volume tudi jouant le
2. Pour des potentiels lentement dcroissants (en particulier pour les interactions ioniques ou dipolaires)
il faut additionner toutes les interactions des Ai et des Bj de toutes les cellules obtenues par priodicit

2.2 volution des systmes classiques

15

mme rle. Ainsi on peut tout aussi bien considrer que le domaine de calcul est le carr reprsent
en pointills sur la figure 2.1. Dans la pratique, on garde la trace chaque instant des positions
des particules dans une seule cellule, et on veille prendre en compte les interactions entre images
les plus proches.
Remarque 2.1 (Taille minimale de la cellule de simulation). On prendra garde ce que la cellule
de simulation soit suffisamment grande pour quune particule ninteragisse quune fois avec une
autre particule ou son image priodique. Par exemple, pour un domaine de simulation cubique de
ct L, il faut que le rayon de coupure rcut du potentiel soit tel que
L > 2rcut .

2.2 volution des systmes classiques


2.2.1 quations de Hamilton
En gnral, les interactions entre les particules sont dcrites par la fonction nergie potentielle V V (Q) = V (q1 , . . . , qN ). Lnergie totale, somme de lnergie potentielle et de lenergie
cintique, scrit
1
H(Q, P) = V (Q) + PT M 1 P.
(2.1)
2
La fonction H(Q, P) est appele le Hamiltonien du systme. Le systme est rgi par le principe
fondamental de la dynamique (loi de Newton), qui prend la forme des quations de Hamilton :
Dynamique hamiltonienne

pi (t)

q i (t) = p H(Q, P) =
,
i
mi

p i (t) = qi H(Q, P) = qi V (Q).

(2.2)

Cest un systme dquations diffrentielles ordinaires (EDO). Par la suite, on fera lhypothse
quil y a une et une seule solution cette EDO. Ceci est le cas par exemple si le champ de force V
est globalement lipschitzien (par application du thorme de Cauchy-Lipschitz). 3 Un systme tel
que (2.2), pos dans R2dN est dit hamiltonien si on peut dfinir des variables Q RdN , P RdN
et une fonction H(Q, P) telle quil puisse scrire sous la forme (2.2). Comme toute EDO, la
dynamique (2.2) est caractrise par son flot.
Dfinition 2.2 (Flot). On appelle flot de la dynamique hamiltonienne (2.2) la famille dapplications (t )t0 qui, au microtat (Q0 , P0 ) E t = 0 font correspondre les microtats (Q(t), P(t))
E tout instant t 0.
On a toujours t+u = t u pour t, u 0, et la famille (t )t0 constitue donc un semi-groupe.
Cela signifie simplement que si lon prend u (Q0 , P0 ) comme condition initiale, on obtient au bout
du temps t la mme valeur (Q0 , P0 ) quen partant de (Q0 , P0 ) et en intgrant sur un temps t + u.
Pour les systmes hamiltoniens, t a un sens (voir (2.4)) et le flot dfinit un groupe.
(y compris linteraction de chaque particule charge avec chacune de ses rpliques). Un tel calcul porte le
nom de somme dEwald pour les charges ou somme dEwald et Kornfeld pour les diples.
3. Dans certains cas, on peut galer montrer quune condition de Lyapounov est vrifie, i.e. on montre
quune certaine fonction W (Q, P) dcrot au cours du temps, cette dcroissance donnant une information
sur le comportement de la solution (par exemple, elle reste dans un compact). Un cas classique concerne
des dynamiques du type q = q 3 . Dans ce cas, on na pas une condition de Lipschitz globale, mais on
montre facilement que la fonction t 7 W (q(t)) = q(t)2 dcrot au cours du temps, ce qui montre que la
solution reste dans le compact B(0, q(0)). Au final, comme la solution est borne, on peut en fait conclure
que la force est borne, et appliquer quand mme le thorme de Cauchy-Lipschitz.

16

2 Description microscopique et statistique des grands systmes

2.2.2 Pourquoi adopter le formalisme hamiltonien ?


La forme hamiltonienne (2.2) des quations du mouvement est quivalente la dynamique
suivante, sur les positions et les vitesses :

q i (t) = vi ,
v i (t) = 1 qi V (Q, P).
mi
Cependant, on prfre trs souvent lcriture (2.2) pour un certain nombre de raisons que nous
dtaillons ci-dessous.
Invariants de la dynamique
On montre tout dabord que la dynamique (2.2) conserve lnergie du systme. On parle
dailleurs en mcanique de systme conservatif. Ceci est une proprit importante de cette dynamique, fondamentale pour la dfinition de lensemble microcanonique (chapitre 3). Elle se prte
de surcrot plus aisment au passage de la mcanique classique la mcanique quantique, comme
on le verra dans la seconde partie de ce cours.
Proprit 2.1 (Conservation du Hamiltonien le long dune trajectoire). On montre facilement que la dynamique (2.2) est telle que lnergie totale H(Q, P) est prserve le long de la
trajectoire. En effet,
dH(Q(t), P(t))

= Q H(Q(t), P(t)) Q(t)


+ P H(Q(t), P(t)) P(t).
dt
Utilisant alors (2.2) et la dfinition (2.1) du Hamiltonien H,
dH(Q(t), P(t))
= Q V (Q(t)) M 1 P(t) + M 1 P(t) (Q V (Q(t))) = 0.
dt
Ceci montre que H(Q(t), P(t)) = H(Q0 , P0 ) pour tout temps t.
Dautres invariants peuvent
exister, selon les proprits du potentiel. En gnral, laP
quantit de
PN
N
mouvement totale P = i=1 pi est conserve, ainsi que le moment cintique total L = i=1 qi pi
(si on nutilise pas de conditions de bord priodiques), pour des formes de lnergie potentielle
invariantes, respectivement, par translation ou par rotation. Voir, ce sujet, lexercice 2.1.
Mesure invariante
On peut montrer que la dynamique hamiltonienne conserve la mesure de Lebesgue, au sens o
Proprit 2.2 (Conservation de la mesure de Lebesgue). Pour tout borlien B E,
Z
Z
Leb
d (Q, P) =
dLeb (Q, P),
t (B)

la mesure Leb tant la mesure de Lebesgue et (t )t0 le flot de la dynamique hamiltonienne.


Pour des raisons de cohrence avec la mcanique quantique, on utilise plutt la mesure
d0 (Q, P) =

1
1
dLeb (Q, P) =
dq1 . . . dqN dp1 . . . dpN .
3N
N !h
N ! h3N

(2.3)

Le prfacteur fait apparatre N ! et la constante de Planck h ' 6, 626 1034 J.s ; il conduit
valuer le volume dune partie de lespace des phases par un nombre sans dimension. Ce facteur

2.2 volution des systmes classiques

17

dorigine quantique peut tre omis sans dommage en gnral, du moins en prsence dune seule
espce molculaire. 4
Pour vrifier la conservation de la mesure (2.3), on montre que, pour tout t 0,
|Det(Q,P t (Q, P))| = |Jac t (Q, P)| = 1.
Ainsi, le flot dfinit un changement de variable de Jacobien 1. Cette proprir rsulte du fait
que le champ de vecteurs associ la dynamique hamiltonienne est de divergence nulle (voir [19,
Lemme VII.3.1] pour une preuve de cette assertion). On calcule en effet
divQ (P H) + divP (Q H) =

N
X

(qi pi H pi qi H) = 0.

i=1

On peut comprendre ce rsultat par une analogie avec la mcanique des fluides (voir le cours
de cinmatique des milieux continus), 5 en se reprsentant la dynamique hamiltonienne comme
dcrivant un coulement dans lespace des phases, (2.2) donnant la valeur de la vitesse en chaque
point (champ des vitesses en reprsentation eulrienne). Cette vitesse possde dans ce cas 2dN
coordonnes, qui sont celles de (q i )1iN et (p i )1iN . La conservation du volume est exprime
par la condition de divergence nulle du champ de vitesse (fluide incompressible), au vu de lquation
de la conservation de la quantit de matire.
Caractre chaotique de la dynamique hamiltonienne
On montre ici sur un exemple que la dynamique hamiltonienne est en gnrale exponentiellement sensible aux conditions initiales, au sens o une petite perturbation de la donne initiale
grandit exponentiellement au cours du temps. Or, en pratique, il est impossible de connatre exactement les conditions initiales dun systme donn, et de toute faon il existe une erreur numrique
intrinsque des ordinateurs actuels (de lordre de 1016 ). Ces considrations montrent que la notion de trajectoire dun systme dynamique nest pas forcment la bonne notion. Cest un point qui
aura toute son importance lors de la discussion sur lchantillonnage de la mesure microcanonique
et les schmas numriques dintgration associs ( 3.3).
Exemple 2.1. On considre une particule q R soumise au potentiel V (q) = 12 2 q 2 . Dans ce cas,
les quations du mouvement
q = q,
(q0 , p0 ) = (0, 1),

ont pour solution q(t) = 1/2 p0 exp( t). On voit ainsi quuneperturbation de lordre de  sur
limpulsion initiale p0 conduit une perturbation en  1/2 exp( t) au temps t.
La situation prsente dans lExemple 2.1 peut sembler caricaturale, mais est en fait trs
gnrale : en effet, au voisinage de tout maximum local Qmax de la surface dnergie potentielle,
on a localement le dveloppement limit
V (Q) = V (Qmax ) + (Q Qmax )T 2 V (Qmax ) (Q Qmax ) + O(|Q Qmax |3 ),
avec la matrice hessienne 2 V (Qmax ) dfinie ngative. Des dveloppements limits de ce type
montrent galement que la situation rencontre lExemple 2.1 reste valable au voisinage de tout
point-col, o la matrice hessienne du potentiel a au moins une valeur propre ngative - ce qui, en
pratique, vaut pour une grande partie de lespace des phases si le systme est de grande dimension !
Lanalogie avec lcoulement dun fluide peut une fois de plus contribuer rendre intuitive
la proprit de sensibilit aux conditions initiales de la dynamique hamiltonienne dun ensemble
4. Le terme N ! qui exprime lindiscernabilit des particules doit tre conserv en prsence de plusieurs
espces. Dans le calcul de laugmentation dentropie lors dun mlange, son omission conduit au paradoxe
de Gibbs voir le cours Physique des tats de la matire de premire anne [8].
5. Le terme flot est en fait une traduction un peu impropre de langlais flow, cest--dire coulement.

18

2 Description microscopique et statistique des grands systmes

de particules en interaction. Deux trajectoires dans lespace des phases, partant de points trs
proches, scartent de plus en plus et finissent par explorer des microtats trs distants, de mme
que lcoulement turbulent dun fluide conduit en mlanger les diffrentes parties. Lorsque lon
matrialise une petite rgion dun coulement turbulent de fluide incompressible, par exemple au
moyen dun traceur color, on voit la matire repre se disperser dans un volume croissant :
lcoulement divergence nulle rapproche les points selon certaines directions, et les loigne selon
dautres, do une divergence des trajectoires. Il en est de mme pour lcoulement incompressible
dans lespace 2d N dimensions E. 6
Rversibilit en temps
Une autre proprit importante de la dynamique hamiltonienne est sa rversibilit en temps.
Si, linstant t, on renverse les vitesses, alors la trajectoire antrieure dans E est parcourue dans
lautre sens. Autrement dit, si on note S lapplication qui change le signe des vitesses alors que les
positions restent les mmes, i.e.
S(Q, P) = (Q, P),
le flot t est tel que :

t S = S t .

(2.4)

Preuve. Soit (Q0 , P0 ) E donn. Notons (Q(t), P(t)) la solution de (2.2) partant de la condition
b
b
initiale (Q0 , P0 ), et (Q(t),
P(t))
la solution de (2.2) partant de la condition initiale S(Q0 , P0 ) =
b
b
(Q0 , P0 ). On vrifie facilement que (Q(t),
P(t))
et S(Q(t), P(t)) = (Q(t), P(t)) satisu
font (2.2), partant de la mme condition initiale (Q0 , P0 ).
t
2.2.3 Intgration de la dynamique hamiltonienne
On parle quelquefois de problme N corps pour dcrire la dynamique hamiltonienne, dans la
mesure o lvolution de la particule i, donne par
i = qi V (q1 , . . . , qN ),
mi q

(2.5)

dpend a priori des positions de toutes les autres particules. On a affaire un systme de N quations diffrentielles ordinaires couples, et linformation physique importante est le potentiel V .
On verra comment intgrer numriquement ces quations au 3.3.4).
On sait bien sr que les problmes N corps, en gnral, ne se rsolvent pas analytiquement
pour N 3 (et en pratique, jamais dans un cas vraiment intressant !). Une rsolution numrique
des quations du mouvement (2.2) (ou (2.5)) nest possible que pour des systmes dau mieux
une centaine de milliers de molcules et sur des temps trs courts, de lordre de 109 s. La dtermination prcise des trajectoires dans lespace des phases pour le mouvement dun ensemble de
N particules avec N de lordre du nombre dAvogadro NA ' 6 1023 est donc impossible. Fort
heureusement, il est possible dvaluer, dans bien des cas pratiques, des proprits macroscopiques
partir de simulations numriques dchantillons assez petits (quelques centaines de particules
suffisent parfois), pendant une dure assez brve (cf. les exemples des 2.3, 3.3.6 et 5.3.2). Insistons une fois de plus sur le fait que la recherche de la prcision dans le calcul numrique des
trajectoires est illusoire et vaine, cause de la sensibilit aux conditions initiales.
6. On peut trouver dans le livre de Diu et al. [10, p. 577] un calcul approch de cet effet, dans le cas
dun gaz de sphres dures, dont le rsultat est saisissant. Les collisions de molcules dair la pression
atmosphrique, modlises comme des billes lastiques, sont telles quelles amplifient les carts angulaires
sur les portions rectilignes de trajectoire entre deux chocs. Les dviations angulaires croissent donc exponentiellement avec le nombre de chocs. Pour quune particule soit dvie de 1 radian sous leffet dune
perturbation infime celle que cause lattraction gravitationnelle dun exprimentateur pesant 70 kg, 1
mtre de distance il suffit de 10 collisions environ, et de 50 collisions si la perturbation est due lattraction gravitationnelle dun lectron une distance gale au rayon de lunivers ! 10 collisions, dans lair
300 K et la pression atmosphrique 105 Pa, correspondent un temps de lordre de la nanoseconde.

2.3 Comportement des grands systmes : observations

19

Heureusement, ce qui importe en pratique, pour retrouver les lois macroscopiques, cest dtudier des comportements moyens, collectifs. Dans la simulation numrique ce sont les proprits du
flot t qui sont importantes, plutt que celles des trajectoires prises une une. On adoptera en
outre un point de vue statistique : on sintressera en particulier la frquence avec laquelle sont
visites diffrentes parties de lespace des phases. Cette approche statistique a donn lieu tout
le dveloppement historique de la physique statistique (avant les ordinateurs et les simulations
numriques). Nous relevons dans le paragraphe suivant quelques observations qualitatives sur le
comportement des grands systmes qui motivent cette dmarche et prcisons quelques notions de
base ncessaires son dveloppement.

2.3 Comportement des grands systmes : observations


Grce la simulation numrique, il est possible de se livrer diverses expriences numriques en suivant le mouvement dun ensemble de particules interagissant par un potentiel V .
Un cas simple est celui dun cube avec conditions aux limites priodiques et de ct L, la cellule
de base tant dfinie par L/2 x1 , x2 , x3 L/2, et contenant N particules. Nous observons par
la suite les valeurs prises au cours du temps par les nombres N1 et N2 = N N1 de particules
contenues dans chacun des demi-cubes x1 0 et x1 > 0. Cet exemple illustre le comportement
des grandeurs macroscopiques, qui rsultent de multiples contributions des degrs de libert microscopiques dont les fluctuations sont erratiques. Nous utilisons ici le modle des sphres dures
( 1.2.2) et leur diamtre dfinit lunit de longueur. Lunit de temps est /u, o u est la valeur
moyenne quadratique de lune des 3 coordonnes de la vitesse des particules. On verra ( 3.1.3)
que cette vitesse est donne par :
kB T
u=
,
(2.6)
m
o m est la masse des particules et T la temprature. La densit numrique est ici telle que la
fraction volumique de sphres (galement appele compacit)
= 3 /6,

(2.7)

soit gale 0,24. Lobservation de lvolution de grandeurs macroscopique donne des rsultats qui
deviennent approximativement constants et indpendants des conditions initiales aprs un certain
temps. On sattend ainsi, dans notre exemple, ce que la moiti des particules soit contenue, en
moyenne, dans chacune des deux moitis du volume. La figure 2.2 illustre ce comportement, avec
une condition initiale dlibrment particulire : dans ces calculs, on a choisi N1 = N et N2 = 0
t = 0. On constate que le rapport X = N2 /N rejoint rapidement 1/2, et fluctue ensuite en ne
scartant que lgrement de cette valeur.
On voit galement que lamplitude des fluctuations diminue lorsque N augmente. On peut montrer que, dans la limite N +, N2 se comporte comme une variable gaussienne de moyenne N/2
et de variance kB T N/4, tant la compressibilit isotherme. On crit (notation utilise dans
la suite de ce document)


N 1
N2 N
, N kB T .
(2.8)
2 4
La variance de N2 tant proportionnelle
au nombre de particules, le rapport cart-type/moyenne

est en O(N 1/2 ). Ainsi, x = N (X 12 ) possde la densit de probabilit


r


2
2x2
exp
.
(2.9)
P (x) =
kB T
kB T
La figure 2.3 montre que les rsultats de simulation sont bien en accord avec cette prdiction. On
a compar la variance de N2 la prdiction (2.8), en utilisant lquation dtat connue
 des sphres
0, 199
P
'
.
dures [15] qui donne, pour la fraction volumique de sphres = 0, 24,
T
kB T

20

2 Description microscopique et statistique des grands systmes

(a) X(t) pour diffrentes valeurs de N

(b) Dtail des fluctuations autour de 1/2

Fig. 2.2. volution dans le temps de la fraction du nombre de particules contenue dans une moiti de la
cellule de simulation, partant de zro, pour 4 chantillons avec des valeurs de N diffrentes.

(a) Variance de N2 pour diffrents N .

(b) Densit de probabilit de x.

Fig. 2.3. Pour 4 valeurs de N , variance de N2 (a) et densit de probabilit de x = N2 /N (b), compares
la prdiction (2.9), avec la valeur connue k
B T = 0, 199 dans ces conditions thermodynamiques. La
droite pointille sur le graphe (a) est N 7 41 N kB T .

Les donnes statistiques sur les fluctuations de N2 ont t acquises une fois coul un temps
ncessaire loubli de ltat initial particulier (ici, t = 15), quand on peut estimer que les oscillations initiales de N2 (t) sont amorties. Il semble alors que lon ait atteint un tat stationnaire, au
sens statistique du terme, cest--dire que la succession des valeurs prises au cours du temps par la
grandeur observe sapparente la trajectoire dun processus alatoire stationnaire : connaissant
la valeur linstant t, la valeur linstant t0 > t est alatoire et distribue suivant une loi qui ne
dpend que de t0 t. Ceci peut se vrifier par des tests statistiques adquats.

2.3 Comportement des grands systmes : observations

21

Il est intressant de mesurer la fonction dautocorrlation entre les valeurs de N2 des instants
diffrents, que lon dfinit comme :


C(t) = (N2 (t) hN2 i) (N2 (0) hN2 i) .
La notation hi reprsente une moyenne sur le choix de lorigine des temps, pour une longue
trajectoire donne (ventuellement, cette moyenne pourrait galement tre prise sur plusieurs
trajectoires partant de conditions initiales diffrentes). La fonction C(t), normalise par sa valeur
t = 0 (cest--dire la variance de N2 ), est reprsente sur la figure 2.4. Le temps de corrlation de

Fig. 2.4. Fonctions dautocorrlation dpendant du temps, normalises leur valeurs initiales, de N2
(courbe continue) et de k (courbe en pointills). Cette dernire quantit est dfinie par (2.11) et (2.10),
pour un vecteur donde k tel que |k| = 2
. Ici, N = 1999 et = 0,24.
L

N2 est donc assez long, puisque C(t) est toujours oscillant pour t = 30, et donne une indication du
temps de mesure ncessaire pour bien chantillonner la distribution statistique des valeurs prises
par N2 : il faut en principe moyenner sur une dure grande devant le temps de corrlation de N2 ,
pour que la distribution des valeurs observes cesse dtre biaise par ltat initial au dbut des
mesures.
En fait, cette fonction pourrait tre value partir de la connaissance macroscopique de
la thermodynamique et de lhydrodynamique du fluide de sphres dures. On peut en effet faire
lhypothse que les fluctuations de la densit lchelle de la cellule de simulation t = 0 vont,
en moyenne, rgresser comme dil sagissait dun petit cart macroscopique lquilibre global
de lchantillon de fluide tudi. 7 Une telle approche permet de calculer C(t), partir dune
dcomposition de N2 (t) en srie de Fourier. Les longueurs donde les plus faibles ne sont pas bien
dcrites par lapproche macroscopique, mais la dcroissance vers zro de C(t) aux temps longs
est domine par les longueurs donde de lordre de la taille L de la cellule de simulation. La plus
grande est prcisment L, et sur la figure 2.4 on a aussi reprsent la fonction dautocorrlation
de k ,
hk (t)k (0)i
F (k, t) =
,
(2.10)
N
normalise par sa valeur initiale. Le coefficient k est la composante de Fourier du champ de
densit, pour un vecteur donde k tel que |k| = 2
L :
k =

N
X

exp[ik qi ].

i=1

7. Cette hypothse est appele le postulat dOnsager pour la rgression des fluctuations.

(2.11)

22

2 Description microscopique et statistique des grands systmes

On appelle facteur de structure la quantit S(k) F (k, 0) :


S(k) =

hk k i
.
N

(2.12)

Cette quantit est relie aux fonctions de corrlation de densit dans lespace rel (voir 2.5.3).
La dpendance en temps de F (k, t), dont la forme est prdite par lhydrodynamique 8 (voir [20]),
concide bien pour les temps assez grands avec celle de la fonction dautocorrlation de N2 .
Enfin, une remarque importante concerne la rversibilit en temps des trajectoires, proprit
que le systme de sphres dures partage avec les systmes hamitoniens du 2.2. Pour les simulations
dont nous rapportons ici les rsultats, cette proprit signifie en principe que si lon renverse les
vitesses de toutes les particules linstant t, alors, linstant 2t, on doit retrouver la configuration
de dpart (t = 0), qui tait telle que toutes les particules se situent dans la moiti de la cellule de
simulation. Or il nen est rien si t est suffisamment grand (t = O(1)) : on observe simplement des
fluctuations analogues celles que lon voit sur la figure 2.3(b). Ceci sexplique une fois encore par
laccumulation derreurs numriques et linstabilit des trajectoires.

2.4 Approche statistique des grands systmes


Plutt que de se confronter avec lnorme quantit dinformations que constitue la donne de
toutes les coordonnes de (Q, P), on sintresse lorsque lon souhaite retrouver le comportement
macroscopique du systme partir de lapproche microscopique, certaines fonctions de (Q, P)
seulement, valeurs dans Rm avec m  2dN .
Dfinition 2.3 (Observable). On appelle observable une fonction A : E Rm (m < 2dN ) des
microtats (Q, P) E du systme.
Lapproche statistique permet une description rduite du systme en ne sintressant quaux
valeurs moyennes des observables (ventuellement leur fonctions de corrlations en temps), et
non pas la distribution de toutes leurs valeurs possibles. On se donne donc des lois de probabilit
sur E, qui correspondent ltat du systme au sens macroscopique de la thermodynamique.
Dfinition 2.4 (Macrotat). On appelle macrotat une mesure de probabilit dN sur lespace
des phases E. Ltat macroscopique du systme est alors caractris par les valeurs moyennes hAi
des observables A, selon
Z
hAi =
A(Q, P) dN (Q, P).
(2.13)
E

Ces moyennes sont appeles moyennes densemble.


On rappelle quune mesure de probabilit est une mesure de Radon positive de masse totale
gale 1. Ceci signifie que
Z
dN (Q, P) = 1,
E

et, pour tout borlien B B(E),

Z
0

dN (Q, P) 1.
B

Une telle mesure de probabilit peut admettre une densit fN , auquel cas
Z
dN (Q, P) = fN (Q, P) dQ dP, fN 0,
fN (Q, P) dQ dP = 1,
E

8. La priode des oscillations de F (k, t) sur la figure 2.4 est celle des ondes de compression ondes
acoustiques longitudinales de longueur donde L.

2.4 Approche statistique des grands systmes

23

mais ce nest pas forcment le cas. On pourrait imaginer que dN (Q, P) est une masse de Dirac
concentre en un point, ou plus gnralement, une mesure restreinte une sous-varit de lespace.
Un tel exemple sera prsent au 3.1.1.
Notons galement que le point de vue probabiliste est naturel en pratique pour un observateur
qui ne dispose que dune information partielle sur le mouvement des N particules et qui les
fluctuations, comme celles de N2 dans lexemple du 2.3, semblent erratiques. Plus fondamentalement, la sensibilit aux conditions initiales interdit de prvoir les trajectoires dans E, en dpit
du dterminisme exprim par (2.2), car les valeurs initiales des 2dN coordonnes de (Q, P) ne
sont jamais connues quavec une prcision finie. Dans la pratique usuelle du calcul numrique, la
prcision relative sur un nombre rel (cod sur 8 octets) est de lordre de 1016 . En fait, pour
certains systmes dynamiques chaotiques analogues (2.2), on peut montrer 9 quil est impossible
de distinguer :
(i) les trajectoires exactes des quations dterministes pour une certaine condition initiale ;
(ii) les trajectoires des quations dterministes calcules avec des erreurs relatives de 1016 ;
(iii) les trajectoires exactes dun modle modifi, un terme de bruit dordre relatif 1016 tant
ajout dans les quations dterministes.
Ce rsultat est appel lemme de poursuite dans [11], car la trajectoire fausse que lon calcule est
en fait une vraie trajectoire pour une certaine condition initiale tellement proche de celle que
lon a prise quon ne la distingue pas avec le niveau de prcision dont on dispose. Pour de tels
systmes dynamiques chaotiques, la distinction entre volution dterministe ou alatoire nest donc
quaffaire de point de vue.
2.4.1 Approche de lquilibre, moyennes et corrlations en temps
On observe en gnral lorsque lon prpare un systme dans un tat particulier, comme dans
lexemple prcdent o toutes les particules sont initialement dans la moiti du volume accessible, que cette situation de dpart est oublie aprs un certain temps, au-del duquel tout semble
indiquer que le macrotat du systme, cest--dire la mesure de probabilit dN (Q, P) des microtats, est indpendante du temps. Un tel macrotat est par dfinition un tat dquilibre au sens
thermodynamique.
Dans la pratique, lorsque lon simule le mouvement de N particules, on repre un instant t0
o linfluence de ltat initial est devenue ngligeable (on peut par exemple tester la stationnarit
de certaines observables, considres comme processus alatoires, voir 5.3) et on remplace la
moyenne densemble (2.13) par une moyenne en temps
1
hAi =

t0 +

A(t (Q, P)) dt,

(2.14)

t0

dans laquelle on doit prendre assez grand pour avoir un chantillon reprsentatif de la statistique
des fluctuations au cours du temps. La proprit (2.14) est la dfinition pratique de la moyenne
selon le macrotat dquilibre. Dire que les systmes macroscopiques approchent spontanment
dun tat dquilibre, cest dire quil existe un macrotat eq
N tel que, pour toute observable A,
(2.14) concide avec (2.13) pour , t0 assez grands. On fait en sorte une hypothse dergodicit.
Une indication sur les chelles de temps concernes est fournie par les fonctions de corrlation
dpendant du temps. Si A et B sont deux observables, on appelle fonction de corrlation de A et
de B la quantit
CAB (t) = hA(0)B(t)i hAi hBi ,
(2.15)
o B(t) = B(t (Q0 , P0 )), la moyenne tant prise par exemple sur toutes les ralisations de la
dynamique, partant de conditions initiales (Q0 , P0 ) distribues selon dN . Si on admet que les
valeurs prises par les diffrentes observables sont indpendantes des temps loigns (du fait de
9. Nous recommandons la lecture de larticle dAdrien Douady [11] qui illustre ces proprits sur un
modle simple.

24

2 Description microscopique et statistique des grands systmes

loubli des conditions initiales), alors CAB (t) tend vers zro pour t +. Une condition ncessaire
pour que les valeurs prises t et t + puissent tre considres comme indpendantes est que
lon ait  r , o r est le temps caractristique de dcroissance de CAB . On doit donc prendre
 r dans (2.14).
2.4.2 Limite thermodynamique, moyennes et corrlations dans lespace
Cest une constatation dexprience que les observables ayant un sens macroscopique, comme
la pression ou lnergie interne, et qui font intervenir un grand nombre de degrs de libert du
systme ( linstar du nombre N2 dont lvolution est rapporte au 2.3) ne scartent que peu
de leur valeur moyenne, avec des fluctuations qui tendent diminuer, en valeur relative, comme
O(N 1/2 ) lorsque le nombre de particules N augmente. Bien souvent, de telles observables A
peuvent scrire, au moins approximativement,
A=

p
X

Ak ,

(2.16)

k=1

o Ak reprsente la contribution dun sous-systme, cest--dire un sous-ensemble des degrs de


libert du systme entier, correspondant une liste donne de molcules, ou bien celles des
molcules qui linstant considr se trouvent dans une partie donne du volume entier du systme.
Les systmes que lon tudie sont constitus dun grand nombre de particules identiques, et il est
possible si on procde un dcoupage du volume de prendre des sous-domaines de mme taille
et de mme forme. On sattend alors ce que chacune des p observables partielles Ak joue le
mme rle , et par consquent, si on les considre comme des variables alatoires, elles soient
quidistribues. Par exemple, pour le nombre N2 de molcules dans la moiti du volume accessible
on peut dcouper la moiti de la cellule en p petites cellules identiques, et crire N2 comme la
somme des nombres de particules contenues dans chacune de ces petites cellules.
Lapproche consistant dfinir un sous-systme par la liste des molcules qui lui sont attribues est trs commode quand on a affaire des degrs de libert indpendants. On a alors
E = E1 E2 Ep , et le microtat est ainsi un p-uplet (Q, P) = (Qk , Pk )1kp avec
(Qk , Pk ) Ek (pour 1 k p). On peut galement dcomposer le Hamiltonien comme une somme
de Hamiltoniens partiels :
p
X
Hk (Qk , Pk ).
(2.17)
H(Q, P) =
k=1

Il est immdiat dans ce cas que le mouvement de chacun des (Qk , Pk ) est indpendant de tous les
autres. On aura alors indpendance statistique entre les fluctuations de chacune des observables
partielles. Lapplication du Thorme de la Limite Centrale (2.16), somme de variables indpendantes quidistribues, assure alors (sachant que le nombre p augmente proportionnellement N )
que A est une variable gaussienne de variance
D
E
2
(A hAi) N.
Toutefois, le cas dun Hamiltonien se dcomposant en une somme de termes faisant intervenir
des degrs de libert indpendants est exceptionnel et correspond aux rares systmes physiques,
comme le gaz parfait, pour lesquels la physique statistique fournit des prdictions exactes.
En gnral, une dcomposition de la forme (2.17) est impossible crire exactement, mais
on peut obtenir une partition approximative en dcoupant le volume total en sous-parties, et en
faisant une hypothse dindpendance grande distance. En effet, si les sous-systmes sont euxmmes assez grands, deux sous-systmes adjacents ne sont corrls que par lintermdiaire des
degrs de libert des molcules situes la proximit de la frontire, dont la contribution dcrot
relativement lorsque la taille des sous-systmes augmente. On peut alors formellement sattendre
ce quun rsultat du type Thorme de la Limite Centrale sapplique, et donc ce que les
fluctuations relatives par rapport aux valeurs moyennes soient en O(N 1/2 ). Une indication utile

2.4 Approche statistique des grands systmes

25

pour estimer grossirement limportance des fluctuations rsiduelles dans un chantillon de taille
finie est celle de la longueur de corrlation, longueur caractristique de dcroissance vers zro de
lamplitude des corrlations entre les observables qui dpendent des degrs de libert des molcules
au voisinage dun point donn dans le volume occup par le systme. Pour considrer que des soussystmes associs un dcoupage du volume sont approximativement indpendants, une condition
ncessaire est que leur taille soit grande devant la longueur de corrlation.
On appelle limite thermodynamique la limite dans laquelle le nombre de particules N tend vers
linfini, ainsi que le volume V = |D| du systme, tandis que la densit numrique = N/V est
maintenue constante. Dans la limite thermodynamique, les observables du type (2.16) qui rsultent
de la somme de contributions locales peuvent tre considres comme fixes, et on retrouve alors
la description dterministe de la thermodynamique pour les systmes macroscopiques. De telles
grandeurs, qui ont une moyenne croissant proportionnellement N , sont appeles grandeurs extensives. Les grandeurs caractrisant ltat thermodynamique du systme et possdant une limite
thermodynamique finie sont dites intensives (pression, temprature, densit par exemple).
En gnral, il est trs difficile de prdire le comportement des systmes physiques dans la limite
thermodynamique. Les considrations heuristiques qui prcdent ne sont que des arguments de
plausibilit de la rgression des fluctuations dans cette limite (cest--dire que les fluctuations des
observables caractrisant ltat thermodynamique du systme deviennent ngligeables). Il convient
toutefois de vrifier ces prdictions, ce dont on peut sassurer par lexprience et la simulation
numrique. Les exceptions sont associes des phnomnes physiques particuliers, comme les
transitions de phase du second ordre.
2.4.3 Ensembles statistiques
Jusquici, nous avons suppos que lon observait lvolution dans le temps dun systme unique,
et que lon pouvait ventuellement donner le sens de probabilits aux frquences doccurrence des
microtats. Pour motiver et justifier le recours une approche probabiliste, nous avons brivement
invoqu lapparence erratique des fluctuations des grandeurs observables, et le caractre chaotique
de la dynamique hamiltonienne dun grand nombre de particules, cest--dire son imprvisibilit
pratique du fait de la sensibilit aux conditions initiales et la loi dinteraction. La physique
statistique sest construite sur un postulat fondamental (voir 3.1), et qui permet de prdire
les macrotats dquilibre (cest--dire la mesure sur E correspondant lchantillonnage par la
dynamique hamiltonienne dans la limite des temps longs). Grce ce postulat de dpart, on a
deux possibilits pour la dtermination numrique des moyennes des observables :
soit on simule directement le mouvement des particules avec la dynamique hamiltonienne,
cest la mthode de la dynamique molculaire (voir chapitre 3) ;
soit on cherche tirer au sort des microtats selon la loi de probabilit prdite par le postulat,
ce qui conduit aux mthodes de Monte-Carlo (voir chapitre 5).
Traditionnellement, la physique statistique fait appel la notion densemble statistique, qui est
une manire de se reprsenter un macrotat ou une mesure de probabilit sur E. Lide densemble
statistique renvoie une collection fictive de systmes identiques, chacun reprsentant un tirage
au sort selon une certaine loi de probabilit. On distingue diffrents types densemble selon le
modle que lon se donne pour les interactions du systme tudi avec le reste de lunivers. En fin
de compte, les proprits thermodynamiques telles que lquation dtat dun fluide, par exemple,
ne dpendent pas du rcipient qui en contient un chantillon macroscopique. Aussi sattend-on
ce que les diffrents ensembles statistiques, qui sont des constructions abstraites et commodes
pour passer de lchelle microscopique lchelle macroscopique, conduisent aux mmes rsultats
physiques dans la limite thermodynamique.
chacun des ensembles statistiques usuels correspond une mesure de probabilit dquilibre
diffrente sur E. Les ensembles usuels sont caractriss par les paramtres de contrle qui sont
utiliss pour dcrire ltat du systme. Comme on le verra, les macrotats dquilibre correspondant ces diffrents ensembles possdent certaines proprits de maximisation de lentropie. On
distingue ainsi les cas usuels suivants :

26

2 Description microscopique et statistique des grands systmes

(i) la situation dun systme isol maintenu dans un volume fixe D (avec V = |D|), compos
de N particules et dont lnergie totale E est constante, est dcrite par lensemble microcanonique ou ensemble (N, V, E). On verra que la mesure sur E qui lui correspond nest
pas la plus commode dutilisation (chapitre 3) ;
(ii) lensemble canonique dcrit la situation dun systme de N particules dans un rcipient
de volume V fix pouvant changer de lnergie avec un autre systme appel thermostat,
qui fixe sa temprature T . On parle donc aussi densemble (N, V, T ) (voir chapitre 4). La
temprature caractrise la propension du systme cder de lnergie ;
(iii) lensemble grand-canonique, ou ensemble (, V, T ), dcrit la situation dun systme, en
contact avec un thermostat, et constitu par des particules se trouvant dans un volume V
donn. Ces particules sont cependant en nombre variable, des changes ayant lieu avec un
certain rservoir de particules. Le potentiel chimique mesure la propension du systme
absorber des particules ;
(iv) lensemble isotherme-isobare, enfin, ou ensemble (N, P, T ), dcrit la situation du systme
en contact avec un thermostat et avec un rservoir de volume qui lui impose une certaine
pression P .
Ces diffrents ensembles statistiques font intervenir des changes (dnergie, de volume, de particules) avec un systme rservoir, suppos trs grand, de telle sorte que la quantit dnergie quil
fournit au systme tudi (ou le nombre de particules, ou le volume) est infime par rapport sa
taille et naffecte pas son tat. Le thermostat est un rservoir dnergie par exemple.
Beaucoup dobservables, en particuler celles que lon peut crire comme somme de contributions
locales ( la manire de (2.16)), ont, des termes de fluctuation en O(N 1/2 ) prs, la mme
moyenne dans les diffrents ensembles statistiques, pourvu que le sens macroscopique du macrotat
considr soit le mme. Toutefois leur variance, cest--dire
D
E
2
Var (A) = (A)2 = (A hAi) ,
(2.18)
est diffrente. Par exemple, la variance de lnergie totale est identiquement nulle dans lensemble
microcanonique (puisque la valeur de H(Q, P) est une constante du mouvement), alors quelle
nest pas nulle dans les ensembles canonique, grand-canonique et isotherme-isobare, en raison des
changes dnergie avec le thermostat.

2.5 Quelques observables courantes


2.5.1 Lnergie et ses fluctuations
Lobservable nergie est donne par la fonction Hamiltonien H. Cest une constante du mouvement dans lensemble microcanonique. Sa variance est alors nulle. Dans les ensembles canonique
ou isotherme-isobare, cette variance est lie aux capacits calorifiques, selon 10


Var (H)NVT
1 hHi
=
(2.19)
cv =
N
T
N kB T 2
V
pour la capacit calorifique par particule volume constant, value dans lensemble canonique,
ou


Var (H)NPT
1 hHi
cp =
=
(2.20)
N
T
N kB T 2
P
pour la capacit calorifique par particule pression constante, value dans lensemble isothermeisobare. Dans le cas de lensemble microcanonique, on peut lier cv aux fluctuations de lnergie
cintique totale
10. Ces formules seront tablies dans les chapitres suivants.

2.5 Quelques observables courantes

K=
selon

27

N
X
p2i
,
mi
i=1

1
3k 2 T 2
Var (K)NVE = B
N
2


1

3kB
2cv


.

(2.21)

2.5.2 Le tenseur des contraintes


Considrons un tat stationnaire (invariant dans le temps) et homogne (uniforme dans lespace) dun systme de N particules de masse m, maintenues lintrieur du domaine D R3 ,
de volume |D|, et interagisssant par un potentiel de paires V(r) qui ne dpend que des distances rij = |qj qi | entre les positions qi (1 i N ) des particules. On cherche valuer
la valeur du tenseur des contraintes (de Cauchy) . Pour simplifier, supposons que nous nous intressons un chantillon de forme cubique et de ct L, avec des conditions aux limites priodiques.
Ainsi, (x1 , x2 , x3 ) [L/2, L/2]3 . Nous admettons de plus que la fonction potentiel V(r) est de
porte finie rc (i.e. V(r) = 0 si r rc ), et nous nous limitons 11 rc < L/2.
Fixant une direction {1, 2, 3}, on peut valuer le flux J = (J1 , J2 , J3 ) de quantit de
mouvement, transporte en direction des x croissants, au travers du plan x = x
0 (flux sortant
).
Par
dfinition
du
tenseur
des
contraintes,
de la rgion x < x
0
2
J (x
0 ) = L ,

1 3.

Ce flux a deux origines physiques distinctes. Le mouvement des particules qui traversent la surface
(1)
(2)
x = x
0 lui apporte une contribution J , laquelle sajoute un autre terme J , d aux forces
que les particules situes dun ct de la surface (x < x
0 ) exercent sur les particules situes de
lautre ct (x > x
0 ).
La stationnarit de la quantit de mouvement moyenne contenue dans une tranche quelconque

x
1 < x < x0 montre que
Z
1 L/2
2
L =
J (x ) dx .
L L/2
(1)

Dans cette intgrale, le terme J (x ) ne contribue que pour les valeurs de x correspondant la
coordonne qi du centre dune particule i. Le flux de quantit de mouvement correspondant est
alors
Z L/2
N
X
(1)
J (x )dx =
mvi vi .
L/2

i=1

Pour le second terme, notons dabord que


X

J(2) (x
0) =
i t.q.
j t.q.

x
0
x
0

Fij ,

rc < qi < x0
< qj < x0 + rc

Fij dsignant la force exerce par la particule i sur la particule j. Dans le calcul de lintgrale de
J(2) chaque paire (i, j) telle que qi < qj contribue pour les x compris entre qi et qj . On a donc,
en symtrisant les rles de i et j,
Z L/2
1X
J(2) (x ) dx =
Fij rij e ,
2
L/2
i6=j

o la somme est tendue tous les couples (i, j) avec i 6= j, et e est le vecteur unitaire le long de
laxe des x . En rassemblant les diffrentes contributions, et en notant que le volume de la cellule
est L3 = |D|, on trouve :
11. Cette condition assure que les conditions de bord priodiques ont un sens.

28

2 Description microscopique et statistique des grands systmes

1
n=
|D|

*N
X

1X
mvi vi +
Fij rij
2
i=1

+
n

i6=j

pour tout vecteur n orthogonal lune des faces du cube, de sorte que les deux tenseurs du second
ordre concident :
*N
+
X
1
1X
=
(mvi vi ) +
(Fij rij ) .
|D| i=1
2
i6=j

Dans cette formule, le vecteur rij dsigne la diffrence qj qi entre les positions des copies les
plus proches de i et de j par la priodicit des conditions aux limites. Comme la force drive du
potentiel V, fonction de la distance rij = |rij |, on peut galement crire :
*N

+
X
1
1 X V 0 (rij )
=
(mvi vi )
rij rij
.
(2.22)
|D| i=1
2
rij
i6=j

La pression moyenne P = tr/3 est alors


1
P =
3|D|

*N
X

1X
rij V 0 (rij )
mvi2
2
i=1

+
(2.23)

i6=j

Rappelons que dans un fluide simple lquilibre, on a toujours = P 1. On montre galement


plus gnralement que
*N
+
X p2
1
i
P =
qi qi V (Q)
3|D| i=1 mi
On notera que ces formules peuvent se mettre sous la forme de sommes de contributions
locales dans la mesure o le potentiel dinteraction de paire a une porte rc . Par ailleurs, comme
on normalise la moyenne par le volume de la cellule de simulation, on a une grandeur intensive.
En labsence dcoulement (vitesse moyenne des particules nulle), chaque coordonne 1 3
de la vitesse dune particule 1 i N est telle que (voir les chapitres suivants)

kB T
(vi )2 =
.
m

(2.24)

Le premier terme de la pression donne donc kB T . Le gaz parfait est le fluide sans interactions
pour lequel V = 0, on retrouve donc son quation dtat P = kB T .
2.5.3 Microstructure et corrlations de densit
La macrotat dN , que lon suppose symtrique vis--vis des permutations des N particules,
contient toute linformation statistique sur le systme, ce qui est norme. Beaucoup dobservables
dintrt pratique peuvent tre moyennes sans faire appel une connaissance aussi dtaille.
Densit un corps
PN
Si les observables que lon cherche calculer sont de la forme A1 = i=1 1 (qi ), il nest besoin,
pour valuer la moyenne hAi, que de connatre la loi marginale de la position dune particule, obtenue en prenant la marginale de dN par rapport toutes les variables q2 , . . . , qN , p1 , p2 , . . . , pN .
On suppose que dN est domine par la mesure de Lebesgue,
dN (Q, P) = fN (Q, P) dQ dP,
et que la densit fN est rgulire. Multipliant par N et exploitant la symtrie, on dfinit la densit
un corps (1) (r) comme

2.5 Quelques observables courantes

29

Z
d(1) (r) = N

fN (r, q2 , . . . , qN , p1 , . . . , pN ) dq2 . . . dqN dP.

R
R
On a alors D (1) (r)dr = N et hA1 i = D 1 (r)(1) (r) dr. Dans un systme homogne (les fluides
simples), (1) (r) est constante et concide avec sa moyenne spatiale, qui est simplement la densit
(numrique) = N/V . Dans un solide, (1) (r) prsente des maxima bien marqus au voisinage
des sites du rseau (cristallin ou amorphe) des positions moyennes des particules.
Densit de paires
On peut gnraliser cette approche des densits n corps. Toutefois, en pratique, on sintresse essentiellement la densit 2 corps, qui peut tre mesure exprimentalement par
des techniques de diffusion de rayonnement ou de particules. Par ailleurs, un certain nombre
dobservables rsultent de la somme de contributions de paires de particules (comme lnergie potentielle
dans le cas dun potentiel dinteractions par paires), et sont donc de la forme
P
A2 = 1i,jN, i6=j 2 (qi , qj ). Leurs moyennes font apparatre la densit deux corps (2) (r1 , r2 ),
densit de la loi marginale de la paire de positions (q1 , q2 ), multiplie par N (N 1) (pour raisons
de symtries, tenant compte du nombre total de paires de D D) :
Z
hA2 i =
(2) (r1 , r2 )2 (r1 , r2 )dr1 dr2 ,
DD

avec
(2)

(r1 , r2 ) = N (N 1)

fN (r1 , r2 , q3 , . . . , qN , p1 , . . . , pN ) dq3 . . . dqN dP.

R
On a DD (2) (r1 , r2 )dr1 dr2 = N (N 1). Dans le cas dun systme homogne, (2) (r1 , r2 ) ne
dpend que de r12 = r2 r1 , que lon notera simplement r. Si le systme est de plus isotrope,
alors la densit deux corps (2) (r1 , r2 ) est une fonction scalaire de la norme r = |r| du vecteur
r = r2 r1 . On dfinit la fonction de corrlation de paires g(r) par
(2) (r1 , r2 ) = 2 g(|r2 r1 |),
o est la densit du systme. La fonction g(r) dcrit les corrlations entre positions des particules,
prises deux deux. Si une particule est place lorigine des coordonnes, alors, la distance r, la
densit de particules nest pas mais g(r), cest--dire que
particules entre les
R r le nombre moyenR de
r
distances r1 et r2 dune particule de rfrence nest pas r12 4r2 dr, mais r12 4r2 g(r) dr. Dans
un fluide g(r) tend vers 1 lorsque r +. Si r est infrieur au diamtre du nuage lectronique,
lintrieur duquel la pntration du centre dune autre molcule est interdite par une trs forte
rpulsion, on a g(r) = 0. Entre ces deux limites, g(r) prsente des oscillations caractristiques de
la structure dun liquide.
La figure 2.5 prsente ainsi la fonction g(r) dans le liquide de sphres dures pour la fraction
solide =0,49. On note que g(r) est discontinue en r = . Le premier maximum de g(r) manifeste
laccumulation de particules dans une couche plus dense une certaine distance caractristique
des premires voisines, qui compense partiellement leur exclusion autour du centre de la particule
origine. Les oscillations, rapidement amorties, plus grande distance traduisent une organisation
locale en couches successives, de moins en moins marque mesure que lon sloigne de la particule
centrale. Lamplitude de ces oscillations est une fonction croissante de la densit (ou dcroissante
de la temprature).
Avec un potentiel fortement rpulsif, mais fini, comme dans le cas du fluide de Lennard-Jones,
plutt quune rpulsion de cur dur (cest--dire une stricte exclusion strique courte distance), g(r) passe trs rapidement de zro une valeur maximale correspondant la distance des
particules proches voisines lorsque r augmente, mais sans discontinuit, comme on le voit sur la
figure 2.6.
Dans un solide cristallin, on peut galement dfinir une fonction de corrlation de paires g(r)
analogue, condition de moyenner (2) (r1 , r2 ) sur la position r1 et sur les orientations de r12 :

30

2 Description microscopique et statistique des grands systmes

(b) =0,49

(a) =0,24

Fig. 2.5. Fonction de corrlation de paires dans le fluide de sphres dures pour deux valeurs de la fraction
volumique, la plus leve ( =0,49) correspondant la coexistence avec le cristal)

Fig. 2.6. Fonction de corrlation de paires de largon liquide au voisinage du point triple (rsultat
exprimental, cit dans [20])

g(r) =

1
42 |D|

Z Z
(2) (r, r + R(r, )) d dr,
D

(2.25)

R(r, ) dsignant ici le vecteur de norme r et dorientation S. Cette fonction est reprsente
sur la figure 2.7, pour un cristal cubique faces centres de sphres dures. Les pics correspondent
aux distances entre sites du rseau, et leur largeur est lie aux vibrations des atomes autour de
leur position moyenne.
Calcul de quantits moyennes
Un exemple dobservable dont on peut valuer la moyenne avec la fonction de corrlation de
paires est lnergie potentielle dun systme avec interactions de paires :
Z +
Ep = 2N
g(r)r2 V(r) dr,
0

tandis que lnergie cintique moyenne est daprs (2.6) gale 3N kB T /2. La pression, daprs (2.23)
(et en utilisant (2.6)), est donne par

2.5 Quelques observables courantes

31

Fig. 2.7. Fonction de corrlation de paires dans le cristal de sphres dures pour la compacit = 0,55.

2
P = kB T

r3 g(r)V 0 (r) dr.

(2.26)

Le premier terme de (2.26) est la pression du gaz parfait, dans lequel les molcules sont sans
interaction. Les dinteractions rpulsives, V 0 (r) < 0, tendent logiquement augmenter la pression,
et les interactions attractives, V 0 (r) > 0, la diminuer.
Facteur de structure
On dfinit aussi la fonction de structure (ou facteur de structure), fonction du vecteur donde k
(dont la dimension est linverse dune longueur), par
Z
S(k) = 1 +
[g(r) 1] exp(ik r)dr,
R3

lorsque |g(r)1| dcrot suffisamment vite vers zro. Le facteur de structure S(k) est la transforme
de Fourier de r=0 + (g(r) 1), cest--dire de la densit de paires avec rptition
(2) (r1 , r2 ) = (2) (r1 , r2 ) + (1) (r1 )(r2 r1 ).

(2.27)

Lisotropie entrane que S(k) ne dpend que de k = |k|, et


Z
S(k) = 1 + 4

r
0

sin(kr)
[g(r) 1] dr.
k

(2.28)

Cette dfinition concide avec (2.12). Le facteur de structure est directement accessible par des
techniques exprimentales de diffusion de rayonnement X ou de neutrons. Il vrifie
lim S(k) = kB T ,

k0

(2.29)

Cette formule, qui relie corrlations de densit


et rponse une sollicitation extrieure, fait inter

1
, qui apparat dans les relations (2.8) et (2.9).
venir la compressibilit isotherme, =
P T
Les expriences de diffusion de rayons X ou de neutrons permettent de mesurer directement
la fonction de structure, et cest ainsi que la fonction de corrlation de paires reprsente sur la
figure 2.6 a t obtenue. 12

12. Les petites oscillations qui apparaissent sur le graphe aux faibles distances, l o g(r) devrait exactement sannuler, sont des artefacts du calcul numrique de la transforme de Fourier inverse dans (2.28).

32

2 Description microscopique et statistique des grands systmes

Exercices
Exercice 2.1 (Invariants de la dynamique hamiltonienne). Montrer que la quantit de
mouvement totale est conserve si on prend des conditions de bord priodiques ou si le systme
nest pas confin, lorsque le potentiel dinteraction entre les particules est invariant par translation,
au sens o, pour tout r Rd ,
V (q1 , q2 , ...qN ) = V (q1 + r, q2 + r, ...qN + r).
Montrer que le moment cintique total nest pas conserv pour des conditions de bord priodiques,
mais quil lest si le systme nest pas confin, condition que le potentiel soit invariant par rotation,
au sens o, quelle que soit la rotation R SO3 (R),
V (q1 , q2 , ...qN ) = V (Rq1 , Rq2 , ...RqN ).
Dans les deux cas, on pourra commencer par traiter le cas simple dun potentiel de paire ne
dpendant que de la distance.
Exercice 2.2. On considre deux systmes hamiltoniens du type (2.2), constitu chacun du mme
nombre N de particules, avec le mme potentiel dinteraction. La masse des particules est m1 dans
le premier et m2 dans le second. Comparer les flots 1t et 2t correspondants. Deux tels systmes
peuvent tre, en pratique, lun de molcules de mthane CH4 , lautre de mthane deutri, CD4
(le deutrium est lisotope de lhydrogne comportant un neutron dans le noyau). Quen dduit-on
sur leurs proprits thermodynamiques ?
Exercice 2.3 (Cas des potentiels en puissance inverse). On considre la dynamique (2.2),
avec le potentiel dinteraction de paire des sphres molles , donn par (1.3).
(1) Quelle est la condition sur lexposant n pour que lnergie reste une grandeur extensive ?
(2) En gnral, dans un fluide, les grandeurs thermodynamiques et les moyennes des observables ne
dpendent que de la densit et de lnergie par particule, e = E/N . Montrer dans ce cas que
P/(kB T ), e/(kB T ) et, gnralement, toute observable sans dimension, ainsi que la fonction
de corrlation de paire fonction de la distance exprime en units de 1/3 , ne dpendent que
de la combinaison e3/n .
Pour les besoins de lexercice on dfinira la temprature T partir de lnergie cintique moyenne :
hEc i =

3
N kB T.
2

3
Postulat fondamental et ensemble microcanonique

3.1 Le postulat de base et ses consquences . . . . . . . . . . . . . . . . . . . . . . . . .


3.1.1 Macrotat dquilibre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.2 Cas du gaz parfait . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.3 Distribution de Maxwell (cas gnral) . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Entropie, temprature . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.1 Dfinition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.2 Proprits de lentropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.3 Couplage thermique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.4 Les drives de la fonction entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.5 Entropie et fluctuations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.6 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Intgration des quations du mouvement et chantillonnage de la
mesure microcanonique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.1 Dynamique hamiltonienne et symplecticit . . . . . . . . . . . . . . . . . . . . . . . .
3.3.2 Approximation et flot numrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.3 Schmas dintgration usuels pour les quations diffrentielles ordinaires
3.3.4 Schmas dintgration prservant des proprits de la dynamique
Hamiltonienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.5 Comparaison numrique des diffrents schmas . . . . . . . . . . . . . . . . . . . . .
3.3.6 Application un systme physique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

34
34
35
37
38
38
39
40
40
41
42
43
43
44
45
48
55
56
59

Nous avons soulign au chapitre 2 la pertinence dune description statistique des fluctuations
des grandeurs observables associes au mouvement conservatif dune collection de particules en
interaction. La notion dquilibre thermodynamique, associe la stationnarit des processus modlisant lvolution dans le temps des observables dun systme isol, fait naturellement apparatre
un macrotat, qui est une mesure de probabilit sur lespace des phase E. Or, jusquici, nous ne
savons valuer que des moyennes sur une trajectoire (ce qui suppose un calcul numrique), au lieu
de moyennes densemble (en rfrence la notion d ensemble statistique voque au 2.4.3).
Le postulat fondamental sur lequel sest construite la physique statistique donne le macrotat
dquilibre, et permet de prdire directement certains rsultats sans passer par le calcul numrique.
De plus, cest partir de la description statistique, en termes de macrotats, que lon peut dfinir
les notions essentielles dentropie, de temprature et de transfert de chaleur, grandeurs dont les
valeurs macroscopiques ne sobtiennent pas en gnral par la moyenne dune observable approprie
(elles nont pas de sens pour un microtat).
Ce chapitre nonce ce postulat de base, et en donne certaines consquences immdiates ( 3.1).
Il rappelle ensuite comment on retrouve lentropie et la temprature ( 3.2), et enfin discute de
la mise en uvre numrique de la simulation par la technique de la dynamique molculaire, qui

34

3 Postulat fondamental et ensemble microcanonique

consiste intgrer les quations du mouvement ( 3.3). On verra que le choix dun algorithme
appropri est dict par des considrations de stabilit, du fait de la ncessit dun chantillonnage
par intgration sur des temps trs longs.

3.1 Le postulat de base et ses consquences


3.1.1 Macrotat dquilibre
La mesure dquilibre doit tre invariante par le flot t de la dynamique hamiltonienne, et rester
concentre sur la sous-varit de E correspondant aux invariants de la dynamique (ou constantes
du mouvement) : nergie E, ventuellement quantit de mouvement totale et moment cintique
(selon les conditions aux limites utilises). On suppose par la suite que seule lnergie est conserve
dans le mouvement. On note
M(E) = {(Q, P) E,

H(Q, P) = E}

la sous-varit de E des tats dnergie gale E. Notons que les sous-varits {M(E), E R}
forment une partition disjointe de E, au sens o
[
E=
M(E), M(E) M(E 0 ) = si E 6= E 0 .
ER

Le postulat fondamental stipule que la sous-varit correspondant la valeur constante E de lnergie, est entirement explore par le systme dans son mouvement, et que le macrotat dquilibre
scrit
dM(E) (Q, P)
1
1
dNVE (Q, P) =
H(Q,P)E =
,
(3.1)
(N, V, E)
(N, V, E) |H(Q, P)|
dM(E) (Q, P) tant la mesure de Lebesgue induite sur la sous-varit M(E), et (N, V, E) une
constante de normalisation (de sorte que dNVE est bien une mesure de probabilit) :
Z
dM(E) (Q, P)
(N, V, E) =
.
M(E) |H(Q, P)|
Laire de lhypersurface M(E) dans E est appele fonction de partition microcanonique. On peut
comprendre la dfinition (3.1) comme la densit de probabilit uniforme par rapport la mesure
de Lebesgue dans le domaine compris entre les hypersurfaces M(E) et M(E + E), dans la limite
E 0. On dit traditionnellement que tous les microtats de mme nergie sont quiprobables .
Ainsi, le postulat fondamental revient faire lhypothse dergodicit suivante :
Ergodicit selon une trajectoire hamiltonienne
Hypothse 3.1. La moyenne par rapport la mesure microcanonique dune observable A sur
E est donne par
1
T + T

lim

A(t (Q0 , P0 )) dt =
0

A(Q, P) dNVE (Q, P),

(3.2)

o E = H(Q0 , P0 ), la mesure dNVE est donne par (3.1), et (t ) est le flot de la dynamique
hamiltonienne (2.2).
On ne peut montrer rigoureusement une telle galit que dans quelques cas (les systmes intgrables, i.e. qui peuvent tre rsolus analytiquement). En revanche, il existe des contre-exemples
simples cette proprit. . . qui montrent donc quil faut tre prudent, et ventuellement modifier la dfinition de la sous-varit explore M(E) en la sparant en ses diffrentes composantes
connexes (voir la Remarque 3.1).

3.1 Le postulat de base et ses consquences

35

Remarque 3.1 (Un cas de non-ergodicit). On considre le potentiel unidimensionnel


V (q) = h(q + 1)2 (q 1)2 .

(3.3)

Ce potentiel a deux minima globaux V (1) = 0 en 1, et un maximum local V (0) = h en 0. On


a V 0 (1) = V 0 (0) = V 0 (1) = 0 et V 00 (1) = V 00 (1) = 8h, V 00 (0) = 4h. Remarquons que les
sous-varits M(E) pour E < h sont formes de deux composantes connexes. Partant du voisinage
dun des deux minima dnergie, on nexplore quun des deux puits, et on ne peut donc pas explorer
toute la surface dnergie {H(q, p) = E < h} (voir la figure 3.1).

1.4
1.2

Position

1.0
0.8
0.6
0.4
0.2
0.0
1.5

1.0

0.5

0.0

0.5

1.0

1.5

Energie

Fig. 3.1. Positions accessibles dans la surface dnergie H(q, p) = 0.6, pour le potentiel (3.3) avec h = 1
et une particule de masse m = 1. Noter quil y a deux composantes connexes et que si la dynamique
hamiltonienne est initialement dans une des composantes, elle y reste.

Remarque 3.2 (Non-ergodicit et comportement des grands systmes.). On constate toutefois en


pratique quen prsence dun grand nombre de particules, les situations telles que celles de la
Remarque 3.1 tendent disparatre. Mme si, en moyenne, lnergie cintique dune particule est
insuffisante pour quelle puisse franchir certaines barrires de potentiels, les changes avec le reste
du systme peuvent lui autoriser des fluctuations suffisantes pour autoriser de tels mouvements.
Dans les grands systmes, les violations manifestes du postulat fondamental sont en gnral associes des phnomnes physiques particuliers, qui mritent une tude spcifique. Ce sont des
barrires entropiques (et non nergtiques comme dans la Remarque 3.1) qui empchent un chantillonnage correct.
Un exemple clbre concerne les transitions de phase, dans lesquelles un choix sopre de la
direction dun certain paramtre dordre comme lorientation de molcules allonges dans le
cas de la transition isotrope/nmatique cite au 1.3. Le temps de relaxation des fluctuations de
cette orientation augmente alors exponentiellement avec la taille du systme. La perte dergodicit
survient aussi dans le cas de la transition vitreuse, qui est une augmentation brutale du temps
de relaxation des fluctuations de la structure dun fluide lorsquil est refroidi et comprim trop
vite pour que les particules puissent sorganiser sur le motif cristallin correspondant la phase
thermodynamiquement stable.
3.1.2 Cas du gaz parfait
En gnral on ne sait pas calculer (N, V, E), ni valuer la mesure dune partie de E selon (3.1).
Une exception est le cas du gaz parfait, pour lequel les molcules sont sans interaction. Dans ce

36

3 Postulat fondamental et ensemble microcanonique

cas, pour un gaz confin dans un volume V = |D| donn,


H(Q, P) =
On a alors
(N, V, E) =

VN

N
X
p2i
.
2m
i=1

(n, R) =

n n/2 Rn1
,
(1 + n2 )

La formule de Stirling montre que (x)

(3N,

2mE),
!
o on a not (n, R) laire de la sphre de rayon R dans Rn :
h3N N

(3.4)

tx1 exp(x) dt.

(x) =
0
1

2 xx 2 exp(x) lorsque x +.

Distribution des positions


La mesure (3.1) assure luniformit de la densit de Q = (qi )1iN dans lespace des configurations V N . Ainsi, autour dun point Q de V N tel que chaque qi appartienne une moiti
donne du volume accessible, la probabilit de prsence est la mme quau voisinage de Q tel que
chaque volume moiti contienne environ la moiti des particules. Cela nest pas contradictoire avec
lhomognit macroscopique de la distribution des molcules dans le volume accessible, car les
microtats qui contreviennent nettement une telle homognit correspondent un volume trs
faible dans lespace des configurations DN . En effet, les valeurs de Q telles que chaque particule
soit dans une moiti donne du domaine accessible ne constituent que la fraction 2N du volume
N/2
total dans lespace des configurations DN , ngligeable devant le nombre CN des configurations
ayant exactement N/2 particules dans chaque moiti du volume.
Distribution des impulsions
Daprs le macrotat dquilibre pour le gaz parfait, on a une expression de la densit de
probabilit de la quantit de mouvement dune particule donne :
P (p) = V h

(N 1, V, E
(N, V, E)

p2
2m )

En utilisant (3.4) et la formule de Stirling (lorsque N +),




1
p2
P (p) =
exp
,
2mkB T
(2mkB T )3/2

(3.5)

formule dans laquelle T (la temprature) est fixe par lnergie selon
E=

3
N kB T.
2

(3.6)

La densit (3.5) dfinit la distribution de Maxwell pour la quantit de mouvement dune particule.
On retrouve ainsi la formule (2.6) de la vitesse quadratique moyenne.
Cas des sphres dures
Dans le cas du modle de sphres dures, (3.1) nous donne directement aussi un rsultat duniformit de la probabilit dans la partie de lespace des configurations telle quaucune paire de
particules ne sinterpntre, la distribution des impulsions tant la mme que pour le gaz parfait.

3.1 Le postulat de base et ses consquences

37

Dans (3.4), il faut remplacer V N = |D|N par la mesure Q, sensiblement plus petite, du domaine
de DN dans lequel les sphres ne sinterpntrent pas. On a :
(N, V, E) =

Q
(3N,
2mE).
h3N N !

(3.7)

Une approximation de Q est, pour les faibles densits,


N

Q ' V N (1 4) ,

(3.8)

o la compacit dfinie par (2.7) fait intervenir le volume exclu 1 autour du centre de chaque
sphre.
Notons aussi quen raison de la factorisation (3.7) de la fonction de partition microcanonique,
la distribution de Maxwell pour les vitesses ou les impulsions sapplique directement aussi dans le
cas des sphres dures.
3.1.3 Distribution de Maxwell (cas gnral)
Pour un systme avec des interactions distance, lnergie totale E se partage entre nergie
cintique Ec dpendant de P et nergie potentielle Ep , dpendant de Q.
La distribution de Maxwell sapplique quelles que soient les interactions des particules, et nest
pas limite au gaz parfait. On verra au chapitre 4 que si on considre lensemble canonique, ce
rsultat est immdiat. Dans le cas microcanonique, on peut sen convaincre en notant quaussi
bien lnergie potentielle que lnergie cintique sont des variables extensives, sommes de multiples
contributions locales, et quelles fluctuent trs peu. Si on les considre comme fixes leurs valeurs
les plus probables, on est ramen au cas prcdent.
Remarquons galement, toujours dans la limite des grands systmes, lindpendance statistique
entre impulsions et positions des particules, et lindpendance entre diffrentes coordonnes de P.
Cette indpendance contraste avec les corrlations des positions des particules voisines, dcrites
en partie par la fonction de corrlation de paires introduite au 2.5.3.
Ordres de grandeur
Pour une temprature de lordre de 300 K, selon (3.5) ou (2.6), la vitesse totale en moyenne
quadratique
s
 r
p2
3kB T
=
m2
m
est de lordre de 600 m/s pour la molcule deau H2 0 (masse molaire 18 g/mol), 500 m/s pour la
molcule dazote N2 (masse molaire 28 g/mol), 470 m/s pour la molcule doxygne O2 (masse
molaire 32 g/mol). 2
Limite classique de la mcanique quantique pour un ensemble de particules
Les phnomnes de petite chelle chappent la mcanique classique et doivent tre traits
par la physique quantique. Anticipant sur la seconde partie de ce cours, citons la fameuse relation
dindtermination de Heisenberg. Pour une particule donne, on ne saurait dterminer exactement
1. En fait le centre dune sphre est exclu de lintrieur de la sphre dont le rayon est , cest--dire le
diamtre dune sphre dure. Le volume exclu total est donc 4V si V est le volume du systme.
2. Ces valeurs leves des vitesses instantanes ne signifient pas que, dans un gaz ou un liquide, les
molcules parcourent rapidement des distances importantes. En effet, le mouvement des molcules, aprs
un certain temps doubli de la vitesse initiale, sous leffet des interactions, apparat comme erratique
et est bien dcrit comme un mouvement
brownien, de sorte que la distance parcourue pendant le temps

t  est alatoire et dordre t. Ce phnomne est tudi au chapitre 6.

38

3 Postulat fondamental et ensemble microcanonique

sa coordonne q et sa quantit de mouvement dans la mme direction, p . Les incertitudes q


et p sur les composantes q et p de la position et de la quantit de mouvement dune particule
sont lies par
~
q p .
(3.9)
2
En raison de ces effets quantiques, la notion mme de trajectoire classique est dnue de sens
petite chelle. Pour quun traitement classique reste justifi, il faut que lon puisse dcrire le
mouvement de la particule avec, simultanment
qx trs petit devant la distance typique 1/3 entre deux particules voisines ;
px trs petit devant la valeur typique mkB T de p .
Une condition ncessaire est donc mkB T 1/3  ~. On a coutume de lexprimer en recourant
la longueur donde thermique (ou de de Broglie), donne par
r
2
=~
.
(3.10)
mkB T
Ainsi, le rgime classique correspond
1/3  .

(3.11)

La longueur est de lordre dune fraction d pour les petites molcules (eau, azote, dioxyde
de carbone,. . . ) et les atomes (sauf lhydrogne). Comme elle varie en m1/2 et T 1/2 , il est
cohrent de ngliger les effets quantiques pour les noyaux atomiques et les molcules, sauf basse
temprature, ou densit trs leve (cas des toiles naines). Les lectrons, en revanche, doivent
tre traits par la mcanique quantique.

3.2 Entropie, temprature


3.2.1 Dfinition
Pour un systme isol, dont la statistique est dcrite dans lensemble microcanonique, on dfinit
lentropie par la formule de Boltzmann :
S(N, V, E) = kB ln (N, V, E).

(3.12)

La temprature T est alors donne par :


1
=
T

S
E


.

(3.13)

N,V

Cas du gaz parfait


Pour le gaz parfait, un calcul (que lon pourra refaire en exercice) dans lequel on ne garde que
les termes dominants (dordre N ) donne, en utilisant la formule de Stirling et en notant e = E/N
lnergie par particule :

3/2 !
3
S
5
3
= ln h
.
(3.14)
N kB
2
4me
On en tire la temprature par (3.13) :
T =

2e
,
3kB

et on retrouve lnergie du gaz parfait


E=

3
N kB T,
2

(3.15)

3.2 Entropie, temprature

39

rsultat que lon avait anticip avec les formules (2.6) et (3.6). Remplaant e par T dans (3.14),
lexpression de lentropie en fonction de la densit et de la temprature fait rapparatre la longueur
donde thermique :

5
S
= ln 3 .
(3.16)
N kB
2
3.2.2 Proprits de lentropie
Lentropie dfinie par (3.12) est bien, on peut le vrifier, celle de la thermodynamique macroscopique. Bien que le lien entre physique statistique microscopique et termodynamique macroscopique
classique soit assez peu dtaill dans ce cours (nous renvoyons aux rfrences [8, 23, 2, 25] pour
des prsentations plus dveloppes), nous indiquons ici quelques proprits fondamentales et utiles
de lentropie, en signalant au passage, lorsquil y a lieu, la cohrence avec la thermodynamique
macroscopique.
Extensivit de lentropie et robustesse du calcul
Lentropie du gaz parfait est extensive (i.e. proportionnelle N ). Il en est de mme, nous
ladmettrons, pour lentropie dun systme avec des interactions, la fonction de partition tant
domine par les termes exponentiels de lordre de exp(N ) avec une constante . Cette extensivit
entrane par (3.13) lintensivit de la temprature.
On peut considrer, pour justifier lextensivit de lentropie, un argument de dnombrement
de configurations accessibles. Soit un dcoupage dun systme macroscopique en p sous-systmes
identiques, identifis par le volume quils occupent ou bien par les particules quils contiennent
(comme dans le 2.4.2). Ils occupent chacun un volume V /p, et contiennent en moyenne N/p
particules et lnergie E/p. Si on nglige les interactions entre sous-systmes diffrents, ainsi que
les fluctuations de lnergie et du volume ou du nombre de particules dans un sous-systme (car elles
naffectent quune proportion ngligeable de lensemble des degrs de libert), on peut remplacer
(N, V, E) par [(N/p, V /p, E/p)]p . On en dduit que lentropie totale est proportionnelle p, et
donc N .
On notera quune erreur dun facteur N dans le calcul de (o est constant), erreur
norme si N est de lordre du nombre dAvogadro, est sans consquence sur le calcul de lentropie,
proportionnelle au logarithme de . De mme, on peut remplacer la surface {H(Q, P) = E}, dans
le calcul de , par le volume tout entier donn par {H(Q, P) E}, sans en affecter lvaluation
de la partie extensive (dominante) de lentropie. On le vrifiera en exercice dans le cas du gaz
parfait.
Enfin, la suppression du facteur h3N dans la mesure de lespace des phases dcale la valeur
de lentropie dune constante 3N ln h. Sans considration de mcanique quantique, lentropie dun
systme classique nest dtermine qu une constante prs.
Extensions de la dfinition
Sous la forme (3.12), lentropie nest dfinie a priori que pour le macrotat de lquilibre
microcanonique. Par extension, on a coutume dassocier une valeur de lentropie tous les
macrotats similaires,
cest--dire pour des mesures de Lebesgue induites sur des sous-varits

{(Q, P) E A1 (Q, P) = A01 , . . . , Ap (Q, P) = A0p }. Le plus souvent, les observables Ai ont un
sens macroscopique, et/ou sont associes certaines fractions macroscopiques du systme. On
crit S(N, V, E, A0 ) sans plus de prcision pour lentropie dun tel macrotat, en se fondant sur la
dfinition (3.12) de lentropie comme logarithme du volume dans lespace des phases. La dfinition
la plus gnrale de lentropie est celle de la thorie de linformation (voir le chapitre 4).

40

3 Postulat fondamental et ensemble microcanonique

3.2.3 Couplage thermique


Considrons deux systmes macroscopiques pouvant changer de lnergie, mais faiblement
coupls, et isols du milieu extrieur, contenant respectivement N1 et N2 particules, dans des
volumes fixs V1 et V2 . Leurs nergies E1 et E2 varient en raison des changes, mais la somme
E = E1 + E2 est fixe. La fonction de partition microcanonique, peut se factoriser, en trs bonne
approximation, comme
(N, V, E) = A1 (N1 , V1 , E 1 )2 (N2 , V2 , E E 1 ),

(3.17)

o A est un terme born par (N1 N2 )a (avec une certain a < + indpendant des Ni ) et E i
dsigne la valeur la plus probable de Ei . 3 Lnergie E 1 ralise donc le maximum du produit
1 (N1 , V1 , E 1 )2 (N2 , V2 , E E1 ), ou de son logarithme, qui nest autre que la somme des entropies
des deux sous-systmes. On a ainsi
S1 (N1 , V1 , E 1 ) S1 (N2 , V2 , E E 1 )
+
= 0,
E1
E2
cest--dire :

1
1
=
.
T1
T2

Lquilibre thermique (cest--dire lquilibre vis--vis des changes dnergie au moyen dun petit
hamiltonien de couplage) entre deux systmes impose lgalit de leurs tempratures. On retrouve
l une proprit caractristique de la temprature en thermodynamique.
3.2.4 Les drives de la fonction entropie
La dmarche conduisant la dfinition de la temprature, et tablissant lgalit des tempratures entre deux systmes changeant de lnergie par un faible couplage peut tre reproduite
pour le volume, ou bien encore pour le nombre de particules, pourvu que lon sen donne une
dfinition convenable, comme des observables. Leur point commun est dtre des grandeurs qui
se conservent dans les changes, de sorte que si deux sous-systmes changent du volume on a
V = V1 + V2 constant, et sils changent des particules cest N = N1 + N2 qui est constant.
Lorsquil sagit de deux parties dun mme corps, il est normal de considrer que de tels transferts
impliquent aussi des changes dnergie. En plus de lgalit des tempratures, la maximisation
de (3.17) par rapport au partage du volume, N1 et N2 constants, donne alors :




S1
S2
=
.
V1 N1 ,E1
V2 N2 ,E2
Si on identifie S lentropie de la thermodynamique macroscopique des fluides, on sait que


S
P
= ,
(3.18)
V N,E
T
o P est la pression. Lquilibre thermodynamique vis--vis des changes de volume conduit donc
lgalit des pressions, en plus de celle des tempratures. La formule (3.18), applique au gaz
parfait, dont lentropie est donne par (3.16), donne bien
P = kB T.

(3.19)

3. Cette valuation de partir des valeurs les plus probables des observables macroscopiques E1 et
E2 est similaire celle que lon a voque pour justifier la distribution de Maxwell pour les quantits
de mouvement dans le cas gnral : on avait alors argu que lon pouvait en permire approximation
considrer lnergie cintique et lnergie potentielle comme fixes.

3.2 Entropie, temprature

41

Si on identifie plutt les deux systmes macroscopiques par leur localisation spatiale, fixant
exactement leurs volumes V1 et V2 mais autorisant des changes de particules, alors la maximisation
de lentropie totale donne lgalit des tempratures de des potentiels chimiques , car


S

= .
N V,E
T
Pour comprendre que la pression dfinie avec (3.18) est bien la pression habituelle, on peut
concevoir un dispositif idal (appel piston adiabatique dans la prsentation traditionnelle de
la thermodynamique) qui est une paroi sur laquelle on exerce une force constante, correspondant
une pression impose P , mais dpourvue dentropie. La maximisation de lentropie totale, alors
gale celle du systme, impose






S
S
S
P
dS(N, V, E P V )
E
=0=
+
=
.
dV
V E,N
E V,N V
V E,N T
Notons quen rcrivant les drives de lentropie values ci-dessus sous la forme
dE = T dS P dV,
on retrouve la dcomposition dune variation dnergie du systme en somme du travail W =
P dV et de la chaleur Q = dS
T reus. On reverra au passage ces notions dans le chapitre 4.
3.2.5 Entropie et fluctuations
Lentropie est jusquici calcule comme intgrale de la mesure microcanonique sur certains
ensembles, correspondant des valeurs imposes de certaines observables macroscopiques. Dans
ce calcul on peut considrer les observables macroscopiques extensives comme fixes leur valeur
la plus probable, dont le voisinage immdiat concentre la distribution de probabilit. En raffinant
lgrement ce calcul, on peut valuer la densit de probabilit dune telle variable A au voisinage
de sa valeur la plus probable A. Lentropie S(A) est maximale pour A = A, et on peut crire
S(A) = S(A)
ce qui correspond

1 2S
(A) (A A)2 ,
2 A2



1 2S
2
(A) exp
(A) (A A) ,
2kB A2

o la drive seconde est value pour A = A. La quantit A est donc distribue selon une loi
gaussienne de moyenne A et de variance

Var (A) =

2 (S/kB )
A2

1
.

Si A est extensive (A N ), alors on a bien Var (A) N , et donc Var (A) /N est intensive.
Lentropie S doit tre maximale pour la valeur A la plus probable de lobservable macroscopique
A, et donc sa drive seconde doit tre ngative. Dans le cas contraire, il se produirait une volution
spontane tendant augmenter lentropie, et ltat de dpart caractris par la valeur A serait
instable.
On peut raisonner de la mme faon avec p observables scalaires, formant un p-uplet (Ak )1kp .
On relie alors [23] les covariances de ces variables la matrice hessienne de lentropie. La stabilit
requiert quelle soit dfinie ngative.

42

3 Postulat fondamental et ensemble microcanonique

Preuve de la formule (2.21).


Lnergie E tant fixe, on peut crire lentropie fonction de lnergie cintique comme la somme
de lentropie associe aux quantits de mouvement et de lentropie associe aux degrs de libert
de position, les nergies correspondantes tant Ec et lnergie potentielle Ep = E Ec .
On crit ensuite lentropie totale S comme la somme dun terme Sc (Ec ) associ aux quantits
de mouvement et dun terme Sp (Ep ) associ aux variables positions, et le dveloppement au second
ordre donne :
1 (1/T )
1 (1/T )
(Ec E c )2
(Ep E p )2
2 Ec
2 Ep


1 (1/T ) (1/T )
= Sc (E c ) + Sp (E p )
+
(Ec E c )2 .
2
Ec
Ep

S = Sc (E c ) + Sp (E p )

La capacit calorifique volume constant par particule cv se dcompose en une partie lie
(id)
lnergie cintique, cv (on note id pour idale , cest la valeur de cv dans le gaz parfait ou
(ex)
gaz idal) et une partie provenant de lnergie potentielle, que nous notons cv (pour en excs
(id)
E
relativement au gaz parfait). La valeur cv = N1 Tc = 32 kB tant connue, on peut rcrire :
(1/T )
2
=
et
Ec
3N kB T 2

1
(1/T )
1
=
= (ex)
.
3
Ep
(N cv 2 N kB )T 2
N cv T 2

On a donc pour la densit de probabilit de Ec , avec E c = 32 N kB T


 


1
1
3
2
P (Ec ) exp
+
(E

N
k
T
)
,
c
B
3N kB T 2
2N cv 3N kB T 2
2
dont on dduit la formule cherche (2.21).
3.2.6 Discussion
On verra au chapitre 4 que la mesure canonique permet de remdier certains inconvnients de
lapproche microcanonique, lis la contrainte de lnergie totale fixe. En effet, cette contrainte
impose que la mesure dquilibre dans E est concentre sur une sous-varit. Il existe ainsi des corrlations entre les degrs de libert Q, P du systme mme lorsquils sont en principe indpendants,
cest--dire avec un Hamiltonien de la forme (2.17).
Bien que lon ait pu rapidement retrouver certaines notions de la thermodynamique macroscopique, des questions dapparence dlicate doivent tre souleves. Ce cours nentend nullement
clore des dbats anciens et complexes ce propos, et ces difficults connues nont pas empch le
dveloppement de la physique statistique et le succs des simulations numriques. On pourra se
reporter aux rfrences [2, 10, 25].
Ergodicit et degrs de liberts indpendants
Ainsi, prcisment dans le cas dun Hamiltonien prsentant une dcomposition selon (2.17), on
peut noter que le postulat fondamental est en toute rigueur injustifi. En fait, chacune des nergies
des sous-systmes est, en principe, une constante du mouvement, et lergodicit est manifestement
viole. Ainsi, chaque molcule dun gaz parfait devrait conserver indfiniment la mme quantit
de mouvement et la mme nergie cintique, et on voit bien mal comment sa vitesse pourrait
chantillonner la distribution de Maxwell au cours du temps...
Cest un dilemne classique de la physique statistique : avec des degrs de libert indpendants,
les moyennes selon les macrotats dquilibre se calculent aisment, mais le systme ne peut pas
se mettre lquilibre ! En pratique, on suppose que de trs faibles interactions existent, que lon
nglige lorsque lon crit le hamiltonien du systme, mais qui, long terme, parviennent en
thermaliser les diffrentes parties. Ainsi, dans le cas du gaz parfait, on admet loccurrence de rares
collisions entre les molcules.

3.3 Intgration des quations du mouvement et chantillonnage de la mesure microcanonique

43

Irrversibilit
Une autre classe de difficults, plus gnrale et plus srieuse, apparat lorsque lon cherche
retrouver la notion thermodynamique dirrversibilit, qui est associe laugmentation de lentropie de la thermodynamique. Nous avons invoqu une condition dentropie maximale en discutant,
par exemple, de la rpartition de lnergie entre deux systmes coupls. Par ailleurs, nous avons
dfini lentropie commme logarithme dun certain volume dans E (admettons que lon donne une
petite paisseur aux sous-varits sur lesquelles on concentre la mesure, quitte la faire tendre
vers zro par la suite). La dynamique hamiltonienne conserve les volumes dans E. Par consquent
lentropie, logarithme du volume sur lequel on rpartit uniformment la densit de probabilit,
est constante. Comment peut-on donc atteindre ltat dentropie maximale, si on part dun tat
dentropie infrieure, dans lequel, par exemple, deux parties macroscopiques du systme sont des
tempratures diffrentes ?
Une explication possible est rechercher dans lemploi de deux notions dentropie diffrentes,
une entropie microscopique lie aux dtails des mouvements dans lespace des phases, et une
entropie macroscopique, qui serait insensible aux dtails fins de la rpartition de la mesure dans E.
Si, t = 0, la mesure est uniforme dans un domaine rgulier A E, alors elle sera uniforme t > 0
dans t (A), qui est une partie de E de mme volume, mais, en raison du caractre chaotique de
la dynamique, de forme beaucoup plus complexe, avec des feuillets et des replis. De faon image,
si A est une boule pleine, alors t (A) ressemble davantage une boulette de papier froiss. Vue
grande chelle, on peut ainsi lui attribuer un volume plus grand, et on peut considrer que cest
un tel volume qui doit tre pris en compte pour valuer lentropie macroscopique. Ainsi, cette
dernire peut augmenter.
En thermodynamique, laugmentation de lentropie est associe lirrversibilit. Les transformations rversibles sont celles qui maintiennent constante lentropie dun systme isol.

3.3 Intgration des quations du mouvement et chantillonnage de la


mesure microcanonique
3.3.1 Dynamique hamiltonienne et symplecticit
Nous avons prsent au 2.2 les quations de Hamilton et certaines des proprits du flot
(t )tR qui en dcoulent. Nous avons insist sur limportance que lon doit attacher aux proprits
statistiques des ensembles de trajectoires plutt quaux trajectoires individuelles, do lintrt de
bien connatre les caractristiques du flot. Avant de sattaquer la rsolution numrique approche
des quations du mouvement, nous allons complter la liste des proprits de la dynamique hamiltonienne (voir 2.2.2), en mentionnat en particulier une proprit structurelle trs importante, la
symplecticit, qui, comme on le verra, dtermine le choix dun schma de discrtisation appropri.
Posant y = (Q, P) R2N d , on peut rcrire la dynamique de Newton sous la forme dune
quation diffrentielle ordinaire :


dy
Q H(Q, P)
= J H = J
,
(3.20)
P H(Q, P)
dt
o J est la matrice relle carre de taille 2dN


0 IdN
J=
.
IdN 0
On remarque que J est antisymtrique et orthogonale (i.e. J T = J = J 1 ), et donc de dterminant gal 1.
Dfinition 3.1 (Symplecticit). Pour un ouvert U E, une application g : U R2dN est
symplectique si la matrice jacobienne g 0 (Q, P) vrifie

44

3 Postulat fondamental et ensemble microcanonique

[g 0 (Q, P)]T J g 0 (Q, P) = J

(3.21)

pour tout (Q, P) U .


Rappelons qutant donne une application g(Q, P) = (g1 (Q, P), . . . , g2dN (Q, P))T , sa matrice
jacobienne g 0 (Q, P) est dfinie par
g
1
q1

g 0 (Q, P) =

2dN

q1

g1
q2dN

..
.
.

g2dN
...
q2dN
...

On montre alors
Thorme 3.1 (Symplecticit du flot hamiltonien). Soit H(Q, P) une fonction de C2 (U )
(U E ouvert). Alors, pour tout t fix tel que t existe, le flot t est une transformation symplectique.
Preuve. Soit le flot t de (3.20). On remarque tout dabord que





d t (y)
dt (y)

t (y)
=
=
J H(t (y)) = J 2 H(t (y))
.
dt
y
y
dt
y
y
Ainsi, notant : t 7

t (y)
, on a
y


d
(t)T J (t) = (t)T 2 H(t (y)) J T J (t) + (t)T 2 H(t (y)) J 2 (t) = 0,
dt
en utilisant J T = J. Ceci montre que (y)T J (y) = (0)T J (0) = J, ce qui permet de
u
conclure la symplecticit.
t
En fait, on peut mme montrer quune EDO est localement hamiltonienne si et seulement
si son flot est symplectique. La symplecticit permet de retrouver directement la proprit de
conservation du volume dans lespace des phases. En effet, si g est une application symplectique,
le dterminant de sa matrice jacobienne vaut 1 daprs (3.21). Cette conservation du volume explique de manire heuristique les bonnes proprits numriques de certains schmas dintgration :
en effet, les trajectoires partant du voisinage dun point ne peuvent pas diverger dans toutes les
directions, sans quoi, le volume balay dans lespace des phase augmenterait. La rversibilit en
temps est galement importante de ce point de vue : partant du voisinage dun mme point, si on
a divergence de toutes les trajectoires dans un sens du temps, on a convergence dans lautre. . . ce
qui est absurde !
3.3.2 Approximation et flot numrique
On cherche ici intgrer numriquement (2.2) (ou (3.20)), afin dobtenir des moyennes dobservables, ou bien des fonctions de corrlation dpendant du temps. Etant donn un pas de temps
t, une intgration numrique dune EDO
dy
= f (y).
dt

(3.22)

consiste approximer la solution exacte y(tn ) = nt (y 0 ) au temps tn = nt par une solution


approche y n . Cette solution est obtenue par itration dune mthode numrique t . On a ainsi,
pour une mthode un pas (le calcul de y n+1 ne demande que la connaissance de y n ),

3.3 Intgration des quations du mouvement et chantillonnage de la mesure microcanonique

45

y n+1 = t (y n ).

y(tn+1 ) = t (y(tn )),


Or, la solution exacte est telle que
Z

y(tn+1 ) = y(tn ) +

f (y(tn + s)) ds.

(3.23)

Une approximation du flot t par un flot numrique t revient donc trouver une approximation
convenable de (3.23).
La convergence dune mthode numrique est souvent caractrise sur une trajectoire, i.e. pour
une condition initiale donne y 0 , et en intgrant sur un temps fix T . On va voir cependant que
la notion de convergence sur une trajectoire nest pas la bonne notion : on va lui prfrer la
convergence dun ensemble de trajectoires et la prservation des proprits particulires du flot
hamiltonien. On parlera ainsi dintgration numrique gomtrique pour caractriser les schmas
prservant des invariants particuliers de la dynamique hamiltonienne. En particulier, comme on
cherche chantillonner des sous-varit qui sont des surfaces de niveau du Hamiltonien, il est
important de bien prserver lnergie du systme au cours du temps, et ce, pour des temps trs
longs sans quoi la sous-varit chantillonne aura peu de rapport avec la sous-varit associe
la dynamique (2.5).
Avant de se lancer dans ltude des schmas numriques, prcisons tout dabord un critre
trs important en pratique : le cot de calcul. En dynamique molculaire, le principal cot dune
itration de la mthode numrique est lvaluation de la force V (q). On peut sen convaincre
aisment en prenant lexemple dun systme comme le fluide de Lennard-Jones, o, en labsence
dhypothse supplmentaires, le calcul des interactions demande deffectuer une boucle sur toutes
les paires de particules, ce qui reprsente un cot de calcul en O(N 2 ).
3.3.3 Schmas dintgration usuels pour les quations diffrentielles ordinaires
Comme les quations de Newton peuvent se mettre sous la forme dune EDO, on peut utiliser
tous les schmas dintgration usuels pour intgrer numriquement (3.20). Nous allons prsenter
successivement les schmas dEuler explicite et implicite, ainsi que des schmas plus fins tels que
les schmas de Runge-Kutta dordres 2 et 4. Ce dernier schma est gnralement un trs bon
schma, et constitue lalgorithme par dfaut de nombreux codes dintgration dEDO gnrales.
Ltude de ces schmas demande de considrer :
lordre des schmas numriques, qui traduit la prcision de la trajectoire calcule, et la
petitesse des erreurs dintgration locales ;
la stabilit (ventuellement la stabilit linraire), qui traduit la robustesse du schma par
rapport laccumulation des erreurs dintgration locales et darrondi.
Les notions dordre, de stabilit, et de stabilit linaire, sont rappeles dans lAppendice B. On
peut dores et dj sentir que la seconde notion, celle de stabilit, sera trs importante car on
souhaite calculer des moyennes sur de longues trajectoires, en chantillonnant correctement le
macrotat dquilibre microcanonique.
Remarque 3.3. Le lecteur prendra garde quil ny a pas de contradiction pour un schma numrique
tre la fois consistant (convergence trajectorielle temps dintgration T fix, dans la limite
t 0) et (linairement) instable (explosion de la norme pour T + t fix).
Remarque 3.4. Il est videmment souhaitable quun schma numrique soit (linairement) stable.
Ce nest toutefois pas une condition suffisante pour tre un bon schma en dynamique molculaire !
On souhaite en effet que le schma conserve bien lnergie du systme, et donc quil ne soit pas
dissipatif.
Schma dEuler explicite.
Le schma dEuler explicite scrit pour une EDO gnrale de la forme (3.22),

46

3 Postulat fondamental et ensemble microcanonique

y n+1 = y n + tf (y n ).
Ceci correspond une approximation de lintgrale apparaissant dans (3.23) par une formule de
quadrature o lon nutilise que linformation lextrmit gauche de lintervalle en temps. Pour
les quations de Newton (2.5), cela conduit au schma
 n+1
q
= q n + tM 1 pn ,
(3.24)
n+1
p
= pn tV (q n ).
On a ainsi


1
Euler
p, p tV (q) .
t (q, p) = q + tM

On vrifie facilement que le schma dEuler explicite est dordre 1 (voir lExample B.1). En
effet,
Z


t


Euler
f (y(s)) ds f (y(0))t
|y(t) t (y(0))| =
0

Z t

|f (y(s)) f (y(0))| ds
Z

0
t

s|y 0 ((s))| ds,

avec (s) ]0, s[, en utilisant une ingalit des accroissement finis. On en dduit que la diffrence
entre la solution exacte intgre sur un pas de temps t et lapproximation numrique donne par
le schma est en O(t2 ), ce qui signifie en effet que le schma est dordre 1 (voir la Dfinition B.2).
Retenons galement de ce calcul que la vrification de lordre dun schma consiste en pratique
effectuer des dveloppements de Taylor, et tudier quels termes se compensent. On montre
galement facilement que le schma dEuler explicite est stable (au sens de la Dfinition B.3),
cest--dire robuste des erreurs darrondi et/ou sur les conditions initiales, condition dintgrer
sur un temps T fini et donn a priori. Finalement, ce schma est donc convergent, au sens de la
Dfinition B.4.
En revanche, le schma dEuler explicite est toujours linairement instable en temps long
(Rappelons que cette notion est dfinie au B.3). On peut sen convaincre facilement dans le cas
dune particule de masse 1 soumise au potentiel harmonique V (q) = 21 2 q 2 en dimension 1, auquel
cas on peut rcrire (3.24) sous la forme matricielle
 n
q
y n+1 =
= A(t)y n
(3.25)
pn


avec
A(t) =


1
t
.
2 t 1

p
La matrice A(t) a pour valeurs propres = 1 it. Comme | | =
1 + 2 t2 > 1
si t > 0, on en dduit bien que le schma est inconditionnellement linairement instable. En
particulier, partant dune condition initiale (q 0 , p0 ) donne, on a divergence de lnergie :
H(q n , pn ) (1 + 2 t2 )n H(q 0 , p0 ) +
lorsque n +. Ainsi, on nchantillonne pas du tout la surface dnergie constante {H(q, p) =
H(q 0 , p0 )}. Lexprience numrique montre galement que lnergie diverge au cours du temps
pour des potentiels non-linaires gnraux.

3.3 Intgration des quations du mouvement et chantillonnage de la mesure microcanonique

47

Schma dEuler implicite.


Le schma dEuler implicite scrit pour une EDO gnrale de la forme (3.22),
y n+1 = y n + tf (y n+1 ).
Ceci correspond une approximation de lintgrale apparaissant dans (3.23) par une formule de
quadrature o lon nutilise que linformation lextrmit droite de lintervalle en temps. En
pratique, cela demande de rsoudre un problme de point fixe non-linaire, ce qui est plus coteux
quune itration simple dun schma explicite. Toutefois, lexprience montre quon peut utiliser
des pas de temps t plus grands quavec un schma explicite.
Pour les quations de Newton (2.5), cela conduit lalgorithme
 n+1
q
= q n + tM 1 pn+1 ,
(3.26)
n+1
p
= pn tV (q n+1 ).
On vrifie facilement que le schma dEuler implicite est dordre 1 et convergent. Concernant la
stabilit linaire en temps long, on peut rcrire (3.26) sous la forme matricielle (3.25) avec


1
1
t
A(t) =
.
2
1 + 2 t2 t 1
Il est en effet remarquable que dans le cas linaire la mthode dEuler implicite peut tre rcrite
de manire explicite 4 . La matrice A(t) a pour valeurs propres = (1 it)1 . Comme
 1
| | = 1 + 2 t2 2 < 1 si t > 0, on en dduit que le schma est inconditionnellement
linairement stable. Cependant, on a convergence de lnergie vers 0 lorsque n +, puisque
H(q n , pn ) (1 + 2 t2 )n H(q 0 , p0 ).
Pour un potentiel gnral, on sattend encore avoir un schma dissipatif, ne se comportant pas
bien sur des temps longs. Lexprience numrique confirme cette conjecture.
Schma de Runge-Kutta dordre 4.
Les mthodes dintgration numrique de Runge-Kutta sont trs utilises pour lintgration des
EDO, particulirement dans le cas dEDO non-autonomes y = f (t, y). Le schma de Runge-Kutta
dordre 4 suivant (prsent dans le cas dune EDO autonome (3.22)) est trs utilis en pratique :
n
Y
= yn

n+1
Y
= y n + f (Y n ) t/2
n+2
Y
= y n + f (Y n+1 ) t/2

n+3
Y
= y n + f (Y n+2 ) t
et on pose alors
y n+1 = y n + t

f (Y n ) + 2f (Y n+1 ) + 2f (Y n+2 ) + f (Y n+3 )


.
6

(3.27)

Ce schma est dordre 4 (do son nom), et demande 4 valuations de la force par pas de temps.
Concernant la stabilit linaire, on a la formulation matricielle (3.25) avec



(t)2
(t)4
(t)2
+
t 1

1
2
24 
6
.
A(t) =
2
2
(t)2
(t)4
(t)
1
+
t 1
6
2
24
4. Cest un bon exercice que de mener ce calcul...

48

3 Postulat fondamental et ensemble microcanonique

On en dduit que les valeurs propres sont




(t)2
(t)4
(t)2
= 1
+
it 1
,
2
24
6
et donc que

(t)6
(t)8
+
.
72
576
Ceci montre que pour t > 0 assez petit (numriquement, t 2, 828427), on a | | < 1.
Ceci montre que le schma de Runge-Kutta dordre 4 est conditionnellement stable en temps long,
mais, en analogie avec le schma dEuler implicite, quil est galement dissipatif dans sa zone de
stabilit, et ne permet donc pas un chantillonnage correct de la sous-varit dnergie constante.
| | =

3.3.4 Schmas dintgration prservant des proprits de la dynamique


Hamiltonienne
Nous avons vu aux 2.2 et 3.3.1 que la dynamique hamiltonienne possde certaines proprits
qui la distinguent dune EDO dans son type le plus gnral. Nous introduisons ici des schmas
numriques dont le flot vrifie des proprits analogues au flot de la dynamique hamiltonienne.
Lanalyse numrique de ces schmas repose sur lanalyse derreur rtrograde. Alors que lanalyse numrique traditionnelle cherche des bornes a priori sur les erreurs commises, en interprtant
le schma numrique comme une approximation de la solution exacte, lide originale de lanalyse
derreur rtrograde est dinterprter le schma numrique comme la solution exacte dun problme
approch, et dtudier ce dernier. On montre alors que les schmas symplectiques prservent exactement une nergie approche, ce qui les conduit prserver approximativement lnergie du
systme sur des temps exponentiellement longs 5 (voir Thorme 3.2). La conservation approche
de lnergie garantit alors que lon chantillonne bien une sous-varit proche de la sous-varit
cible. On parle dintgration gomtrique, cest--dire dune intgration numrique qui prserve
bien les proprits gomtriques/structurelles fondamentales.
Dfinition 3.2 (Symplecticit dun schma numrique). Une mthode numrique un pas
est symplectique si lapplication
t : y 0 7 y 1 = t (y 0 )
est symplectique lorsque la mthode est applique un systme hamiltonien rgulier.
L encore, la notion de symplecticit est lie la conservation du volume dans lespace des
phases. Ceci explique que pour une mthode symplectique, les trajectoires ne peuvent pas converger
vers une trajectoire donne (ce qui impliquerait une diminution du volume dans lespace des phases,
ce qui est le cas du schma dEuler implicite et de Runge-Kutta dordre 4 pour t assez petit), ou
au contraire diverger (ce qui impliquerait une augmentation du volume dans lespace des phases, ce
qui est le cas du schma dEuler explicite). Cette prservation du volume explique heuristiquement
la trs bonne stabilit des schmas symplectiques, prcise par le Thorme 8.1 de [19] :
Thorme 3.2 (Conservation approche de lnergie en temps long pour des mthodes
symplectiques). On considre un Hamiltonien H : E R analytique et une mthode numrique t symplectique, dordre p. Si la solution numrique reste dans un compact K E, alors
il existe h > 0 tel que
H(y n ) = H(y 0 ) + O(tp )
pour des temps exponentiellement longs nt eh/t .
5. On peut montrer galement la conservation des invariants et une drive linaire de lerreur sur la
trajectoire sur des temps exponentiellement longs pour des systmes compltement intgrables. Le lecteur
(trs motiv, car le sujet est technique !) pourra, en guise dintroduction, consulter le cours de Master de
Philippe Chartier et Erwan Faou [7], et ensuite se plonger avec dlices dans les chapitres IX et X de [19].

3.3 Intgration des quations du mouvement et chantillonnage de la mesure microcanonique

49

Ce rsultat est dnonc technique, et pose de fortes contraintes sur le systme. On a toutefois
des rsultats analogues sous des hypothses un peu plus faibles. Retenons cependant que ce genre
de rsultat mathmatique est peut-tre sous-optimal, au sens o on na jamais observ en pratique
une drive de lnergie pour un schma symplectique ! On motivera par la suite ce rsultat en
prsentant des rsultats lmentaires danalyse rtrograde. En anticipant, on peut dire que les
bonnes proprits des schmas symplectiques sont la consquence du fait quune nergie approche
est conserve de manire exacte, ce qui signifie que lnergie exacte est conserve de manire
approche.
Outre la notion de symplecticit, le flot hamiltonien jouit dautres proprits, en particulier la
rversibilit en temps, et la symtrie. Ces proprits sont galement importantes pour les schmas
numriques, et mmes suffisantes dans certains cas pour assurer le bon comportement en temps
long. 6
Dfinition 3.3 (Rversibilit en temps dun schma numrique). Dfinissant loprateur
de rversibilit en temps S par S(q, p) = (q, p), on dit quun schma numrique est rversible en
temps si
S t = t S.
Cette proprit est satisfaite pour la grande majorit des schmas numriques associs (2.5),
et en tout cas, tous les schmas que nous allons rencontrer satisfont cette proprit, et ne savre
donc pas tre une proprit discriminante. Ceci nest pas le cas pour la symtrie en temps :
Dfinition 3.4 (Symtrie dun schma numrique). On dit quun schma numrique est
symtrique lorsque
t t = Id.
On vrifie facilement quaucun schma du 3.3.3 ne vrifie cette condition (voir Exercice 3.2).
En revanche le flot hamiltonien vrifie ces deux proprits (la symtrique provenant du fait que le
flot hamiltonien est un groupe).
Exemple 3.1. Vrifions titre dexemple que le schma dEuler explicite est rversible en temps
mais pas symtrique. Rappelons que

1
p, p tV (q) .
Euler
t (q, p) = q + tM
On a ainsi



1
Euler
p, p tV (q) = S q tM 1 p, p + tV (q) = S Euler
t (q, p) = q tM
t (q, p) ,
ce qui montre la rversibilit en temps. En revanche,

Euler
Euler
1
Euler
p, p tV (q)
t t (q, p) = t q + tM


= q + t2 M 1 V (q)p + t(V (q + tM 1 p) V (q))
= (q, p) + O(t2 ),

ce qui montre que le schma nest pas symtrique.

6. Attention, il existe des schmas symtriques qui ne sont pas symplectiques, et des schmas symplectiques qui ne sont pas symtriques. . . On pourra se reporter au chapitre XI de [19] pour ltude des
proprits des schmas rversibles en temps : on montre que, pour des systmes compltement intgrables
ou quasi-intgrables, la symtrie suffit assurer la conservation des invariants sur des temps exponentiellement longs.

50

3 Postulat fondamental et ensemble microcanonique

Schmas dEuler symplectiques.


Pour un Hamiltonien sparable (2.1), on peut crire H(q, p) = H1 (q, p) + H2 (q, p), avec
H1 (q, p) = 12 pT M 1 p et H2 (q, p) = V (q). Le champ de force se dcompose selon


q = M 1 p,
q =
0,
,
p = 0,
p = V (q).
Chacun des deux systmes hamiltoniens ci-dessous a un flot que lon peut calculer exactement. Ce
sont respectivement
1t (q, p) = (q + t M 1 p, p),

2t (q, p) = (q, p tV (q)).

On utilise alors une formule de Lie-Trotter. 7 Une approximation numrique de (2.5) obtenue par
cette mthode de dcomposition est par exemple
(q n+1 , pn+1 ) = 2t 1t (q n , pn ).
Les applications 2t , 1t sont symplectiques pour tout temps t car ce sont les flots de dynamiques
hamiltoniennes. Par ailleurs, on vrifie facilement par une formule de drivation des applications
composes que la composition de deux applications symplectiques est encore symplectique. Plus
explicitement, on obtient le schma dit "Euler symplectique A"
 n+1
q
= q n + tM 1 pn ,
(3.28)
n+1
p
= pn tV (q n+1 ).
Si on compose les flots dans lautre sens, on obtient encore un schma symplectique, dit "Euler
symplectique B"
 n+1
q
= q n + tM 1 pn+1 ,
(3.29)
n+1
p
= pn tV (q n ).
Ces deux schmas sont tous deux explicites et dordre 1, rversibles mais pas symtriques.
Pour ltude de la stabilit linaire, on considre nouveau loscillateur harmonique avec m = 1.
Dans ce cas particulier, on a la formulation matricielle (3.25) avec respectivement




1
t
1 (t)2 t
AEuler A (t) =
,
A
(t)
=
.
(3.30)
Euler B
2 t 1 (t)2
2 t
1
Les valeurs propres de ces matrices sont
(t)2
= 1
it
2

r
1

(t)2
.
4

On a donc bien | | = 1 condition que t < 2. Ceci montre que les schmas dEuler symplectique sont conditionellement linairement stables en temps long. Comme les valeurs propres sont
de module 1, on sattend heuristiquement ce quil ny ait pas de drive de lnergie dans un sens
ou dans lautre.
Remarque 3.5. Insistons sur limportance de la condition de stabilit linaire en temps long t <
2. Cette condition montre que sil existe des frquences hautes dans le systme, le pas de temps
dintgration devra tre trs petit ! La trs bonne stabilit des schmas et la conservation de
lnergie sur des temps longs vient donc avec une contrainte sur le pas de temps maximal que lon
peut utiliser...

7. Avec des mots simples (ou pour ceux qui ont jou au serpent sur leur portable) : pour faire un pas en
diagonale, on fait un pas sur le ct et un pas tout droit. . . Cest lexemple le plus simple de dcomposition.

3.3 Intgration des quations du mouvement et chantillonnage de la mesure microcanonique

51

Schma de Strmer-Verlet.
Le schma de Strmer-Verlet est le schma le plus utilis en pratique pour lintgration des
quations (2.5). Il a t dcouvert et redcouvert plusieurs fois au cours du temps, en particulier
par Strmer (1907) en astronomie, et par Verlet (1967) en dynamique molculaire. Mais, comme la
remarqu Feynman, on en trouve dj des traces chez Newton (1687) ! Une trs bonne introduction
sur lhistorique de ce schma est donne dans [18].
La procdure conduisant lobtention des schmas dEuler symplectiques est quelque peu
arbitraire, dans la mesure o il faut dcider dun certain ordre dans la composition. On peut
symtriser cette opration par la composition
t = 2t/2 1t 2t/2 ,
qui conduit au schma de Strmer-Verlet :
Algorithme de Strmer-Verlet

n+1/2

V (q n ),
= pn

p
2
Partant dune configuration initiale (q 0 , p0 ),
q n+1 = q n + tM 1 pn+1/2 ,

pn+1 = pn+1/2 t V (q n+1 ).


2
(3.31)

On vrifie que ce schma est dordre 2 et quil est symtrique, alors que les schmas dEuler
symplectiques A et B ne le sont pas. Lintrt de la symtrisation est quon peut gagner un ordre
de prcision, en naugmentant pas le nombre dvaluations totales de la force (quitte stocker les
forces calcules au pas prcdent pour la premire mise jour des vitesses sur un demi-pas de
temps).
Concernant la stabilit linaire en temps long, on a, toujours dans le cas de loscillateur harmonique avec des particules de masse m = 1, la formulation matricielle (3.25) avec

A(t) = AEuler A (t/2)AEuler

(t)2
1
t

2


B (t/2) =
(t)2
(t)2 ,
2
t 1
1
4
2

o AEuler A , AEuler B sont donnes par (3.30). On montre facilement que les valeurs propres de
A(t) sont toutes deux de module 1 si et seulement si t < 2.
Remarque 3.6 (Formulation sans les impulsions). Un calcul simple montre que la solution de (3.31)
vrifie
q n+1 2q n + q n1
M
= V (q n ).
t2
On reconnat ainsi une dicrtisation par diffrences finies centres de lquation du mouvement
M q = V (q).
Finalement, le schma de Strmer-Verlet peut tre construit trs simplement ! En revanche, cette
construction simple ne permet pas de mettre en vidence les proprits structurelles profondes du
schma numrique, et il serait difficile de montrer que lnergie est prserve de manire approche
sur des temps longs avec cette manire de faire.

52

3 Postulat fondamental et ensemble microcanonique

Remarque 3.7 (Algorithme de Verlet gnralis). Dans le cas o le Hamiltonien nest pas sous la
forme sparable (2.1), la dynamique hamiltonienne scrit en gnral
(
q(t)

= p H(q, p),
p(t)

= q H(q, p).
Dans ce cas, le schma de Verlet est

q H(pn+1/2 , q n ),
pn+1/2 = pn

2 h

i
t
q n+1 = q n +
p H(pn+1/2 , q n ) + p H(pn+1/2 , q n+1 ) ,

pn+1 = pn+ 21 t H(pn+1/2 , q n+1 ).


q
2
Le schma nest alors plus un schma explicite. On pourra se reporter [19, 24] pour plus de
prcisions.
Conservation exacte dune nergie approche : un exemple.
Dans le cas de loscillateur harmonique, on peut prciser la bonne conservation de lnergie
pour le schma de Verlet. On cherche une matrice C(t) R22 diagonale telle que
y 0 R2 ,

(y n )T C(t)y n = (y 0 )T C(t)y 0 ,

cest--dire C(t) diagonale telle que


A(t)T C(t)A(t) = C(t).
Par exemple,



(t)2
2

C(t) =
4
0

0
1

convient. Ceci montre que


n 0,

Ht (q n , pn ) = Ht (q 0 , p0 ),

o le Hamiltonien modifi
Ht (q, p) = H(q, p) (t)2 q 2 /4.
Ainsi, on a bien conservation exacte dune nergie approche O(t2 ) prs, ce qui conduit au
final une conservation de lnergie exacte O(t2 ) pour tout temps.
Elments danalyse rtrograde
Rappelons que lide originale de lanalyse rtrograde est dinterprter le schma numrique
comme la solution exacte dun problme modifi (au lieu de linterprtation usuelle en tant que
solution approche dun problme exact). Cest un rsultat profond de la thorie de lintgration
gomtrique que le systme hamiltonien modifi est encore hamiltonien... Ainsi, le schma numrique conserve bien une nergie approche, ce qui permet de montrer quil conserve de manire
approche lnergie exacte. On a vu un tel rsultat dans le cas de loscillateur harmonique, mais
comment gnraliser ce rsultat ?
La manire de procder est dcrire un dveloppement du flot modifi en puissances de t.
Considrons la dynamique
y(t)
= f (y(t)),
(3.32)

3.3 Intgration des quations du mouvement et chantillonnage de la mesure microcanonique

53

de flot t , et un schma numrique associ y n+1 = t (y n ), approximation dordre p. On cherche


une quation modifie
z(t)
= ft (z(t)),
(3.33)
dont le flot t est une bonne approximation de t , au sens o t est une approximation
numrique dordre suprieur ou gal p + 1 de t . Pour ce faire, on dveloppe ft en puissances
de t, et on identifie les termes dans les dveloppements des flots.
Premier exemple : le schma dEuler explicite
Prenons un exemple. Dans le cas du schma dEuler explicite, p = 1 et t (y) = y + tf (y).
On crit ft sous la forme
ft (y) = f (y) + tF1 (y) +

t2
F2 (y) + . . . .
2

Il sagit donc de chercher F1 tel que t soit une approximation dordre 2 de t . Pour ce faire, on
dveloppe la solution de (3.33) selon
t2
z(0) + . . .
2

z(t) = z(0) + tz(0)

t2 0
= z(0) + t[f (z(0)) + tF1 (z(0)) + . . . ] +
f (z(0))z(0)

2 t


1
= z(0) + tf (z(0)) + t2 f 0 (z(0))f (z(0)) + F1 (z(0)) + O(t3 ).
2
Ainsi,
t (z) t (y) = O(t3 )
si on choisit

1
F1 (y) = f 0 (y)f (y).
2
Ceci montre que le schma dEuler est une approximation dordre 2 de la dynamique
y(t)
= f (y(t))

t 0
f (y(t))f (y(t)).
2

On peut itrer cette construction pour construire une dynamique modifie qui dont le flot est
dordre arbitrairement proche du flot du schma numrique. 8
Dans le cas o la dynamique exacte (3.32) est hamiltonienne, le terme correctif est





1
1
0
M 1
M 1 q V (q)
M 1 p
tF1 (y) =
=
.
q V (q)
2 2q V (q) 0
2 2q V (q) M 1 p
On ne peut pas rcrire ce terme comme drivant dun Hamiltonien selon


p H1 (q, p)
F1 (q, p) =
.
q H1 (q, p)
Si cela tait possible, on aurait

F1 (q, p) =


F11 (q, p)
,
F12 (q, p)

q F11 + p F12 = 0,

ce qui nest pas le cas. Ceci montre que le systme modifi nest pas de type hamiltonien.
8. En fait, on a omis de prciser la constante qui apparait dans le terme O(t3 ) ci-dessus. Une analyse fine montrerait que cette constante diverge avec laugmentation de lordre, et on ne peut donc pas
atteindre un ordre quelconque si facilement... En fait, on ne peut pas crire en gnral ft comme une
srie convergente en puissances de t.

54

3 Postulat fondamental et ensemble microcanonique

Second exemple : le schma dEuler symplectique


On peut effectuer le mme genre de calculs pour le schma dEuler symplectique (3.28). On a
dans ce cas
 n+1
q
= q n + tM 1 pn ,
n+1
p
= pn tq V (q n ) t2 2q V (q n )M 1 pn + O(t3 ).
Or, on a vu ci-dessus que la solution de la dynamique modifie partant de y n = (q n , pn ) est
 n+1   n 




1 0 n
q
q
M 1 pn
2
n
n
=
+
t
+
t
F
(y
)
+
f
(y
)f
(y
)
+ ...
1
pn+1
pn
V (q n )
2
La comparaison avec le schma dEuler symplectique montre que le choix suivant permet dassurer
que le flot numrique du schma dEuler symplectique concide avec le flot de la dynamique
modifie lordre 2 :

 

1
M 1 q V (q)
p H1 (q, p)
F1 (q, p) =
=
,
q H1 (q, p)
2 2q V (q) M 1 p
avec

1 T 1
p M q V (q).
2
Dans ce cas, la dynamique modifie est encore hamiltonienne, et est associe au Hamiltonien
H1 (q, p) =

H t (q, p) = H(q, p) + tH1 (q, p).


On vient ainsi de montrer que
H t (q n , pn ) = H t (q 0 , p0 ) + O(t2 ),
alors que
H(q n , pn ) = H(q 0 , p0 ) + O(t).
On conserve donc mieux une nergie approche. Une fois de plus, ce processus peut tre itr. La
figure 3.2 illustre numriquement ce rsultat.

2.0
1.9

Energie

1.8
1.7
1.6
1.5
1.4
1.3
0

10

Temps

Fig. 3.2. Evolution temporelle de H et de H t (ligne plus forte) pour le potentiel double-puits, pour
le schma dEuler symplectique avec un pas de temps t = 0, 05. Notons que les variations de H t sont
plus faibles que celles de H.

3.3 Intgration des quations du mouvement et chantillonnage de la mesure microcanonique

55

3.3.5 Comparaison numrique des diffrents schmas


On illustre en figure 3.3 lerreur en fonction du pas de temps t dans le cas dun oscillateur harmonique de pulsation = 1, pour un temps dintgration T = 1, et la condition initiale (q 0 , p0 ) = (0, 1), lerreur tant alors eT (t) = |q T /t sin(T )|. On vrifie bien que la relation
log(eT (t)) = F ( log(t)) est affine avec un pente proche de 4 dans le cas du schma de
Runge-Kutta 9 dordre 4, et proche de 2 dans le cas du schma de Strmer-Verlet.
15

13
12

14

11

13
10

12
log(erreur)

log(erreur)

11

10

8
7
6

9
5

8
4

3
2

6
0.8

1.0

1.2

1.4

1.6

1.8

2.0

2.2

2.4

2.6

2.8

0.5

3.0

1.0

1.5

2.0

2.5

3.0

3.5

4.0

4.5

5.0

5.5

6.0

log(dt)

log(dt)

Fig. 3.3. gauche : trac de log(eT (t)) en fonction de log(t) pour le schma de Runge-Kutta
dordre 4 dans le cas de loscillateur harmonique. droite : cas du schma de Strmer-Verlet.

1.5

1.0
1.0

0.8

Energie

impulsion

0.5

0.0

0.4

0.5

0.2

1.0

1.5
1.5

0.6

0.0
1.0

0.5

0.0
position

0.5

1.0

1.5

50

100

150

200

250

300

350

400

Temps

Fig. 3.4. Intgration en temps long du potentiel double puits par une mthode de Runge-Kutta dordre 4.

On compare ensuite une intgration sur un temps assez long (T = 400) de la dynamique
hamiltonienne pour une particule de masse m = 1 dans le potentiel double puits (3.3), pour h = 1
et t = 0, 2, partant de (q, p) = (0, 1). Les figures 3.4 et 3.5 prsentent les rsultats obtenus pour le
schma de Runge-Kutta dordre 4 et de Strmer-Verlet, respectivement. On voit que dans le cas du
schma de Verlet, lenergie oscille autour de lnergie initiale E = 1, et le portrait de phase montre
que la trajectoire numrique est localise autour de la sous-varit des configurations dnergie
gale 1 (on peut le voir en traant une trajectoire de rfrence avec un pas dintgration trs
petit). En revanche, le schma de Runge-Kutta dordre 4, quoique plus prcis, a un comportement
en temps long moins bon du fait de sa dissipativit. La trajectoire numrique est rapidement pige
dans le puits de gauche, et lnergie dcrot au cours du temps.
9. Cest dailleurs pour cela quon se limite des pas de temps plus grands que 104 , car dans ce cas,
lerreur est de lordre de 1016 , soit la prcision machine...

56

3 Postulat fondamental et ensemble microcanonique

1.5
1.0
1.0
0.8

Energie

impulsion

0.5

0.0

0.4

0.5

0.2

1.0

1.5
1.5

0.6

0.0
1.0

0.5

0.0

0.5

1.0

1.5

position

50

100

150

200

250

300

350

400

Temps

Fig. 3.5. Intgration en temps long du potentiel double puits par le schma de Strmer-Verlet.

En conclusion, on voit bien que la notion dordre local, lie une convergence trajectorielle
en temps court, nest pas la plus pertinente dans le contexte de la dynamique molculaire, o
on cherche calculer des moyennes en temps long selon lhypothse dergodicit du postulat
fondamental.
3.3.6 Application un systme physique
Adimensionnalisation et choix du pas de temps
Il est commode de mettre en uvre les algorithmes prcdents dans un code en travaillant
en units rduites, ne serait-ce quafin de manipuler des nombres qui ne soient ni trop petits, ni
trop grands, ou de vrifier plus rapidement les ordres de grandeurs des rsultats (si on obtient une
quantit moyenne de lordre de 1020 en units rduites, il faut sinquiter). On peut galement se
servir plusieurs fois du mme calcul pour obtenir des rsultats sur des systmes diffrents (dcrits
par les mmes fonctions potentielles, mais avec des paramtres diffrents !). On considre :
lunit de masse m, par exemple la masse de la fraction majoritaire des atomes simuls ;
lunit dnergie, donne par le minimum du potentiel dinteraction liant typique entre deux
molcules (par exemple,  pour le potentiel de Lennard-Jones (1.4)) ;
lunit de longueur l, donne par la distance dinteraction typique (par exemple, la distance 21/6 entre deux molcules lies par le potentiel de Lennard-Jones).
On en dduit des units drives, comme lunit de temps t0 . Pour ce faire, on crit que lnergie
cintique typique est en m(/t0 )2 , et donc t0 (m/)1/2 .
Pour un fluide ou solide dargon, de masse molaire M = 39, 95 g/mol, les interactions entre les
atomes sont donnes par le potentiel de Lennard-Jones (1.4), avec comme paramtres /kB = 120 K
et = 3,405 . On en dduit que lunit de masse est m = 6, 64 1026 kg, lunit de longueur
est l = 21/6 = 3, 82 , et donc lunit de temps t0 = 2, 42 1012 s.
Le pas de temps est choisi suffisamment petit pour que lintgration numrique soit stable
sur des temps longs, mais suffisamment grand pour que lon puisse effectivement intgrer sur des
temps longs. En pratique, il est bon de calculer la frquence fondamentale du systme, note ,
et de choisir t tel que t < 2, typiquement, t 0, 1. Pour le potentiel de Lennard-Jones
utilis pour largon, une frquence fondamentale peut tre obtenue par un dveloppement limit
au voisinage de la position dquilibre : 2 = V 00 ()/m, soit 2, 93 1013 s1 . Notons que la
connaissance de la frquence fondamentale permet galement de dduire un temps caractristique
dvolution du problme.

3.3 Intgration des quations du mouvement et chantillonnage de la mesure microcanonique

57

Systme de Lennard-Jones
On prsente un cas test rel : un fluide ou un solide dargon. En pratique, on utilise un potentiel
de Lennard-Jones tronqu 10 un certain rayon de coupure rc , typiquement rc 2, 5 3. On
considre ensuite un domaine de simulation de la forme [0, L]3 , avec L > 2rc (sinon, lutilisation
de conditions de bord priodiques na aucun sens, voir Remarque 2.1).

7.0983e21

2.0e21

7.0984e21

0.0e+00

Energie (J)

7.0985e21

7.0986e21

7.0987e21

2.0e21

4.0e21

6.0e21
7.0988e21

8.0e21
7.0989e21

1.0e20

7.0990e21
0.0

0.5

1.0

1.5

2.0

2.5

3.0

3.5

4.0

4.5

5.0

0.0

0.5

1.0

1.5

2.0

2.5

Time (ps)

3.0

3.5

4.0

4.5

5.0

Time (ps)

Fig. 3.6. Gauche : volution de lnergie moyenne par particule pour un solide dargon en structure CFC
la densit = 1456 kg/m3 , pour des vitesses tires initialement selon une maxwellienne une temprature Tinit = 180 K. Droite : volutions conjointes de lnergie totale (ligne pleine), lnergie cintique
(courbe du haut en traits interrompus) et de lnergie potentielle (courbe du bas en traits interrompus).

Il est commode de rpartir initialement les atomes selon un rseau rgulier, par exemple cubique
face centres (CFC) pour des solides, ou cubique simple si on veut simuler un fluide. En effet, cette
dernire structure est moins stable, et est donc plus facile faire fondre. Le paramtre important
est la taille a de la cellule lmentaire du rseau cristallin. Dans lexemple des figures 3.6 et 3.7,
on a considr un cube de 512 cellules lmentaires, pour un rseau CFC de paramtre a =
4, 5 (soit 1024 particules). On tire ensuite des vitesses selon une distribution de Maxwell une
certaine temprature Tinit , et on intgre la dynamique hamiltonienne avec un schma de StrmerVerlet avec un pas de temps t = 5 1015 s, utilisant un rayon de coupure rc = 9 .

200

50

180
0

140
Pression (MPa)

Temprature cintique (K)

160

120
100
80

50

100

60
40

150

20
0
0.0

0.5

1.0

1.5

2.0

2.5

3.0

Temps (ps)

3.5

4.0

4.5

5.0

0.0

0.5

1.0

1.5

2.0

2.5

3.0

3.5

4.0

4.5

5.0

Temps (ps)

Fig. 3.7. Mmes paramtres que pour la figure 3.6. Gauche : volution de la temprature cintique en
fonction du temps. Droite : pression instantane.
10. Idalement, cette troncature seffectue de manire ce que le potentiel reste C1 (]0, +[), par le biais
dune spline dans un domaine [rmod , rc ]. Mais tous les codes ne font pas les choses aussi proprement, et
souvent on tronque brutalement le potentiel. . .

58

3 Postulat fondamental et ensemble microcanonique

0.0040

0.0030

0.0035
0.0025
Densit de probabilit

Densit de probabilit

0.0030
0.0025
0.0020
0.0015

0.0020

0.0015

0.0010

0.0010
0.0005
0.0005
0.0000
600

400

200

200

Composante selon z de la vitesse

400

600

0.0000
600

400

200

200

400

600

Composante selon z de la vitesse

Fig. 3.8. Distribution des vitesses vz au temps t = 5 1014 s pour les mmes conditions que pour
la figure 3.6. Gauche : N = 1296 atomes. Droite : N = 16000 atomes. La courbe en ligne pleine est la
maxwellienne de mme variance que la distribution empirique des vitesses.

On montre en figure 3.6 que lnergie est bien conserve pour le pas de temps choisi (erreur
de lordre de 0,01%). On voit galement que les diffrentes composantes de lnergie squilibrent
rapidement pour se stabiliser vers des valeurs peu prs constantes. La figure 3.7 prsente lvolution de la temprature cintique et de la pression en fonction du temps. Il faut moyenner ces
quantits sur la trajectoire pour obtenir une approximation des moyennes densemble (voir le 5.3
pour plus de prcisions sur le calcul des barres derreur et les tests de convergence). Enfin, la
figure 3.8 prsente des distributions de vitesses un instant donn. Comme on sy attendait, cette
distribution des vitesses est bien approche par une distribution de Maxwell, et ce, dautant mieux
que le nombre datomes simuls est grand.

3.3 Intgration des quations du mouvement et chantillonnage de la mesure microcanonique

59

Exercices
Exercice 3.1. Vrifier que les schmas de Runge-Kutta (3.27) et le schma de Strmer-Verlet (3.31)
sont respectivement dordres 2 et 4.
Exercice 3.2. Montrer que tous les schmas numriques de ce chapitre sont rversibles en temps,
mais que seul le schma de Verlet est symtrique.
Exercice 3.3. Montrer que, dans le cas dun oscillateur harmonique, les schmas dEuler symplectiques prservent exactement lnergie un terme O(t) prs.
Exercice 3.4. Montrer que la composition de schmas symplectiques est encore symplectique.
Exercice 3.5. On change de coordonnes dans lespace des phases : les qi , pi sont remplacs par
les q0i = fi (Q, P), et les p0i = gi (Q, P), les fi , gi dfinissant un diffomorphisme rgulier dans E, et
telle que les quations de Hamilton dcrivent lvolution des nouvelles variables avec le hamiltonien
H 0 (Q0 , P0 ) = H(Q, P). Montrer que le jacobien de ce changement de variables vaut 1. On pourra
montrer pour ce faire quon a en fait une transformation symplectique.
Exercice 3.6. On considre une collection de N oscillateurs harmoniques identiques, dans un
espace de dimension 1 pour simplifier. Le Hamiltonien du systme scrit :
H(q, p) =

N
X
1 p2
i

i=1

2m

1
+ Kqi2 .
2

valuer la fonction de partition microcanonique, lentropie et la temprature pour la valeur E =


N e de lnergie totale. Montrer que lune quelconque des quantits de mouvement est distribue
selon la loi de Maxwell si N est assez grand.
Exercice 3.7 (Pression osmotique dune solution dilue de molcules neutres). Un rcipient de volume V est empli dun liquide, dans lequel sont dissoutes des molcules dune espce
chimique diffrente, en faible proportion. La concentration (nombre de molcules de solut par
unit de volume) est c.
(1) On suppose la solution dilue, cest--dire que c est assez faible pour que lnergie de la solution
puisse tre considre comme indpendante des positions des molcules du solut. Justifier cette
approximation en considrant le volume v de la rgion du solvant dont ltat est affect par la
prsence dune molcule de solut.
(2) Lune des parois du rcipient est en fait semi-permable, elle laisse passer les molcules de
solvant mais pas celles du solut. De lautre ct de cette paroi se trouve un compartiment
contenant du solvant pur. En raisonnant sur lentropie, montrer que la pression est plus grande
dans la solution que dans le solvant pur, la diffrence tant par dfinition la pression osmotique
, ressentie par la paroi semi-permable, et qui vaut :
= ckB T
sous lhypothse de solution dilue.
Indications : on pourra chercher une forme factorise de la fonction de partition microcanonique. On identifiera partir de


S
=T
.
V E

4
Lensemble canonique

Le recours lensemble canonique, reprsentatif dun systme dont les changes avec le milieu
extrieur sont des transferts dnergie avec un thermostat, est motiv par le manque de commodit
dutilisation de la mesure microcanonique, et aussi par la proximit avec lexprience : il est
beaucoup plus pertinent de modliser les objets physiques de notre univers quotidien en considrant
que leur temprature est fixe, plutt que leur nergie totale.

4.1 Distribution de Botzmann-Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


4.1.1 Couplage avec un thermostat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.2 Distribution de Boltzmann-Gibbs et information manquante . . . . . . . . .
4.2 nergie libre et grandeurs thermodynamiques . . . . . . . . . . . . . . . . . . .
4.2.1 Dfinition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.2 Drives de lnergie libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.3 Minimisation de lnergie libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.4 Calculs avec la fonction de partition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Cas de degrs de libert indpendants . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3.1 Sous-systmes indpendants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3.2 Indpendance des positions et des quantits de mouvement pour une
collection de particules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3.3 Gaz parfait, grandeurs idales et dexcs dans les fluides . . . . . . . . . . . . .
4.3.4 Cas des oscillateurs harmoniques indpendants . . . . . . . . . . . . . . . . . . . . .
4.4 Quelques remarques sur les applications du formalisme canonique .
4.4.1 Gaz, solides et liquides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4.2 Approche de lquilibre et thermalisation . . . . . . . . . . . . . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

61
61
62
64
64
64
65
65
67
67
67
68
68
70
70
70
72

4.1 Distribution de Botzmann-Gibbs


La mesure de probabilit dquilibre sur E dans lensemble canonique est appele la distribution
de Botzmann-Gibbs, et sa forme constitue un des rsultats les plus fondamentaux de la physique
statistique. Nous indiquons ici deux manires de lobtenir : la premire ( 4.1.1) est fonde sur
le couplage idal avec un thermostat, trait comme au 3.2.3 ; la seconde ( 4.1.2) fait appel
lentropie dfinie selon la thorie de linformation.
4.1.1 Couplage avec un thermostat
Nous avons admis au 3.2.3 que sil y a couplage thermique entre deux systmes macroscopiques, on peut valuer la fonction de partition microcanonique de la runion des deux comme le

62

4 Lensemble canonique

produit des fonctions de partitions revenant chacun, et cette factorisation correspond lvaluation de lentropie totale comme somme des entropies des deux systmes (voir (3.17)).
Nous nous replaons ici dans ce cadre, et supposons que le second systme, que lon appelle
thermostat, est trs grand, de sorte que son couplage avec le premier, qui est le systme physique
que lon souhaite tudier (et que lon lappellera simplement le systme dornavant), naffecte
son tat que de faon ngligeable. Les variations dentropie du thermostat seront alors traites au
premier ordre dans les variations de son nergie. Ainsi, quelle que soit la valeur de E, on crit
pour lentropie du thermostat, en vertu de la dfinition (3.13) de la temprature :
E
,
T
S0 dsignant lentropie du thermostat lorsquil prend toute lnergie disponible, et T sa temprature. une constante additive prs, lentropie totale vaut donc S(N, V, E) E
T . On obtient ainsi
la densit de probabilit p(E) dune valeur donne de lnergie du systme par (3.12) :


E
p(E) exp
.
kB T
Sth = S0

Il sera commode dans toute la suite du cours dutiliser la notation :


1
=
.
kB T

(4.1)

Lquiprobabilit pour les microtats de mme nergie de la runion du systme et du thermostat


entrane lquiprobabilit des microtats du systme de mme nergie E. On en tire donc la forme
suivante de la densit de probabilit (macrotat dquilibre canonique), par rapport la mesure
0 (Q, P) introduite en (2.3).
Distribution de Boltzmann-Gibbs, macrotat dquilibre canonique
La mesure canonique a pour densit de probabilit
NVT (Q, P) d0 = Z 1 eH(Q,P) d0 ,
La constante de normalisation Z est la fonction de partition canonique :
Z
Z=
eH(Q,P) d0 .

(4.2)

(4.3)

Le macrotat dquilibre est donc dduit ici de lapproche microcanonique pour la runion du
systme avec le thermostat. La mesure de Botzmann-Gibbs sur E quil dfinit savre trs commode
dutilisation. Dans la pratique on peut effectivement vrifier que le macrotat dquilibre dune
petite partie macroscopique dun grand systme, si son volume et le nombre de particules quelle
contient sont fixs, est bien dcrit par cette distribution.
4.1.2 Distribution de Boltzmann-Gibbs et information manquante
Entropie et dfaut dinformation
Dans lapproche de la thorie de linformation 1 lentropie est dfinie, vis--vis dun observateur,
comme le manque dinformation sur le systme observ. On dfinit ainsi lentropie S [N ] dun
macrotat possdant une densit N par rapport la mesure 0 par
1. On trouvera dans la rfrence [2] une prsentation claire et dtaille de cette approche. En revanche,
la rfrence [25] vite dy avoir recours, en raison du rle quelle fait jouer un observateur humain, et
dfinit lentropie comme ( la constante kB prs) logarithme du volume despace de phases explor par
le systme dans son mouvement .

4.1 Distribution de Botzmann-Gibbs

63

Z
S [N ] = kB

(4.4)

N (Q, P) ln N (Q, P)d0 .

La dtermination du macrotat dentropie maximale est alors motive par lexploitation de linformation disponible sans introduire de choix ou de biais injustifi.
La dfinition (4.4) se justifie dabord pour les distributions de probabilits discrtes, auquel
cas on a affaire lentropie de la thorie de linformation (ou entropie de Shannon)
X
S = kB
pi ln pi .
(4.5)
i

On prend ensuite une limite continue, le choix de la mesure 0 dans E tant naturel car cest
une mesure invariante pour la dynamique hamiltonienne. Pour motiver la dfinition (4.5), on
peut montrer (voir par exemple [2]) quelle est compatible avec les proprits de base que lon
doit attribuer une fonction des pi ayant le sens du manque dinformation, ou de linformation
moyenne acquise par lobservation de lun des vnements discrets possibles. La proprit essentielle
est ladditivit, qui exprime quune information acquise en deux temps, correspondant par exemple
deux niveaux de prcision des observations, est la somme de linformation acquise lors de ltape
grossire et de linformation moyenne acquise lors de ltape la plus fine. Une autre proprit est
que lentropie doit tre maximale lorsque tous les vnements sont quiprobables. La constante kB
fixe conventionnellement lunit dinformation.
La dfinition (4.4) gnralise celle que nous avons utilise au chapitre 3, avec laquelle elle
concide lorsque les macrotats possdent une densit uniforme par rapport la mesure 0 dans
A E de mesure positive finie. En effet, on a alors


Z
1
1
S = kB
ln
d0 = kB ln 0 (A).
0 (A)
A 0 (A)
Maximisation sous contrainte
Faisons lhypothse que lnergie du systme tudi est connue en moyenne, cest--dire que la
valeur de
Z
hHi =
N (Q, P)H(Q, P) d0
(4.6)
E

est impose. La maximisation de S[N ] sous les contraintes (4.6) et


Z
N d0 = 1,

(4.7)

conduit la condition doptimalit suivante, qui doit tre satisfaite pour toute variation N
de N :
Z
Z
Z
(ln N (Q, P) + 1)N (Q, P) d0 + H(Q, P)N (Q, P) d0 + N (Q, P) d0 = 0,
E

o on a introduit les multiplicateurs de Lagrange et associs respectivement aux contraintes (4.6)


et (4.7). Ceci entrane
ln N = H 1,
et on en dduit donc le rsultat (4.2), en reconnaissant dans le paramtre dfini en (4.1), tandis
que la fonction de partition Z = exp( + 1) normalise la distribution.

64

4 Lensemble canonique

4.2 nergie libre et grandeurs thermodynamiques


4.2.1 Dfinition
Lnergie libre F (appele parfois nergie libre de Helmholtz sil y a une ambigit possible avec
dautres potentiels thermodynamiques) est classiquement dfinie en thermodynamique comme 2
F (N, V, T ) = E(N, V, S) T S,
et il est commode de la considrer 3 comme une fonction de T , tandis que E est fonction de S.
Lnergie libre F est directement relie la fonction de partition Z. Pour le voir, crivons lentropie,
value par (4.4) pour la densit N de Boltzmann-Gibbs. On trouve :
S = kB ( hHi ln Z) ,
et on a donc, lnergie interne macroscopique E sidentifiant la moyenne de lobservable H,
F = kB T ln Z(N, V, T ).

(4.8)

On peut remarquer que dans la premire approche que nous avons employe pour obtenir la
distribution de Botzmann-Gibbs ( 4.1.1), lentropie du systme tudi se confondait avec lentropie
microcanonique correspondant la valeur la plus probable de lnergie du systme. Ceci entrane
une lgre diffrence pour lnergie libre F , qui disparat dans la limite N +. Dans la pratique,
on utilisera la formule (4.8), et on gardera donc la seconde dfinition de lentropie ( 4.1.2), qui
est la plus gnrale.
4.2.2 Drives de lnergie libre
Les drives de lnergie libre par rapport ses variables naturelles V et T se dduisent des
drives de lnergie interne, ou de lentropie. On a ainsi :








 


F
E
S
E
S
S
=
ST
=
ST
= S,
(4.9)
T V
T V
T V
S V T V
T V
tandis que









 



F
E
S
E
E
S
S
=
T
=
+
T
= P.
V T
V T
V T
V S
S V V T
V T

(4.10)

Ces relations permettent, en supposant que lon parvienne calculer Z et donc F = kB T ln Z,


den dduire lentropie, lnergie interne et la pression.
Le potentiel chimique est dfini comme drive de lnergie libre par rapport au nombre de
particules N ; ainsi, lorsque N est grand,


F
' F (N + 1, V, T ) F (N, V, T ).
=
N V,T
On sattend en effet une variation dnergie libre entre deux tats dquilibre la mme temprature dans le mme volume lorsque lon introduit une particule supplmentaire.
2. Cela signifie que F = E S E
est au signe prs selon les conventions la transforme de Legendre
S
de E par rapport la variable S.
3. La thermodynamique sest dveloppe, historiquement, en mettant laccent sur lnergie plus que sur
lentropie, et cest pourquoi on a pris lhabitude dcrire E fonction de S et F fonction de T plutt que
S/kB fonction de E et (S/kB ) E fonction de .

4.2 nergie libre et grandeurs thermodynamiques

65

4.2.3 Minimisation de lnergie libre


Au chapitre 3 nous avons discut de la rpartition de lnergie (plus gnralement, de toute
grandeur conserve, cest--dire qui ne varie que par des changes) entre diffrentes parties dun
systme macroscopique, et caractris lquilibre par le maximum de lentropie. Dans le cas dun
systme coupl avc un thermostat, la mme dmarche applique la runion du systme et du
thermostat conduit maximiser la somme de leurs entropies, qui est une constante prs
S

E
F
= ,
T
T

T dsignant ici la temprature du thermostat. Il faut donc minimiser lnergie libre (la temprature
tant fixe).
Une application est lquilibre des phases (comme dans les rgions de coexistence des diagrammes de phase des figures 1.3a et 1.4). Deux phases en quilibre sont la mme temprature,
et elles peuvent changer, en plus de la chaleur, du volume et des particules. On a donc galit des
potentiels chimiques et galit des pressions. Pour chaque phase, le potentiel chimique peut tre
pris comme fonction de la densit et de la temprature, ou bien de la pression et de la temprature.
Les indices se rapportant aux deux phases en prsence, on a ainsi la condition
1 (P, T ) = 2 (P, T ),
qui dtermine la ligne de coexistence dans le plan P, T (comme sur la figure 1.3b).
Une autre consquence remarquable de la minimisation de lnergie libre est la comptition
entre nergie et entropie. basse temprature, cest lnergie E qui tend dominer dans lnergie
libre F = E T S. Minimiser lnergie libre, cest alors essentiellement minimiser lnergie. Pour les
systmes usuels composs dun grand nombre de particules, lnergie potentielle est souvent minimale pour des configurations ordonnes basse temprature. Cest lune des raisons pour lesquelles
la phase stable est cristalline basse temprature 4 Des considrations entropiques entrent quand
mme en jeu cependant, et elles peuvent mme dterminer le changement de phase, commme on
la voqu au chapitre 1. En revanche, haute temprature, le terme entropique devient prpondrant, et minimiser lnergie libre revient alors maximiser lentropie. Cest en phase gazeuse et
non dans les phases condenses liquide ou solide 5 que lentropie est la plus grande, parce que les
particules accdent un domaine beaucoup plus tendu.
4.2.4 Calculs avec la fonction de partition
la diffrence de la fonction de partition microcanonique (N, V, E), la fonction de partition
canonique Z, fonction de (N, V, T ), permet des calculs commodes.
Drivation par rapport la temprature
La drive de la fonction de partition par rapport est
Z
Z
= H(Q, P) exp[H(Q, P)]d0 .

E
Comme
hHi =

1
Z

Z
E

H(Q, P) exp[H(Q, P)]d0 ,

4. .
5. On considre ici implicitement un systme maintenu dans une enceinte de volume constant, et dont le
volume est assez grand pour permettre le changement de phase entre liquide et vapeur. basse temprature
il y a condensation et on observe un quilibre liquide-vapeur ou solide-vapeur. Ce sont dans les conditions
isothermes et isobares auquel cas il faut minimiser lenthalpie libre G(N, P, T ) = F + P V , galement
appele nergie libre de Gibbs que lon a une seule phase.

66

4 Lensemble canonique

on a alors
E = hHi =

ln Z
.

(4.11)

Une seconde drivation donne


2 ln Z
hHi
2
= H 2 hHi = Var (H) =
,
2

ce qui tablit la formule (2.19) pour la capacit calorifique volume constant par particule cv :


Var (H)
1 E
=
cv =
.
N T V
N kB T 2
Drivation par rapport un paramtre du Hamiltonien
Supposons que le Hamiltonien dpende dun certain paramtre . Par exemple, des forces
extrieures sont appliques sur les particules, et apparat dans lexpression du champ de force
correspondant. On a donc un Hamiltonien H H(, q). Un calcul analogue (4.11) donne alors :




F
H
=
,
(4.12)
T

o la notation hi renvoie une moyenne canonique pour la mesure Z1 eH(,q) . Une action
extrieure sur le systme entrane une variation de lnergie des microtats, gale au travail des
forces extrieures. La relation (4.12) signifie donc que la variation dnergie libre dun systme
coupl un thermostat lors de lapplication de sollicitations extrieures est gale la moyenne des
travaux microscopiques pour chaque macrotat visit (paramtr par ), et on identifie ainsi au
second membre, une fois intgr sur un intervalle de , le travail fourni au systme. Notant W ce
travail on a ainsi


F
dW
=
.
T
d
Au sens de la thermodynamique, on a ici une transformation isotherme rversible, cest--dire dans
laquelle le systme reste en quilibre interne et en quilibre avec le milieu extrieur.
Le travail des forces extrieures est gal la variation dnergie libre, qui prend donc le sens
dune nergie potentielle macroscopique pour les volutions temprature constante. Dans les
problmes de statique macroscopiques, temprature constante, on utilise souvent des nergies
potentielles (par exemple lastiques), qui, du point de vue de la thermodynamique, sont en fait des
nergies libres. En particulier, les forces gnralises qui drivent de tels potentiels macroscopiques
sont donc pour une part dues des variations dentropie.
Travail et chaleur
La variation de lnergie interne hHi est, par un calcul analogue (4.11) :






hHi
H
H
H
=
H
hHi
.

On reconnat dans le premier terme le travail reu dW


d , qui est la moyenne des variations dnergies
des microtats. Le second terme, d la variation des poids statistiques exp(H) des diffrentes
microtats, est la chaleur reue par le systme. Notant Q la chaleur on a alors, en utilisant (4.12)
et T dS = dE dF ,
dW
dQ
dQ
dS
dE
=
+
,
avec
=T
,
d
d
d
d
d
pour une transformation isotherme rversible. Ceci est conforme la thermodynamique macroscopique, qui dcrit lvolution de lnergie en fonction du travail et de la chaleur.

4.3 Cas de degrs de libert indpendants

67

Rponse linaire statique


Le rsultat prcdent pour la variation de hHi peut tre rcrit pour une observable A quelconque. On le trouve en gnral prsent sous une forme lgrement diffrente, avec un hamiltonien
dpendant de sous la forme
H(, Q, P) = H0 (Q, P) B(Q, P),

(4.13)

o B est une observable donne. On a donc H


= B dans les formules prcdentes. Au premier
ordre dans le paramtre , la variation de la moyenne de A fait intervenir sa covariance 6 avec B,
value pour = 0 :
hAi = hAi0 + Cov|=0 (A, B) + O(2 ).
(4.14)

4.3 Cas de degrs de libert indpendants


4.3.1 Sous-systmes indpendants
Pour un hamiltonien de la forme (2.17), somme dnergies associes des degrs de libert
diffrents, on a une forme tensorise de la densit de probabilit canonique :
NVT (Q, P) =

p
Y

(k)

NVT (Qk , Pk ),

k=1

o
(k)

NVT (Qk , Pk ) =

1
exp [Hk (Qk , Pk )] ,
Zk

Z
Zk =

exp [Hk (Qk , Pk )] dQk dPk .

Q
La fonction de partition globale scrit elle aussi Z = k Zk . Une telle forme de la distribution de
probabilit est caractristique de lindpendance statistique entre les observables dpendant des
Qk , Pk et des Ql , Pl si l 6= k.
4.3.2 Indpendance des positions et des quantits de mouvement pour une
collection de particules
En fait, on peut pour tout Hamiltonien sparable (somme des nergies cintiques associes
chacune des coordonnes des 3N quantits de mouvements pi dune part, et de lnergie potentielle
V (Q) dautre part), tensoriser la mesure de probabilit entre les impulsions et les positions selon

!
p2i,
1
1
1
Y

dNVT (Q, P) =
exp
exp [V (Q)] dQ dP,

N!

2m Zq
1iN
13

o est la longueur donde thermique introduite en (3.10). Ainsi, chacune des composantes pi,
est indpendante des autres et indpendante des positions, et les quantits de mouvement sont
distribues selon la loi de Maxwell (3.5), dont on tablit ainsi la validit gnrale pour des particules
classiques quelles que soient leurs interactions. La fonction de partition Z scrit :
Z
Zq
,
Z
=
exp [V (q1 , q2 , . . . , qN )] dq1 dq2 , . . . dqN .
Z=
q
N !3N
Lintgrale de configuration Zq ne se calcule pas analytiquement en gnral, et il faut recourir des
mthodes numriques approches pour calculer les moyennes densemble pour la mesure canonique
(voir chapitre 5).
6. La covariance des observables A et B est Cov(A, B) = hABi hAi hBi. Ici, les moyennes sont prises
par rapport la mesure de Boltzmann associe au Hamiltonien non perturb H(0, , ).

68

4 Lensemble canonique

4.3.3 Gaz parfait, grandeurs idales et dexcs dans les fluides


Le formalisme canonique permet une dtermination simple et directe des proprits thermodynamiques du gaz parfait, pour lequel Zq = V N , et ainsi 7
Zid (N, V, T ) =

VN
.
N !3N

Ceci donne lnergie libre (par (4.8))


F (N, V, T ) = N kB T [ln(3 ) 1],

(4.15)

puis, par drivation, lentropie, lnergie interne et la pression, pour lesquelles on retrouve les
rsultats (3.16), (3.15) et (3.19). Le potentiel chimique du gaz parfait vaut :
= kB T ln(3 ).

(4.16)

Il est ngatif et nettement plus grand que kB T en valeur absolue, en raison de lingalit 3  1.
Ceci provient de laugmentation dentropie rsultant de lajout dune particule.
En gnral, lnergie libre et ses drives, pour un systme de N particules avec des interactions, peuvent scrire comme une somme dune contribution idale qui est la valeur de
la grandeur considre dans le gaz parfait, et dune contribution d excs. Cette sparation se
dduit directement de lcriture de la fonction de partition comme produit :
Z = Zid

Zq
,
VN

et on crit par exemple F = F id + F ex , avec F id donne par (4.15) et




Zq
ex
F = kB T ln
.
VN
Lorsque lon recherche les proprits macroscopiques du systme en mesurant des moyennes dobservables dans un calcul numrique, on peut se dispenser de calculer la contribution connue du
gaz parfait (contribution cintique) pour se concentrer sur la contribution inconnue de la partie configurationnelle de lnergie libre. Ainsi, la mthode de Monte-Carlo pour chantillonner la
distribution de Boltzmann-Gibbs de lensemble canonique (voir chapitre 5) ne sintresse qu la
simulation de la loi de probabilit marginale par rapport aux positions. Pour calculer par exemple
cv , plutt que dutiliser la formule (2.19), on utilise la valeur connue cv = 32 kB pour les gaz parfaits
monoatomiques, et on value seulement
cex
v =

Var (Ep )
,
N kB T 2

en chantillonnant les fluctuations de la seule nergie potentielle Ep .


4.3.4 Cas des oscillateurs harmoniques indpendants
Motivation : solide basse temprature
temprature suffisamment basse, les N particules en interaction que nous tudions restent
au voisinage dun minimum de lnergie potentielle. Cest en effet le terme dnergie qui domine
dans la minimisation de lnergie libre. Soit Q0 le vecteur des positions qui minimisent le potentiel
V (Q). On peut donc crire, en dveloppant le potentiel V (Q) au voisinage de Q0 au second ordre
dans le vecteur des dplacements U = Q Q0 ,
7. La notation id renvoie au gaz parfait, galement appel gaz idal la traduction anglaise est ideal
gas.

4.3 Cas de degrs de libert indpendants

69

1
V (Q0 + U) = V (Q0 ) + U K U + O(|U|3 ),
2
o la matrice symtrique K = 2 V (Q0 ) est appele matrice des raideurs (ou matrice dynamique
en physique des solides). On suppose par la suite que K est dfinie positive (i.e. on se place au
voisinage dun minimum strict). Par un changement de variable diagonalisant K, on peut rcrire
le Hamiltonien comme 8

3N  2
X
pk
1

H(Q, P) =
+ Kk qk2 ,
2m 2
k=1

cest--dire comme somme des hamiltoniens de 3N oscillateurs harmoniques ( une dimension)


indpendants. chacun est associ une raideur Kk , et une pulsation propre
r
Kk
k =
.
m
Un cas particulier trs important en pratique est celui des cristaux, arrangements priodiques pour
lesquels la manire approprie de diagonaliser la matrice K a t tudie en dtail en physique des
solides (voir lExercice 4.12 pour un exemple simplifi de systme cristallin).
Rsultats
La fonction de partition se factorise 9 en Z =

F = kB T

3N
X

Zk , avec Zk =


ln

k=1

kB T
~k

kB T
. Lnergie libre est alors :
~k


.

(4.17)

Limite classique de la mcanique quantique pour un oscillateur harmonique


Il est utile dtudier la condition
ngliger les effets quantiques pour un
p pour quon puisse

oscillateur harmonique. Avec q kB T /K et p kB T m, on peut ignorerp


les incertitudes q
m
et p lies par la condition de Heisenberg (3.9) pourvu que lon ait ~  kB T K
, soit
~  kB T.

(4.18)

Capacit calorifique
Avec une famille doscillateurs harmoniques indpendants, une quantit ne dpendant pas des
pulsations propres est la capacit calorifique. En effet celle-ci est simplement gale au nombre
doscillateurs indpendants, multipli par la constante de Boltzmann kB . La capacit calorifique
volume constant est en effet
S
2F
Cv = T
= T
,
T
T 2
On obtient alors
Cv = 3N kB .

(4.19)

8. Dans cette transformation, la matrice qui fait passer des p


k est la transpose de celle qui
i aux p
transforme les u
k . On vrifie (exercice) que les qk et les pk sont des variables conjugues pour le
i en q
Hamiltonien.
9. Dans le cas de particules confines au voisinage des sites dont les positions sont donnes par Q0 ,
on considre que les sites sont discernables et on ne divise pas par N ! dans le calcul de la fonction de
partition.

70

4 Lensemble canonique

Ce rsultat constitue la loi de Dulong et Petit pour la capacit calorifique des solides. Les recherches pour expliquer les carts systmatiques cette loi au tournant du 20me sicle (on observe
des capacits calorifiques plus faibles basse temprature) conduisirent lintroduction, dabord
arbitraire, deffets de quantification de lnergie des oscillateurs, qui ultrieurement sexpliqurent
par la mcanique quantique. Daprs (4.18), ces carts sont dautant plus manifestes que la temprature est basse, ou bien que les raideurs sont grandes. Ainsi, le diamant, matriau dont les
modules lastiques sont trs levs, prsente toujours 300 K des carts notables par rapport la
loi de Dulong et Petit.

4.4 Quelques remarques sur les applications du formalisme canonique


Les applications de la distribution de Boltzmann-Gibbs et les problmes que lon peut traiter
dans lensemble canonique sont innombrables et ce bref chapitre nen donne quun chantillon
assez rduit. Quelques prolongements sont suggrs dans les exercices. En guise de conclusion sur
le sujet, nous formulons ici quelques observations gnrales.
4.4.1 Gaz, solides et liquides
Nous avons rencontr deux systmes dont les proprits se calculent simplement, en particulier
dans lensemble canonique. Ce sont le gaz parfait, pour lequel les particules nont pas dinteraction, et la collection doscillateurs harmoniques indpendants, laquelle se ramnent les systmes
dont lnergie potentielle est une fonction quadratique (positive) des variables. Ces deux systmes
exactement solubles fournissent des bases efficaces pour tudier les proprits des gaz et des solides rels. Les interactions dans un gaz, lcart lharmonicit dans un solide, peuvent tre traits
perturbativement dans certains rgimes, cest--dire que lon peut utiliser des dveloppements
asymptotiques des grandeurs tudies dans les petits paramtres qui expriment la diffrence avec
le modle dont la solution exacte est connue (voir par exemple lExercice 4.11).
Il nen est rien pour les liquides, et cest pourquoi leur tude sappuie aussi fortement sur la
simulation numrique.
Remarquons toutefois que le recours lapproche numrique se justifie aussi pleinement quand
il sagit de proprits de systmes simples , tels quun cristal quasi-harmonique, en prsence de
dfauts, ou lors de perturbations de forte amplitude toutes circonstances qui sollicitent le systme
hors du domaine de validit des hypothses des modles solubles ! Une application traditionnelle de
la simulation par dynamique molculaire est ainsi ltude de leffet dun bombardement dun rseau
cristallin par des particules ou des rayonnements susceptibles de fournir une nergie suffisante
pour dplacer des atomes hors de leur site dquilibre. Les parois mtalliques destines contenir
le rayonnement de matriaux fissiles subissent de telles agressions, et lestimation de la perte
ventuelle de leur capacit de confinement est un objectif important pour la sret des installations
nuclaires, par exemple.
4.4.2 Approche de lquilibre et thermalisation
Le gaz parfait, les oscillateurs harmoniques, et gnralement tous les systmes dans lesquels
on peut isoler des ensembles de degrs de libert indpendants, sont simples du point de vue de
leurs proprits statiques dquilibre. Il faut remarquer quils sont cependant singuliers du point
de vue de lapproche de lquilibre et de la dynamique. En effet, il ny a aucun transfert dnergie
entre les composantes indpendantes. On retrouve donc les mmes difficults que dans lapproche
microcanonique, et on peut invoquer de mme de petits termes de couplage pour rendre le modle
dynamiquement cohrent.
Une question supplmentaire se pose dans lensemble canonique : le fonctionnement dynamique
du couplage avec le thermostat, qui, lui aussi, sopre par un Hamiltonien que lon ncrit pas.
En fait, on a coutume de considrer, dans les questions de dynamique, que les changes avec

4.4 Quelques remarques sur les applications du formalisme canonique

71

le thermostat se font sur des temps trs longs, de sorte que leur influence ne se fait pas sentir
pendant la dure dtude du systme, lchelle de ses temps de relaxation propres. On admet
cependant que le thermostat a jou son rle de prparation de ltat initial. Cela revient considrer
des configurations initiales distribues selon la mesure canonique, qui voluent ensuite par la
dynamique hamiltonienne du systme dcoupl du thermostat (ce qui est bien cohrent, car la
dynamique hamiltonienne prserve la mesure canonique).

72

4 Lensemble canonique

Exercices
Exercice 4.1. Que vaut la capacit calorifique moolaire volume constant dun gaz de molcules
diatomiques (comme lazote et loxygne de lair) ?
Exercice 4.2. On considre un systme de N particules interagissant par un potentiel de paire,
dans un volume V temprature T , avec des conditions aux limites priodiques.
(1) Au moyen dun changement de variables dans lespace des phases E, montrer que leffet dun
changement de volume sur la distribution de Boltzmann-Gibbs se ramne la variation dun
paramtre du hamiltonien. On veillera utiliser des changements de variable qui conservent
la mesure 0 .
(2) Dduire la formule (2.23) pour la pression, partir de la drive de lnergie libre par rapport
au volume.
Exercice 4.3 (Potentiels en puissance inverse). On se replace dans le cas de lExercice 2.3.
tablir les mmes conclusions partir de la distribution de Botzmann-Gibbs dans lensemble
canonique.
Exercice 4.4. tablir la formule (2.19) sans utiliser la fonction de partition ni la forme de la
mesure canonique, avec une approche similaire la preuve de la formule (2.21) (chapitre 3, page 42).
Exercice 4.5 (Calcul du potentiel chimique par la mthode dinsertion de Widom). On
tudie un systme de N particules dans lensemble canonique, et on cherche valuer le potentiel
chimique dexcs ex .
(1) crire ex en fonction du rapport des intgrales de configuration Zq N + 1 et N particules
(2) On place au hasard une N + 1ime particule, avec une probabilit uniforme dans le volume
V occup par le systme de N particules lquilibre. On note W lnergie potentielle dinteraction de cette particule supplmentaire avec les N premires. Montrer que exp[ex ] est
gale la moyenne sur la position de cette particule test de la moyenne selon la distribution
de lensemble canonique des N particules de exp[W ].
Exercice 4.6 (Frquence des collisions dans un systme de sphres dures). Montrer que
le nombre moyen de collisions par particule et par unit de temps dans un systme de sphres
dures est
r
kB T
2
nc = 2
g(+ ),
m
g(+ ) = limr,
paires en r = .

r>

g(r) tant lamplitude de la discontinuit de la fonction de corrlation de

Exercice 4.7 (Pression du fluide de sphres dures (1)). Pour les sphres dures on ne peut
pas exprimer la pression partir de la formule (2.23), car on na pas de potentiel diffrentiable
pour calculer des forces. On peut nanmoins obtenir une formule fonde sur le bilan de quantit
de mouvement dans les chocs.
(1) Calculer la loi du choc, qui donne les vitesses aprs le choc en fonction des vitesses antrieures
au choc. Les collisions conservent la quantit de mouvement et lnergie cintique.
(2) Montrer que lon a :



2 3
g(+ ) ,
P = kB T 1 +
3

o g(+ ) est dfini dans lExercice 4.6.


Exercice 4.8 (Pression du fluide de sphres dures (2)). On approche le comportement des
sphres dures par celui des sphres molles, cest--dire interagissant par le potentiel (1.3), dans la
limite n +. cette fin, on dfinira la fonction y(r; n) par :

4.4 Quelques remarques sur les applications du formalisme canonique

73

g(r; n) = y(r; n)eV(r;n) .


On rappelle ici que ces fonctions sont relatives au systme de sphres molles avec une valeur donne
de lexposant n. Dans la limite des sphres dures (n +), on supposera que y(r; n) tend vers
une fonction rgulire y, la diffrence de eV(r;n) qui tend vers la fonction de Heaviside H(r).
Discuter rapidement cette hypothse et retrouver le rsultat de lExercice 4.7.
Exercice 4.9 (quilibre dun gaz isotherme sous gravit). Un gaz parfait tant en quilibre
dans le champ de la pesanteur, donner sa densit et sa pression P en fonction de laltitude z.
Exercice 4.10 (Rponse linaire un champ de forces extrieur). un systme de N
particules en interaction, trait dans lensemble canonique, on applique un champ de forces extrieures qui drive du potentiel (r), suppos petit, et dont les effets seront traits au premier
ordre. Le hamiltonien est donc de la forme (4.13), avec = 1 et
B(Q, P) =

N
X

(qi ).

i=1

(1) En utilisant (4.14), calculer au premier ordre la variation de hAi lquilibre induite temprature constante par lapplication du champ extrieur (r), dans le cas o lobservable A est
de la forme :
N
X
A(Q) =
(qi ),
i=1

avec une fonction quelconque. En dduire une expression de la variation du champ de densit
un corps (1) (r) faisant intervenir la densit deux corps (2) introduite en (2.27), du systme
non perturb.
(2) Montrer que pour un systme homogne (fluide) on peut exprimer ce rsultat avec les transformes de Fourier de et de la fonction de corrlation de paires, faisant ainsi apparatre le
facteur de structure S(k) (on pourra admettre pour simplifier que la perturbation sannule
en-dehors dune certaine rgion).
(3) Dans lhypothse o le potentiel appliqu varie lentement dans lespace, crire au premier
ordre la variation du champ de densit du systme fluide qui en rsulte lquilibre, par une
approche purement macroscopique (statique des fluides), faisant apparatre la compressibilit
isotherme .
(4) En dduire la relation (2.29) entre facteur de structure et compressibilit isotherme.
Exercice 4.11 (Deuxime coefficient du viriel). On appelle dveloppement du viriel lcriture
de la pression dun fluide comme srie entire de la densit, sous la forme :

P (, T ) = kB T 1 + b2 (T ) + b3 (T )2 + . . . ,
et le coefficient bi (T ) est le i-me coefficient du viriel. On se propose dvaluer b2 (T ) dans le cas
dun systme de particules interagissant par un potentiel de paire ne dpendant que de la distance,
V(r).
(1) Ecrire lintgrale de configuration Zq en fonction des quantits fij associes aux paires de
particules, dfinies par :
fij = exp[V(rij )] 1,
en adoptant lapproximation suivante dans lintgrande de lintgrale :
Y
X
(1 + fij ) ' 1 +
fij .
1i<jN

1i<jN

Discuter cette approximation et lutiliser pour valuer lnergie libre dexcs F ex .

74

4 Lensemble canonique

(2) En dduire la pression dexcs et la valeur du deuxime coefficient du viriel b2 (T ). Que vaut-il
pour les sphres dures ? Vrifier que lon retrouve lapproximation donne par (3.8).
(3) Dans le cas gnral, montrer que le dveloppement de la pression jusquau second ordre en
correspond une certaine approximation de basse densit pour la fonction de corrlation de
paires g(r) dans la formule (2.26).
Exercice 4.12 (Modes propres dune chane de ressorts). On considre un systme unidimensionnel form dune chane de particules de masse m lies leurs voisines par des ressorts de
raideur K, avec des conditions aux limites priodiques. Trouver le changement de coordonnes
qui permet dcrire le hamiltonien du systme sous forme dune somme de hamiltoniens associs
des oscillateurs harmoniques indpendants. On cherchera les coordonnes de ces oscillateurs en
considrant des modulations sinusodales du dplacement le long de la chane, avec des longueurs
donde sous-multiples de la longueur de la chane.

5
chantillonnage de la mesure canonique

5.1 Le schma de Metropolis-Hastings . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


5.1.1 Lalgorithme de Metropolis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.2 Le schma de Metropolis-Hastings . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.3 Quelques raffinements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 La dynamique de Langevin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.1 Brve introduction pratique aux quations diffrentielles stochastiques
5.2.2 La dynamique de Langevin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3 Tests statistiques de convergence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.1 Vitesse de convergence pour les chanes de Markov . . . . . . . . . . . . . . . . .
5.3.2 Convergence de certaines observables . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.4 Application numrique : fluide de Lennard-Jones . . . . . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

76
76
79
81
82
82
85
88
89
91
93
96

Ce chapitre prsente des mthodes dchantillonnage de la mesure canonique. Lobjectif


est dengendrer, par une mthode numrique adquate, une suite de configurations microscopiques (q n , pn )n0 telles que
Z
Niter
X1
1
A(q n , pn ) =
A(q, p) dcan (q, p),
Niter + Niter
E
n=0
lim

avec
dcan (q, p) = Z

1 H(q,p)

dq dp,

Z=

eH(q,p) dq dp.

(5.1)

(5.2)

Remarquons que lchantillonnage des impulsions ne pose pas de problme (car les impulsions
peuvent tre considrs comme des variables alatoires gaussiennes indpendantes), et la vraie
difficult est dchantillonner la partie configurationnelle de la mesure canonique, cest--dire la
mesure
Z
dcan (q, p) = Z 1 eV (q) dq,
Z =
eV (q) dq,
DN

o D est lensemble des configurations accessibles. Cette tche nest pas triviale car le nombre de
degrs de liberts du systme est usuellement trs grand, et la mesure dcan trs concentre (i.e.
elle prend des valeurs non ngligeables sur un ensemble de trs petite taille). Des mthodes usuelles
dintgration numrique ou de quadrature (lments finis, diffrences finies, etc) ne peuvent pas
tre utilises du fait de la grande dimension de lespace. En effet, le nombre de points considrer
est bien trop grand : si on utilise par exemple des diffrences finies, il y a K Ndim points considrer,
le nombre de degrs de liberts valant Ndim 1036 dans la pratique. De mme, des mthodes
usuelles dchantillonnage en probabilits (algorithme de rejet, fonction dimportance) ne peuvent
N

76

5 chantillonnage de la mesure canonique

gnralement pas tre utilises en tant que telles car on ne dispose pas dune bonne approximation
a priori de la mesure chantillonner.
Nous prsentons dans ce chapitre des techniques couramment employes dans la pratique quotidienne de la simulation molculaire pour calculer des moyennes, utilisant une chane de Markov
(en particulier le schma de Metropolis-Hastings), ou des quations diffrentielles stochastiques
(surtout la dynamique de Langevin) convenablement discrtises. Dans les deux cas, on peut montrer que la mesure canonique est prserve par la dynamique. On peut mme obtenir des thormes
de convergence, du type de la Loi des Grands Nombres, pour justifier des limites telles que (5.1).
Ainsi, contrairement au cas microcanonique, lergodicit est ici un rsultat quon peut prouver
rigoureusement. Cependant, on verra aussi que, mme si lergodicit est assure dun point de vue
thorique, il se peut quen pratique les temps de simulations associes soient prohibitivement longs
pour observer la convergence de la moyenne (5.1).
Finissons par un point davertissement important : les dynamiques que nous prsentons dans
ce chapitre ne sont pas des dynamiques physiques ! On doit simplement les considrer comme des
moyens commodes dchantillonner une mesure de probabilit.

5.1 Le schma de Metropolis-Hastings


Le schma de Metropolis et ses raffinements permettent dchantillonner une mesure de probabiliti connue sa constante de normalisation prs. Ceci est heureux en pratique car les fonctions
de partitions sont difficiles calculer. Le cadre thorique qui sous-tend ces algorithmes est celui
de la thorie des chanes de Markov. Une chane de Markov est un processus alatoire temps
discret dont le rsultat litration n + 1 ne dpend que du rsultat litration n, et non des
itrations prcdentes (incrments sans mmoire).
Une chane de Markov est dtermine de manire unique par son noyau de transition, qui donne
la probabilit de passer dune configuration q une configuration q 0 . La suite des configurations
visites (q 0 , q 1 , . . . , q n , . . . ) est une suite de variables alatoires corrles. En particulier, on ne peut
pas appliquer les thormes de convergence usuels pour les variables alatoires indpendantes et
identiquement distribues (loi des grands nombres, thorme de la limite centrale, etc). Cependant,
il existe des thormes analogues dans le cas des chanes de Markov, qui permettent de conclure
la convergence de lchantillonnage (voir 5.3).
5.1.1 Lalgorithme de Metropolis
Lalgorithme historique de Metropolis et al. [26] utilise une fonction de proposition T (q, q 0 )
qui permet, partir dune configuration donne q, de proposer une nouvelle configuration q 0 en
perturbant la configuration q. La fonction T (q, ) est la densit dune mesure de probabilit :
Z
T (q, ) 0,
T (q, q 0 ) dq 0 = 1.
DN

Pour lalgorithme de Metropolis originel, cette fonction de proposition doit tre symtrique, au
sens o
T (q, q 0 ) = T (q 0 , q).

5.1 Le schma de Metropolis-Hastings

77

Algorithme de Metropolis
Algorithme 5.1. Pour n 0,
(1) proposer une nouvelle configuration qn+1 partir de la configuration q n , avec une fonction
de proposition symtrique T (q n , qn+1 ) ;
(2) accepter la nouvelle configuration avec une probabilit




n+1
n
can (
q n+1 )
p = min 1,
= min 1, e[V (q )V (q )] ,
n
can (q )
et poser q n+1 = qn+1 dans ce cas ; sinon q n+1 = q n .

Remarque 5.1 (Accepter avec une probabilit p). En pratique, pour dcider si on effectue une action
avec une probabilit 0 p 1, on tire un nombre alatoire U uniformment entre 0 et 1 (on notera
U U[0, 1]), et on effectue laction si U p. Ainsi, si p est petit, il est peu probable que U p. La
gnration dun nombre alatoire selon U[0, 1] se fait par exemple en Scilab avec la commande rand.
On peut interprter cet algorithme de la manire suivante : si la nouvelle configuration a une
nergie infrieure la configuration actuelle, on laccepte coup sr ; sinon, on laccepte avec une
certaine probabilit, dautant plus grande que la nouvelle nergie est proche de la prcdente. Notons quil est important dassurer quon peut accepter des nergies plus grandes, car cela permet
de franchir des barrires nergtiques (ventuellement en plusieurs coups) et de passer dun minimum local du potentiel un autre. Remarquons galement que lorsquune proposition est rejete,
on garde la configuration prcdente, qui compte donc plusieurs fois dans la moyenne (5.1) (sans
quoi, ladite moyenne serait fausse !).
On peut considrer des fonctions de proposition non symtriques dans la gnralisation lalgorithme propose par Hastings [21] (voir 5.1.2). La preuve de convergence de lAlgorithme 5.1 est
dailleurs faite dans le cadre plus gnral du 5.1.2.
Exemple 5.1 (chantillonnage dun potentiel double puits). On considre une particule astreinte
se mouvoir dans le potentiel unidimensionnel (3.3), savoir
V (q) = h(q + 1)2 (q 1)2 .
On va chantillonner la mesure canonique (5.2) pour = 1, et diffrentes valeurs de h, en utilisant
le schma de Metropolis. Il faut en premier lieu dcider quelle fonction de proposition symtrique
T nous allons utiliser. Le choix le plus simple est dutiliser des incrments indpendants et alatoirement distribus selon une loi uniforme ou gaussienne par exemple. Notant N (a, b) la loi dune
variable gaussienne centre en a et de variance b, et U[a, b] la loi uniforme sur [a, b], on peut
considrer


 1
|q 0 q|2
q 0 = q + G, G N (0, 2 )
et donc T (q, q 0 ) = 2
exp
= T (q 0 , q), (5.3)
2 2
ou

1
1|q0 q| = T (q 0 , q).
(5.4)
2
Partant de q 0 = 0, une ralisation de lAlgorithme 5.1 avec la fonction de proposition (5.4) donne,
pour h = 1, = 0, 4 et Niter = 104 itrations, des positions distribues de manire peu prs
gale dans les deux puits, avec des transitions nombreuses entre les puits (voir la figure 5.1).
Lhistogramme des positions visites semble indiquer que les positions sont asymptotiquement
correctement rparties. En revanche, si la barrire nergtique h pour passer dun puits un autre
est plus grande (par exemple h = 4), alors lalgorithme de Metropolis reste longtemps coinc
dans un des puits, ce qui met en pril la convergence numrique de lchantillonnage. On pourrait
q 0 = q + U, U U(, )

et donc T (q, q 0 ) =

78

5 chantillonnage de la mesure canonique

0.8
3.0

0.7

2.5
Densit de probabilit

Densit de probabilit

0.6
0.5
0.4
0.3

2.0

1.5

1.0

0.2
0.5

0.1
0.0
2.0

1.5

1.0

0.5

0.0

0.5

1.0

1.5

2.0

0.0
2.0

1.5

1.0

0.5

0.0

0.5

1.0

1.5

2.0

(b) h = 4

(a) h = 1

Fig. 5.1. Comparaison entre la densit de probabilit thorique (courbe) et empirique (histogramme)
des configurations visites (algorithme de Metropolis), pour deux valeurs de h.

remdier ce problme en considrant des incrments moins locaux (qui permettraient de passer
directement dun puits un autre, comme 3). Cet exemple montre tout le savoir-faire parfois
ncessaire pour assurer un chantillonnage correct. Ceci est dautant plus vrai que la dimension
du systme est grande.
Exemple 5.2 (Fluide de Lennard-Jones). On considre un fluide de Lennard-Jones, dont les positions des N particules sont notes q = (q1 , . . . , qN ). Partant dune configuration q n donne, on
peut crer une nouvelle configuration de plusieurs manires diffrentes. Par exemple, on peut choisir une particule au hasard (i.e. tirer un entier {1, . . . , N } au hasard) et modifier alatoirement sa
position dun dplacement tir selon une loi uniforme ou gaussienne. Si on dplace par exemple
une particle par un mouvement gaussien standard (en dimension 3) mutipli par un facteur , on
a la fonction de proposition

!

3
N
n+1
n 2
X
Y
|q

q
|
1
1
j
j

T (q n , q n+1 ) =
qkn (qkn+1 )
exp
.
N
2 2
2
j=1
k6=j

En effet, on a une probabilit 1/N de choisir un indice j au hasard (ce qui donne le premier terme
de la somme, qui exprime le fait que parmi les positions qkn+1 , seul qjn+1 est diffrent de qjn ), et
ensuite on effectue un dplacement gaussien pour cette particule, do le second terme. On peut
imaginer bien dautres modifications, par exemple effectuer un dplacement pour chaque particule
selon un ordre dfini (et pas alatoire comme ci-dessus), en acceptant ou rejetant chaque fois
la nouvelle configuration ainsi produite ; ou en dplaant toutes les particules avant de rejeter ou
accepter, auquel cas
!
PN

3N
n+1
n 2
|q

q
|
1
j
j
j=1

T (q n , q n+1 ) =
exp
.
2 2
2
Bien sr, on peut considrer des magnitudes de dplacements i dpendant de la particule en
question (si jamais certaines ont des longueurs dinteraction plus grandes que les autres, on
pourra rduire i ).
Remarque 5.2 (Choix des paramtres de la fonction de proposition et taux de rejet). La doxa en
simulation molculaire est que les paramtres des fonctions de proposition doivent tre choisis
afin que le taux dacception dans lalgorithme de Metropolis soit de lordre de 0,5. Cest une rgle
dusage, fonde sur une constatation empirique, et qui ne peut tre justifie mathmatiquement que
dans certains cas limites analytiques. Mais en pratique, on se rend compte que cette prescription

5.1 Le schma de Metropolis-Hastings

79

permet en effet datteindre une bonne performance de lalgorithme en terme de variance (i.e.
permet de rduire au mieux lerreur statistique). Lide est que les erreurs statistiques sont lies
la trop grande corrlation entre les configurations chantillonnes. Cette corrlation peut avoir
deux origines pour lalgorithme de Metropolis :
(i) un taux de rejet trop grand conduit considrer souvent q n+1 = q n , ce qui est, en un sens, une
corrlation maximale. Ceci arrive si les dplacements proposs sont trop grands, conduisant
des configurations atypiques ;
(ii) des dplacements trop petits, ce qui conduit certes taux de rejet trs petit, mais les nouvelles
configurations ressemblent alors normment aux prcdentes.
Il sagit donc de trouver un bon compromis entre le fait daccepter dune nouvelle configuration
et le fait davoir des nouvelles configurations assez diffrentes des prcdentes, do cette rgle du
moiti rejet/moiti acceptation.
5.1.2 Le schma de Metropolis-Hastings
Le schma de Metropolis-Hastings a t propos par Hastings en 1970 [21]. On ne fait plus
lhypothse que la fonction de proposition est symtrique, mais on tient compte du biais engendr
par lasymtrie de la proposition en modifiant la probabilit dacceptation/rejet.
Algorithme de Metropolis-Hastings
Algorithme 5.2. Pour n 0,
(1) proposer une nouvelle configuration qn+1 partir de la configuration q n , avec une probabilit T (q n , qn+1 ) ;
(2) accepter la nouvelle configuration avec une probabilit


can (
q n+1 )T (
q n+1 , q n )
n n+1
p = r(q , q ) = min 1,
,
can (q n )T (q n , qn+1 )
et poser q n+1 = qn+1 dans ce cas ; sinon q n+1 = q n .
On vrifie que lon retrouve bien lalgorithme de Metropolis originel dans le cas dune fonction
de proposition symtrique. La chane de Markov correspondante est caractrise par le noyau de
transition


Z
P (q, dq 0 ) = r(q, q 0 )T (q, q 0 ) dq 0 + 1

r(q, Q)T (q, Q) dQ


DN

q ,

qui donne la probabilit, partant de q, darriver dans un voisinage qd0 dune autre configuration
q 0 DN . On peut donc voir le noyau de transition comme une famille de mesures de probabilit
indexe par q DN . La premire partie du noyau de transition provient des pas accepts de q
vers q 0 : on a une probabilit T (q, q 0 ) de proposer la configuration q 0 partant de q, et ensuite une
probabilit r(q, q 0 ) daccepter ce mouvement. La seconde partie du membre de droite rsume tous
les mouvements rejets, pour lesquels on reste la position initiale q. La probabilit de rejet est
la probabilit complmentaire de la probabilit dacceptation, qui est la somme des probabilits
lmentaires dacceptation r(q, q 0 )T (q, q 0 ) dun mouvement de q vers q 0 . On vrifie ainsi que
Z
P (q, dq 0 ) = 1.
DN

On dfinit ensuite rcursivement, pour un borlien B B(DN ), la probabilit darriver en B en


exactement n pas, partant de q :
Z
P n (q, B) =
P (q, dq 0 ) P n1 (q 0 , B).
DN

80

5 chantillonnage de la mesure canonique

On dit que la chane de Markov est irrductible si pour tout q DN et tout borlien B B(DN )
de mesure de Lebesgue strictement positive, il existe n 1 tel que P n (q, B) > 0. Cela traduit une
proprit daccessibilit globale de toutes les rgions de lespace des phases (on peut atteindre un
voisinage de nimporte quel point en un nombre fini de pas). Dans le cas du schma de MetropolisHastings, cette accessibilit est lie un choix judicieux de la fonction de proposition T .
Exemple 5.3. Pour le fluide de Lennard-Jones, on peut vrifier facilement que des dplacements
alatoires dune ou plusieurs particules permettent de passer dune configuration nimporte quelle
autre en un nombre fini de pas (comme dans un jeu de taquin, on dplace des particules pour placer
q1 dans la position souhaite, puis on fait de mme pour q2 , etc). Chaque dplacement alatoire
a une probabilit strictement positive (mme si elle est trs petite !) dtre observ, ce qui donne
au final une probabilit strictement positive de passer dune configuration une autre.
On montre que le schma de Metropolis-Hastings converge au sens du thorme suivant.
Thorme 5.1 (Convergence du schma de Metropolis-Hastings). Supposons que la
chane de Markov engendre par le schma de Metropolis-Hastings soit irrductible. Alors, pour
toute observable A L1 (can ), et pour presque tout q 0 DN ,
1X
A(q i ) hAi =
n+ n
i=1
n

lim

DN

A(q) can (q) dq

p.s.

Remarquons donc que lon peut montrer que la dynamique de Metropolis-Hastings est ergodique, contrairement au cas microcanonique, o lergodicit est une hypothse. La preuve de ce
rsultat utilise un certain nombre de concepts avancs de la thorie des chanes de Markov. Le
lecteur intress pourra se rfrer [27], et nous nous contentons de donner les lments prinipaux
de la preuve.
Preuve. La preuve de la convergence se dcompose en deux parties : (i) on montre tout dabord
que la mesure can est une mesure invariante de la dynamique de Metropolis-Hastings ; (ii) comme
elle est par ailleurs irrductible (et apriodique, car on a une probabilit non nulle de rester sur
place) et admet une mesure de probabilit invariante, on obtient la proprit dergodicit le long
dune trajectoire recherche.
La preuve de convergence se rduit donc montrer linvariance de la mesure cible can . Pour
ce faire, on vrifie que pour toute fonction f L1 (can ),
Z
Z
Z
f (q 0 )can (q)P (q, dq 0 ) dq =
f (q 0 )can (q 0 ) dq 0 .
DN

DN

DN

Ceci traduit en effet de manire faible (en dualit contre des fonctions intgrables) que, partant de can et faisant un pas de la dynamique de Metropolis-Hastings avec le noyau P (terme
can (q)P (q, dq 0 )), on retrouve bien can .
On remarque en premier lieu que, notant a(q, q 0 ) = T (q, q 0 )r(q, q 0 ) la probabilit daccepter un
mouvement de q vers q 0 , on a la proprit dite de bilan dtaill
can (q)a(q, q 0 ) = can (q 0 )a(q 0 , q).
Alors,

DN

DN

f (q 0 )can (q)a(q, q 0 ) dq 0 dq =

Z
DN

DN

f (q 0 )can (q 0 )a(q 0 , q) dq 0 dq.

Par ailleurs,
Z
Z



Z
f (q 0 )can (q) 1
r(q, Q)T (q, Q) dQ q (dq 0 ) dq =
DN
DN


Z
f (q 0 )can (q 0 ) 1
a(q 0 , Q) dQ dq 0 .

Z
DN

=
DN

DN

(5.5)

5.1 Le schma de Metropolis-Hastings

En sommant les deux contributions prcdentes,


Z
Z
Z
0
0
f (q )can (q)P (q, dq ) dq =
DN

DN

Ceci conclut la preuve de linvariance de la mesure.

DN

81

f (q 0 )can (q 0 ) dq 0 .
u
t

Remarque 5.3 (Invariance de la mesure). On retiendra surtout de la preuve prcdente quune


condition ncessaire pour la convergence de la chane de Markov est que la mesure cible soit
invariante. Ceci peut sinterprter de deux manires :
(i) si on avait des conditions initiales canoniquement distribues, i.e. q 0 dcan , alors lensemble des q 1 donns par une itration de la chane de Markov est encore distribu selon dcan ;
(ii) on a galement une interprtation trajectorielle : si on considre lensemble des configurations visites le long dune trajectoire suffisamment longue, elles forment globalement un
chantillon distribu selon dcan , et ce, bien quelles soient corrles.
Remarque 5.4 (Bilan dtaill). La proprit de bilan dtaill (5.5) est galement une proprit
importante, qui exprime une certaine rversibilit de la chane de Markov : tant dans une configuration q plus probable que la configuration q 0 , on a une probabilit plus grande daller en q
partant de q 0 que le contraire. Ceci est li un flux de probabilit assurant la conservation de la
mesure invariante.
Exemple 5.4 (Diffusion brownienne ajuste). On prsente ici un schma de Metropolis-Hastings
introduit dans [30] (MALA, Metropolized Adjusted Langevin Algorithm). Pour une particule dans
un potentiel unidimensionnel V , et partant dune configuration q, on propose une nouvelle configuration q 0 par une dynamique de gradient perturbe :
r
2
0
q = q V (q) +
U,
U N (0, 1).
(5.6)

La configuration propose diffre de la configuration originelle cause du terme V (q) qui tend
ramener les configurations vers des minima locaux de lnergie potentielle (donc des configurations
plus probables), le terme alatoire permettant de ne pas systmatiquement diminuer lnergie. La
probabilit datteindre q 0 partant de q est ainsi
r



|q 0 q + V (q)|2
T (q, q 0 ) =
exp
.
4
4
Notons que T (q, q 0 ) 6= T (q 0 , q) en gnral, cause du terme de force V . En pratique, lintensit des perturbations proposes est choisie afin dobtenir un taux dacceptation/rejet proche
de 0,5, afin que lalgorithme soit le plus efficace possible. Ceci peut tre justifi thoriquement
dans certains cas. Nous verrons en 5.3 selon quels critres on peut numriquement chercher un
paramtre optimal. On prsente en figure 5.2 quelques rsultats dchantillonnages obtenus avec
cet algorithme pour le potentiel (3.3), pour = 0, 2 et n = 104 itrations de la chane de Markov.
5.1.3 Quelques raffinements
De nombreux travaux ont propos des amliorations des algorithmes de type Metropolis ou
Metropolis-Hastings. En fait, ce quon cherche amliorer, ce sont les fonctions de proposition T
utilises. Ainsi,
(i) on peut proposer de nouveaux mouvements adapts la physique du systme. Par exemple,
pour des fluides de Lennard-Jones ou des mlanges de fluides, il peut tre intressant de
combiner des mouvements locaux (du type des algorithmes prcdents), et des mouvements non-locaux, comme, par exemple, dplacer une seule particule en tirant sa nouvelle
position compltement alatoirement dans le domaine de simulation (ou seulement parmi
des zones de lespace densit plus faible), changer le type dune particule, casser une
liaison chimique et en recrer une autre ailleurs, etc ;

82

5 chantillonnage de la mesure canonique

0.9

1.6

0.8

1.4
1.2
Densit de probabilit

Densit de probabilit

0.7
0.6
0.5
0.4
0.3

0.8
0.6
0.4

0.2

0.2

0.1
0.0
2.0

1.0

1.5

1.0

0.5

0.0

0.5

1.0

1.5

0.0
2.0

2.0

1.5

1.0

0.5

0.0

0.5

1.0

1.5

2.0

(b) h = 4, taux de rejet 0,87

(a) h = 1, taux de rejet 0,3303

Fig. 5.2. Comparaison entre la densit de probabilit thorique (courbe) et empirique (histogramme)
des configurations visites (algorithme de Metropolis-Hastings, version MALA avec = 0.2).

(ii) on peut galement utiliser des manires plus abstraites de proposer des nouveaux mouvements : un cas typique est celui o lon simule deux rpliques du systme des tempratures diffrentes, une temprature haute (on sattend donc ce que la chane de
Markov des configurations chantillonnes cette temprature converge plus rapidement),
et une temprature basse ; les configurations proposes la temprature basse tant celles
chantillonnes par la temprature haute. Cette technique, connue sous le nom de parallel
tempering permet de lutter contre la mtastabilit 1 du systme (voir lExercice 5.3).

5.2 La dynamique de Langevin


On prsente dans cette section une manire de modifier la dynamique hamiltonienne pour
faire en sorte quelle puisse explorer tous les niveaux dnergie, et avec la bonne frquence (cest-dire de manire cohrente avec la mesure canonique). On utilise pour ce faire des processus
stochastiques, qui sont des dynamiques en temps continu (comme la dynamique hamiltonienne), au
contraire des approches de type chanes de Markov prsentes ci-dessus. Cela dit, numriquement,
la discrtisation des processus stochastiques conduit naturellement considrer des chanes de
Markov.
5.2.1 Brve introduction pratique aux quations diffrentielles stochastiques
Quelques proprits du mouvement brownien
On rappelle rapidement quelques proprits lmentaires du mouvement brownien afin de prsenter des discrtisations dquations diffrentielles stochastiques (EDS) simples. Considrons le
processus stochastique qt donn par
dqt = dWt ,

q0 = q 0 ,

(5.7)

o Wt est un mouvement brownien standard de dimension 1 (pour simplifier). Le mouvement


brownien standard est tel que
0 t0 tn ,

Wti+1 ti N (0, ti+1 ti ),

les variables (Wti+1 ti )i=0,...,n1 tant par ailleurs indpendantes. On peut donc voir lEDS (5.7)
comme la limite lorsque t 0 du schma numrique (il sera suffisant, pour les besoins de ce
cours, davoir cette image en tte) :
1. Cest dire une convergence numrique trs lente, voir la 5.3 pour plus de prcisions.

5.2 La dynamique de Langevin

q n+1 = q n + t Gn ,

83

(5.8)

25

25

20

20

15

15

10

10

5
y

o q n est une approximation de qnt , les (Gn )nN tant des variables alatoires gaussiennes standard indpendantes. Notons que lincrment du mouvement brownien est distribu selon une gaussienne de variance t,ce qui revient en pratique ajouter une variable alatoire gaussienne multiplie par un facteur t.
On dduit facilement de (5.8) que q n est une variable gaussienne centre et q 0 et de variance n 2 t (et en fait, dans ce cas simple, q n et qnt sont distribus selon les mmes lois). La

10

10

15

15

20

20

25
25

20

15

10

10

15

20

25
25

25

20

15

10

10

15

20

25

Fig. 5.3. Deux ralisations dun mouvement brownien (5.7) selon la discrtisation (5.8) pour t = 0, 1
et nt = 100.

figure 5.3 prsente deux ralisations (i.e. deux trajectoires) de (5.7), avec la discrtisation (5.8),
dans le cas dun mouvement brownien de dimension 2. Un mouvement brownien de dimension d
est Wt = (W1,t , . . . , Wd,t ), o chacun des Wi,t est un mouvement brownien standard de dimension 1, ces diffrents mouvements browniens tant par ailleurs indpendants.
Evolution en temps de la loi de qt
Nous avons caractris qt par sa loi (gaussienne centre en x0 , de variance 2 t), ce qui tait facile
car nous en avions une expression analytique explicite. De tels calculs ne peuvent toutefois pas
tre mens analytiquement en gnral, et il faut savoir comment volue la loi des solutions dune
EDS. Pour cela, il est commode de considrer un ensemble (infini) de ralisations de lEDS (5.7),
partant de configurations initiales distribues selon une mesure d 0 = (q) dq. Les configurations
sont alors distribues au temps t selon la loi de densit (t, ). 2
Nous allons prsent tablir formellement lquation aux drives partielles (EDP) satisfaite
par . Nous omettons volontairement de prciser les notions de rgularit de fonctions et les
espaces fonctionnels adquats. Lesprance (la moyenne) dune fonction A est, au temps t,
Z
E(A(qt )) =
A(q) (t, q) dq.
DN

Pour simplifier, on se place dans le cas o qt R (on indiquera ensuite comment les rsultats sont
modifis dans le cas dun espace de dimension suprieure), auquel cas Gn N (0, 1). On regarde
commment E(A(q n )) varie dune itration lautre. Pour ce faire, on utilise la discrtisation (5.8),
et on effectue un dveloppement de Taylor :

2. Nous admettrons que, pour t > 0, la loi de la variable alatoire qt est effectivement densit par
rapport la mesure de Lebesgue. Cela provient de la proprit rgularisante de lquation dvolution
parabolique satisfaite par cette loi.

84

5 chantillonnage de la mesure canonique




E(A(q n+1 )) = E A(q n + t Gn )





2 t 00 n
3/2
n
0 n
n
n 2
= E A(q ) + t A (q ) G +
A (q )(G ) + O(t )
2

2 t
= E(A(q n )) + t E(A0 (q n ))E(Gn ) +
E(A00 (q n ))E((Gn )2 ) + O(t3/2 )
2
2 t
= E(A(q n )) +
E(A00 (q n )) + O(t3/2 ),
2
en utilisant, pour passer de la deuxime la troisime ligne, lindpendance des variables alatoires
q n et Gn et la linarit de lesprance. Ainsi,


Z
Z
2 t 00
A(q) ((n + 1)t, q) dq =
A(q) +
A (q) (nt, q) dq + O(t3/2 ).
(5.9)
2
DN
DN
Une intgration par parties donne (on suppose que les termes de bords valent 0 ou se compensent) :


Z

((n + 1)t, q) (nt, q) 2 2


A(q)

q (nt, q) dq = O( t).
t
2
DN
Lorsque t 0 avec nt t, on obtient :


Z
2 2
A(q) t (t, q)
q (t, q) dq = 0.
2
DN
Cette quation tant valable quelle que soit la fonction A, on en dduit que
t =

2 2
.
2 q

Dans le cas multidimensionnel, on montre de la mme manire que


t =

2
,
2

(t = 0, ) = ().

Cette EDP est lquation de Fokker-Planck associe lEDS (5.7). On a ainsi une simple quation
de diffusion. Si on part initialement dune mesure de Dirac en x0 , on sait que lon trouve au temps
t une gaussienne de variance 2 t, centre en x0 . Rappelons en effet que la solution lmentaire de
lquation de la chaleur
2
t =
, (t = 0, ) = 0 ,
2
en dimension 3N est bien
3N/2



1
q2
,
(t, q) =
exp

2 2 t
2 2 t
comme on peut le vrifier directement.
Une quation diffrentielle stochastique modle
La dynamique brownienne ci-dessus tait une diffusion libre sur tout lespace. On souhaiterait
la modifier afin dobtenir un processus qui chantillonne la mesure canonique. Une manire de
faire est dajouter un terme de drive, qui ramne la dynamique vers les zones importantes de la
mesure (i.e. vers des valeurs pas trop grandes de V ) au lieu de laisser la diffusion schapper. On
peut penser par exemple une dynamique de gradient perturbe par un mouvement brownien,
telle que

5.2 La dynamique de Langevin

dqt = V (qt ) dt + dWt ,

85

(5.10)

o Wt est un mouvement brownien standard de dimension dN , o d est la dimension de lespace


physique ambiant. Une discrtisation de cette EDS est par exemple le schma

(5.11)
q n+1 = q n V (q n ) t + t Gn ,
o les Gn sont des vecteurs gaussiens standard indpendants et identiquement distribus (i.i.d.)
de dimension dN .
Notant encore (t, ) la loi de qt , on montre que lquation de Fokker-Planck associe
lEDS (5.10) est
2
t = (V ) +
= L.
2
On peut en effet motiver cette quation par un travail similaire celui fait ci-dessus pour la
diffusion libre. Il apparat un terme supplmentaire de la forme
Z
tA(q) V (q) (nt, q) dq

DN

dans (5.9), quon transforme laide dune intgration par parties pour liminer laction des
drives sur la fonction A.
On peut alors vrifier que, si
2
2 = ,
(5.12)

la mesure canonique est une solution stationnaire de lquation de Fokker-Planck, au sens o


Lcan = 0. Ceci montre bien en effet que si on part dune variable distribue initialement selon
can et quon la fait voluer selon (5.10), on aura (t, ) = can pour tout t 0. La vrification de
la proprit Lcan = 0 ne pose pas de problme particulier :




2
2
V
V
V
L e
= (e
V ) +
e
= 1
(eV V ) = 0,
2
2
avec le choix (5.12). La relation (5.12), fondamentale pour assurer lchantillonnage de la bonne
mesure, est appele relation de fluctuation-dissipation, dans la mesure o elle dtermine la taille
typiques des fluctuations alatoires imposer (ces fluctuations apportant de lnergie au systme)
pour compenser le terme de dissipation V et ce, afin que lnergie moyenne du sytme soit
correcte.
Concernant le schma numrique (5.11), si le potentiel V vrifie certaines conditions (par
exemple, si V est globalement lipschitzien) et que le pas de temps t est assez petit, on peut
montrer que les positions visites par le processus stochastique sont distribues selon une mesure dt proche de la mesure dcan (q) = Z 1 eV (q) . Ce biais peut tre corrig en ajoutant une
tape de Metropolis (voir la figure 5.4, et comparer galement (5.11) avec lAlgorithme 5.2 avec la
fonction de proposition (5.6)). On verra au 5.3 que, sans correction de type Metropolis, il faudra
distinguer dans le calcul de moyenne canonique un terme derreur statistique, et un terme de biais
li au pas de temps.
5.2.2 La dynamique de Langevin
En 1827, le botaniste R. Brown a dcouvert au microscope le mouvement incessant et irrgulier
de petites particules en suspension dans leau. Le mouvement de ces particules, nommes alors
browniennes est une consquence de lagitation thermique petite chelle. Cest Albert Einstein,
qui, en 1905, a donn la premire explication thorique claire de ce phnomne, et cest pour reprsenter la position dune particule brownienne quun processus stochastique a t construit pour
la premire fois, par N. Wiener en 1923. Le modle de Langevin est un modle phnomnologique
dans lequel on analyse leffet du fluide sur la particule brownienne en considrant deux forces : une

86

5 chantillonnage de la mesure canonique

0.8

1.5
0.7

1.0
0.5

0.5

0.0

Densit de probabilit

0.6

0.4

0.3

0.5

0.2

1.0

0.1

0.0
2.0

1.5
1.5

1.0

0.5

0.0

0.5

1.0

1.5

2.0

1000 2000 3000 4000 5000 6000 7000 8000 9000 10000
Iteration n

(b) x en fonction du numro n de litration.

(a) Histogramme des positions visites.

Fig. 5.4. Ralisation de lEDS (5.10) avec la discrtisation (5.11) pour t = 0, 05, nt = 50, = 1 pour
le potentiel (3.3).

force de frottement visqueux, et une force fluctuante, cense reprsenter les impacts incessants des
molcules du fluide sur la particule brownienne 3 . La dynamique de Langevin est ainsi donne par
lEDS suivante :

pi,t

dt,
dqi,t =
m
(5.13)
p

dpi,t = qi V (qi,t ) dt i,t dt + dWi,t ,


mi
o les (Wi,t )t0 sont des mouvements browniens standard indpendants de dimension 3. Les paramtres and sont respectivement la friction et lamplitude des fluctuations alatoires. Ils sont
lis par la relation de fluctuation-dissipation, qui assure que la mesure canonique est une solution
stationnaire de lquation de Fokker-Planck associe (5.13) :
2 =

2
.

(5.14)

La calcul qui mne cette relation est analogue au calcul qui mne (5.12). Il suffit de noter que
lquation de Fokker-Planck associe (5.13) est

2
t = M 1 p q + q V p + p (M 1 p) +
p ,
2
et que exp(H) en est une solution stationnaire.
Rgimes limites
Notons que si = 0 (et donc = 0), on retrouve la dynamique hamiltonienne usuelle (voir
la figure 5.5 pour une illustration). On peut galement montrer quon retrouve (5.10) dans la
limite m 0. Cependant, en pratique, la dynamique de Langevin est souvent plus efficace pour
chantillonner la mesure canonique que sa limite de fortes frictions (5.10) (voir par exemple [5]).
3. En fait ceci na pas grand sens : les petites molcules qui constituent la particule brownienne sont tout
aussi agites que celles du fluide. De plus, la sparation dchelles de temps, sur laquelle se fonde le modle,
entre grosses particules (lentes) et molcules du fluide (rapides) ignore le couplage entre le mouvement des
particules browniennes et ceux du fluide la mme chelle : ainsi la vitesse moyenne dans un volume de
fluide gal celui de la particule varie lentement, elle aussi. Le modle de Langevin, bien quayant jou
un rle important pour le traitement de diffrents phnomnes une chelle msoscopique en espace et
en temps, nest pas une description correcte de la dynamique des particules browniennes, pour laquelle il
a initialement t invent. Fort heureusement, il concide dans ce cas, pour des temps assez longs, avec le
modle dEinstein, qui consiste crire (5.10), et est pleinement justifi pour les particules collodales en
suspension. Et quelle que soit la validit physique de lquation de Langevin, cela ne remet bien sr pas en
cause lusage qui en est fait ici, o on fait appel une dynamique fictive pour chantillonner une mesure.

5.2 La dynamique de Langevin

87

Mise en uvre numrique


Une discrtisation de dpi,t = qi V (qi,t ) dt

pi,t
dt + dWi,t est par exemple
mi

pn+1
= pni qi V (qin ) t
i

pni
t + t Gni ,
mi

avec (Gni )i,n des vecteurs gaussiens standard indpendants. On peut ainsi discrtiser lEDS (5.13)
par le schma suivant, qui consiste faire un demi-pas de temps en impulsions, un pas de temps
en positions, et un demi-pas de temps en impulsions :

pn t 1
t
n+1/2

i
+ tGni ,
= pni qi V (q n )
pi

2
m
2
2

n+1/2
p
,
qin+1 = qin + t i

mi

t
pn+1 t 1

n+1/2

pn+1
qi V (q n+1 )
= pi
i
+ tGni .
i
2
mi 2
2
Pour des questions de stabilit numrique, on a implicit le second demi-pas de temps en impulsions, mais on peut remettre le schma sous forme explicite :



pni

t
n+1/2

n
n
n

V
(q
)

+
p
=
p
+

qi
i ,
i
i

2
mi

n+1/2

p
qin+1 = qin + t i
,
(5.15)
mi

t
t n
1

n+1/2
n+1

pi

=
qi V (q n+1 ) +
Gi .
pi
t
2
2
1 + 2m
i

1
p

Notons que si = 0 (et donc = 0), on retrouve le schma de Verlet usuel. Notons galement que

3
4

4
1.5

1.0

0.5

0.0

0.5

(a) = 0, 1

1.0

1.5

1.5

1.0

0.5

0.0

0.5

1.0

1.5

(b) = 3

Fig. 5.5. Trajectoire dune ralisation de la dynamique de Langevin avec la discrtisation (5.15) pour t =
0.005, nt = 5 pour le potentiel (3.3). Pour petit (a), les trajectoires sont (localement) proches des
trajectoires hamiltoniennes. Lorsque augmente (b) ainsi, en raison de (5.14), que lamplitude du bruit
le caractre erratique de la dynamique est plus apparent.

lon emploie deux fois le mme nombre alatoire dans la premire et la dernire quations car on
a, dans un certaine mesure, coup en deux le terme alatoire. Dans le cas V = 0 et = 0, on
alors

pn+1
= pni + t Gni ,
i

88

5 chantillonnage de la mesure canonique

qui est bien une discrtisation consistante de dpi,t = dWt . On aurait galement pu intgrer la
premire et la dernire quation en employant des nombres alatoires indpendants, mais auquel
cas il aurait fallu tenir compte du fait quon intgre pendant un temps t/2. On aurait ainsi des
mises jour des demi-pas de temps de la forme
r
pni t
t n
n+1/2
n
n t
= pi qi V (q )
pi

+
G ,
2
mi 2
2 i
et
pn+1
i
n+1/2

avec Gni , Gi

n+1/2
pi

qi V (q

n+1

pn+1 t
t
i
+
)
2
mi 2

t n+1/2
G
,
2 i

indpendants.

Convergence
On peut montrer, pour toute friction ( condition que soit donn par (5.14)) que
lEDS (5.13) admet la mesure canonique comme mesure invariante, et que, partant dune condition
initiale quelconque et moyennant quelques hypothses sur le potentiel dinteraction V (voir [5]),
on a
Z
Z
1 T
lim
A(qt , pt ) dt =
A(q, p) dcan (q, p).
T + T 0
E
En pratique, on discrtise convenablement (5.13) (avec le schma (5.15) par exemple), et on calcule
une approximation de la moyenne densemble par
Z
Niter
X1
1
A(q n , pn ) =
A(q, p) dcan (q, p) + O(t).
Niter + Niter
E
n=0
lim

Notons en effet que, contrairement au schma de Metropolis-Hastings qui chantillonne exactement


la mesure canonique, la mesure chantillonne par la dynamique de Langevin nest pas exactement
la mesure canonique, et lerreur est usuellement de lordre de O(t). Si le pas de temps est
suffisamment petit, cette erreur est difficilement mesurable, eu gard aux fluctuations statistiques
des quantits que lon cherche calculer (voir 5.3).

5.3 Tests statistiques de convergence


Le Thorme 5.1 montre que, sous des hypothses souvent facilement vrifies en pratique,
le schma de Metropolis-Hastings est ergodique. On a galement des rsultats analogues pour la
dynamique de Langevin. Toutefois, en pratique, il est possible que cette convergence soit lente, et
que lalgorithme reste coinc pour des temps longs dans certaines rgions de lespace des configurations. Ces rgions sont appeles des tats mtastables, et un des grands dfis de la simulation
molculaire actuelle est dchantillonner au mieux la mesure canonique malgr la prsence de ces
tats mtastables. Pour mieux comprendre la mtastabilit, on prsente au 5.3.1 des rsultats de
convergence plus prcis pour les chanes de Markov, qui sont, rappelons le, le bon cadre thorique
pour la tudier la convergence des mthodes numrique.
Pour valuer la qualit de la convergence, on a souvent recours des conditions ncessaires
de convergence : on pourra demander ainsi que les moyennes empiriques sur une trajectoire dun
certain nombre dobservables aient converg. Cette approche est dtaille au 5.3.2, mais est
insuffisante pour caractriser la convergence. On ne sait dcider que la non-convergence, et il
faudra alors se dire que si rien nindique quon na pas converg, alors on admettra que lon
a converg... La question de la convergence de lchantillonnage est minemment difficile et non
encore rsolue. Le lecteur pourra en juger par lui-mme au cours des sances de travaux pratiques...

5.3 Tests statistiques de convergence

89

5.3.1 Vitesse de convergence pour les chanes de Markov


Erreur statistique
Sous des hypothses techniques que nous ne dtaillons pas ici (voir par exemple [27]), on peut
montrer quune chane de Markov (q n , pn ) ergodique pour la mesure canonique vrifie galement
une sorte de thorme de la limite centrale :



N AN hAi N (0, 2 ),
(5.16)
can

lorsque N +, o

N 1
1 X
AN =
A(q n , pn ),
N n=0

est la moyenne trajectorielle 4 de lobservable A, et


Z
hAican =
A(q, p) can (q, p) dq dp
E

sa moyenne densemble. La quantit est la variance de la chane de Markov, et peut se dcomposer comme la somme dune variance intrinsque (gale la variance qui rsulterait dune moyenne
de variables alatoires indpendantes), et dune variance additionnelle provenant des corrlations
entre les configurations successives :
2 = Varcan (A) + 2

+
X



Ecan (A(q 0 , p0 ) hAican )(A(q n , pn ) hAican ) ,

(5.17)

n=1



Varcan (A) = Ecan (A hAican )2 .

Ainsi,on peut dire que lerreur statistique commise en approchant hAican par AN est de lordre
de / N . Il est donc important en pratique de bien estimer , afin dobtenir des estimations
prcises de la moyenne densemble, ou au moins de quantifier correctement les erreurs. On peut
par exemple obtenir un intervalle de confiance 95% selon



IN (A) = AN 1.96 , AN + 1.96


.
N
N
Exemple 5.5 (Exemple analytique : importance des termes de corrlations). Considrons lobservable A(q) = q et la chane de Markov unidimensionnelle
p
q n+1 = (1 t)q n + 2 1 tGn ,
(5.18)
o les variabes alatoires (Gn )n0 sont des gaussiennes standard i.i.d. Pour simplifier, on suppose
que


1
q 0 N 0,
(1 t/2)
qui est la mesure invariante de la chane (voir Example 5.6). La variance (5.17) peut tre calcule analytiquement
dans ce cas car E(q n ) = E(q 0 ) = 0 pour tout n 0, et E q n q 0 =


(1 t)n E (q 0 )2 . Ainsi,
2
.
2 =
t
Il est instructif de comparer cette variance
 
E q 2 = 1 (1 t/2)1 ,
qui est la variance obtenue pour des variables i.i.d. distribues selon la mesure invariante prcise cidessus. On note que leffet des corrlations augmente significativement la variance, et ce, dautant
plus que t est petit.
4. Dans cette section, on notera, pour simplifier, N le nombre d itrations, not prcdemment Niter .
On fera attention ne pas le confondre avec le nombre de particules formant le systme molculaire...

90

5 chantillonnage de la mesure canonique

Elments de dmonstration de (5.17)


Donnons une preuve formelle de la formule (5.17). Quitte remplacer A par A hAican , on
peut supposer que hAican = 0. On a alors

N
X
1
A(q i )A(q j ) .
Varcan (AN ) = 2 Ecan
N
i,j=1
Supposons que la chane soit stationnaire (pour cela, il faut attendre un temps assez long, dit
temps de thermalisation, pour que la chane soit lquilibre), cest--dire que
h
i


Ecan A(q i )A(q j ) = Ecan A(q 0 )A(q |ij| ) .
Alors,
N Varcan (AN ) = Ecan (A2 ) + 2


N 
X


k
1
Ecan A(q 0 )A(q k ) .
N

k=1

Supposant que

+
X



Ecan A(q 0 )A(q k ) < +,
k=1

une application du thorme de convergence domine montre que


N Varcan (AN )

+
X



Ecan A(q 0 )A(q k ) ,

k=1

ce qui donne (5.17).


Biais
On a vu que les chanes de Markov obtenues par discrtisation dquations diffrentielles stochastiques ayant la mesure canonique pour mesure stationnaire, peuvent ne plus admettre la
mesure canonique comme mesure invariante, mais plutt une mesure canonique approche, note
t
can . Dans ce cas, on sattend ce que



N AN hAit
N (0, 2 ),
can
la variance tant toujours donne dans par la formule (5.17), quitte remplacer can par t
can .

Dans ce cas, on peut dire que lerreur commise en


approchant
hAi
par
A
est
de
la
somme
can
N

dune erreur statistique, toujours de lordre de / N , et dun biais systmatique, de lordre de




hAit hAican = O(tp ),
can
o p dpend de la prcision du schma numrique. Pour les schmas prsents dans ce chapitre,
p = 1. En pratique, le terme de biais est souvent largement ngligeable devant lerreur statistique.
Exemple 5.6. Une situation dans laquelle on peut dmontrer rigoureusement une telle estimation est celle de lExemple 5.5, pour lequel on peut identifier la mesure invariante effectivement
chantillonne par la dynamique p
numrique. La chane de Markov (5.18) est une discrtisation
consistante de lEDS dqt = qt + 2 1 dWt , qui a pour mesure invariante
exact N (0, 1 ),
alors que la dynamique discrtise a pour mesure invariante

5.3 Tests statistiques de convergence


t
num
N

0,

1
(1 t/2)

91


.

Pour montrer ce rsultat, on commence par remarquer que si on part dune distribution gaussienne
centre, on conserve une distribution gaussienne centre. On peut donc crire q n N (0, an ) la
n-ime itration. On cherche la limite de an lorsque n +. On crit pour cela une quation
sur la variance an :


p
2t n 2
E((q n+1 )2 ) = E (1 t)2 (q n )2 + 2(1 t) 2t 1 q n Gn +
(G ) ,

et donc
an+1 = (1 t)2 an +

2t
.

On vrifie alors facilement que


an a =

1
.
(1 t/2)

lorsque n +.
5.3.2 Convergence de certaines observables
Pour les systmes rels, on ne peut pas savoir si on a vraiment converg ou non vers la loi cible.
Tout ce quon peut faire, cest vrifier que certaines moyennes reprsentatives ont converg.
Utilisation de ralisations indpendantes
On peut penser tester la convergence de la moyenne dune observable le long dune trajectoire. Ceci nest toutefois quune condition ncessaire de convergence, pas suffisante en pratique.
En effet, lorsque la dynamique dchantillonnage reste coince dans un tat mtastable, seule
une exploration locale est faite. Ainsi, dans le cas de la figure 5.1b, si lobservable en question
tait A(q, p) = q, on aurait une moyenne fausse (autour de 1), mais une variance plus petite que
dans la situation de la figure 5.1a !
Il faut ajouter la convergence le long dune trajectoire une mesure de la convergence sur les
diffrentes ralisations possibles. Pour cela, on considre M ralisations indpendantes du processus
dchantillonnage, partant de M conditions initiales indpendantes 5 (q 1,0 , p1,0 ), . . . , (q M,0 , pM,0 ).
On note (q m,n , pm,n )n=0,...,N 1 les configurations chantillonnes partant de la condition initiale
(q m,0 , pm,0 ). Pour une observable donne A, on calcule la moyenne trajectorielle pour chacune des
ralisations :
N 1
1 X
Am
=
A(q m,n , pm,n ),
N
N n=0
la moyenne empirique globale :
M
1 X m

A ,
AN =
M m=1 N

et la variance entre les moyennes trajectorielles :


2
M,N
(A) =

M
2
N X  m
AN AN .
M m=1

Sous de bonnes hypothses,


2 =

2
lim M,N
.


2
En effet, (5.16) montre que pour N assez grand, on a N Var Am

hAi
can ' .
N

lim

M + N +

5. Obtenir de telles conditions initiales est dj un dfi en soi ! Usuellement, on thermalise le systme
avec dynamique de Langevin par exemple, et on choisit les conditions initiales parmi les configurations
visits, en veillant les prendre suffisamment espaces afin de limiter la corrlation. On peut ventuellement
effectuer cette dynamique une temprature plus leve pour augmenter encore plus la dcorrlation.

92

5 chantillonnage de la mesure canonique

Moyenne par blocs


Dans la pratique, il est souvent plus commode de considrer une seule longue trajectoire pour
calculer les moyennes canonique. Il est encore possible dobtenir une estimation de lerreur statistique par une procdure dite moyennes par blocs, qui consiste dcomposer une longue trajectoire en morceaux de taille croissante (voir [14] pour une rfrence dans le monde de la physique
statistique computationnelle, ou [16] dans la littrature en statistique).
Plus prcisment, considrons une trajectoire (q i )i1 de longueur N = nm, m tant le nombre
de blocs et n le nombre de points dans un bloc. Les variables alatoires
1
n

Akn =

kn
X

A(qi ),

k = 1, . . . , m

i=(k1)n+1

sont approximativement distribues selon N (hAican , 2 /n), o 2 est donne par (5.17). Un estimateur de 2 est donc
m
n X k
2
n,m
(An Anm )2 ,
=
m1
k=1

Anm
tant la moyenne sur toute la trajectoire. On peut galement obtenir une estimation
2
de lerreur statistique commise en approchant 2 par n,m
, voir [14] pour plus de dtails. Dans
tous les cas, la mthode nest valide que si la longueur de corrlation typique est (beaucoup) plus
petite que la taille des blocs. En pratique, on augmente progressivement la taille des blocs, ce qui
fait que la variance estime augmente (car on prend de plus en plus compte de la corrlation) et
on regarde quelle valeur la variance se stabilise.
A1nm

Quelques exemples
Exemple 5.7 (Exemple analytique). On reprend la chane de Markov (5.18). La figure 5.6 prsente
des estimations de la variance 2 , obtenues en utilisant plusieurs rpliques indpendantes, ou des
moyennes par blocs, dans le cas = 1 et t = 0, 05. Rappelons que la valeur analytique de la
variance est 2/(t) = 40.

10

10

Trajectorial average

10

10

15

20

25

Logarithmic block length (p)

2
Fig. 5.6. Gauche : Variance N,M
en fonction de la longueur N de la trajectoire, avec M = 100
2
trajectoires indpendantes. Lapproximation linaire (ligne en traits interrompus) donne N,M
' 40N 1 .
Droite : Estimation de la dviation standard par moyenne par blocs, en fonction de la taile n = 2p des
blocs (ligne pleine). On a moyenn sur 100 estimations indpendantes (intervalle de confiance en traits
pointills).

Exemple 5.8 (Dtection de la mtastabilit.). Considrons le potentiel double-puits V (q) = (q 2


1)2 , et une trajectoire de la dynamique (5.11) avec = 5 et t = 0, 05. On sattend une mtastabilit du potentiel, et donc ce que la particule reste longuement confin dans un puits avant de
passer un autre. Deux observables ont un comportement trs diffrent : lnergie potentielle, qui

5.4 Application numrique : fluide de Lennard-Jones

93

est symtrique (V (q) = V (q)) et la position q. La position moyenne devrait tre gale 0, mais il
est possible que la lente convergence numrique empche une estimation prcise de cette moyenne
densemble ; alors que la convergence de lobservable nergie potentielle devrait tre nettement
plus rapide puisque la mtastabilit ne laffecte pas. La figure 5.7 prsente les estimations de la
variance obtenues par les mthodes dcrites ci-dessus. Comme prvu, la variance de lobservable
position est bien plus grande que celle de lobservable nergie potentielle.

Position

Energy

10

10
10
Trajectorial average

10

10

10

15

20

25

30

Logarithmic block length (p)

2
Fig. 5.7. Gauche : Variance N,M
en fonction de la longueur N de la trajectoire, avec M = 100 trajectoires
indpendantes. Lapproximation linaire (ligne en traits interrompus) donne 2 ' 2500 pour lobservable
position, et 2 ' 0.20 pour lobservable nergie potentielle. Droite : Estimation de la dviation standard
par moyenne par blocs, en fonction de la taile n = 2p des blocs (ligne pleine), pour lobservable position.
On a moyenn sur 100 estimations indpendantes (intervalle de confiance en traits pointills). La valeur
estime de la variance est 2 ' 2800.

Conclusion et mise en garde


On retiendra donc que
seule la non-convergence est dcidable : tout ce quon peut faire en pratique, cest considrer plusieurs observables, aussi diffrentes que possibles (nergie, temprature cintique,
pression,. . . ), et vrifier que chacune semble avoir converg, au sens o lintervalle de
confiance est raisonnablement petit la fin de la simulation, et o plusieurs simulations
partant de conditions initiales diffrentes donnent les mmes rsultats (avec une variance qui
naugmente pas lorsquon rassemble les configurations microscopiques correspondantes) ;
il faut, dans tous les cas, rester humble face la caractrisation de la convergence, et plutt
faire la liste des indicateurs qui sont en accord avec lhypothse selon laquelle la convergence
a eu lieu, que de dire quon a converg.
On trouvera plus de rfrences et de prcisions sur la mesure de la convergence dun chantillonnage
par chane de Markov dans [17, chapitres 3 et 8].

5.4 Application numrique : fluide de Lennard-Jones


On considre un fluide dargon une densit = 1400 kg/m3 , simul avec une dynamique de
Langevin la temprature cible T = 400 K. On utilise des pas de temps t = 5 1015 s, avec
t/m = 0, 005 (m tant la masse dun atome dargon, de masse molaire M = 39, 95 g/mol).
Notons quil sagit dun fluide dense (la densit est suprieure elle de leau liquide, en units
rduites on a 3 ' 0,833), supercritique (la temprature critique de largon est environ 151 K,
sa densit critique 535 kg/m3 ). Nous nous situons dans la rgion marque F du diagramme de
phases de la figure 1.3.

94

5 chantillonnage de la mesure canonique

Thermalisation des quantits de mouvement


On peut vrifier que la distribution des quantits de mouvement est conforme la prdiction thorique (distribution de Maxwell) la temprature simule. En particulier, la temprature
cintique, dfinie comme la moyenne de lobservable
Tc (q, p) =

N
1 X p2i
,
3N kB i=1 mi

415

415

410

410

405

405

Kinetic temperature

Kinetic temperature

doit tre gale la temprature vise. La figure 5.8 donne les valeurs de Tc observes en fonction
de lindice ditration, pour des systmes de tailles diffrentes. On observe bien la bonne moyenne,
et la variance est gale 2T 2 /N , conformment la prdiction (exercice).

400

395

390

400

395

390

385
1000

6000
Time step

11000

385
1000

(a) N = 8000 particules

6000
Time step

11000

(b) N = 64000 particules

Fig. 5.8. Evolution typique de la temprature cintique au cours du temps, pour un fluide dargon de
densit = 1400 kg/m3 la temprature cible T = 400 K. On note que les fluctuations de Tc diminuent
lorsque N augmente.

Capacit calorifique
On calcule prsent la capacit calorifique molaire volume constant.
Cv =

NA
(hH 2 i hHi2 )
N kB T 2

pour T = 400 ou 600 K. On utilise un pas de temps t = 1014 s T = 400 K avec t/m = 0, 01,
et t = 5 1015 s, t/m = 0, 005 T = 600 K. Les valeurs de rfrence sont extraites de
tables thermodynamiques 6 , et donnes dans la lgende des diffrents tracs de Cv en fonction du
nombre de pas de temps de simulation (figure 5.9).
On observe, en particulier, la convergence des rsultats, avec une prcision augmentant avec
le nombre de pas de temps. En moyenne, 500 000 pas de temps semblent suffisants pour assurer
une convergence de lordre de 0,2 J/K/mol (soit une erreur relative de lordre de 1 %). On ne la
pas fait ici, mais une manire plus rigoureuse de proposer une barre derreur est de calculer la
variance de Cv , ce qui demande le calcul du moment dordre 4 de lnergie ou plusieurs simulations
indpendantes.
Bien entendu, la partie idale de Cv se calcule aisment, puisquelle vaut simplement
(R = NA kB ' 8,314J/K tant la constante des gaz parfaits)
6. Toutes les rfrences exprimentales que nous considrons pour largon sont tires du NIST Chemistry
Webbook, http://webbook.nist.gov/chemistry/fluid/

5.4 Application numrique : fluide de Lennard-Jones


18.5

95

18.3
18.2

18.3
18.1
18.0
18.1
17.9
17.9

17.8
17.7

17.7
17.6
17.5
17.5
17.4
17.3
1e5

2e5

3e5

4e5

5e5

6e5

17.3
1e5

(a) T = 400 K, valeur tabule 18,12 J/K

2e5

3e5

4e5

5e5

6e5

(b) T = 600 K, valeur tabule 17,46 J/K.

Fig. 5.9. Estimation de la capacit calorifique molaire volume constant Cv en fonction du nombre de
pas de temps.

Cvid =

3
R ' 12,471 J/K.
2

quation dtat de largon


Nous montrons pour finir le calcul de la relation entre densit et pression dans largon la
temprature de 300 K, depuis la pression atmosphrique ordinaire jusqu des pressions 10000
fois plus leves (pour lesquelles la densit rduite 3 atteint environ 1,07). La temprature
est largement suprieure la temprature critique (de 151 K). Dans cette gamme largon passe
continment de ltat de vapeur ordinaire, qui est bien dcrit par lquation dtat des gaz parfaits,
celui de fluide trs dense supercritique.

700

1800
600

1600

500
Densit (kg/m^3)

Densit (kg/m^3)

1400
1200
1000
800
600

400
300
200

400
100

200

0
0

200

400

600

800

1000

Pression (MPa)

10

15

20

25

30

35

40

Pression (MPa)

(a) Masse volumique fonction de P

(b) Dtail des faibles pressions.

Fig. 5.10. Loi dtat de largon T = 300 K (+) compare des mesures exprimentales (courbe
pleine).

La figure 5.10a compare les rsultats numriques aux donnes exprimentales, ce qui donne
un trs bon accord. On notera que lon peut atteindre par la simulation des rgimes inaccessibles
exprimentalement. Sur la figure 5.10b apparat la tangente lorigine, dont la pente est donne
par la loi des gaz parfaits, soit, avec P en MPa et la densit de masse en kg/m3 ,
P = 6, 2433 102 .

96

5 chantillonnage de la mesure canonique

Exercices
Exercice 5.1. Lalgorithme Hybrid Monte-Carlo a t propos dans [12] pour chantillonner la
mesure canonique. Cest une chane de Markov, dfinie par la procdure suivante.
Hybrid Monte Carlo
Algorithme 5.3. Pour une configuration initiale q 0 M et > 0,
(1) gnrer des impulsions pn selon la maxwellienne la temprature inverse et calculer
lnergie E n = H(q n , pn ) de la configuration (q n , pn ) ;
(2) calculer (q n , pn ) = (pn, , q n, ), en intgrant la dynamique hamiltonienne sur lintervalle de temps [0, ] en partant de la condition initiale (q n , pn ) ;
(3) calculer lnergie E n, = H(q n, , pn, ) de la nouvelle configuration et accepter la nouvelle
configuration q n, avec une probabilit
n = min(1, e(E

n,

E n )

).

Dans ce cas, poser q n+1 = q n, , sinon q n+1 = q n .

(1) Montrer que les tapes (1) et (2) de lalgorithme (dans le cas o est le flot de la dynamique
hamiltonienne) prservent la mesure canonique.
(2) Montrer que si est le flot de la dynamique hamiltonienne, alors ltape dacceptation/rejet
nest pas ncessaire. Quen est-il dans le cas o est le flot dfini par un schma numrique ?
(3) Montrer que si le schma numrique est rversible et prserve le volume dans lespace des
phases, alors la mesure canonique est invariante par la chane de Markov.
(4) Montrer que cet algorithme nest pas ergodique pour un potentiel harmonique si est gal
un multiple priode, mais quil est ergodique pour les autres choix de . Commenter.
Exercice 5.2. Il est possible de remplacer la rgle dacceptation dans le schma de MetropolisHastings (Algorithme 5.2) par dautres rgles. Montrer par exemple que la rgle de Baker
rBaker (q n , qn+1 ) =

can (
q n+1 )T (
q n+1 , q n )
n+1
n+1
n
can (
q
)T (
q
, q ) + can (q n )T (q n , qn+1 )

permet galement dassurer la prservation de la mesure canonique


Exercice 5.3. Le parallel tempering consiste simuler deux rpliques dun mme systme en
parallle, chacun selon une dynamique de Monte-Carlo par exemple, et proposer de temps en
temps un change des configurations. Notant 1 , 2 les tempratures inverses des systmes, et q1 , q2
les configurations microscopiques avant lchange propos entre les configurations q1 et q2 , montrer
que la probabilit daccepter lchange des configurations est donne par
r(q1 , q2 ) = e(1 2 )(V (q1 )V (q2 )) .

6
Un exemple de proprit dynamique : lautodiffusion dans
les fluides

La physique statistique ne se borne pas tudier les proprits des systmes constitus dun
grand nombre de particules en interaction dans leurs tats dquilibre thermodynamique, elle vise
galement prdire comment ils vont voluer au cours du temps sous laction de sollicitations
extrieures. On souhaite ainsi retrouver, par exemple, le comportement visqueux des fluides en
coulement, ou bien les proprits de conductivit thermique des matriaux, partir de lchelle
molculaire. La simulation numrique par dynamique molculaire, puisquil sagit de modliser la
dynamique physique du systme et non pas seulement dchantillonner une certaine mesure dans
lespace des phases a t utilise pour cela ds son origine.
Nous ne donnons ici quune illustration dans un cas simple dun domaine vaste et complexe de
la physique statistique, dont ltude est plus difficile que celle des proprits dquilibre. Lexemple
de lautodiffusion des molcules dun fluide nous permet dillustrer le rle des fonctions de corrlation dpendant du temps et la relation entre rponse linaire des sollicitations extrieures et
corrlations du systme non perturb.
Tout au long de ce chapitre il est admis que les diffrentes moyennes sont values selon la
distribution de Boltzmann-Gibbs, tant entendu que lusage de lensemble canonique est conforme
aux indications du paragraphe 4.4.2 et naffecte que le tirage alatoire dune configuration initiale,
la dynamique hamiltonienne mise en uvre par la suite ignorant tout couplage avec le thermostat.
Les rsultats concernant la thermodynamique et les coefficients de transport macroscopiques sont
indpendants de lensemble statistique utilis pour les obtenir dans la limite thermodynamique
(i.e. dans la limite N +).
6.1 La diffusion de particules marques dans un fluide . . . . . . . . . . . . . . . 98
6.1.1 chelles de temps et nature du mouvement . . . . . . . . . . . . . . . . . . . . . . . . 98
6.1.2 Mouvement brownien et diffusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
6.2 Proprits des fonctions de corrlation . . . . . . . . . . . . . . . . . . . . . . . . . . 101
6.2.1 Proprits gnrales des fonctions de corrlation dpendant du temps . 101
6.2.2 Proprits particulires de la fonction dautocorrlation des vitesses . . . 103
6.3 Relation entre corrlation et rponse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6.3.1 Importance des proprits de rponse linaire . . . . . . . . . . . . . . . . . . . . . . 105
6.3.2 Rponse linaire une perturbation du Hamiltonien . . . . . . . . . . . . . . . . 105
6.3.3 Mobilit dune particule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
6.4 Remarques finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

98

6 Un exemple de proprit dynamique : lautodiffusion dans les fluides

6.1 La diffusion de particules marques dans un fluide


6.1.1 chelles de temps et nature du mouvement
Dans un fluide, imaginons que nous marquons une ou plusieurs molcules sil y en a plusieurs, elles seront suffisamment loignes pour ne pas sinfluencer mutuellement pour en suivre
les mouvements. Cest bien sr possible en dynamique molculaire, et des techniques de marquage
isotopique autorisent galement de telles expriences en laboratoire. Les interactions de la particule avec ses voisines modifient peu peu sa vitesse, jusqu la dcorrler compltement de sa
valeur initiale. Mesure sur une dure assez longue, la vitesse dune particule chantillonne
alors

la distribution de Maxwell, conformment (3.5). Sa moyenne est nulle, et sa variance, soit v2 ,
gale 3kB T /m.
La fonction dautocorrlation de la vitesse, dfinie par :
C(t) = hv(0) v(t)i ,

(6.1)

caractrise la perte dinfluence de la condition initiale pour la trajectoire dune particule (dans
un fluide, du fait de lisotropie, C(t) peut tre dfinie partir de la corrlation dune coordonne
quelconque x de la vitesse : on a alors C(t) = 3 hvx (0)vx (t)i).
La fonction dautocorrlation de la vitesse est reprsente sur la figure 6.1 1 dans le liquide
de Lennard-Jones, normalise par sa valeur initiale C(0) = 3kB T /m. Elle prsente un dbut

Fig. 6.1. Fonction dautocorrlation de la vitesse (6.1)r


dans le liquide de Lennard-Jones On utilise des
48
.
units rduites : = 3 , T = kB T /, t = t/ et =
m 2

doscillation pour des temps intermdiaires, et ne se distingue plus de zro pour des temps de
lordre de quelques units (rduites). De fait, pendant des intervalles de temps t successifs grands
devant lunit utilise sur cette figure, les dplacements r successifs dune particule dont on suit le
1. Rsultats dus D. Lvesque et L. Verlet, cits dans [20].

6.1 La diffusion de particules marques dans un fluide

99

Fig. 6.2. Trajectoire dune particule dans le fluide de sphres dures pour la compacit = 0,24, vue en
projection dans les 3 plans de coordonnes. Les points noirs reprsentent les positions aux moments des
collisions, qui correspondent un changement de direction de la vitesse.

mouvement sont dcorrls. On a alors une marche alatoire dont les trajectoires erratiques, comme
le montre la figure 6.2, rappellent celles dun mouvement brownien (comparer la figure 5.3).
6.1.2 Mouvement brownien et diffusion
Hypothse dindpendance et consquences
Prcisons cette analogie, en admettant (cest une hypothse trs forte, qui nest pas exacte
en pratique) que les dplacements ri de la particule pendant des intervalles de temps successifs
t sont statistiquement indpendants. Ils sont alors galement quidistribus (le mouvement dune
particule est un processus stationnaire lquilibre), de moyenne nulle (par isotropie) et admettent
une matrice de covariance que nous prenons gale :
hr r i = 2Dt ,
dfinissant ainsi le coefficient D. Pour simplifier, tudions le mouvement selon la coordonne x
les autres coordonnes variant de faon indpendante. Agrgeons M  1 pas x, dfinissant des
pas plus grands x, correspondant aux mouvements pendant des intervalles de temps successifs
de longueur t = M t. Nous obtenons alors une chane de Markov (xn )nN , avec, en vertu du
thorme de la limite centrale,

xn+1 = xn + 2D t Gn ,
avec des variables alatoires Gn N (0, 1) indpendantes, cest--dire exactement (5.8) : on retrouve la discrtisation du mouvement brownien introduite au chapitre 5. temps long devant
t, on sait que chacune des coordonnes du vecteur bout--bout r(t) r(0) de la chane est
distribue comme N (0, 2Dt). Il y a talement, ou diffusion de la densit de probabilit de prsence du marcheur alatoire, et D, dont la dimension est [L]2 [T ]1 , est par dfinition le coefficient
de diffusion. Ltalement de cette densit correspond, physiquement, au mlange progressif des

100

6 Un exemple de proprit dynamique : lautodiffusion dans les fluides

molcules marques avec le reste du fluide, jusqu ce que leur concentration soit uniforme dans
lchantillon. tout instant t, la concentration c de particules marques obit lquation de
diffusion :
c
= Dc.
(6.2)
t
Il en est de mme pour la densit de probabilit de la position dune seule particule.
Test numrique
On peut vrifier quen dpit de lusage de lapproximation dindpendance, qui est une simplification, les observations sont bien en accord avec les conclusions quon en a tires concernant la
description statistique du mouvement long terme. Ainsi, on a bien r2 (t) t pour le carr de la
distance parcourue, comme le montre la figure 6.3, aprs quelques collisions dans le cas des sphres
dures, ou plus gnralement une fois passe la dure caractristique doscillation dune particule
dans la cage forme par ses proches voisines. Dans les simulations, on peut donc obtenir le


Fig. 6.3. Carr moyen de la distance parcourue, |r(t) r(0)|2 fonction de t dans le fluide de sphres
dures = 0,24 (mmes units que celles de la figure 2.2).

coefficient de diffusion selon :


|r(t) r(0)|2
D = lim
t+
6t

(6.3)

Autodiffusion et diffusion dune particule diffrente en solution ou en suspension


Nous avons jusquici considr que les particules marques dont on suit le mouvement taient
des molcules du fluide identiques toutes les autres. Cest pourquoi on parle alors plus prcisment
dautodiffusion surtout en prsence dautres phnomnes de type diffusif, pour viter de les
confondre.
Rien ne change qualitativement dans les considrations qui prcdent si la particule suivie est
dune nature diffrente. Il peut sagir dune molcule dun solut, ou bien encore dune particule
collodale, cest--dire, typiquement, dune taille comprise entre le nanomtre et le micron. De tels
objets peuvent tre dcrits comme macroscopiques (comme des chantillons de matire continue),
mais sont toujours sensibles lagitation molculaire, ils constituent les particules browniennes
observables au microscope. Un changement quantitatif notable par rapport au cas des molcules
est la brivet du temps de corrlation de leur vitesse, au regard du temps typique ncessaire pour
que leur dplacement soit de lordre de leur diamtre. De ce fait, le mouvement de ces particules

6.2 Proprits des fonctions de corrlation

101

peut tre dcrit comme brownien toutes les chelles de temps physiquement pertinentes pour
dcrire leur trajectoire.
Le coefficient de diffusion des particules collodales est nettement plus faible que celui des
molcules. On verra plus loin pourquoi il est donn par la formule (1.5).

6.2 Proprits des fonctions de corrlation


6.2.1 Proprits gnrales des fonctions de corrlation dpendant du temps
Dfinition
Rappelons la dfinition des fonctions de corrlation introduite au Chapitre 2, par (2.15). En
gnral, on appelle fonction de corrlation (on sous-entend alors : dpendant du temps) des observables A et B la covariance de A et de B(t). La fonction B(t) est obtenue partir de B en
remplaant les coordonnes de (Q, P) E par celles de t (Q, P), qui rsultent dune volution par
la dynamique hamiltonienne pendant la dure t partir de Q, P, pris comme microtat initial.
Ainsi, B(t) est par dfinition lobservable B t . La fonction de corrlation, note CAB a donc
pour dfnition :
CAB (t) = hA(0)B(t)i hAi hBi = Cov (A, B t ) .
(6.4)
Sa valeur t = 0 est la covariance Cov (A, B).
Stationnarit
Nous avons dj rencontr la proprit de stationnarit, qui justifie la dfinition sous la
forme (6.4), avec un choix arbitraire de lorigine des temps. Elle rsulte de lquilibre, la mesure de
probabilit can dans lespace des phases E qui dfinit les moyennes cest--dire la distribution de
Bolzmann-Gibbs de lensemble canonique tant indpendante du temps. La stationnarit signifie
que les moyennes sont indpendantes du temps : on a
t R,

hA t i = hAi ,

et, en considrant le produit de deux observables, fonctions de (Q, P) que lon peut composer avec
le flot hamiltonien t pour diffrentes valeurs de t, on trouve :
t, t0 R,

hA(t0 )B(t + t0 )i hAi hBi = hA(0)B(t)i hAi hBi = CAB (t).

Pour les observables qui sont des fonctions diffrentiables des coordonnes des microtats, on peut
dfinir leur drive par rapport au temps par :
A =

N
N
X
X
A
A
A H
A H
q i +
p i =

.
q
p
q
p
p
i
i
i
i
i qi
i=1
i=1

(6.5)

La stationnarit entrane des relations utiles pour des fonctions de corrlation impliquant de telles
drives temporelles des observables. En effet, notons dabord que lon peut permuter moyenne et
drive par rapport au temps, on a ainsi
Z
d
d
hA(0)B(t)i =
A(Q, P)B t (Q, P)dcan (Q, P)
dt
dt
Z E
D
E

=
A(Q, P)B t (Q, P)dcan (Q, P) = A(0)B(t)
.
E

En crivant ensuite que la drive de hA(t0 )B(t + t0 )i par rapport t0 sannule (stationnarit), on
obtient pour des observables quelconques, fonctions rgulires des qi et des pi , lgalit :
D
E
D
E
d

CAB (t) = CAB (t) = A(0)B(t)


= A(0)B(t)
= CAB
(6.6)
(t).
dt

102

6 Un exemple de proprit dynamique : lautodiffusion dans les fluides

Effets dun renversement des vitesses


Exploitons maintenant la proprit de rversibilit de la dynamique hamiltonienne, exprime
par (2.4) laide de loprateur de renversement des vitesses S. Notons dabord que beaucoup dobservables utiles ont une parit dfinie vis--vis du renversement des vitesses, cest--dire quelles
vrifient :
A S = A A,
(6.7)
avec A = 1 pour certaines, dites paires, comme lobservable nergie, cest--dire le Hamiltonien
H, ou lobservable pression (dont la moyenne apparat dans la formule 2.23), et A = 1 pour
dautres, dites impaires, comme la vitesse dune particule marque que nous tudions dans ce
chapitre. On vrifie aisment que si lobservable A, fonction diffrentiable de (Q, P) possde la
parit A , alors sa drive temporelle, donne par (6.5), est dote de la parit oppose.
Les quantits de mouvement napparaissant que sous la forme de leurs carrs (distribution de
Maxwell) dans la densit de probabilit canonique, on aura, pour toute observable A,
hAi = hA Si ,

(6.8)

de sorte que la moyenne dune observable impaire est nulle, ainsi que la covariance de deux observables de parits opposes.
Considrons maintenant deux observables A et B ayant des parits dfinies A et B , et cherchons relier CAB (t) CBA (t). Pour simplifier lcriture, nous supposons quitte remplacer A
par A hAi et B par B hBi que leurs moyennes sont nulles. Exploitant dabord (2.4), sous la
forme t = S t S, on a :
CAB (t) = hA(B t )i = hA (B S t S)i ,
qui entrane daprs (6.8) applique au produit des deux observables, sachant que S S = I,
CAB (t) = h(A S) (B S t )i ,
que lon transforme alors par (6.7) applique A et B en
CAB (t) = A B hA(0)B(t)i .
Invoquant alors la stationnarit qui entrane que
CAB (t) = CBA (t),

(6.9)

CAB (t) = A B CBA (t).

(6.10)

il vient :

Nous verrons plus loin que les fonctions de corrlation donnent directement la rponse des systmes
tudi en physique statistique des sollicitations extrieures. Dans ce contexte la proprit (6.10),
issue de la rversibilit en temps de la dynamique hamiltonienne au niveau microscopique, a des
consquences remarquables au niveau de la thermodynamique hors dquilibre macroscopique.
Dcorrlation temps long
Une proprit gnrale des fonctions de corrlation que nous admettons est quelles possdent
la limite nulle pour t + : pour deux observables quelconques A et B, on a
lim CAB (t) = 0,

t+

cest--dire

lim hA(0)B(t)i = hAi hBi .

t+

Il sagit dune proprit, lie lergodicit, appele proprit de mlange de la dynamique hamiltonienne, dont nous admettons que les systmes dintrt physique constitus dun grand nombre
de particules en interaction sont dots en gnral (cf. la discussion de lergodicit au Chapitre 3,
Remarques 3.1 et 3.2). La proprit de mlange est plus forte que la proprit dergodicit au sens
de lgalit des moyennes sur le temps et des moyennes densemble.

6.2 Proprits des fonctions de corrlation

103

Une majoration
Une application directe de lingalit de Schwarz, en utilisant la stationnarit, donne, pour
toutes observables A et B tout instant t :
1

|CAB (t)| [Var (A)] 2 [Var (B)] 2 .


Ainsi, dans le cas B = A, la fonction dautocorrlation dun observable est majore, en valeur
absolue, par sa variance, cest--dire par sa valeur initiale.
6.2.2 Proprits particulires de la fonction dautocorrlation des vitesses
Fonction dautocorrlation de la vitesse et coefficient de diffusion
On peut, en appliquant les proprits gnrales des fonctions de corrlation la fonction dautocorrlation de la vitesse transformer le rsultat (6.3) et faire apparatre la fonction dautocorrlation des vitesses C(t) :

|r(t) r(0)|

Z tZ

C(t2 t1 ) dt1 dt2 ,

=
0

soit, C(t) tant paire daprs (6.9),

|r(t) r(0)|

Z tZ

C(t2 t1 ) dt1 dt2 .

=2
0

t1

Avec le changement de variable (de jacobien 1)


(
u = t2 t1 , 0 u t,
v = 21 (t1 + t2 ), u/2 v t u/2,
on trouve


|r(t) r(0)|2 = 2

(t u)C(u)du,
0

de sorte que lon a :



1

|r(t) r(0)|2 = 2 lim


t+
t+ t

Z t

lim

u
C(u) du = 2
t

C(u) du
0

en admettant que C L1 ([0, +[), par application du thorme de convergence domine de


Lebesgue. Ceci demande que lautocorrlation de la vitesse dcrot suffisamment rapidement. Do
la formule :
Z
1 +
D=
C(t) dt.
(6.11)
3 0
Ce rsultat (6.11) est un exemple dune famille de formules auxquelles on donne le nom de formules
de Green-Kubo, qui expriment un coefficient de transport macroscopique comme lintgrale dune
fonction de corrlation dobservables microscopiques.

104

6 Un exemple de proprit dynamique : lautodiffusion dans les fluides

Dveloppement temps court et frquence dEinstein


Du fait de la parit de C(t) et de la rgularit des trajectoires (avec un potentiel dinteraction
indfiniment drivable), on a le dveloppement limit :
C(t) = C(0)[1 02 t2 + O(t4 )],
avec, F tant la force subie par la particule suivie,
*  +
2

2
m
dv
1
2
=
|F| .
0 =
3kB T
dt
3mkB T
En convenant que les gradients sont pris par rapport la position de la particule marque, et en
notant V (fonction de toutes les positions) lnergie potentielle totale, on a :
Z

2
kB T
|F| =
V (exp[V ]) dQ,
Zq DN
do, par une intgration par parties, 2 on tire
Z

2 kB T
|F| =
2 V exp[V ]dQ.
Zq DN
0

Avec le potentiel de paire V(r), fonction de la distance seule, dont le laplacien est V 00 (r) + 2 V r(r) ,
cela scrit :


Z +

2
V 0 (r)
2
00
|F| = 4kB T
r g(r) V (r) + 2
dr.
r
0
On a donc :


Z
4 + 2
V 0 (r)
02 =
r g(r) V 00 (r) + 2
dr.
(6.12)
3m 0
r
La quantit 0 est appele frquence dEinstein. Autour de la particule marque et la distance r
le champ de densit moyen est g(r). Il en rsulte une force nulle lorigine, qui correspond un
minimum local du potentiel associ ce champ de densit. La frquence 0 est exactement gale
la pulsation propre des oscillations dune particule de masse m au voisinage de ce minimum.
La frquence dEinstein fixe le temps caractristique des variations rapides de la vitesse dun
particule. La connaissance de 0 permet un choix appropri du pas de temps dans les simulations.
Le pas de temps t se comparera alors 1/0 (typiquement on prendra 0 t dordre 1/10).
Comportement temps long
Le retour zro de la fonction dautocorrlation de la vitesse C(t) dtermine loubli des conditions initiales et la possibilit de passer, pour les temps plus longs, une description markovienne
du mouvement alatoire dune particule. Il est donc important de connatre le comportement
asymptotique de la fonction dautocorrlation temps long. Les modles les plus simples, fonds
sur lapproximation dune suite de collisions dcorrles, par exemple, dans le cas des sphres dures
(hypothse simplificatrice remontant Boltzmann, dite du chaos molculaire ), prdisent une
dcroissance exponentielle de C(t). Or, on a 3 :
2. le terme de flux au travers de DN sannule dans le cas dun systme confin par un potentiel de
bote ; et en fait la nature locale de la moyenne recherche entrane que le rsultat doit tre indpendant
de la nature des conditions aux limites.
3. Pour ce comportement, on peut fournir lexplication suivante [20], en comparant la vitesse de la
particule suivie celle dune petite rgion dans un fluide, qui serait anime dune vitesse suprieure, dans
une certaine direction, celle du fluide ambiant. La dcorrlation correspond alors la perte progressive de
cette diffrence de vitesse. Celle-ci se produit, dans un coulement,
par diffusion : la quantit de mouvement

est diffuse dans une rgion dont le diamtre crot comme t, tant la viscosit cinmatique. Cette
quantit de mouvement est mv, avec une masse m qui augmente comme t3/2 . La vitesse v doit donc
dcrotre comme t3/2 .

6.3 Relation entre corrlation et rponse

C(t) = O(t3/2 ) pour t +.

105

(6.13)

Cette dcroissance algbrique de C(t) tmoigne deffets collectifs complexes et persistants, difficiles
modliser. En fait, la fonction dautocorrlation de la vitesse dune particule collodale prsente
galement ce comportement temps long, ce qui montre quelle nest pas correctement dcrite
par lquation de Langevin (cest--dire (5.13) avec un potentiel V nul), cense modliser de telles
particules msoscopiques ! En effet (exercice) la dynamique de Langevin pour une particule isole
prdit une dcroissance exponentielle de la fonction dautocorrlation de sa vitesse.
Ce comportement temps long ne remet pas en cause, du moins dans un espace trois dimensions, lexistence dun coefficient de diffusion. Dans un espace deux dimensions, en revanche, on
ne parvient pas dfinir un coefficient de diffusion indpendant de la taille du systme.

6.3 Relation entre corrlation et rponse


6.3.1 Importance des proprits de rponse linaire
Le sollicitations extrieures sur le systme sont dordinaire de trs faibles perturbations du
mouvement spontan des particules qui le constituent. Pour le montrer sur un exemple, discutons
des perturbations appliques un fluide dans un coulement avec un fort taux de dformation :
considrons un coulement dans lair avec un taux de cisaillement de = 104 s1 . Cela entrane
une diffrence de vitesse de 103 m/s en des points distants de 10 cm, alors que la vitesse du son
est denviron 330 m/s. Au niveau microscopique, on a affaire des molcules dont les vitesses sont
distribues selon une loi gaussienne dont la moyenne est la vitesse densemble
r locale (vitesse de
3kB T
lcoulement), et dont lcart-type u0 est donn par la loi de Maxwell : u0
, ou quelques
m
centaines de m/s (cf. 3.1.3). Le gaz ne sera pas beaucoup perturb tant que les diffrences
des vitesses des molcules lors des collisions ne sont pas sensiblement affectes par lcoulement
densemble, cest--dire tant que la condition
l
 u0 ,
dans laquelle l est le libre parcours moyen, reste satisfaite. Or l est de lordre de 107 m dans lair
temprature et pression ordinaires (comme on pourra le vrifier en exercice), do l
103 m/s
avec la valeur de choisie, ce qui est bien ngligeable devant les vitesses thermiques. Mme un
trs fort taux de cisaillement ne perturbe qu peine les mcanismes molculaires, et reprsente
donc une faible modification du macrotat dquilibre. La viscosit de cisaillement, dans un fluide,
exprime une variation des contraintes au permier ordre dans la petite perturbation introduite par
lapplication dun taux de cisaillement.
Dune faon gnrale, la recherche dune rponse linaire, cest--dire de variations des moyennes
des observables entranes par une perturbation extrieure, est justifie par la faiblesse, dans les
cas pratiques, des actions extrieures, compares aux interactions des molcules du systme. Outre
le comportement visqueux des fluides, on peut citer, comme lois phnomnologiques exprimant
une rponse linaire la loi de Fourier pour la conduction de la chaleur, la loi dOhm pour la conduction lectrique, ou la loi de Fick pour linterdiffusion dans un mlange. La physique statistique
permet de fonder ces lois sur une approche microscopique, et de donner des expressions analogues
(6.11) pour les coefficients quelles contiennent. Ces relations font intervenir des fonctions de
corrlation entre observables du systme tudi, caractristiques de sa dynamique en labsence de
perturbation.
6.3.2 Rponse linaire une perturbation du Hamiltonien
Considrons nouveau le Hamiltonien perturb H0 B, o B est une observable et un petit
paramtre scalaire, tel que nous lavions introduit en (4.13) pour en tudier les effets en statique.
Nous supposerons pour simplifier quen labsence de perturbation on a hBi = 0.

106

6 Un exemple de proprit dynamique : lautodiffusion dans les fluides

Le paramtre peut dpendre du temps. Admettre une rponse linaire dune observable
quelconque A aux perturbations passes, cest postuler lexistence dune fonction de rponse que
nous noterons AB (t), telle que lon ait tout instant t :
Z
hA(t)i hA(t)i hAi0 =

AB (t u)(u)du.

(6.14)

Dans cette formule, hA(t)i est la moyenne selon un macrotat (mesure de probabilit) qui est
influenc par lhistoire de la perturbation (t), mais proche du macrotat dquilibre canonique
du Hamiltonien H0 du systme non perturb. Pour crire (6.14), nous avons suppos que, la
perturbation tant faible, son application nentranait aucune volution importante du systme,
qui ne vieillit pas, cest pourquoi leffet linstant t dune perturbation t0 ne dpend que de
la diffrence t t0 . De plus, on doit bien sr imposer la condition que la rponse ne dpende que
du pass : AB (t) est nulle pour tout t < 0.
Supposons maintenant que nous avons appliqu une perturbation constante (ou trs lentement
croissante) = 0 tout instant t < 0, de sorte qu t = 0 on a atteint le macrotat dquilibre
(canonique) avec le Hamiltonien (4.13) pour la valeur 0 . Alors les moyennes des observables
peuvent tre calcules, au premier ordre en , selon (4.14). linstant t = 0, supprimons la
perturbation : on aura (t) = 0 pour tout t > 0. Le systme volue alors avec la dynamique
hamiltonienne en labsence de perturbation, caractrise par le flot t . Nous pouvons alors valuer
hA(t)i, dfinie en (6.14), de deux faons diffrentes. Selon (6.14), nous avons :
Z
hA(t)i = 0

AB (t u)du = 0

AB (u)du.

(6.15)

Par ailleurs, la relation (4.14), applique lobservable A(t) = A t fournit :


hA(t)i = 0 Cov (B, A(t)) = 0 CBA (t).

(6.16)

En notant H(t) la fonction de Heaviside (qui vaut 1 si t 0 et 0 si t < 0), lgalit pout tout t
des seconds membres de (6.15) et de (6.16) donne le rsultat :
AB (t) =

d
CBA (t)H(t) = CB A (t)H(t).
dt

(6.17)

La formule (6.17) relie donc simplement la fonction de rponse AB la fonction de corrlation


des observables A et B en labsence de perturbation.
6.3.3 Mobilit dune particule
Revenant ltude particulire du mouvement dune particule marque dans le fluide, perturbons le Hamiltonien de faon exercer une force constante F sur cette particule, que nous prenons
conventionnellement parallle laxe de la coordonne x. Dans (4.13), on prendra donc = F et
B = x, labscisse de la particule.
Nous nous intressons la vitesse moyenne v que la particule acquire dans la direction x de
la force applique, et nous notons la fonction de rponse correspondante. On a donc, au premier
ordre en F ,
Z
t

hv(t)i =

(t u)F (u)du,

avec daprs (6.17), et en utilisant (6.6),


(t) = Cxv (t)H(t) = Cvv (t)H(t) =

C(t)H(t),
3

6.4 Remarques finales

107

o nous retrouvons la fonction dautocorrlation de la vitesse C(t), qui exprime donc la rponse
de la vitesse une histoire de la force applique.
On appelle mobilit dune particule dans un fluide le coefficient de proportionnalit entre la
vitesse moyenne quelle acquire en rgime stationnaire et la force constante quon lui applique.
On a par dfinition
Z
Z +
+
C(t)dt.
=
(t)dt =
3 0
0
Par comparaison avec (6.11), on a donc
D = kB T.

(6.18)

Lorsque la particule suivie est de taille msoscopique, cest--dire grande lchelle molculaire
(mais elle doit rester assez petite toutefois si on veut pouvoir dceler son mouvement brownien),
sa mobilit se calcule simplement par lhydrodynamique macroscopique. Le mouvement dune telle
particule est gnralement en rgime de Stokes (trs faible nombre de Reynolds), et on a pour une
sphre de rayon R anime de la vitesse v la force visqueuse
Fv = 6Rv,
tant la viscosit de cisaillement du fluide. Sous laction dune force applique F , la vitesse en
rgime stationnaire est telle que F + Fv = 0, ce qui fournit la mobilit :
=

1
.
6R

En combinant cette relation avec (6.18), on en tire la valeur du coefficient de diffusion, li = R, T


et par la relation de Stokes-Einstein (1.5) :
D=

kB T
,
6R

qui est donc tablie dans le cas dune particule collodale dont la mobilit est donne par lhydrodynamique de Stokes macroscopique.
Avec T = 293 K, = 103 Pa.s (viscosit de leau 293 K), R = 107 m, on a ainsi
D ' 21012 m2 s1 . Comme on la signal au Chapitre 1, la formule de Stokes-Einstein donne un
trs bon ordre de grandeur des coefficients dautodiffusion dans les liquides constitus de petites
molcules, qui sont donc de lordre de 109 m2 s1 .
On remarquera que la diffusion molculaire dans les liquides est un phnomne trs lent notre
chelle. Le temps caractristique D pour un transport diffusif sur une distance L est D = L2 /D,
il est inversement proportionnel la taille des particules diffusantes et atteint dj 105 secondes
(une journe) pour L 1 cm do lutilit de la petite cuiller pour homogniser la concentration
du sucre dans une tasse de caf !

6.4 Remarques finales


Lapproche de la thorie de la rponse linaire que nous avons esquisse et applique au cas
simple de la diffusion de particules marques permet de donner des expressions microscopiques, partir des fonctions de corrlation, des coefficients macroscopiques qui apparaissent
dans les lois linaires de la thermodynamique hors dquilibre. On peut consulter les ouvrages
de rfrence sur la simulation molculaire [15, 1] pour en savoir plus. Il convient au pralable
didentifier des observables appropries pour les variables ou les champs macroscopiques qui
interviennent dans ces lois, comme par exemple le flux de chaleur.
Citons la formule de Green-Kubo pour la viscosit de cisaillement des fluides, qui fait intervenir le volume V et un terme non diagonal quelconque xy de lobservable tenseur des
contraintes dfinie par (2.22) :

108

6 Un exemple de proprit dynamique : lautodiffusion dans les fluides

V
kB T

hxy (0)xy (t)i dt.


0

La proprit de symtrie (6.10) des fonctions de corrlation est en fait lorigine des relations
de rciprocit dOnsager [23], important rsultat de la thermodynamique des phnomnes
hors dquilibre coupls. Un tel couplage se rencontre par exemple dans les conducteurs,
pour lesquels un gradient de potentiel lectrique entrane un courant lectrique (loi dOhm)
et aussi un flux de chaleur (effet Peltier), tandis quun gradient de temprature entrane un
flux de chaleur (loi de Fourier) et aussi un courant lectrique (effet Seebeck). Les rponses des
flux (chaleur, courant) aux forces conjugues (gradients de temprature ou de potentiel)
font intervenir une matrice de coefficients de rponse dont les relations de rciprocit, issues
de (6.10), tablissent la symtrie.

Partie II

Introduction la physique quantique

7
Introduction historique : la rvolution quantique

La mcanique quantique est une thorie physique apparue au dbut du vingtime sicle. Venant
au secours de la mcanique Newtonienne et de llectromagntisme pour dcrire le monde de
linfiniment petit, elle proposait une vision pour le moins rvolutionnaire du fonctionnement des
constituants intimes de la matire et de la lumire. Incroyable pour certains (mme pour le grand
Albert Einstein !), choquante, trange, elle a pourtant donn le coup denvoi dun sicle de progrs
technologiques sans prcdents.
Le monde physique en 1900
Comme pour toute thorie, ses dbuts furent difficiles. A la fin du 19me sicle, le temps des
conservatismes religieux de lEurope, qui avaient fait abjurer Galile en 1633, est certes rvolu.
Pour autant, le monde scientifique connat un moment dautosatisfaction, qui le rend peu rceptif
aux ides nouvelles. Les physiciens ont en effet leur disposition trois thories, dites de nos jours
thories classiques, trs abouties :
la mcanique Newtonienne , dveloppe partir du 17me sicle, qui met en quations le
mouvement des corps, et dont les concepts se retrouvent la base des disciplines que sont
la mcanique des fluides et la rsistance des matriaux ;
la thermodynamique, ne au dbut du 19me sicle, que Boltzmann vient vers la fin du 19me
sicle de faire voluer jusqu sa version statistique ;
llectromagntisme, labor dans la deuxime moiti du 19me sicle, qui apprhende dans
une thorie unifie le caractre ondulatoire de la lumire et les phnomnes doptique, les
phnomnes dlectro et de magntostatique, ainsi que ceux de conduction et dinduction
lectrique.
Dans ces thories, les constituants de ce monde se partagent en deux entits clairement distinctes :
la matire, dune part, cest dire les corps solides, liquides ou gazeux, mais surtout palpables, que la mcanique classique apprhende au travers de la notion de particule, ou plus
prcisment, de point matriel. Cette entit a un caractre ponctuel et se meut dans lespace le long dune trajectoire. Soulignons quil nest pas encore question datome lpoque.
Lide de ces grains lmentaires de matire, emprunte la philosophie grecque antique,
fait encore dbat. Ds 1869, Mendeleev a certes dj labor sa fameuse classification des
lments. Pour autant, il faudra attendre la preuve exprimentale de lexistence de llectron
en 1897, puis de celle du noyau atomique en 1912, pour convaincre les derniers incrdules ;
les champs diffus (champ de gravitation, champ lectrique, champ magntique), qui occupent
tout lespace, vide et matire compris, et sont capables dinteraction avec la matire. Leurs
mouvements (au moins pour les champs lectromagntiques) prennent la forme de dformations, appeles ondes, plus ou moins tendues travers lespace, et qui ont la proprit
de se propager.
Force est de constater que ces thories expliquent remarquablement grand nombre daspects du
monde tel que nous le percevons avec nos cinq sens. Elles sont par ailleurs entirement suffisantes aux dveloppements technologiques de lpoque. Il nest ainsi pas trs tonnant quen 1892,

112

7 Introduction historique : la rvolution quantique

William Thomson, alias Lord Kelvin, co-fondateur de llectromagntisme et de la thermodynamique, dclare :


La physique est dfinitivement constitue dans ses concepts fondamentaux : tout ce quelle
peut dsormais apporter, cest la dtermination prcise de quelques dcimales supplmentaires.
Cependant, cette citation se poursuit :
Il y a bien deux petits problmes : celui du rsultat de lexprience de Michelson et celui
du corps noir, mais ils seront rapidement rsolus et naltrent en rien notre confiance. . .
Deux petits problmes...
Deux petits problmes en effet. . . En mesurant avec prcision la vitesse de la lumire, Michelson
vient de montrer en 1887 que la thorie de llectromagntisme saccommode mal des changements
de repre, et quil nexiste surtout pas de repre absolu pouvant servir crire les quations de
Maxwell. Quant au fameux corps noir, bloc de matire chauff dont on mesure le spectre dmission
radiatif (il est connu quun fer chaud prend une couleur rouge, mais des radiations sont en fait
mises toutes les longueurs donde), nul nest lpoque capable de comprendre la forme des
spectres obtenus.
Et ces deux petits problmes ne sont bientt pas les seuls. Les progrs techniques aidant, les
physiciens se dotent en cette fin de sicle de nouveaux instruments de mesure et dobservation.
Ils imaginent de nouvelles expriences, et auscultent la nature avec une prcision et une minutie
sans prcdent. Leffet photolectrique, mis en vidence en 1887 par Hertz, soulve le problme de
la comprhension du rle jou par la longueur donde de la lumire dans sa capacit extraire les
lectrons dun solide. Viendra rapidement lnigme de la stabilit de latome : en 1912, les lectrons
et les noyaux atomiques voient leur existence prouve exprimentalement. Pour autant, les thories
physiques classiques prdisent quun assemblage noyau-lectrons ne peut que seffondrer sur lui
mme. Comment comprendre le fait que latome tient ?
Autant de questions auxquelles, malgr loptimisme affich de Kelvin, la science classique
savre finalement incapable de rpondre. Les thories de lpoque, que lon croyait parfaitement
abouties, et surtout, de porte universelle, montrent leurs limites. On dcouvre peu peu quil
existe, au del des phnomnes classiques, tout un monde de nouveaux phnomnes dont on
ignorait jusqualors lexistence. Les thories classiques ne semblent finalement sappliquer qu
une portion restreinte dentre eux.
Tracer les frontires du domaine dapplications des thories classiques, construire une nouvelle
thorie adapte la description et la prdiction de ces nouveaux phnomnes, telle fut la tche des
physiciens au dbut du 20me sicle. Au final, ce ne sont pas une, mais plusieurs thories qui verront
le jour, parfois dailleurs dveloppes par les mmes personnes. De lexprience de Michelson natra
la relativit. Le rayonnement du corps noir, leffet photo-lectrique, et le problme de la stabilit de
latome conduiront quant eux la construction dune nouvelle physique : la physique quantique.
Une thorie choquante
La physique quantique sattache essentiellement (mais, nous le verrons, pas exclusivement)
rendre compte du mode de fonctionnement de la matire et de la lumire aux chelles microscopiques. Elle choque, intrigue parfois. Tout dabord, par les principes physiques quelle dfend.
Citons ple-mle :
la dualit onde-corpuscule : la lumire, par essence une onde en physique classique, peut
parfois se matrialiser en un point prcis de lespace, la manire dune particule. Rciproquement, des particules telles que des lectrons et des neutrons peuvent se comporter aussi
comme des ondes, pouvant se superposer et interfrer entre elles ;
le principe dincertitude : Il est par exemple, impossible physiquement de connatre simultanment la position et la vitesse dune particule ;

7 Introduction historique : la rvolution quantique

113

le don dubiquit des particules : une particule peut occuper simultanment plusieurs points
de lespace ;
limpossibilit de faire une mesure sur un systme sans modifier ltat de ce dernier ;
le fait que le rsultat de cette mesure est quasi-systmatiquement alatoire, tout en ne
pouvant prendre que des valeurs bien prcises.
Et la liste nest pas exhaustive. Quiconque nest pas choqu par la thorie quantique ne la pas
comprise , disait Niels Bohr, un des ses fondateurs. De nos jours, prs de 100 ans aprs ses
premiers balbutiements, et aprs pratiquement autant dannes de mise en oeuvre sans faille, la
mcanique quantique heurte toujours le sens commun. Le fait est que loin de se limiter nos
fournir de nouveaux outils mathmatiques pour dcrire la nature, la mcanique quantique nous
met face un monde que nous connaissons mal, et dont nous navons en gnral aucune intuition.
Au del de ses principes physiques, la thorie quantique choque aussi par son formalisme mathmatique. Les quations peuvent paratre, dune certaine manire, plus compliques, et la ralit
physique plus lointaine que dans les thories classiques, tel point quau dbut du 20me sicle,
cette thorie des quantas fut parfois appele mcanique des matrices. Soulignons qu lpoque,
les concepts mathmatiques sur lesquels elle sappuie, notamment les espaces de Hilbert et dans
une moindre mesure, les distributions, sont eux-mme loin dtre aboutis. Cest ainsi un dveloppement conjoint de la physique et des mathmatiques que lon a assist. La thorie quantique
doit beaucoup pour sa mise en forme des mathmaticiens comme Hilbert ou Von Neumann. En
retour, elle a t source dinspiration pour lancer de nouveaux sujets de recherche en mathmatique. Il nest dailleurs pas rare que certains rsultats de la thorie quantique, initialement admis
par les physiciens en tant que faits exprimentaux, mais sans que lon sache les dmontrer, naient
vu leurs preuves mathmatiques apportes que longtemps aprs.
La thorie quantique tonne donc, et pourtant, aprs un sicle de confrontation continue avec
lexprience, force est de constater que... a marche ! Jamais mise en dfaut ce jour, elle parvient, en ne sappuyant que sur un petit nombre de principes, rendre compte avec une extrme
finesse de toujours plus dobservations exprimentales. Construite lorigine sur la base dexpriences impliquant des lectrons, sa validit a pu depuis tre vrifie sur les noyaux atomiques
puis les constituants les plus intimes de la matire. La comprhension quelle a donn du monde
microscopique a permis dimaginer, puis de raliser, nombre de dveloppements technologiques et
scientifiques du 20me sicle :
les machines lectroniques semi-conducteurs , que lon retrouve aujourdhui partout, de la
simple montre lordinateur le plus perfectionn, en passant par le lave linge, les systmes
de communication, et les panneaux solaires ;
les nouvelles sources lumineuses : la lumire LASER, bien sur, et ses innombrables applications scientifiques, industrielles et mdicales, mais aussi les diodes lectroluminescentes
(LED), qui, simples voyants dappareils ou lments de tlcommandes infra-rouges lorigine, deviennent aujourdhui une vritable source conomique dclairage ;
les techniques de spectroscopie analytique (spectroscopie dabsorption UV-visible-Infra rouge,
spectroscopie de fluorescence, Rsonance Magntique Nuclaire,. . . ) qui permettent en peu
de temps de retrouver la structure chimique de composs, que ce soit dans un tube essai
ou aux confins de lespace. Citons galement un appareil de notre quotidien driv de ces
techniques : le four micro-ondes ;
une nouvelle discipline scientifique : la chimie quantique. La physique quantique donne les
clefs de comprhension du mcanisme de la liaison chimique, et permet maintenant de prdire, lavance, par le biais de la simulation numrique et - nouveau- grce de considrables
dveloppements en mathmatiques appliques, parfois bien mieux que lexprience, quelles
seront les proprits dune molcule donne ;
loin de linfiniment petit, on a dcouvert quil existait aussi des systmes de grande taille
rgis par la mcanique quantique : des corps clestes tels que les toiles neutrons, mais
galement des corps notre chelle, tels que les aimants, dont seule la physique quantique
explique laimantation temprature ambiante. Noublions pas enfin les supraconducteurs,
riches dacquis autant que despoirs au plan technologique.

114

7 Introduction historique : la rvolution quantique

Une fois que lon a, sinon compris, du moins assimil et admis les fondements de la physique
quantique, il est frappant de raliser que loin dtre abstraite et inaccessible, elle est a la base
de nombre de petites choses de notre quotidien. La couleur des objets, par exemple, ou le fait,
tout simplement, que tous les matriaux denses qui nous entourent ont des masses volumiques
comparables, de lordre de 1 10 kg par litre.
Les thories quantiques : Mcanique quantique et Thorie des champs
Parlons maintenant de mcanique quantique. Car peut-tre lavez vous remarqu, nous navons
jusquici employ que le terme de physique quantique. La physique quantique dsigne lensemble des
adaptations quont connues au dbut du vingtime sicle la mcanique Newtonienne et llectromagntisme. La distinction entre les deux disciplines, clairement spares lorigine, est devenue
un peu plus floue sur le fond, mais sest nanmoins maintenue en grande partie dans la forme, si
bien que la physique quantique se retrouve divise en deux branches :
la mcanique quantique, qui se proccupe, comme la mcanique classique, du mouvement et
de la dynamique de la matire, et qui peut tre vue comme une extension de la mcanique
classique vers les chelles microscopiques ;
la thorie quantique des champs : elle englobe en premier lieu loptique quantique, attache
la description des champs lectromagntiques, et qui manipule entre autres la notion de
photons. Mais elle sintresse de manire plus gnrale tous les phnomnes vibratoires
non localiss (ondes acoustiques dans les solides, avec la notion de phonons). Beaucoup plus
difficile daccs que la mcanique quantique, nous nous contenterons dy faire ponctuellement
allusion.
Physique quantique vs physique classique
Lhistoire nous enseigne donc que la thorie quantique a t pense comme complmentaire
de la thorie classique. Ce serait un contresens que de vouloir les opposer. La thorie quantique
est un largissement et un raffinement de la thorie classique, et permet de dcrire de nouveaux
phnomnes physiques. Rciproquement, la thorie classique peut tre vue comme un moyen de
simplifier la thorie quantique dans certaines situations.
Dans ce cours, nous verrons que, bien que le formalisme de la mcanique quantique soit clairement distinct de celui de la mcanique classique, il contient en lui nombre de rsultats dits
classiques. Un de nos soucis dans les pages qui viennent sera de faire ressortir, chaque fois que cela
sera possible, ces similarits.

8
La particule quantique isole

Le premier systme que nous tudions dans le cadre de la thorie quantique est une particule
isole qui se dplace dans le vide, sans la moindre interaction avec lextrieur. Ce systme simple
permet dintroduire le formalisme des fonctions donde. Alors que la mcanique classique enseigne
que la particule, pour peu quon lobserve dans un repre Galilen, suit un mouvement rectiligne
et uniforme, la thorie quantique prdit dj un comportement beaucoup plus riche.

8.1 Description quantique de la particule en translation . . . . . . . . . . . . . . 115


8.1.1 La fonction donde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
8.1.2 Lquation de Schrdinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
8.1.3 La constante de Planck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
8.1.4 Remarques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
8.2 Conservation des probabilits - dynamique de la particule . . . . . . . . 117
8.2.1 Equation de Schrdinger et normalisation . . . . . . . . . . . . . . . . . . . . . . . . . 117
8.2.2 Forme locale de la conservation des probabilits : Courant et Vitesse
de probabilit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
8.3 La phase de la fonction donde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
8.4 Solutions de lquation de Schrdinger dans le vide . . . . . . . . . . . . . . 119
8.4.1 Etude du Hamiltonien quantique de la particule libre . . . . . . . . . . . . . . . 119
8.4.2 Solution gnrale : Le paquet dondes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
8.5 Quelques solutions particulires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
8.5.1 Les ondes de De Broglie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
8.5.2 Le paquet donde quasi-monochromatique . . . . . . . . . . . . . . . . . . . . . . . . . 124
8.5.3 Le paquet dondes gaussien. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
8.5.4 Superposition dtats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

8.1 Description quantique de la particule en translation


8.1.1 La fonction donde
En mcanique quantique, la particule perd son aspect localis. Elle peut staler sur un domaine
plus ou moins tendu de lespace, et marquer de son empreinte simultanment plusieurs positions.
Son tat ne se dcrit plus laide dun vecteur position r(t) et dun vecteur impulsion p(t). Ces
deux notions sont remplaces par celle de fonction donde.
Dfinition 8.1. Ltat de la particule quantique au temps t est entirement dcrit par une fonction
donde note (r, t). Cest un champ scalaire valeurs complexes, dfini en tout point r de lespace.

116

8 La particule quantique isole

Fig. 8.1. La fonction donde complexe (r, t) et la probabilit de prsence (r, t) = |(r, t)|2 .

Une interprtation physique de (r, t) est donne par le phnomne exprimental suivant :
lorsquon cherche, au moyen dun instrument de mesure, localiser la position de la particule
dans lespace, cette dernire se matrialise en un point , choisi alatoirement parmi les positions o (r, t) 6= 0. Au cours de ce processus, tous les points possibles dapparition ne sont pas
quiprobables. La probabilit p(B) de trouver la particule dans un domaine B de lespace est
Z
p(B) =
|(r, t)|2 dr.
B

Comme on ne considre quune seule particule 1 , lespace ambiant est ici R3 .


Dfinition 8.2. La densit de probabilit de faire apparatre la particule au point r lors dune
mesure est (r, t) = |(r, t)|2 . Elle vrifie la condition de normalisation :
Z
Z
t R,
(r, t) dr =
|(r, t)|2 dr = 1.
(8.1)
R3

R3

Par abus de language, (r, t) est souvent simplement appele probabilit de prsence. Au vu de
ces relations, la probabilit de prsence sexprime en m3 , et lamplitude en m3/2 .
Dun point de vue mathmatique, lespace des fonctions donde est un espace de Hilbert 2 ,
que lon notera H par la suite. Dans le cas dune particule sans spin 3 , lespace H est identifi
lespace L2 (R3 , C).
8.1.2 Lquation de Schrdinger
Postulat 8.1. Lvolution temporelle en repre Galilen de la fonction donde dune particule
isole de masse m est rgie par lquation de Schrdinger :
i~

~2
=
.
t
2m

(8.2)

Dans cette quation, i est le nombre complexe tel que i2 = 1, et dsigne loprateur
Laplacien par rapport la variable despace r. Lquation de Schrdinger est ainsi une quation
dvolution. Le fait quelle est bien pose mathmatiquement sera vu dans un cadre plus gnral
au 9.1.2.
1. Le formalisme des fonctions donde permet galement de dcrire simultanment plusieurs particules
(voir le chapitre 13).
2. On rappelle quun espace de Hilbert est un espace vectoriel norm complet muni dun produit scalaire.
3. Vous avez certainement entendu parler de cette petite flche oriente vers le haut ou le bas dont on
affuble llectron dans certaines situations. Nous verrons au 12.6 quoi elle correspond prcisment, et
surtout, dans limmdiat, nous loublions !

8.2 Conservation des probabilits - dynamique de la particule

117

8.1.3 La constante de Planck


Lquation de Schrdinger fait apparatre une nouvelle constante physique : la constante de
Planck. Elle est note ~, et vaut dans le systme dunits internationales :
~ = 1.055 1034 Js.
On prononce hache barre. Elle est au coeur des thories quantiques et permet aussi de dfinir
les ordres de grandeurs typiques des caractristiques physiques des systmes quantiques (taille de
latome, nergie des photons,. . . - voir Appendice A.2).
Exprime dans les units plus conventionnelles que sont le mtre, le kilogramme, et la seconde,
lunit de la constante de Planck est le kg m2 s1 . Elle a donc mme unit quun moment cintique.
8.1.4 Remarques
(1) On retrouve ici les analogues aux ingrdients de la thorie classique :
on a un objet mathmatique pour dcrire ltat du systme un instant donn : cest la
fonction donde, qui remplace le couple position-impulsion ;
on a galement une loi qui dtermine la manire dont le systme volue au cours du temps :
cest lquation de Schrdinger, que lon peut voir comme une version quantique de lquation
fondamentale de la dynamique.
(2) La particule dont il est question peut tre une particule lmentaire au sens physique du terme,
telle quun lectron, un proton, ou un neutron. Mais il peut sagir plus gnralement du centre
de gravit dun corps solide que lon dsirerait dcrire de manire quantique. De mme quen
mcanique classique, la thorie quantique ne fait aucune distinction, dans son formalisme,
entre une particule physique et le centre de masse dun objet volumineux.
(3) Probabilit de prsence ou densit de probabilit dapparition ? Nous avons dit que |(r, t)|2
est la densit de probabilit du lieu de matrialisation de la particule lorsquon cherche en
mesurer la position. On pourrait tre tent den dduire que la particule ne perd jamais son
caractre ponctuel, que pour une raison obscure, on ne pourrait jamais exactement connatre
sa position, et que la thorie quantique serait charge de grer linformation manquante de
manire statistique.
Gardons nous bien de cette erreur dinterprtation. Car chaque instant, la particule est bel
et bien prsente simultanment en divers points de lespace. Malheureusement, la mcanique
quantique affuble la quantit |(r, t)|2 du nom de probabilit de prsence... Tradition dangereuse qui pousse la confusion. Dailleurs, si on cherche tre prcis sur les termes, |(r, t)|2
nest mme pas au sens strict une probabilit, mais une densit de probabilit.
Ce qui pousse la particule se montrer en un seul point est un phnomne bien particulier de
la mcanique quantique, nomm rduction du paquet donde. Nous y reviendrons au 11.4.

8.2 Conservation des probabilits - dynamique de la particule


Nous examinons un certain nombre de proprits mathmatiques remarquables de lquation de
Schrdinger. Certaines sont ncessaires pour assurer le caractre cohrent de la thorie quantique.
Elles permettent galement de saisir le contenu dynamique de la fonction donde.
8.2.1 Equation de Schrdinger et normalisation
Proposition 8.1. Lquation de Schrdinger est compatible avec la condition de normalisation de
la fonction donde, au sens o, si k(0, )kL2 (R3 ) = 1, alors, pour tout t R, k(t, )kL2 (R3 ) = 1.

118

8 La particule quantique isole

Preuve. La dmonstration sera dveloppe dans un cadre plus gnral au 9.1.4. Elle consiste
formellement considrer la quantit :
Z
N (t) =
|(r, t)|2 dr.
R3

On tablit, sur la base de lquation de Schrdinger, que


tel que N (t0 ) = 1 alors, N (t) = 1 pour tout t R.

dN
dt

= 0. On en dduit que sil existe t0


u
t

Ce rsultat permet de ne pas faire de la condition de normalisation une proccupation permanente : il suffit en particulier quelle soit vrifie dans les conditions initiales dun problme pour
quelle soit vrifie tout le temps.
8.2.2 Forme locale de la conservation des probabilits : Courant et Vitesse de
probabilit
La conservation globale de la probabilit de prsence (r, t) = |(r, t)|2 peut scrire de manire
locale, la manire dune conservation de la masse en mcanique des fluides 4 . Dans les dfinitions
qui suivent, (r, t) dsigne la phase de la fonction donde.
Dfinition
p 8.3 (Courant et vitesse de probabilit). Etant donne une fonction donde
(r, t) = (r, t)ei(r,t) qui dcrit ltat quantique dune particule de masse m, on appelle courant
de probabilit le champ de vecteurs valeurs relles :
J(r, t) = i


~
.
2m

(8.3)

On appelle vitesse de probabilit le champ de vecteur valeurs relles :


v(r, t) =

~
.
m

(8.4)

Le caractre rel du courant de probabilit vient du fait que le terme de droite de (8.3) est
la diffrence de deux quantits complexes conjugues. Ces deux nouvelles grandeurs prennent
pleinement leur sens physique grce la proprit (formelle) suivante :
Proprit 8.1 (Conservation locale). La probabilit de prsence (r, t), le courant de probabilit J(r, t), et la vitesse de probabilit v(r, t) vrifient les relations suivantes de conservation locale
de la probabilit de prsence :
J(r, t) = (r, t)v(r, t),
(8.5)

+J=
+ (v) = 0.
t
t
Ces quations forment un systme hyperbolique de lois de conservation.

(8.6)

La premire des
pdeux relations se montre simplement en considrant des fonctions donde de
la forme (r, t) = (r, t) ei(r,t) dans lexpression de J. On laisse en exercice le fait que
J=

~
.
m

Pour la seconde relation, il suffit de vrifier lquation concernant le vecteur J. Par lquation de
Schrdinger (8.2),

i~

i~
=
, et
=
.
t
2m
t
2m
Il vient ainsi :
4. Dailleurs, ce champ scientifique est celui de lhydrodynamique quantique (quantum hydrodynamics).

8.4 Solutions de lquation de Schrdinger dans le vide

119


i~
=
+
=
.
t
t
t
2m
Par ailleurs,
J = i



~
~
+ = i
.
2m
2m

On retrouve ainsi lexpression prcdente.


Lquation (8.6) a la forme dune quation de conservation de matire. Elle permet dinterprter
J(r, t) comme une densit de flux de probabilit de prsence. La densit J(r, t) indique comment
la particule se dplace localement pour rarranger la manire dont elle occupe lespace.
De mme quen mcanique des fluides, lorigine du courant peut tre associe, au moins de
manire formelle, lexistence dun champ v(r, t) de vitesses dcoulement des probabilits. Il est
remarquable que ce champ ne dpende que du gradient de la phase de la fonction donde. Cest ce
gradient de phase (r, t), que nous avions ignor jusque l, qui constitue lquivalent quantique du
champ de vitesse classique.

8.3 La phase de la fonction donde


Les quantits |(r, t)| et (r, t) sont les analogues des vecteurs position et impulsion ( la
masse prs) qui en mcanique classique dcrivent compltement ltat dune particule ponctuelle.
Il est cependant intriguant que la phase (r, t) nintervienne que par son gradient. En fait, sa
valeur prcise na aucune signification physique en elle mme. Seules les diffrences de phases au
sein dune mme fonction donde sont porteuses dinformation.
En effet, si on dphase globalement dune constante 0 la fonction donde (r, t) en la
t) = (r, t) ei0 de phase
multipliant par ei0 , on obtient une nouvelle fonction donde (r,

(r, t) = (r, t) + 0 et qui vrifie :


(
t)|2 = |(r, t)|2 ,
|(r,
t) = (r, t).
(r,
Les fonctions donde et contiennent donc la mme information physique de localisation et de
cintique sur la particule. Il en ressort que :
Proprit 8.2. La fonction donde dune particule nest dfinie qu une phase prs sans importance. Deux fonctions donde qui ne diffrent lune de lautre qu un dphasage global prs
dcrivent le mme tat quantique. 5

8.4 Solutions de lquation de Schrdinger dans le vide


On tudie dans cette section les solutions de (8.2). Avant de donner la forme gnrale des
solutions, nous tudions au pralable loprateur dans le cadre de la thorie spectrale. Cet
exercice trs mathmatique savrera particulirement utile par la suite.
8.4.1 Etude du Hamiltonien quantique de la particule libre
0 = ~2 sur H = L2 (R3 ), dit oprateur Hamiltonien. Pour plus
On dfinit loprateur H
2m
de clart, on notera par la suite les oprateurs avec un . Cette notation na rien voir avec la
notation u
qui dsigne usuellement la transforme de Fourier
5. Il existe dailleurs pour la mcanique quantique un formalisme particulier, dit des oprateurs densit
(hors programme pour nous !) qui ne travaille quen terme de diffrences de phases, et limine naturellement
ce problme de redondance dans la transcription des tats.

120

8 La particule quantique isole

k R ,
3

u
(k) = F(u)(k) = (2)

de u. On notera par dfaut

3/2

u(r)eikr dr

R3

Z
hf, gi =

f (r)g(r) dr
R3

0 est videmment symtrique sur C (R3 ) : pour ,


le produit scalaire sur H. Loprateur H
0

3
C0 (R ),


Z
Z
Z
~2
~2
~2

=
=

.
2m
2m
2m
R3
R3
La proprit fondamentale qui suit permet dappliquer beaucoup de rsultats importants (rappels
en Appendice C).
0 ). Loprateur
Proposition 8.2 (Caractre auto-adjoint de H
2
0 = ~
H
2m

dfini sur le domaine


0 ) = H2 (R3 ) = { L2 (R3 ), L2 (R3 )}
D(H
dense dans H = L2 (R3 ), est un oprateur auto-adjoint non-born sur L2 (R3 ).
0 sont directement hrites de celles de loprateur Laplacien . On
Preuve. Les proprits de H
vrifie facilement, en utilisant la transforme de Fourier, que , L2 (R3 ), si et seulement si
3

H2 (R3 ). Comme C
0 (R ) D(H0 ), H0 est bien domaine dense dans H. Par dfinition,




~2
2
3
2
3
2
3

D(H0 ) = u L (R ), v L (R ), w H (R ),
w, u = hw, vi .
2m
Or,



Z

~2
~2
2
~2
|k| w,
u
=
w, u =
w(k)

(|k|2 u
(k)) dk.

2m
2m
2m R3

) si et seulement si u L2 (R3 ) et |k|2 u


L2 (R3 ), i.e. u H2 (R3 ) =
Ceci montre que u D(H
0
0 ). On a en outre
D(H
2
0 u)(k) = ~ |k|2 u
F(H
(k),
2m
u = ~2 u. Ceci montre finalement que H
0 est auto-adjoint.
soit H
0
2m
0 est non-born. On peut toutefois sen convaincre en considrant la fonction
Il est clair que H
u(x) = (x) |x|1 avec rgulire support dans B(0, 1), qui est bien L2 (R3 ). En revanche,
u nest pas dans L2 (R3 ). On peut alors trouver une suite de fonctions rgulires un telles que
0 un kL2 (R3 ) +
u
kun kL2 (R3 ) < + alors que kun kL2 (R3 ) + et donc kH
t
0 :
On peut prsent caractriser le spectre de loprateur H
0 = ~2
Proposition 8.3 (Spectre du hamiltonien de la particule libre). Le spectre de H
2m
est purement continu :
0 ) = ess (H
0 ) = c ( H
0 ) = [0, +[.
(H
0 est auto-adjoint, son spectre est contenu dans R et son spectre rsiduel est
Preuve. Comme H
0 ) tel que H
0 u = u, alors (
vide. On remarque ensuite que sil existait R et u D(H
~2
2
3
0 na pas de valeur
u(k) = 0 pour tout k R , ce qui donne u
= 0. Ceci montre que H
2m |k| )
2
~
, et donc que
propre, et le spectre ponctuel est vide. On remarque ensuite que 2m
~2
2m est inversible si < 0. En effet,

8.4 Solutions de lquation de Schrdinger dans le vide

121



~2

u = v L2 (R3 )
2m
est quivalent
u=F

v
||2 +

~2 ||2
2m

H2 (R3 ).

~
Linverse ( 2m
)1 est donc de domaine dense et born.
0 ) = ess (H
0 ) = c ( H
0 ) [0, +[. Montrons prsent ess (H
0) =
On a donc ce stade (H

3
[0, +[. On considre pour ce faire 0, C (R ) telle que
soit support dans B(0, 2), et
de norme kkL2 (R3 ) = 1. On dfinit alors la suite de fonctions
r 0
r
u(r) = n3/2
eik r ,
un (r) = n3/2
n
n
2

0 2

|k |
~
o k0 R3 est tel que ~ 2m
= . On a, au sens des distributions, 2m
u = u, mais u 6 L2 (R3 ).
En revanche, un L2 (R3 ) pour tout n et
2

kun kL2 (R3 ) = 1.


Par ailleurs, comme



 r 
 r 
~2
~2 1
~2 1


0


|k
|
u

u
+



,
n
n
2m

m n5/2
n
2m n7/2
n
on a bien k

~2
2m un

un kL2 (R3 ) 0. Enfin, pour v L2 (R3 ),


Z
Z








3 un v = 3 F(un ) v 0
R

+ k0 )) 6= 0 seulement si k B(k0 , 2n1 ). Ceci montre donc un * 0.


car F(un )(k) = n (n(k
~2
u
Finalement, le lemme de Weyl (Appendice C, Lemme C.1) montre que ess ( 2m
).
t
Remarque 8.1. La preuve de la Proposition 8.3 montre en particulier que les ondes planes eikr sont
0 (et donc de
des quasi-fonctions propres, ou des fonctions propres gnralises, du Hamiltonien H
loprateur Laplacien), au sens o ce sont des limites de suites de Weyl.
8.4.2 Solution gnrale : Le paquet dondes
0 =
Nous allons voir prsent comment utiliser la caractrisation ci-dessus du spectre de H
pour construire le forme gnrale des solutions de lquation de Schrdinger (8.2). On
vrifie facilement que, pour k R3 , si

~2
2m

Ek =

~2 |k|2
,
2m

alors les fonctions


k (r, t) = e



E
i kr ~k t

sont des solutions au sens des distributions de (8.2). Cette forme de fonctions, appeles ondes
planes, ne correspond toutefois pas des fonctions dtats physiquement admissibles car elles ne
sont pas de norme L2 (R3 ) finie. Ce sont des tats propres gnraliss (mathmatiquement, des
limites de suites de Weyl).
La solution gnrale normalisable de lquation de Schrdinger sobtient en considrant un
paquet dondes, cest dire une superposition linaire de plusieurs ondes planes (en utilisant une
fonction de pondration (k)) :

122

8 La particule quantique isole

1
(r, t) =
(2)3/2

Z
(k)e



E
i kr ~k t

(8.7)

dk,

R3

avec L2 (R3 ). Notons que (r, t) est la transforme de Fourier inverse de (k)e ~ Ek t . On
vrifie que la fonction ainsi construite vrifie bien lquation de Schrdinger dans le vide (8.2)
ds que
Z
i

R3

|(k)| |k|2 dk < +.

On a par ailleurs, par la relation de Parseval,


Z
Z
|(r, t)|2 dr =
R3

R3

|(k)|2 dk.

La condition de normalisation (8.1) aboutit au rsultat :


Proposition 8.4. La forme gnrale des solutions (r, t) de lquation de Schrdinger dans le
vide est donne par :
Z


E
1
i kr ~k t
(r, t) =
(k)e
dk,
(8.8)
(2)3/2 R3
avec :
Z
|(k)|2 dk = 1.
R3

8.5 Quelques solutions particulires


En dpit de la forme trs souple de la solution gnrale, la fonction donde dune particule se
dplaant dans le vide prend en pratique quelques formes types que lon examine prsent. Ce
petit catalogue de solutions particulires de lquation de Schrdinger va aussi permettre de nous
fixer les ides.
8.5.1 Les ondes de De Broglie
Les ondes de De Broglie sont les ondes planes :
k (r, t) = e



E
i kr ~k t

(8.9)

Une reprsentation schmatique de ces ondes est donne par la figure 8.2. Bien quils ne soient pas
normalisables, ces tats sont beaucoup utiliss en pratique pour dcrire la situation limite dans
laquelle la fonction de pondration devient extrmement pique autour dun vecteur donde
k donn. Cest le cas bien souvent des particules mises depuis une source lointaine 6 . En tant
qutat limite, la norme de londe de Broglie perd son sens physique de probabilit de prsence.
En revanche, sa phase garde toute sa pertinence.
Les ondes de De Broglie sont caractrises par leur vecteur donde k, et leur pulsation qui
2
vaut ici = E~k = ~k
2m . Ce rsultat confirme, sil tait encore besoin de sen convaincre, que
lquation de Schrdinger se comporte comme une quation des ondes. La particule peut donc
prendre des aspects trs diffrents :
6. Nous nous garderons bien de prciser ce que signifie lointain dans le cas prsent, mais pour nous
fixer les ides, cela sapplique aux lectrons mis par le canon lectrons dun tube cathodique, aprs
quelques dizaines de centimtres de parcours. La fonction donde tend naturellement staler sur une
distance certes modeste pour nous, mais considrable pour cette particule. Les conditions particulires
dacclration initiale de la particule lui garantissant son caratre monochromatique, on peut alors, en
premire approximation, dire que ltat de llectron en question est une onde de de Broglie vis vis dun
obstacle que llectron viendrait percuter. Cette proprit est la base du fonctionnement des microscopes
lecroniques transmission.

8.5 Quelques solutions particulires

123

Fig. 8.2. Londe de De Broglie (r, t) = k (r, t).

dune part, elle est capable de se matrialiser en un seul point de lespace lorsquon cherche
mesurer sa position ;
dautre part, elle peut, avec des tats sapprochant des ondes de De Broglie, galement
exhiber une comportement purement ondulatoire totalement dlocalis dans lespace.
Ces deux situations extrmes fixent le cadre de ce quon a coutume dappeler la dualit ondecorpuscule.
En tant que limite dtats normalisables (au sens des suites de Weyl), il est utile de donner
un sens physique aux ondes de De Broglie, par exemple en les reliant des concepts de physique
classique.
(1) Quelle est la vitesse de propagation de londe ? Les rsultats de la mcanique classique donnent
vonde =

k
~k
=
.
|k|2
2m

Une premire remarque vient du fait que contrairement, par exemple, llectromagtisme et
aux ondes acoustiques, les ondes de de Broglie ne se propagent pas une vitesse unique. Leur
vitesse de propagation est proportionnelle au vecteur donde k considr.
(2) Quelle est la vitesse de la particule ? Il ne sagit pas directement de la vitesse de londe. Car
londe nest pas la particule, mais uniquement un objet mathmatique qui la dcrit. Nuance
de taille ! La bonne vitesse considrer ici est celle du dplacement des probabilits de prsence. Elle ne dpend de la fonction donde que par sa phase, et le problme de normalisation
nempche donc pas de la calculer :
vprobabilit (r, t) =

~
~k
=
.
m
m

La vitesse vprobabilit ne dpend ni du temps, ni de r. Londe de De Broglie dcrit une particule


qui se dplace dun bloc, avec la mme vitesse locale de dplacement en tous les points de
lespace.
Ce rsultat offre une surprise de taille : londe et la particule ne se dplacent pas la mme
vitesse ! En effet,
vprobabilit = 2vonde .
Nous verrons au paragraphe suivant que ces deux vitesses nont en fait pas tre gales. Voil
qui ajoute la richesse de la dualit onde-corpuscule. En physique, ces deux vitesses portent
des noms diffrents vprobabilit est dite vitesse de groupe, alors que vonde est la vitesse de phase.
(3) Quelles sont la quantit de mouvement et lnergie cintique de la particule ? La vitesse de la
particule ayant t identifie, nous pouvons en dduire, en nous appuyant sur la mcanique
classique, sa quantit de mouvement
p = mvprobabilit = ~k,
et son nergie cintique
Ec =

~2 k2
1
mv2probabilit =
= Ek = ~.
2
2m

124

8 La particule quantique isole

La quantit Ek intervenant dans la dfinition (8.9) des ondes de De Broglie sidentifie donc
lnergie cintique 7 .
Les deux dernires relations ci-dessus se remettent en forme sous la forme condense :
p = ~k,

E = ~.

(8.10)

Elles ont t tablies par Louis De Broglie en 1923. Elles dictent une rgle assez gnrale qui
permet, lorsquon ne connat pas le dtail de la fonction donde dune particule, de dfinir les
caractristiques essentielles de son comportement ondulatoire partir de la seule connaissance
de sa vitesse. Elles sappliquent dans toutes les situations o, de par sa prparation physique,
la particule acquiert un comportement monochromatique et dlocalis. Elles relient quantit de
mouvement et nergie cintique respectivement au vecteur donde et la pulsation. Remarquons
le rle central jou par la constante de Planck.
Historiquement, en 1923, lexprience dite deffet Compton venait de mettre clairement en
vidence le caractre corpusculaire de la lumire, et les relations (8.10) venaient dtre identifies
comme celles donnant linterprtation corpusculaire des ondes lumineuses (dans le sens o les
photons associs une onde de pulsation et de vecteur donde k ont une impulsion p et une
nergie cintique E dfinies par (8.10)). De Broglie, cherchant transposer ce concept de dualit
la matire, reprit ces relations sur des bases purement pragmatiques.
8.5.2 Le paquet donde quasi-monochromatique
Ce modle de fonction donde correspond la situation dans laquelle la distribution utilise
dans la construction du paquet donde (8.7) est une approximation dune distribution de Dirac
(centre en un vecteur donde k0 ). Il offre un moyen de rsoudre la question de normalisation de
londe de De Broglie. La fonction donde propose est de la forme :
(r, t = 0) ' eik0 r F (r) .
Londe de De Broglie de vecteur k0 est multiplie par une fonction enveloppe F (r), que lon suppose
trs rgulire, au sens o ses drives despace premire et seconde sont ngligeables devant les
quantits |k0 | et |k0 |2 respectivement. La fonction F (r) permet de satisfaire la normalisation,
et fait apparatre explicitement le fait que la particule ne remplit jamais en pratique tout lespace
(voir la figure 8.3).

Fig. 8.3. Le paquet donde quasi-monochromatique denveloppe F et de vecteur donde k0 .

Si lon regarde (r, t = 0) comme un paquet donde (8.7), la pondration (k) est, une
translation prs de vecteur k0 , la transforme de Fourier de F (r), au moins au temps t = 0. On
peut alors donner une expression approche de (r, t), en effectuant un dveloppement limit
lordre 2 de lexponentielle dans lintgrale (8.8),

7. Nous verrons en fait dans les chapitres prochains quil faut interprter Ek comme lnergie totale de
la particule

8.5 Quelques solutions particulires

(r, t) ' e



Ek
i k0 r ~ 0 t

= k0 (r, t)

125

Z
1
1
(k)ei(kk0 )(r ~ Ek (k0 )t) dk
3/2
(2)
R3


1
F r Ek (k0 )t .
~

On observe que les composantes onde k0 et enveloppe F ont chacune leur comportement propre
(voir la figure 8.4) :
londe de De Broglie k0 se dplace la vitesse constante,
vphase

1 Ek0 k0
1
~k0 ,
=
~ |k0 |2
2m

comme si lenveloppe ntait pas l. Nous retrouvons ici la vitesse que nous avions appele
vitesse de phase ;
la fonction enveloppe F se translate dans lespace, apparament sans se dformer, une vitesse
dfinie par :
1
1
vgroupe Ek (k0 ) = ~k0 .
~
m
Nous retrouvons la valeur de ce que nous avions appel vitesse de groupe.
Prcisons demble que labsence de dformation de lenveloppe nest quapparente. Elle rsulte
des approximations faites dans le calcul de lintgrale. Des calculs plus prcis montreraient quune
dformation, mme lente, a toujours lieu (voir 8.5.3 pour ltude dtaille dun cas particulier).
En ngligeant toutefois les effets de dformation de F , la probabilit de prsence de la particule
est
2
(r, t) = |F (r vgroupe t)| .
La translation subie par la fonction F rappelle le mouvement rectiligne et uniforme de la particule
classique. La vitesse de la particule est donc bien vgroupe . Sous cette enveloppe, la particule exhibe
nanmoins le caractre ondulatoire dune onde de De Broglie qui se dplace une autre vitesse.
Cette caractristique ne disparait que lorsque la particule est immobile, et donc que k0 = 0.
Par rapport la mcanique classique, la ncessaire lgre dlocalisation de la particule et le
comportement oscillant sous-jacent sont des faits exprimentaux dont seule la mcanique quantique
est capable de rendre compte.

Fig. 8.4. Vitesse de phase et vitesse de groupe pour le paquet donde monochromatique tal.

8.5.3 Le paquet dondes gaussien.


Afin dobserver de manire plus prcise le phnomne de dformation de lenveloppe dune
particule quantique ( peu prs) localise, nous traitons une situation dans laquelle tous les calculs
ont le mrite de pouvoir tre mens de manire exacte. Prenons

(r, t = 0) =

1
202

3/4



|r|2
exp 2 exp (ik0 r) .
40

126

8 La particule quantique isole

Il sagit dune onde de De Broglie dimpulsion p0 = ~k0 contenue dans une enveloppe gaussienne.
Lcriture de sous sa forme paquet donde (8.8) utilise la fonction de pondration
 2 3/4
2
2

(k) =
e0 (kk0 ) .

Lvolution temporelle sobtient sans difficult de principe en calculant de manire exacte lintgrale (8.8). Lexpression de (r, t) tous temps est cependant assez complique, et nous ne nous
intressons ci-dessous qu la probabilit de prsence, pour laquelle on obtient (voir Exercice 8.5) :
s
 !
3/2

2

p0 2
r

t
~
1
m
2+
exp

,
(t)
=
t2 .
(r, t) = |(t, r)|2 =

0
2 2 (t)
2 2 (t)
2m0
(8.11)
Cette expression montre que lenveloppe de la fonction donde reste de forme gaussienne, et que son
centre se dplace de manire rectiligne et uniforme la vitesse de groupe p0 /m. Nous retrouvons en
cela (de manire rigoureuse !) les rsultats obtenus pour le paquet donde quasi-monochromatique.
Pour autant, maintenant que nous disposons de rsultats exacts, nous voyons que la largeur
de cette gaussienne, que lon peut typiquement prendre gale (t), augmente progressivement
au cours du temps (voir la figure 8.5). Cette volution, est lente jusqu des temps de lordre
de ttransition = 2m02 /~, puis sacclre ensuite pour atteindre sur les temps longs un accroissement
linaire en (t) = ~t/2m0 (voir la figure 8.6). Cette vitesse dtalement est dautant plus rapide
que la particule est lgre et initialement localise.

Fig. 8.5. Etalement du paquet donde gaussien au cours de sa propagation. La probabilit de prsence
(r, t) est reprsente trois instants successifs t = 0 < t1 < t2 .

Fig. 8.6. Evolution temporelle de la largeur (t) du paquet donde gaussien.

Ce rsultat a une porte trs gnrale en mcanique quantique :


Proprit 8.3 (Etalement du paquet donde). Quelques soient les conditions initiales, les
paquets donde des particules voluant dans le vide ont vocation se dlocaliser de plus en plus
aux temps longs. On dit quils stalent.

8.5 Quelques solutions particulires

127

Fixons nous les ides dans lexemple du paquet gaussien :


considrons un lectron frachement arrach son atome, et que lon suppose initialement
confin sur un domaine de lordre de : 0 1010 m. Ltalement entre dans son rgime
linaire au bout de ttransition = 1.8 1016 s. Si cet lectron est acclr dans un canon
lectrons sous une tension de 1 kV, on obtient au bout de 50 cm parcourus (cest dire
peine t = 20 ns de parcours), un talement dj de lordre de 1 cm. Cela souligne la caractre
extrmement phmre de la localisation des particules lmentaires livres elles-mmes.
Le caractre insaisissable de llectron libre nest pas quune expression de langage ! Nous
pouvons juger de la rapidit avec laquelle son tat se rapproche dune onde de De Broglie
trs dlocalise ;
faisons de mme avec une petite masse de 1 g, initialement localise sur 1 cm. Le temps
ttransition passe alors 61019 annes. Ltalement du paquet donde est en fait imperceptible
pour les objets suffisament massifs et/ou volumineux. Lindformabilit du paquet donde
quasi-monochromatique devient en particulier vraie dans la limite des trs grands talements.
La mcanique classique, par ses concepts de coordonnes despace et de trajectoire, fait lhypothse que les particules (ou centres de masse dobjets), quelques soient leur nature, conservent
indfiniment leur caractre localis. Nous comprenons ici pourquoi cette mcanique ne peut sappliquer de manire satisfaisante qu des objets suffisament lourds, et pourquoi on doit changer
de thorie physique pour dcrire les protons, lectrons, neutrons et autres particules lmentaires
qui constituent la matire.
8.5.4 Superposition dtats
Nous abordons l une classe dtats quantiques impossibles concevoir en mcanique classique.
Ils dcoulent du principe suivant :
Proprit 8.4 (Principe de superposition). Si deux fonctions donde 1 (r, t) et 2 (r, t) sont
solutions de lquation de Schrdinger, alors toute fonction donde obtenue par combinaison linaire
est encore solution :
(r, t) = 1 (r, t) + 2 (r, t)
avec , C assurant la condition de normalisation k(t, )kL2 (R3 ) = 1.
Cette proprit est une consquence directe de la linarit de lquation de Schrdinger. La
possibilit pratique de trouver des coefficients et constants qui permettent de satisfaire en
permanence la condition de normalisation dcoule de la compatibilit entre lquation de Schrdinger et la normalisation de la fonction donde : il suffit que et soient choisis de sorte que
(r, t) soit normalise t = 0 pour quelle le soit tout le temps.

Fig. 8.7. Eclatement dun paquet donde en une superposition de trois paquets indpendants lors de
sa diffraction sur un obstacle. Aprs limpact, la particule se trouve simultanment rpartie dans les trois
paquets diffracts.

128

8 La particule quantique isole

On peut donc avoir des tats quantiques qui sont des superpositions de plusieurs paquets donde
indpendants, par exemple deux paquets quasi-monochromatiques :




Ek
Ek
~k1
~k2
i(k1 r ~ 1 t)
i(k2 r ~ 2 t)
(r, t) = e
F1 r
t + e
F2 r
t .
m
m
La particule est alors partage entre deux paquets qui ont chacun leur propre fonction enveloppe
et leur propre vitesse de dplacement. Dune certaine manire, la particule est comme scinde en
deux portions indpendantes.
De telles situations sont courantes en pratique, lorsque quune particule vient heurter un
obstacle (voir la figure 8.7). Le caractre ondulatoire de la fonction donde donne alors souvent
lieu un phnomne de diffraction : la particule se partage en plusieurs morceaux, qui repartent
chacun dans des directions diffrentes.
Dans un tel tat superpos, certaines questions perdent leur sens :
quelle est limpulsion de la particule ? On sent que la rponse doit faire intervenir, dune
certaine manire, les impulsions ~k1 et ~k2 , mais impossible den dire plus 8 , car la particule
possde ces deux impulsions simultanment ;
~2 k2
quelle est son nergie ? L aussi, nous sommes face un subtil mlange entre Ek1 = 2m1 et
~2 k2

Ek2 = 2m2 .
La suite du cours permettra, peu peu, de mieux apprhender ce type de situation.
Il peut enfin arriver que deux fractions indpendantes de la fonction donde dune mme particule viennent au cours de leur dynamique se rencontrer. Elles donnent lieu, comme en optique,
des phnomnes dinterfrences, dans lesquels la probabilit de prsence de la particule acquiert
des formes trs singulires.

8. Au moins ce stade du cours !

8.5 Quelques solutions particulires

129

Exercices
Exercice 8.1 (Longueur donde de de Broglie).
Calculer la longueur donde de de Broglie dans les cas suivants :
(1) Un lectron dnergie 1 eV.
(2) Un proton dnergie 1 MeV.
(3) Le centre de gravit dune masse de 1 kg se dplaant 1 m/s.
Commenter ces rsultats, en considrant la longueur donde comme la prcision avec laquelle on
peut raisonnablement localiser ces particules.
Exercice 8.2 (Exploration du noyau atomique).
Une exprience dexploration du noyau consiste bombarder une feuille dor par des lectrons
ayant une nergie dune centaine de MeV. Montrer que cest bien dans cette gamme dnergie que
les lectrons peuvent effectivement tre diffracts par un noyau dor. Pour lor, le nombre de charge
vaut Z = 79 et le nombre de masse vaut A = 197.
On indique que la taille des noyaux est r = A1/3 r0 avec r0 =1.2 fm.
Exercice 8.3 (Sensiblit de loeil humain).
En 1917, Fabry et Buisson mesurent la limite de sensibilit de loeil et montrent que le plus
faible point lumineux perceptible dans lobscurit totale est une bougie situe 27 km.
(1) La puissance de lnergie lumineuse visible mise par une bougie est de lordre de 0.01 W.
Quelle est la puissance collecte par la pupille de loeil dun observateur situ 27 km de
celle-ci ? (On assimilera la pupille un trou de 5 mm de diamtre)
(2) La longueur donde typique de la lumire visible est de lordre de = 500 nm. Quelle est, en
fonction de , de la constante de Planck h = 2~ et la vitesse de la lumire c lnergie E
porte par un photon visible ? Faire lapplication numrique.
(3) Pour dcider ou non denvoyer au cerveau linflux nerveux annonant la dtection dun point
lumineux, loeil intgre le nombre de photons reus en 100 ms. Dduire des rsultats qui
prcdent lordre de grandeur du nombre de photons ncessaires pour dclencher linflux.
Exercice 8.4 (Interfrence quantique).
On considre, dans une zone Z de lespace, une particule dont ltat est localement donn par
la superposition de deux ondes de De Broglie :
 

 

Ek1
Ek2
(r, t) = exp i k1 r
t
+ exp i k2 r
t
.
~
~
En dpit du problme de normalisation des ondes planes, nous considrons que la norme de (r, t)
ainsi dfinie reste physiquement interprtable dans la zone Z.
(1) Calculer, pour les points r intrieurs la zone Z, la densit de probabilit de prsence (r, t)
de la particule.
(2) Montrer que (r, t) possde un caractre ondulatoire dont on prcisera le vecteur donde et la
pulsation.
Exercice 8.5 (Paquet dondes gaussien).
Lobjectif de cet exercice est de montrer la formule (8.11) dans le cas o lespace ambiant est R.
Initialement, on considre la fonction donde

(0, x) = 0 (x) =
(1) Montrer que k(0, )kL2 (R) = 1.

1
202

1/4

ex

/402

eik0 x .

130

8 La particule quantique isole

(2) Donner une quation diffrentielle ordinaire satisfaite par


Z
0 (k) =
0 (x)eikx dx,
R

et en dduire la transforme de Fourier de 0 .


(3) Donner, en adaptant (8.7), la forme gnrale de (t, x).
(4) Montrer que |(t, x)| est de forme gaussienne et donner sa variance 2 (t).
Exercice 8.6 (Etalement du paquet donde).
Un atome est mis au contact dune masse mtallique de taille caractristique a = 1 cm. On
suppose quun des lectrons de latome, initialement maintenu dans un volume dune longueur
caractristique de 1010 m, peut alors schapper et voir sa fonction donde envahir lensemble du
mtal. En utilisant les rsultats sur le paquet donde gaussien, estimer le temps caractristique
ncessaire cet talement.

9
La particule quantique en interaction avec un potentiel

Nous exposons ici comment la mcanique quantique rend compte des interactions dune particule avec des forces drivant dun potentiel. La thorie quantique permet, dans certains cas particuliers, de retrouver la relation fondamentale de la dynamique de la mcanique classique. Nous
dcrivons linverse des situations dans lesquelles la particule quantique dfie les lois classiques,
et joue aux passes-murailles.

9.1 Dynamique de la particule en interaction . . . . . . . . . . . . . . . . . . . . . . . . 131


9.1.1 Lquation de Schrdinger avec potentiel . . . . . . . . . . . . . . . . . . . . . . . . . . 131
9.1.2 Caractre bien pos de lquation de Schrdinger . . . . . . . . . . . . . . . . . . . 132
9.1.3 Rgularit de la fonction donde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
9.1.4 Le terme potentiel et la normalisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
9.2 Le paquet donde en interaction : la limite classique . . . . . . . . . . . . . . 135
9.3 Etats stationnaires de la particule quantique . . . . . . . . . . . . . . . . . . . . . 137
9.3.1 Que sont les tats stationnaires ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
9.3.2 Lquation de Schrdinger indpendante du temps . . . . . . . . . . . . . . . . . . 137
9.3.3 Energie de la particule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
9.3.4 Rgularit des tats stationnaires unidimensionnels . . . . . . . . . . . . . . . . . 138
9.3.5 Minoration de lnergie des tats stationnaires . . . . . . . . . . . . . . . . . . . . . 139
9.3.6 Importance des tats stationnaires en mcanique quantique . . . . . . . . . . 139
9.4 Une situation purement quantique : la barrire de potentiel . . . . . . 139
9.4.1 La barrire de potentiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
9.4.2 Etats stationnaires de la barrire de potentiel . . . . . . . . . . . . . . . . . . . . . . 140
9.4.3 Effet tunnel et transmission rsonnante . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
9.4.4 Et la limite classique ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
9.5 Implmentation numrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
9.5.1 Schma de Cranck-Nicholson. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
9.5.2 Dcomposition doprateurs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

9.1 Dynamique de la particule en interaction


9.1.1 Lquation de Schrdinger avec potentiel
En mcanique quantique, la particule soumise des forces est encore dcrite par une fonction donde (r, t). En particulier, linterprtation de (r, t) = |(r, t)|2 en terme de densit de
probabilit de prsence reste inchange. Lquation de Schrdinger est cependant modifie.

132

9 La particule quantique en interaction avec un potentiel

Dfinition 9.1. Linteraction dune particule avec des forces extrieures drivant dun potentiel
V (r, t) est dcrite par lquation de Schrdinger avec potentiel :
i~

~2
=
(r, t) + V (r, t)(r, t).
t
2m

(9.1)

Rappelons quune force F est dite driver dun potentiel si F F(r, t) et sil existe un champ
scalaire valeur relles V (r, t) tel que
F(r, t) = V (r, t).
On peut citer par exemple :
(1) la force de gravitation : pour une particule attire par un corps de masse M dont le centre de
gravit est pris comme origine de lespace, la force et le potentiel sont respectivement :
Fgravitation (r) = G

Mm
er ,
r2

Vgravitation (r) = G

Mm
,
r

o G = 6.67 1011 m3 kg1 s2 est la constante de gravitation ;


(2) la force de Coulomb (en lectrostatique) : dans le cas particulier dune particule de charge
lectrique q se dplaant dans un champ lectrique statique E(r),
FCoulomb (r) = qE(r),

VCoulomb (r) = qU (r),

o U (r) est le potentiel lectrique, dfini par la relation E(r) = U (r).


Pour toutes ces forces, le champ de potentiel qui intervient dans lquation de Schrdinger sidentifie au champ de potentiel classique.
Citons toutefois un contre-exemple : la force de Lorentz
FLorentz = qv(t) B(r, t).
Cette force est ressentie par une particule classique charge qui se dplace la vitesse v dans un
champ magntique B. Elle ne peut pas se mettre explicitement sous la forme dune fonction de
la seule position r de la particule. Elle peut donc encore moins scrire comme le gradient dun
champ de potentiel, et on ne peut pas utiliser lquation de Schrdinger (9.1) dans ce cas. 1
9.1.2 Caractre bien pos de lquation de Schrdinger
On se place dans le cas o le potentiel extrieur V ne dpend pas du temps. On introduit
que nous nommons oprateur Hamiltonien du systme
loprateur suivant, not H,
2
= ~ + V (r).
H
2m

(9.2)

est la somme de deux oprateurs symtriques, loprateur de multiplication par V


Loprateur H
~2

et H0 = 2m (voir le 8.4.1 pour le caractre symtrique de ce dernier oprateur). En gnral,


est galement auto-adjoint 2 , mais cette proprit est vrifier au pralable dans tous les cas.
H
Des indications sur la manire de mener cette vrification seront donnes au chapitre 10.
Lquation de Schrdinger est bien pose au sens mathmatique du terme ds que loprateur
Hamiltonien est autoadjoint :
1. Il existe en fait une troisime forme de lquation de Schrdinger, qui permet de traiter linteraction dune particule charge avec un champ lectromagntique quelconque. Elle fait intervenir, en plus du
potentiel Coulombien U (r, t), le potentiel vecteur A(r, t). Le lecteur intress pourra trouver ces dveloppements dans tout ouvrage de rfrence en mcanique quantique.
2. Rappelons quun oprateur auto-adjoint est symtrique, mais pour quun oprateur symtrique soit
auto-adjoint, il faut vrifier des conditions sur le domaine de ladjoint (voir C.1).

9.1 Dynamique de la particule en interaction

133

un oprateur auto-adjoint non-born sur un espace de Hilbert H.


Thorme 9.1 (Stone). Soit H

(t))tR doprateurs
Alors iH est le gnrateur infinitsimal dun groupe fortement continu (U
sur H, cest--dire
(0) = Id, U
(t1 + t2 ) = U
(t1 )U
(t2 ) pour tout t1 , t2 R (proprit de groupe) ;
U
(t)u0 U
(t0 )u0 kH = 0 (continuit forte) ;
pour tout u0 H et t0 R, limtt0 kU

pour tout t R et u0 H, kU (t)u0 kH = ku0 kH (unitarit).


pour 0 D(H).

En consquence, (9.1) admet une unique solution C1 (R, H) C0 (R, D(H))

On rappelle que le gnrateur infinitsimal dun groupe 3 (S(t))


tR est loprateur (non

born) A de domaine D(A) H, les lments u D(A) tant caractriss par le fait que lappli
cation t 7 S(t)u
soit drivable en 0, avec



= d S(t)u

.
Au

dt
t=0

= etA dans ce cas.


On utilise la notation formelle S(t)
Ainsi, on peut dfinir la solution de (9.1) pour des donnes initiales suffisamment rgulires.
(t) = eitH . En effet, si la condition
Lvolution est donne par lapplication dun propagateur U

(t)0 vrifie lquation de Schrinitiale est suffisamment rgulire (0 D(H)),


alors (t) = U

dinger (9.1). De plus, grce au propagateur U (t), on va pouvoir dfinir formellement des volutions
(t)0
physiques pour des donnes initiales moins rgulires : on dfinit, par densit, la quantit U
n
n
pour 0 H. En effet, pour 0 H, il existe une suite (0 )nN telle que k0 0 kH 0 lorsque
(t) n en utilisant la proprit de continuit forte
n +. On dfinit alors (t, ) = limn+ U
0

du groupe (U (t))tR .
9.1.3 Rgularit de la fonction donde
Connatre a priori la rgularit de la fonction donde et de ses drives se rvle trs utile dans
ltude explicite de solutions. On se place dans le cas de potentiels V (r) ne dpendant pas du
temps. On note
= {r R | V (r) < +}.
soit autoOn suppose que est ouvert, et que V L2 () + L () par exemple (afin que H
adjoint, voir la Remarque 10.2). On considre la quantit suivante, que nous verrons plus tard tre
lnergie moyenne du systme :
Z
Z
Z
~2
2

E=
H dr =
|(t, r)| dr +
V (r)|(r, t)|2 dr.
(9.3)
2m R3
R3
R3
On admet que le premier terme reprsente lnergie cintique, et le second lnergie potentielle de
la particule. Pour des raisons physiques, ces deux quantits ne peuvent tre infinies. Ceci montre
alors que
(1) le support de est contenu dans . En effet
Z
V (r)|(r, t)|2 dr < +.
R3

Ceci montre que = 0 presque partout sur le complmentaire de ;


(2) de plus,

Z
R3

|(t, r)|2 dr < +.

montre que H1 () pour tout domaine born ;


3. En fait, cette dfinition peut tre un peu modifie et avoir un sens ds quon a affaire un semigroupe.

134

9 La particule quantique en interaction avec un potentiel

On rsume ces proprits en disant que


Proprit 9.1. Si lnergie du systme est finie (i.e. (9.3) est vrifie), alors H1 (), avec
= {r R | V (r) < +}.
Remarque 9.1. Dans des cas particuliers, on peut montrer une rgularit plus grande (voir 9.3.2).
Remarque 9.2 (Continuit de en dimension 1). Dans le cas particulier de la dimension 1 despace
(que nous utiliserons souvent dans les exercices), on a une injection (compacte) H1 () , C0 ()
pour des domaines borns. On en dduit que est C0 (). Ces arguments ne peuvent tre
transposs directement en dimensions despace suprieures, mais doivent tre adapts au cas par
cas en fonction des potentiels considrs (en utilisant typiquement des injections de Sobolev).
9.1.4 Le terme potentiel et la normalisation
La conservation de la normalisation de au cours du temps est encore assure pour lquation
de Schrdinger gnrale (9.1). On a les rsultats suivants.
soit auto-adjoint, lquation de SchrProposition 9.1. Pour tout potentiel V V (r) tel que H
dinger (9.1) est compatible avec la relation de normalisation, au sens o si k(0, )kL2 (R3 ) = 1,
alors, pour tout t R, k(t, )kL2 (R3 ) = 1.
On nonce ici cette proprit de manire explicite, et on en fait une dmonstration ; cependant,
elle tait dj contenue dans lnonc du Thorme 9.1 (unitarit). Formellement, cette proprit
(et le calcul qui suit) se gnralise au cas o V dpend du temps (cependant, dans ce cas, le
caractre bien pos de lquation de Schrdinger (9.1) nest pas clair).
Preuve. On peut faire une preuve explicite pour une donne initiale suffisamment rgulire. Pour
solution de (9.1) est valeurs dans D(H)
par le Thorme 9.1. Or,
un tat initial 0 D(H),
on a




Z
d
1
1
2
H, + , H
|(x, t)| dx = ht , i + h, t i =
dt R3
i~
i~
E D
E
1 D

=
H, , H
=0
i~
est symtrique. Ceci montre que
si H
Z
t R,
|(x, t)|2 dx = 1.
R3

Dans le cas gnral dune donne simplement L2 (R3 ), ce rsultat dcoule directement de lunitarit
u
du propagateur (voir le Thorme 9.1).
t
Comme au chapitre prcdent, la conservation de la normalisation des fonctions donde peut
aussi se voir par le biais des formules de lhydrodynamique quantique.
Proprit
9.2. On considre une particule quantique dcrite par la fonction donde (r, t) =
p
(r, t)ei(r,t) . Si satisfait lquation de Schrdinger avec potentiel (9.1), alors la probabilit de prsence (r, t), le courant de probabilit J(r, t), et la vitesse de probabilit v(r, t) donns
respectivement par
(r, t) = |(r, t)|2 ,

J(r, t) = i


~
,
2m

v(r, t) =

~
,
m

vrifient encore les relations de conservation locale de la probabilit de prsence :


J(r, t) = (r, t)v(r, t)

+J=
+ (v) = 0
t
t
Ces quations forment un systme hyperbolique de lois de conservation.

9.2 Le paquet donde en interaction : la limite classique

135

Le rsultat de conservation locale se dmontre de la mme manire quau chapitre prcdent,


en tenant compte du terme potentiel supplmentaire dans
t . On a formellement :

i~
i
=
V ,
t
2m
~

i~
i
=
+ V ,
t
2m
~

do


=
+
=
t
t
t





i~
i
i~
i~
i
V +
+ V =
.
2m
~
2m
~
2m

Les termes potentiels se simplifient, et ne modifient finalement pas le rsultat de ce calcul. Les
proprits dmontres en sections 8.2.2 et 8.3 restent donc encore vraies.
La drive temporelle de la probabilit de prsence dpend donc uniquement de la fonction
donde, cest dire de ltat du systme linstant considr. En particulier, elle ne dpend pas
du terme potentiel de lquation de Schrdinger (9.1), cest dire des sollicitations extrieures
appliques au systme. Ce rsultat est rapprocher de la mcanique classique, pour laquelle la
dynamique de Newton scrit
dr
p

dt = m ,
dp X

=
Fi .

dt
i
On constate, ici aussi, que la prsence des forces naffecte pas lexpression de la drive temporelle
p
du vecteur position. Cette drive dpend exclusivement du vecteur vitesse v = m
, qui est, avec r,
une des informations dcrivant ltat du systme.

9.2 Le paquet donde en interaction : la limite classique


Dans le cas de lquation de Schrdinger (8.2) pour la particule libre, les paquets donde quasimonochromatiques se dplacent de manire rectiligne et uniforme (voir aux 8.5.2 et 8.5.3). Quen
est-il dans le cas de lquation de Schrdinger avec potentiel (9.1) ?
Considrons une particule quantique de masse m, de fonction donde (r, t), soumise un potentiel V (r, t) pouvant dpendre du temps. Etant donn linterprtation de (r, t) dr = |(r, t)|2 dr
en tant que probabilit de prsence de la particule, on peut dfinir pour cette particule une position
moyenne
Z
R(t) =
r|(r, t)|2 dr.
(9.4)
R3

On montre alors que :


Proposition 9.2. La vitesse de dplacement et lacclration du point moyen R(t) du paquet
donde sont respectivement donnes par :
Z
Z
dR
1 ~
=
v(r, t)|(r, t)|2 dr =
(r, t) (r, t) dr,
(9.5)
dt
m i R3
R3
Z
d2 R
V (r, t) |(r, t)|2 dr.
(9.6)
m 2 =
dt
R3
Preuve. On prsente ici une dmonstration formelle, se limitant des fonctions rgulires pour
lesquelles les intgrations par parties ne posent pas problme, par exemple C0 (R3 ). On en dduit
par densit que (9.5) et (9.6) sont valables lorsque lnergie totale est finie.
Pour obtenir (9.5), on utilise la relation de conservation de la masse t + (v) = 0. Il vient
alors :

136

9 La particule quantique en interaction avec un potentiel

dR
=
dt

Z
r
R3

dr =
t

Z
(v) r dr =

R3
dR
dt se

v(r, t)(r, t) dr.


R3

La deuxime expression propose pour


dmontre en rintroduisant le vecteur courant de
probabilit J(r, t) :
Z
Z
Z

dR
~
1 ~
=
J(r, t) dr = i
dr =
dr.
dt
2m R3
m i R3
R3
La drive seconde de R sobtient ensuite selon :



Z 
d dR
~

()
d2 R
=
+
dr.
m 2 =m
dt
dt dt
i R3 t
t
Or, lquation de Schrdinger (9.1) donne

i~
i
=
+ V ,
t
2m
~
Il vient finalement :
d2 R
~2
m 2 =
dt
2m

()
i~
i
i
=
() V V .
t
2m
~
~

R3

() dr

Z
R3

V dr.

Une dernire intgration par parties montre que la premire intgrale est nulle.

u
t

Ces rsultats ont une interprtation particulirement intuitive. Limpulsion moyenne m dR


dt nest
autre que la moyenne des impulsions locales mv(r, t), pondres au prorata de la probabilit de
2
prsence (r, t). De mme, la force responsable de lacclration ddtR
sobtient en moyennant le
2
directement
en fonction de
champ de forces classique F(r, t) = V (r, t). Lexpression de m dR
dt
et de son gradient peut quant elle ne paratre ce stade du cours quun tour de passe-passe
mathmatique. Son utilit se rvlera par la suite (voir le chapitre 11).
Limite classique
Si la fonction donde est trs pique autour du point R (au sens o le paquet donde a une
extension trs limite devant lchelle caractristique dvolution du champ de force, voir figure 9.1),
lacclration de la position moyenne R(t) du paquet donde est donne par :
m

d2 R
= V (R(t), t).
dt2

(9.7)

Ce rsultat sobtient rigoureusement


dans la limite o |(r, t)|2 * R0 (t) au sens des distributions,
R
auquel cas R(t) R0 (t) et R3 V (r, t) |(r, t)|2 dr V (R0 (t), t).
Si la particule quantique possde un moment donn laspect ponctuel de la particule classique,
alors son vecteur position obit ce mme instant la relation fondamentale de la dynamique. Cest
l un rsultat trs important, qui prouve que la mcanique classique est contenue dans la mcanique
quantique. La principale diffrence de fond entre les deux thories est que la mcanique quantique
se montre capable de dcrire un plus grand nombre de situations physiques, celles notamment
o le caractre tal ou ondulatoire de la particule prend de limportance. Rciproquement,
la mcanique classique doit tre vue comme une approximation, un comportement asymptotique
de la mcanique quantique dans les quelques situations simples o la particule est suffisamment
localise pour pouvoir tre considre comme ponctuelle.
En pratique, le phnomne dtalement du paquet donde fait quune particule perd toujours
terme son aspect localis, et ce dautant plus vite quelle est lgre. En consquence, les corps
lourds sont plus enclins se laisser dcrire par la mcanique classique 4 sur des priodes longues
(typiquement plusieurs milliards de milliards dannes en ce qui concerne les objets de notre
quotidien), que les lectrons (quelques 1016 secondes tout au plus).
4. Mais attention, pas de manire systmatique ! Voir la suite de ce chapitre. . .

9.3 Etats stationnaires de la particule quantique

137

Fig. 9.1. La limite classique : lorsque le paquet donde est trs piqu, lacclaration de sa position
moyenne R(t) sidentifie, au terme de masse prs, la drive locale du champ de potentiel.

9.3 Etats stationnaires de la particule quantique


Afin de nous armer pour lexamen de situations dans lesquelles la particule exhibe pleinement
son comportement quantique, nous tudions en prliminaire une classe particulire de solutions
de lquation de Schrdinger : les solutions stationnaires. Elles sont dfinies pour des champs de
potentiel ne dpendant pas du temps.
9.3.1 Que sont les tats stationnaires ?
Dfinition 9.2. Pour une particule voluant dans un champ de potentiel V (r) indpendant du
temps, on nomme tats stationnaires les solutions de lquation de Schrdinger qui se factorisent
sous la forme :
(r, t) = (r)(t),
avec les conditions de normalisation
Z
|(r)|2 dr = 1,
R3

t R |(t)| = 1.

Les fonctions (r) et (t) = ei(t) sont des fonctions valeurs complexes, nommes respectivement parties spatiale et temporelle de ltat stationnaire.
Du point de vue physique, ces tats stationnaires dcrivent des situations dans lesquelles la
probabilit de prsence (r, t) = |(r)|2 reste constante au cours du temps. Cela ne signifie cependant pas que la particule

reste immobile. Par exemple, dans le cas des ondes de De Broglie,
la fonction donde e
non nul.

i kr

Ek
~

est associe un champ uniforme de vitesse de probabilit v =

~k
m

9.3.2 Lquation de Schrdinger indpendante du temps


Le rsultat qui suit est capital dans la recherche et le calcul des tats stationnaires.
Proposition 9.3 (Equation de Schrdinger indpendante du temps). Pour une particule
de masse m voluant dans un champ de potentiel V (r) indpendant du temps, (r) et (t) sont
les parties spatiale et temporelle dun tat stationnaire, si et seulement si (r) vrifie la condition
de normalisation kkL2 (R3 ) = 1, et sil existe une constante E R homogne une nergie telle
que
~2

(r) + V (r)(r) = E(r),


(9.8)
2m

138

9 La particule quantique en interaction avec un potentiel

et

(t) = ei( ~ t+) ,


E

(9.9)

avec une phase R quelconque. Lquation (9.8) est lquation de Schrdinger indpendante du
temps. La fonction (r) est appele tat dnergie dnergie E.
Remarque 9.3. Une autre manire de voir la chose est de dire que les tats stationnaires (r) et
leurs nergies E sont respectivement les vecteurs propres et les valeurs propres de loprateur
Hamiltonien :
2
= ~ + V.
H
2m
Preuve. Supposons que lon puisse crire (r, t) = (r)(t) avec les conditions de normalisation
donnes dans la Dfinition 9.2. Introduisant cette expression dans lquation de Schrdinger dpendante du temps, il vient :
i~(r)

d
~2
(t) = 0 (t)~(r)(t) =
(r)(t) + V (r)(r)(t).
dt
2m

Simplifiant les deux membres par (t) 6= 0,


0 (t)~(r) =

~2
(r) + V (r)(r).
2m

Comme le second membre de cette galit ne dpend pas du temps, 0 (t) est constant et (t) =
E/~ t + pour des constantes E, R. Finalement,

~2
(r) + V (r)(r) = E(r).
2m

La rciproque, cest dire, le caractre suffisant des relations (9.8) et (9.9) est quant lui immdiat.
u
t
9.3.3 Energie de la particule
La constante E qui apparat dans lquation de Schrdinger indpendante du temps a la dimension dune nergie. Nous admettons ds prsent que E correspond sans ambiguit lnergie
totale de la particule place dans ltat (r). Les tats stationnaires sont dailleurs les seuls tats
quantiques dont lnergie est parfaitement connue. Nous en verrons les raisons plus tard (voir le
chapitre 11). Cela justifie que les tats stationnaires soient appels tats dnergie.
9.3.4 Rgularit des tats stationnaires unidimensionnels
On peut montrer, pour des solutions stationnaires, une rgularit plus grande pour la fonction
donde. En dimension 1 despace par exemple, une solution stationnaire (x) est de classe C1 sur
le domaine = {V < +} avec V L2 (R) + L (R) (on suppose encore ouvert). En effet,
pour une solution stationnaire,

~2 d2
+ (V (x) E)(x) = 0.
2m dx2

Or, (V E) est dans L2loc (), donc est dans H2loc (). Comme on a linjection (compacte)
H1 () , C0 () pour des ensembles ouverts et borns , on en dduit que x est C0 (), et
donc que C1 (). Ceci signifie donc que
est continue partout sur , sannule sur , et est nulle sur c ;
x est continue sur louvert , mais peut prsenter des discontinuits au niveau de .

9.4 Une situation purement quantique : la barrire de potentiel

139

9.3.5 Minoration de lnergie des tats stationnaires


Le rsultat qui suit compare, pour un tat stationnaire, les valeurs possibles de E aux valeurs
prises par le potentiel V (r).
Proposition 9.4. Lnergie E associe un tat stationnaire (r) dune particule quantique voluant dans un champ de potentiel V (r) satisfait la minoration
E inf3 V (r).

(9.10)

rR

Preuve. On considre lquation de Schrdinger indpendante du temps (9.8). On prend rgulire


support compact, et on utilise un argument de densit. Multipliant les deux membres de (9.8)
par (r) et intgrant sur R3 :
Z
Z
~2
V (r)|(r)|2 dr = E.

(r)(r) dr +
2m R3
R3
Or,

Z
R3

Z
(r)(r) dr =

R3

||2 dr 0,

et comme |(r)|2 0, on a finalement, grce la condition de normalisation,


Z
Z
2
E
V (r)|(r)| dr inf3 V
|(r)|2 dr = inf3 V.
R3

R3

u
t
Etant donn que nous savons dj, par anticipation, que E est lnergie totale de la particule,
ce rsultat se comprend simplement comme le fait que cette nergie ne peut tre infrieure au
minimum dnergie potentielle accessible. Rsultat intuitif ? Peut tre dun point de vue classique.
Pour ce qui est de lintuition quantique attendons cependant un peu. . .
9.3.6 Importance des tats stationnaires en mcanique quantique
Lors de ltude dune situation donne, la recherche des tats stationnaires constitue en gnral
le premier travail effectuer. Ils fournissent une base dexemples de fonctions donde acceptables
pour la particule, et reprsentent en cela une prcieuse source dinformation pour mener des
raisonnements physiques. Nous le verrons plus tard, ils constituent galement une base au sens
mathmatique du terme, sur laquelle peuvent se dcomposer toutes les solutions de lquation de
Schrdinger (voir 10.4.3). Ces tats sont enfin des tats dans lesquels lnergie de la particule est
connue sans ambiguit ( loppos, par exemple, de fonctions dondes obtenues par superposition
dtats trs diffrents lun de lautre). Cela en fait des tats trs particuliers, qui se retrouvent
la base de nombre de dveloppements thoriques.

9.4 Une situation purement quantique : la barrire de potentiel


Le rsultat sur la limite classique de lquation de Schrdinger ( 9.2) donne une clef quant
aux situations dans lesquelles le comportement de la particule est susceptible dchapper la
mcanique classique. Il faut pour cela que la fonction donde soit au moins aussi tale que la
distance caractristique sur laquelle volue le champ de potentiel. Cest une situation de ce type,
traite dans un cadre unidimensionnel, que lon tudie dans ce paragraphe.

140

9 La particule quantique en interaction avec un potentiel

Fig. 9.2. Le modle unidimensionnel de la barrire de potentiel.

9.4.1 La barrire de potentiel


On se place en dimension 1 despace et on considre le potentiel (voir figure 9.2)

si x 0,
V = 0
V (x) = V = V0 0 si 0 < x < a,

V =0
si x a.
On cherche savoir comment une particule quantique, arrivant de la gauche avec une nergie
cintique Ec , interagit avec la barrire. Rappelons ce que nous enseignerait la mcanique classique
en pareille situation :
si Ec < V0 : la particule na pas lnergie suffisante pour grimper sur la marche. Elle rebondit
et repart vers la gauche. La vitesse ne fait que changer de signe, et lnergie cintique est
conserve ;
si Ec V0 : la particule passe par dessus la marche et continue sa route vers la droite. Une
fois la marche franchie, elle retrouve sa vitesse et son nergie cintique initiales.
9.4.2 Etats stationnaires de la barrire de potentiel
Calculons les tats stationnaires (x, t) = (x)(t) de la particule quantique et les nergies E
associes, en supposant que la particule arrive sur la barrire par la gauche (ceci sera utile par la
suite). La Proposition 9.4 montre que dans tous les cas, E 0. On cherche ainsi des solutions de

~2 d2
(x) + V (x)(x) = E(x).
2m dx2

Des rsultats gnraux de thorie spectrale (voir le chapitre 10) montrent que le spectre de loprateur Hamiltonien est purement continu. On ne sattend donc trouver que des pseudo-tats
propres (i.e. des limites de suites de Weyl, du type ondes planes). On peut prciser ce rsultat
par une construction analytique des solutions. Pour ce faire, il faut distinguer deux cas, selon que
E < V0 ou E > V0 .
Lorsque E < V0 .
La forme gnrale de la solution de lquation de Schrdinger indpendante du temps, rsolue
par morceaux sur les intervalles ] , 0], ]0, a[, et [a, +[ est :

ikx
ikx

si x 0,
g e + g e
Kx
Kx
(x) = e + e
(9.11)
si 0 < x < a,

ikx
ikx
d e + d e
si x a,

avec
k=

2mE
,
~

p
K=

2m(V0 E)
.
~

9.4 Une situation purement quantique : la barrire de potentiel

141

On a donc des solutions de type ondes planes linfini, qui ne sont pas normalisables (sauf dans le
cas trivial = 0). Du point de vue physique, on les considre cependant comme des tats limites
de paquets donde trs tals qui viendraient interragir avec la barrire 5 .
La forme de la solution (9.11) est la forme la plus gnrale possible mathmatiquement, mais
nest pas pertinente en tant que telle du point de vue physique. Rtablissons tout dabord la
E
dpendance temporelle de la fonction donde en la multipliant par la quantit ei ~ t . De part et
dautre de la barrire, l o le potentiel est nul, les termes en eikx et eikx correspondent aux
E
E
ondes de De Broglie ei(kx ~ t) et ei(kx ~ t) , et reprsentent des tats quantiques dans lesquels la
~k
particule se dplace respectivement aux vitesses + ~k
m et m . Ainsi,
ikx
le terme g e
dcrit une particule arrivant par la gauche. Cette composante correspond
la situation initiale du problme que nous nous posons. Pour imposer la prsence de cette
composante dans les tats recherchs, on prend arbitrairement g = 1. La valeur prcise de
cette constante na pas grande importance, du fait que nos tats ne sont de toute manire
pas normalisables ;
les termes g eikx et d eikx dcrivent respectivement une particule qui repart vers la gauche
aprs avoir rebondi sur la barrire, et une particule qui sloigne vers la droite aprs lavoir
franchie. Il sagit des deux destins envisageables pour la particule en mcanique classique, et
nous considrons, pour linstant sur la base de notre seul bon sens, que ces termes sont en
accord avec le problme pos ;
le terme d eikx dcrit en revanche une particule arrivant de la droite. Comme nous considrons une particule arrivant par la gauche, on prend d = 0.
Au final, on se restreint la recherche de solutions de la forme (voir figure 9.3) :

ikx
ikx

si x 0,
= e + g e
Kx
Kx
(x) = = e + e
si 0 < x < a,

= d eikx
si x a.

Fig. 9.3. Les cinq composantes des tats stationnaires dnergie E < V0 correspondant une particule
arrivant sur la barrire par la gauche.

Le tri qui a t fait parmi les termes proposs doit tre vu comme une tentative de donner aux
tats stationnaires une signification physique qui rpond lesprit du problme. Ce sens physique
est ici celui de la mcanique classique. Il reste cependant a vrifier que ces choix sont bien autoriss
par la thorie quantique. Pour cela, il faut sassurer quil est possible de satisfaire aux conditions
de raccordement des diffrents morceaux de solution. En vertu de leurs proprits de rgularit
5. On verra au 10.3 un autre cas particulier, pour lequel il faudra explicitement exclure certaines
solutions non normalisables. Lesdites solutions ne seront pas de type ondes planes dans ce cas.

142

9 La particule quantique en interaction avec un potentiel

(voir 9.3.4), il faut que et x soient continues en x = 0 et x = a. Les coefficients g , , , et


d doivent donc vrifier le systme linaire de quatre quations quatre inconnues

1 + g = + ,

eKa + eKa = eika ,


d
ik ikg = K K,

KeKa KeKa = ikd eika ,


dont on peut vrifier quil possde effectivement une unique solution :
g =

i(K + ik)keKa
,
(k 2 K 2 ) sinh(Ka) + 2ikK cosh(Ka)

d =

2iKkeika
.
(k 2 K 2 ) sinh(Ka) + 2ikK cosh(Ka)

(K 2 + k 2 ) sinh(Ka)
,
(k 2 K 2 ) sinh(Ka) + 2ikK cosh(Ka)

i(K ik)keKa
,
(k 2 K 2 ) sinh(Ka) + 2ikK cosh(Ka)

Lorsque E > V0 .
La forme gnrale de la solution de lquation de Schrdinger dans le cas o on se restreint
des ondes arrivant par la gauche est (voir figure 9.4)

ikx
ikx

si x 0,
= e + g e
0
0
ik
x
ik
x
(x) = = e
+ e
si 0 < x < a,

ikx
= d e
si x a,

avec
k=

2mE
,
~

p
0

k =

2m(E V0 )
.
~

De la mme manire que prcdemment, la continuit de et de sa drive d


dx en x = 0 et
x = a demande que les coefficients g , , , et d satisfassent un systme linaire de 4 quations
4 inconuues dont lunique solution est
(k 2 k 02 ) sin(k 0 a)
g = 2
,
(k + k 02 ) sin(k 0 a) + 2ikk 0 cos(k 0 a)

i(k + k 0 )keik a
= 2
,
(k + k 02 ) sin(k 0 a) + 2ikk 0 cos(k 0 a)

i(k k 0 )keik a
= 2
,
(k + k 02 ) sin(k 0 a) + 2ikk 0 cos(k 0 a)

d =

2kk 0 eika
.
(k 2 + k 02 ) sin(k 0 a) + 2ikk 0 cos(k 0 a)

9.4.3 Effet tunnel et transmission rsonnante


Rupture avec la mcanique classique
Dans les deux situations E > V0 et E < V0 , il est possible de construire des tats stationnaires
avec d = 0. Cela prouve a posteriori la cohrence et la lgitimit des choix qui nous ont fait
abandonner londe de De Broglie venant de la droite. La thorie quantique autorise donc bien que
la particule soit rflchie ou transmise, lexclusion dautres possibilits.
Un fait surprenant apparat cependant : en dehors de quelques cas particuliers, aucun des coefficients g , , , et d obtenus nest nul. Cela signifie quil est impossible dans le cas gnral, de
construire dtat quantique dans lequel la particule est entirement rflchie vers la gauche, ou entirement transmise vers la droite. La thorie quantique impose que la particule soit simultanment
transmise et rflchie par lobstacle.
Cette rflexion-transmission simultane constitue un comportement qui tranche avec la mcanique classique :

9.4 Une situation purement quantique : la barrire de potentiel

143

Fig. 9.4. Les cinq composantes des tats stationnaires dnergie E > V0 correspondant une particule
arrivant sur la barrire par la gauche.

il faut tout dabord comprendre ce phnomne comme le fait quen interragissant avec la
barrire, la fonction donde se spare en deux composantes : une qui continue sa course vers
la droite, et une qui revient vers la gauche. La particule quantique perd son unit, et son tat
aprs linteraction est une superposition de deux tats transmis et rflchi ;
ensuite, mme avec une nergie E infrieure la hauteur V0 de la barrire, une fraction de
la particule est capable, au moins en partie, de poursuivre sa route vers la droite. Plus fort
encore, la fonction donde, et donc, la probabilit de prsence, ne sont pas nulles dans la zone
0 < x < a o lnergie est pourtant infrieure au potentiel V (x). Cela serait parfaitement
inconcevable en mcanique classique. Pour autant, la thorie quantique autorise la particule
faire des excursions modres dans ces zones interdites. Ces phnomnes sont dsigns
sous le terme deffet tunnel ;
les coefficients g et d sont enfin des nombres complexes. La reflexion ou la transmission de
la particule saccompagne donc dun dphasage. Cette notion, propre la fonction donde,
chappe compltement la mcanique classique, pour qui seules importent les informations
de position et de vitesse.
Conservation de lnergie
Analysons les ondes transmises et rflchies. Toutes deux sont des ondes de De Broglie qui se
dplacent dans une zone o le potentiel V (x) est nul, et qui ont, au signe prs, le mme vecteur
donde k que la particule incidente. Elles dcrivent donc toutes deux une particule qui se dplace
1
~2 k 2
2
la vitesse v = ~k
m , et avec une nergie cintique Ec = 2 mv = 2m . Nous retrouvons le rsultat
classique qui dit que la vitesse et lnergie cintique de la particule se conservent au cours du
rebond ou du franchissement de la barrire.
Probabilits de rebond et de franchissement
Considrons enfin les courants de probabilit associs aux ondes incidente, rflchie, et transmise. Ces ondes de De Broglie ne sont pas normalisables, mais nous pouvons crire, en valeurs
absolues, et une constante multiplicative C prs (la mme pour les 3 ondes) :
Ji = C

~k
,
m

Jr = C|g |2

~k
,
m

Jt = C|d |2

~k
.
m

On peut alors constater que, quelque soit la valeur de lnergie E, Jr + Jt = Ji . Le courant


de probabilit, et donc dune certaine manire la particule, se conservent au franchissement de
la barrire. La particule incidente se retrouve en entier dans les ondes rflchies et transmises,

144

9 La particule quantique en interaction avec un potentiel

et surtout, ne part pas ailleurs. Ce rsultat souligne nouveau la cohrence physique des tats
stationnaires qui viennent dtre construits.
On peut dfinir, partir des flux Ji , Jr et Jt des coefficients de rflexion et de transmission
selon :
Jt
Jr
, T = ,
R=
Ji
Ji
avec R + T = 1. Une interprtation de ces coefficients est la suivante : si lon effectue une mesure
de la position de la particule juste aprs quelle a fini dinteragir avec la barrire, la particule
aura une probabilit R dapparatre gauche, et une probabilit T dapparatre droite (voir
figure 9.5). Les coefficients R et T prennent ainsi valeur de probabilit de rebond et de probabilit
de franchissement de la barrire. 6

Fig. 9.5. La diffraction dun paquet donde arrivant sur la barrire. Instant t1 : avant limpact. Instant t2 :
aprs limpact. Dans le traitement mathmatique de cette section, ces paquets donde sont approxims
par des ondes de De Broglie.

La manire dont R et T voluent en fonction des conditions du problme est galement remarquable. Considrons par exemple T . On dduit des relations qui prcdent que :

!!1
p
2

2m(V

E)
V

0
2
0
1+
sinh
a
si E < V0 ,

E(V0 E)
~
2
!!1
T = |d | =
(9.12)
p

2m(E V0 )
V02

sin
a
si E > V0 .
1+
E(E V0 )
~
Effet Tunnel
Ce cas concerne les nergies infrieures V0 . Fixons quelques ordres de grandeur. Pour un
lectron de masse m = 9.1 1031 kg, devant traverser une barrire dpaisseur a = 1 , de
hauteur V0 = 1 eV, avec une nergie incidente E = 0.5 eV, on trouve T 0.62, soit 62% de
chances de traverser la barrire ! Loin dtre anecdotique, leffet tunnel est donc un phnomne
prpondrant lchelle atomique.
Ds que la masse et les nergies mises en jeu sont ne serait-ce que lgrement suprieures, le
terme en sinus hyperbolique devient rapidement trs grand, et on peut faire lapproximation
6. Le cas de la barrire de potentiel prsente cependant un certain niveau de subtilit. En toute rigueur,
il faudrait, pour bien dfinir ces coefficients de transmission et de reflexion, intgrer la probabilit de
prsence associe chaque composante de ltat quantique, respectivement gauche ou a droite de la
barrire selon la composante, et comparer les valeurs des intgrales obtenues. Du fait que ltat manipul
ici nest pas normalisable, nous avons utilis une approche alternative qui consiste comparer les flux de
probabilit.

9.4 Une situation purement quantique : la barrire de potentiel

16E(V0 E)
T
exp 2
V02

145

!
p
2m(V0 E)
a .
~

La probabilit de traverser la barrire dcrot alors exponentiellement avec lpaisseur de celle-ci.


Lorsquon travaille avec des lectrons, leffet tunnel est extrmement sensible des fluctuations
de lpaisseur a de lordre de la fraction dAngstrm. La technique de microscopie par effet tunnel
met cela profit pour sonder le relief de surface de matriaux avec une rsolution sub-atomique.
Cependant, ds que la particule est trop massive, la probabilit de traverser la barrire devient
vite ngligeable. Dans lexemple ci-dessus, on trouve ainsi T 1019 pour un simple proton de
1.6 1027 kg, et cette quantit na plus grande signification notre chelle (voir figure 9.6).

Fig. 9.6. Probabilit T de traverser une barrire de 1 de large en fonction du rapport E/V0 . A gauche :
cas dun lectron sur une barrire de 1eV. T garde des valeurs trs significatives pour E < V0 . Cest leffet
tunnel. A droite : cas dun proton sur une barrire de 0.1eV. T prsente dimportantes oscillations pour
E > V0 . Cest la transmission rsonante.

Transmission rsonante
Pour les nergies E suprieures V0 , la probabilit de traverser la barrire T oscille entre une
situation de transfert partiel de la particule, et des situations de transfert total o T = 1. Ces
maxima de taux de transmission sont atteints quand k 0 a est un multiple de , cest dire, quand
a est gal un nombre entier de fois la demi longueur donde k0 qui dcrit la particule lintrieur
de la barrire. Ces oscillations sont ainsi le rsultat dinterfrences quantiques de la particule avec
elle-mme au niveau de lobstacle. Cette proprit peut servir en pratique concevoir, dans les
machines lectroniques, des filtres qui ne se laissent franchir que par des lectrons possdant une
nergie donne.
9.4.4 Et la limite classique ?
La limite classique est obtenue dans les situations o la taille du paquet donde devient trs
petite devant lchelle caractristique de variation du potentiel V (x). Une astuce efficace pour
trouver cette limite sans construire explicitement ces paquets donde est de faire tendre dans
les formules de la mcanique quantique la masse m de la particule tudie vers linfini, tout en
maintenant lnergie constante. On observe en effet que les particules massives sont en gnral
suffisamment bien dcrites par la mcanique classique.
Faisons donc tendre m vers linfini dans les rsultats (9.12). Pour E < V0 , nous avons vu que
leffet tunnel devient insignifiant, et nous retrouvons le fait classique de la particule rebondit entirement en arrire. Pour E > V0 , en revanche, augmenter la masse m nempche pas les oscillations

146

9 La particule quantique en interaction avec un potentiel

de T de se produire. Elles deviennent plus rapides, mais leur amplitude reste invariablement borne

1
V02
infrieurement par 1 + 4E(EV
et suprieurement par 1. On ne parvient donc pas tendre
0)
vers la limite classique dune transmission totale.
Cette bizarrerie provient des discontinuits du champ de potentiel. La distance caractristique
sur laquelle ce potentiel volue est en effet la distance nulle ! Ainsi, aussi localis quil soit, un
paquet donde prsentera toujours une largeur suprieure lchelle dvolution de V . En toute
rigueur, le rsultat concernant la limite classique de lquation de Schrdinger ne sapplique donc
pas. Cela ne signifie pas quil est impossible de retrouver le comportement classique : nous y
parvenons dans le cas de leffet tunnel. En revanche, cela nest plus une obligation, comme nous
le constatons pour la transmission rsonante.
Pour forcer le comportement classique rapparatre, il faudrait adoucir la forme de la barrire,
en remplaant, par exemple, les discontinuits en x = 0 et x = a par des rampes. Mme abruptes,
ces rampes possderaient alors une largeur finie. On verrait dans ce cas que les fonctions donde plus
localises que cette largeur retrouvent un comportement classique avec rflexion ou transmission
totale.

9.5 Implmentation numrique


On prsente dans cette section des schmas numriques dintgration de (9.1). Pour simplifier,
nous nous restreindrons au cas dune particule dans un potentiel extrieur indpendant du temps
dans un espace une dimension.
On adimensionnalise le problme en effectuant un changement de variables tel que ~ = 2m = 1
(dans lesprit des units atomiques, voir A.2). Dans ce cas, lvolution de la fonction donde est
rgie par
it = x2 + V (x).
(9.13)
On considre par ailleurs que la solution reste dans un domaine 7 [0, R]. On impose ainsi les
conditions de bord (0, t) = (1, t) = 0. Dautres types de conditions de bord sont possibles, en
particulier des conditions de bord priodiques.
9.5.1 Schma de Cranck-Nicholson.
Ce schma repose sur une approximation de type diffrences finies. Pour un maillage uniforme
(x0 , x1 , . . . , xN +1 ) de [0, R] (ainsi, xi = ix avec (N +1)x = R), on considre une approximation
du Laplacien par la diffrence finie centre
x2 (x, t) =

(x x, t) 2(x, t) + (x + x, t)
+ O(x).
x2

Introduisant le vecteur des approximations de aux points xi , ainsi que les matrices L du
Laplacien discret et Vx du potentiel, soit

2 1

0
1 2 1

V (x0 )
1

.. .. ..
..
= . , Lx =

, Vx =
,
. . .
.
.

x2
.

1 2 1
V (xN )
N +1
1 2
on a une approximation Hx = Lx + Vx du Hamiltonien sur la grille {xi }. Ainsi, lquation
de Schrdinger scrit, dans sa version discrtise en espace,
7. On peut en effet, par un changement de variables bijectif R [0, 1], se ramener ce cas. On peut
galement considrer un domaine suffisamment grand, un paquet dondes suffisamment localis et un temps
dvolution suffisamment court.

9.5 Implmentation numrique

147

it = Hx .
On en dduit que

(t) = eitHx (0).

Cette formule dintgration exacte en temps peut tre utilise dans des cas simples o le calcul de
lexponentielle de matrice (qui demande une diagonalisation pralable de Hx ) peut tre effectu.
On obtient dans ce cas le schma numrique
n+1 = eitHx n .

(9.14)

Pour calculer en pratique cet oprateur, on peut diagonaliser Hx selon Hx = P T DP . Dans


ce cas, eitHx = P T eitD P . Comme la diagonalisation dune matrice demande de lordre
de O(N 3 ) oprations (o N est le nombre de points de grille), cette opration est rapidement
prohibitive. Dans ce cas, il faut approximer eitHx par une formule moins coteuse 8 . On peut
proposer par exemple
eitHx =



1
it
it
1 Hx
1 + Hx
+ O(t2 ),
2
2

ce qui conduit au schma numrique


n+1 = A(t, x) n ,

A(t, x) =



1
it
it
1
Hx
1+
Hx
.
2
2

(9.15)

En pratique, litration (9.15) est rcrite sous la forme dun systme tridiagonal, dont linversion
ne demande que O(N ) itrations :

1n+1
= 0




2ix

n+1
n+1
n+1
2

2 + 3
= R2n ,
1 2 + V (x2 )x +

..
(9.16)
.




2ix
n+1
n+1
n+1
n

N
+ N

2 + V (x2 )x2 +

+1 = RN ,
N 1
t

n+1
N
= 0,
+1
avec



2ix2
n
n
Rkn = k1
2 + V (x2 )x2
kn + k+1
,
t

1 k N.

Des gnralisations au cas des dimensions suprieures existent (on a une forme tridiagonale gnralise).
Ce schma a de bonnes proprits numriques. On vrifie en particulier que la probabilit
numrique
N
X
|kn |2 x
pn =
k=1

est conserve exactement. Ceci provient du fait que les valeurs propres de A(t, x) sont de
module 1. La vrification de cette dernire proprit est immdiate au vu de la dfinition donne
par (9.15).

8. Il faut galement recourir dautres mthodes si le potentiel dpend du temps ! Le schma de CranckNicholson est prcisment utilisable dans ce cadre.

148

9 La particule quantique en interaction avec un potentiel

9.5.2 Dcomposition doprateurs.


Comme on la vu pour certains intgrateurs utiliss en dynamique molculaire, il est possible
de dcomposer un oprateur en oprateurs lmentaires dont lvolution est facile calculer, afin
dobtenir une approximation de lvolution globale en composant lesdits oprateurs lmentaires.
Cette technique est ainsi une alternative une itration en temps la Cranck-Nicholson dans le
cas o le calcul de lexponentielle de matrice pour le schma (9.14) nest pas faisable.
Plus prcisment, on dcompose loprateur Hamiltonien en ses parties cintique et potentielle,
cin
et on considre les flots lmentaires pot
t , t correspondant respectivement aux quations
it = V ,

it = .

La premire quation peut sintgrer analytiquement selon


itV (x)
pot
(x).
t ()(x) = e

La seconde peut galement tre intgre analytiquement en variables de Fourier. Considrant la

transforme de Fourier (k)


= F()(k) de , la seconde quation peut tre rcrite

it (k)
= |k|2 (k).
On a alors

1 it|k|2
cin
(e
).
t ()(x) = F

Au final, un schma numrique fond sur cette dcomposition et les approximations correspondantes des oprateurs lmentaires est donn par
pot
cin
n
n+1 = pot
t/2 t t/2 ( ),

(9.17)

o (tn ) est approxim par n comme pour le schma de Cranck-Nicholson, et les applications pot
t ,
cin
t sont approximes en considrant une grille uniforme (x0 , . . . , xN +1 ) de lespace rel [0, R]. Dans
ce cas,
itV (x0 )
pot
, . . . , eitV (xN +1 ) ) .
t = Diag(e
Pour la partie cintique, on utilise une transforme de Fourier discrte.

9.5 Implmentation numrique

149

Exercices
Exercice 9.1 (Particule uniformement acclre).
On considre une particule quantique de masse m dcrite t = 0 par londe de De Broglie
(r, t = 0) = eik0 r .
On la soumet, partir de t = 0 laction dune force F.
(1) Ecrire lquation de Schrdinger pour la fonction donde (r, t) pour les temps positifs.
(2) Rsoudre cette quation. Indication : on montrera quil existe une solution de la forme gnrale
(r, t) = ei(k(t)r(t)) .
et on se limitera expliciter le vecteur k(t).
(3) Exprimer en fonction de k(t) limpulsion p(t) de la particule. Montrer que p(t) ainsi calcule
obit la relation fondamentale de la dynamique.
Exercice 9.2 (Marche de potentiel).
On considre, dans un contexte unidimensionnel, le paysage de potentiel suivant, dit marche
de potentiel :
(
0
si x < 0,
V (x) =
V0 0
si x 0.
On souhaite tudier ce quil advient dune particule quantique de masse m arrivant sur la marche
par la gauche.
(1) Reprsenter graphiquement ce champ de potentiel.
(2) Donner, sans se proccuper pour linstant des conditions de raccordement de la fonction donde
en x = 0, la forme gnrale de la partie spatiale (x) dun tat stationnaire dnergie E. On
distinguera les cas E > V0 et E < V0 .
On pourra poser :
p
p

2m(E V0 )
2m(V0 E)
2mE
0
k=
,
k =
si E > V0 ,
K=
si E < V0 .
~
~
~
(3) Quelle est, parmi ces tats, la forme des tats physiquement acceptables dcrivant une particule
arrivant par la gauche ?
(4) En utilisant les conditions de raccordement, prciser la forme des tats stationnaires pour
E < V0 . Montrer que la particule est entirement rflchie par la barrire. Montrer galement
quelle pntre lgrement dans la zone x > 0, sur une distance typique ltunnel :
ltunnel = p

~
2m(V0 E)

(5) Application numrique : on considre un lectron arrivant avec une nergie de 1 eV sur une
marche de 2 eV de haut. Calculer ltunnel . Mme question pour un cycliste de 70 kg arrivant
une vitesse de 10 m/s sur une rampe trs raide de 2 m de haut.

10
La particule quantique confine

Jusquici, nous avons considr des particules libres de se dplacer dans tout lespace. Lexemple
des ondes de De Broglie a montr quelles pouvaient adopter nimporte quelle impulsion, nimporte
quelle nergie cintique et nimporte quelle position. Cette libert est cependant loin dtre la
rgle en mcanique quantique. Nous regardons ici la situation dans laquelle un champ de potentiel
indpendant du temps pige la particule dans une rgion de taille limite. Lnergie, et bien dautres
grandeurs, ne peuvent alors prendre que certaines valeurs bien prcises : cest la quantification.
Ceci relve mathmatiquement de proprits spectrales particulires des Hamiltoniens quantiques, qui sont tudies au 10.2 au travers dexemples fondamentaux : puits infini, oscillateur
harmonique quantique, potentiel coulombien (atome de type hydrognode). Au-del des proprits abstraites donnes par la thorie spectrale, des tudes plus fines peuvent tre menes sur des
cas particuliers. Un tel exemple est le cas du trou de potentiel, trait analytiquement au 10.3.
Enfin, une discussion des implications physiques profondes du phnomne de quantification clt
ce chapitre ( 10.4).

10.1 Cas des potentiels confinants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152


10.1.1 Puits infini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
10.1.2 Oscillateur harmonique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
10.2 Thorie spectrale des Hamiltoniens quantiques - exemple du
potentiel coulombien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
10.2.1 Caractre auto-adjoint . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
10.2.2 Spectre essentiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
10.2.3 Spectre ponctuel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
10.3 Un exemple quasi-analytique : le trou de potentiel . . . . . . . . . . . . . . . 159
10.3.1 Dfinition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
10.3.2 Etats dnergie lis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
10.3.3 Etats dnergie de diffusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
10.4 Universalit et implications du phnomne de quantification . . . . . 164
10.4.1 La quantification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
10.4.2 Caractre gnral du phnomne de pigeage . . . . . . . . . . . . . . . . . . . . . . 164
10.4.3 Quantification et dynamique de la particule . . . . . . . . . . . . . . . . . . . . . . . 164
10.4.4 Proprits spectrales des atomes, des molcules, et des corps denses . . 165
10.4.5 La quantification comme lment stabilisateur de la matire . . . . . . . . . 167
10.4.6 Et la limite classique ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
10.4.7 Et ce nest pas tout. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

152

10 La particule quantique confine

10.1 Cas des potentiels confinants


Le puits de potentiel et le potentiel harmonique constituent deux cas trs particuliers de champs
de potentiels. Dans les deux cas, en effet, V est gal ou tend vers + lorsque |r| tend vers +.
La particule, quelque soit sont nergie, se retrouve donc toujours confine dans une petite rgion
despace. Cest ce confinement systmatique qui est lorigine du caractre purement discret du
Dun point de vue mathmatique, cela signifie en particulier que le spectre de
spectre de H.
loprateur Hamiltonien est purement discret, et dun point de vue physique, les systmes sont
compltement quantifis.
10.1.1 Puits infini
Le puits infini correspond au cas dun confinement strict dans un domaine ouvert born ;
dans ce cas, le potentiel V est de la forme

0
si x ,
V (x) =
+ si x 6 .
Nous recherchons les parties spatiales (r) des tats stationnaires, et leurs nergies E associes.
Comme on ne considre que des fonctions donde dnergie finie, on se restreint des fonctions
support dans , par exemple L2 (). On peut montrer en fait (voir 9.1.3) que
Z
1
H0 (),
|(t, x)|2 dx = 1.

Chercher les tats stationnaires de lquation de Schrdinger (9.1) revient donc chercher les
~2
H10 () tels que 2m
= E.
Caractre discret du spectre
Or, par le thorme de Lax-Milgram, pour f L2 (), lquation u = f admet une et une
seule solution, et lapplication f 7 u est linaire borne de L2 () dans H10 (). Alors, loprateur
T = 1 : L2 () H10 () , L2 ()
f 7 u 7 u
est linaire born auto-adjoint compact (car linjection H10 () , L2 () est compacte 1 ). Par
ailleurs, cet oprateur est positif car
D
E
Tf, f = hu, ui = kukL2 () 0.
Ceci montre, en utilisant le thorme C.2, quil existe une suite (n )n1 de rels strictement positifs
convergeant vers 0, et une base hilbertienne (n ) de L2 () tels que
n 1,

Tn = n n .

Finalement, il existe une suite (En )n1 de rels strictement positifs


En =

~2
,
2mn

convergeant vers +, et une base hilbertienne (n )n1 de L2 () tels que


n 1,

n H10 (),

~2
n = En n .
2m

De manire gnrale, on ne peut pas plus prciser les suites (En )n1 et (n )n1 . Pour certaines
gomtries du domaine , on a toutefois des expressions analytiques.
1. Rappelons quun oprateur T : E F (E, F Banach) est compact si, de toute suite borne (un )
donne, on peut extraite une sous-suite (
uk ) = (T unk ) qui converge fortement.

10.1 Cas des potentiels confinants

153

Le puits infini en dimension un despace

Fig. 10.1. Le puits de potentiel infini en dimension 1. A gauche : Reprsentation du champ de potentiel.
Les parties grises correspondent V = +. A droite : Les trois premiers niveaux dnergie.

En dimension un despace, pour le domaine =]0, a[, les fonctions n sont


r
 n 
2
n (x) =
sin
x ,
a
a
les valeurs propres associes tant

~ 2 2 n2
.
2ma2
Les valeurs admissibles de lnergie sont donc chercher dans un ensemble limit : on dit quelles
sont quantifies. On gnralise aisment au cas dun domaine rectangulaire en dimension suprieure. Dans tous les cas, on remarque que seul ltat de plus basse nergie a une fonction donde
qui ne sannule pas dans lintrieur du domaine. Il est dit tat fondamental (voir figure 10.1).
En =

10.1.2 Oscillateur harmonique


Le Hamiltonien dun oscillateur harmonique est de la forme
2
= ~ + 1 m 2 |r|2 ,
H
2m
2

avec > 0. En mcanique classique, cela correspond au cas dune particule de masse m qui serait
relie au point origine par un ressort de raideur k. Danc ce cas, correspond la pulsation des
oscillations queffectue la particule aprs avoir t
q loigne de sa position dquilibre. Le potentiel
classique est dans ce cas V (r) = k|r|2 /2 et =

k
m

(voir figure 10.2).

Caractre quantifi du spectre dnergie


est
Le domaine de loprateur H

= u H2 (R3 )
D(H)


R3

|r|4 |u(r)|2 dr < +

154

10 La particule quantique confine

Fig. 10.2. Le potentiel harmonique en dimension 1.

soit
=
D(H)


u L2 (R3 )

R3

Z
|r|4 |u(r)|2 dr +

R3

|k|4 |
u(k)|2 dk < +

est auto-adjoint.
On vrifie facilement que H
Pour vrifier que le spectre de loscillateur harmonique est purement ponctuel, on peut mener
une tude similaire au cas puits infini (voir Exercice 10.7). On peut galement recourir un rsultat
gnral de thorie spectrale (voir [29, Thorme XIII.67]) qui montre que les Hamiltoniens de la
forme + V avec V L1loc (R3 ) born infrieurement et tel que V (r) + lorsque |r| +,
a un spectre purement ponctuel et on peut galement
ont une rsolvante compacte. Ainsi, H
montrer quil est injectif.
Etats dnergie de loscillateur harmonique 1D
Les tats dnergie de loscillateur harmonique peuvent tre calculs de manire analytique.
Pour un espace de dimension d = 1, ce sont les fonctions de Hermite
n 0,

1/4  m  14 n2 m x2 dn  m x2 
n (x) =
e 2~
e ~
,
~
dxn
2n n!

les niveaux dnergie correspondants (figure 10.3) tant




1
n 0,
En = ~ n +
.
2

Fig. 10.3. Les 4 premiers niveaux dnergie de loscillateur harmonique en dimension 1.

10.2 Thorie spectrale des Hamiltoniens quantiques - exemple du potentiel coulombien

155

10.2 Thorie spectrale des Hamiltoniens quantiques - exemple du


potentiel coulombien
Cette section a pour objectif dtudier des cas plus gnraux de champ de potentiel, et notament ceux o la particule a encore la possibilit, en fonction de son nergie, dexplorer librement
tout lespace, et pas uniquement par le truchement de leffet tunnel. Nous montrons qualors, le
Hamiltonien possde en gnral un spectre qui se scinde en deux parties :
une partie ponctuelle : des valeurs propres qui, en somme, correspondent de vrais tats
physiques (normalisables) ;
une partie continue : des valeurs propres qui correspondent des tats non normalisables,
pouvant nanmoins sexprimer comme des limites de suites de Weyl dtats normalisables.
La proprit fondamentale sous-jacente dont nous avons besoin pour ltude des spectres des
oprateurs est le caractre autoadjoints des Hamiltoniens quantiques. Cest cette proprit que
nous nous intressons en premier lieu. On applique ensuite divers rsultats de lAppendice C pour
caractriser le spectre des diffrents systmes considrs ici.

Fig. 10.4. Le potentiel coulombien. Trs creus au voisinage de lorigine, il tend vers 0 linfini. Une
particule dnergie positive peut a priori explorer librement tout lespace.

Tout au long de cette partie, les rsultats essentiels sont illustrs par le cas du potentiel Coulombien que ressent un lectron au voisinage dun noyau atomique de nombre de charge Z (voir
figure 10.4) :
e2 Z
V (r) =
.
40 |r|
10.2.1 Caractre auto-adjoint
Pour montrer quun Hamiltonien quantique avec potentiel est auto-adjoint, on peut soit faire
une preuve directe au cas par cas, soit utiliser un thorme gnral qui garantit la conservation du
= ~2 + V moyennant certaines
caractre auto-adjoint pour des Hamiltoniens de la forme H
2m
conditions sur V (V perturbation pas trop importante du Laplacien).
0 et W
deux oprateurs non-borns sur un espace de Hilbert H. On dit
Dfinition 10.1. Soient H

) et sil existe des constantes a et b > 0 telles que


que W est H0 -born si D(H0 ) D(W
0 ),
u D(H

uk akH
0 uk + bkuk.
kW

par rapport
Linfimum des a > 0 tels que cette ingalit soit vraie est appele la borne relative de W

H0 .

156

10 La particule quantique confine

0 -born avec une borne relative de


Remarque 10.1. Un oprateur born de H dans lui-mme est H

0 pour tout oprateur H0 .


0 , on montre alors que tous les oprateurs H
0 + W
Connaissant un oprateur auto-adjoint H
H
0 -borns de borne suffisamment petite sont auto-adjoints. On a en effet le
avec W
0 un oprateur auto-adjoint, et W
un oprateur symThorme 10.1 (Kato-Rellich). Soit H
0 -born, de borne relative strictement infrieure 1. Alors H
= H
0 + W
dfini sur le
trique H
= D(H
0 ) est auto-adjoint.
domaine D(H)
Exemple 10.1 (Potentiel coulombien). Montrons que pour le potentiel
V (r) =

e2 Z
,
40 |r|

le Hamiltonien quantique

2
= ~ +V
H
2m
= H2 (R3 ) est auto-adjoint. Loprateur H
0 est ici le Hamiltonien priv de son
domaine D(H)
terme potentiel :
2
0 = ~ .
H
2m

Remarquons tout dabord que loprateur V associ la multiplication par V (r) est symtrique
est donc
de domaine D(V ) H1 (R3 ) par lingalit de Hardy (voir lexercice 10.1). Loprateur H
2
3

symtrique de domaine D(H) = D(H0 ) = H (R ).


Soit alors u H2 (R3 ). Linjection de Sobolev H2 (R3 ) , L (R3 ) (voir par exemple [4]) donne
lexistence dune constante C > 0 telle que

u H2 (R3 ),

kukL (R3 ) C kukH2 (R3 ) ,

o on utilise la norme sur H2 (R3 ) dfinie par (voir Exercice 10.2)


kukH2 (R3 ) = (kuk2L2 (R3 ) + kuk2L2 (R3 ) )1/2 .
On a alors (utilisant pour la fin de cette preuve les units atomiques, voir Appendice A.2)

u
kV ukL2 (R3 ) = Z
|r| L2 (R3 )
!1/2
Z
Z
|u(r)|2
|u(r)|2
dr +
dr
=Z
|r|2
|r|2
R3 \Br
Br

1/2
1
Z 4rkuk2L (R3 ) + 2 kuk2L2 (R3 )
r

1/2
1
2
2
Z 4CrkukH2 (R3 ) + 2 kukL2 (R3 )
r



1/2
1
Z 16CrkH0 uk2L2 (R3 ) + 4Cr + 2 kuk2L2 (R3 )
r
1/2

1
kukL2 (R3 )
kH0 ukL2 (R3 ) + Z 4Cr + 2
r
avec le choix r = 2 /(16CZ 2 ). Ceci montre que V est H0 -born de borne relative gale 0, et H
est auto-adjoint par le thorme de Kato-Rellich (Thorme 10.1).
On aurait galement pu utiliser lingalit de Hardy pour voir que
Z
Z
Z

1
2
2
4
2
kV ukL2 (R3 ) kukL2 (R3 ) =
|| |
u| d
|| |
u| d +
|
u|2 d
2 R3
2 R3
R3
pour tout  > 0.

10.2 Thorie spectrale des Hamiltoniens quantiques - exemple du potentiel coulombien

157

Remarque 10.2. On peut en fait gnraliser directement la preuve prcdente au cas dun potentiel V L2 (R3 ) + L (R3 ) (voir Exercice 10.3).
10.2.2 Spectre essentiel
On a vu que le caractre auto-adjoint dun Hamiltonien quantique peut se dduire du caractre
0 , moyennant certaines conditions sur le potentiel
auto-adjoint du Hamiltonien quantique libre H
V . Sous des conditions plus fortes, on peut galement obtenir des renseignements sur le spectre
=H
0 + V .
essentiel de loprateur H
0 un
Thorme 10.2 (Stabilit du spectre essentiel par perturbation compacte). Soit H
0 ) et V un oprateur symtrique. On suppose que V est
oprateur auto-adjoint de domaine D(H
0 -compacte (i.e. V est un oprateur compact de D(H
0 ) muni de la norme du
une perturbation H
0 uk2 + kuk2 dans H). Alors loprateur H
=H
0 + V dfini sur D(H)
= D(H
0)
graphe |u|2 = kH
= ess (H
0 ).
est auto-adjoint et vrifie ess (H)
On peut appliquer ce rsultat par exemple lorsque le potentiel V (r) est tel que pour tout  > 0,
on puisse crire V (r) = V2 (r) + V (r) avec V2 L2 (R3 ), V L (R3 ), et kV kL (R3 ) . Un
exemple de tel potentiel est le potentiel coulombien.
On vrifie en premier lieu que V dfinit un oprateur multiplicatif symtrique, auto-adjoint
0 -compact. On montre en premier
selon les rsultats du 10.2.1. Montrons ensuite que V est H
2
3

lieu que D(H0 ) D(V ). En effet, soit u D(H0 ) = H (R ). Alors u L2 (R3 ) L (R3 ) par les
injections de Sobolev, et
kV ukL2 (R3 ) kV2 kL2 (R3 ) kukL (R3 ) + kV kL (R3 ) kukL2 (R3 ) < +.
On montre ensuite que si (un ) est une suite borne dans H2 (R3 ) (par une constante M ), alors on
peut extraire de (V un ) une sous-suite convergente au sens de L2 (R3 ). En effet, comme (un ) est
une suite borne dans H2 (R3 ), on peut extraire une sous-suite (unk )k0 telle que
unk * u H2 (R3 ) faible,

unk u presque partout.

Soit  > 0. Une dcomposition V = V2 + V avec kV kL (R3 ) /4M donne :


kV unk V u kL2 (R3 ) kV2 (unk u )kL2 (R3 ) + kV kL (R3 ) kunk u kL2 (R3 )

kV2 (unk u )kL2 (R3 ) + .
2
Il suffit donc de montrer que kV2 (unk u )kL2 (R3 ) 0 lorsque k +. Pour ce faire, on applique
un thorme de Lebesgue en remarquant que |V2 |2 |unk u |2 0 presque partout, et que cette
fonction est domine par la fonction intgrable |V2 (r)|2 sup kunk kL (R3 ) C|V2 (r)|2 M .

10.2.3 Spectre ponctuel


Une manire de prciser le spectre ponctuel est de recourir au thorme suivant :
un oprateur auto-adjoint, que lon suppose
Thorme 10.3 (Principe du Min-Max). Soit H
2
born infrieurement, i.e. il existe c R tel que H c 0. On dfinit, pour n 1,
D
E
= inf
,
n (H)
sup
H,
EEn E, kk=1

de dimension n. Alors, pour tout n 1,


o En dsigne lensemble des sous-espaces de D(H)
soit il y a n valeurs propres (comptes avec leur multiplicit) en dessous du spectre essentiel
et n (H)
est la n-ime valeur propre de H
;
de H,

soit n (H) est le bas du spectre essentiel, auquel cas il y a au plus n 1 valeurs propres

(comptes avec leur multiplicit) en dessous de n (H).


D
E
2. Pour un oprateur T, on utilise la notation T 0 si Tu, u 0 pour tout u D(T).

158

10 La particule quantique confine

Application au potentiel coulombien


Nous avons montr que le Hamiltonien correspondant au potentiel coulombien a pour spectre
= [0, +[ (voir 10.2.2). On va prsent caractriser le spectre ponctuel. Plus
essentiel ess (H)
prcisment, nous allons montrer quil existe une infinit de valeurs propres ngatives, bornes
infrieurement. On a dj montr au 11.5.3 que le Hamiltonien correspondant au potentiel
coulombien est born infrieurement. Par consquent, ces valeurs propres ont comme point daccumulation 0 (si elles avaient un point daccumulation strictement ngatif, ce point appartiendrait
= R+ ).
au spectre essentiel, ce qui ne se peut puisque nous avons montr que ess (H)
D
E
k , k < 0.
Il suffit de trouver une suite de fonctions (k )kN orthonormales telles que H
< 0 < inf ess (H)
pour tout k. Une telle suite de fonctions
En effet, on aura dans ce cas k (H)
3
peut tre construite en prenant une fonction rgulire C
0 (R ), support dans la couronne
{1 < |r| < 2}, et en posant
r
1
.
k (r) = 3/2
k
k
pour k K = {2n , n N }. On vrifie facilement que
(k, l) K2 ,
On calcule ensuite
D
E
k , k =
H

~2
2mk 2

hk , l i = kl .

Z
R3

|(r)|2 dr

e2 Z
40 k

Z
R3

|(r)|2
dr < 0
|r|

si k k0 est assez grand. La suite (k0 +k )k0 convient.


La figure 10.5 rsume la structure du spectre de latome hydrognode. La forme prcise des
fonctions propres sera donne au chapitre 12. On peut toutefois dores et dj prciser une borne
suprieure pour lnergie de ltat fondamental. On considre pour ce faire une famille de fonctions
tests ( )>0 , donne par
r
3 |r|
(r) =
e
,
k kL2 (R3 ) = 1,

et lHamiltonien de latome dhydrogne (Z = 1)


2
2
= ~ e
H
.
2m
40 |r|

Alors, passant en coordonnes sphriques, on montre que


Z
D
E
2 Z
e2
| (r)|2
~2 2
e2
= ~
, H
| |2 dr
dr =

.
2m R3
40 R3
|r|
2m
40
Lexpression du membre de droite atteint son minimum en = me2 /(40 ~2 ), et ce minimum vaut
me4 /2~2 (40 )2 . On en dduit, par le principe du min-max (Thorme 10.3), que la premire
valeur propre E0 vrifie
 2 2
e
m
.
E0 2
2~
40
Lapplication numrique donne E0 13.6 eV. Cette valeur est en fait lnergie trouve exprimentalement pour ltat fondamental de llectron : 13.6 eV (il se trouve en effet que ltat
fondamental est de la forme des fonctions tests utilises ici, voir 12.5). On verra galement au
11.5.4 une borne infrieure de cette premire valeur propre.

10.3 Un exemple quasi-analytique : le trou de potentiel

159

Fig. 10.5. Allure gnral du spectre dnergie dans le potentiel coulombien. Les nergies ngatives sont
quantifies, et correspondent au spectre ponctuel. Les nergies positives forment un continuum correspondant au spectre essentiel.

10.3 Un exemple quasi-analytique : le trou de potentiel


La thorie spectrale offre des rsultats gnraux permettant de prciser sans effort lallure
du spectre dnergie des systmes quantiques. Elle ne donne en revanche aucune information
quantitative sur ceux-ci, ni sur la forme spatiale des tats propres associs. Nous tudions ici un
systme pour lequel une analyse quantitative est possible. Nous constaterons que cette analyse
demande, par rapport lapplication des thormes spectraux, un peu plus de travail !
Le trou de potentiel est un modle unidimensionnel dans lequel le potentiel est nul partout,
sauf sur un petit intervalle o il est ngatif. Il rend compte de manire grossire de la situation
courante dans laquelle une particule quantique peut se faire piger par un centre attracteur,
mais peut galement par un apport suffisant dnergie, retrouver la libert de se dplacer partout
dans lespace. Il est adapt la description qualitative de la plupart des situations de pigeage
rencontres dans la nature.
10.3.1 Dfinition
Nous nous restreignons la dimension 1 despace. Le trou de potentiel est dfini par (figure 10.6) :

si x < a,
0
V (x) = V0 0 si a x a,

0
si x > a.
Nous recherchons les tats stationnaires dune particule de masse m place dans ce potentiel. La
partie spatiale (x) de la fonction donde et son nergie E doivent vrifier lquation de Schrdinger
indpendante du temps :
~2 d2

(x) + V (x)(x) = E(x).


2m dx2
Le rsultat de minimisation de lnergie par le potentiel (Proposition 9.4) impose ici E V0 . On
distingue deux situations, selon que E 0 ou V0 E 0.
On vrifie facilement que le trou de potentiel est une perturbation compacte du Hamiltonien
libre. Son spectre essentiel est donc [0, +[. Nous allons le vrifier par la recherche explicite des

160

10 La particule quantique confine

Fig. 10.6. Le trou de potentiel en dimension 1. Il dcrit de manire simpliste le potentiel ressenti par
une particule au voisinage dun centre attracteur plac lorigine.

fonctions donde. Ce calcul permettra galement de caractriser les valeurs de lnergie des tats
dnergie E < 0.
10.3.2 Etats dnergie lis
On considre V0 E < 0. Dans ce cas, les lments du spectre ne peuvent tre que dans le
spectre discret.
Solutions physiquement admissibles de lquation de Schrdinger
Mathmatiquement, la solution gnrale par morceaux de lquations de Schrdinger est donne
par :

Kx
Kx

si x < a,
e + e
ikx
ikx
(x) = e + e
si a x a,

Kx
e + eKx si x > a.
avec
p

2m(E + V0 )
2mE
K=
,
k=
.
(10.1)
~
~
Dun point de vue physique, les composantes eKx et eKx ne sont cependant pas acceptables,
car elles conduisent une fonction donde non normalisable, et qui ne peut pas non plus tre une
limite de suite de Weyl. 3 Les fonctions (x) physiquement admissibles sont donc de la forme

Kx

si x < a,
e
ikx
(x) = e + eikx si a x a,

Kx
e
si x > a.
Quantification des nergies
Les conditions de continuit sur (x) et sa drive en x = a conduisent au sytme de quatre
quations quatre inconnues , , , :
ika
e
(ik K) = eika (ik + K),

eika (ik K) = eika (ik + K),

= eKa (eika + eika ),

= eKa (eika + eika ).


Ce systme possde la solution vidente (0, 0, 0, 0). Il existe donc une solution non nulle si et
seulement si ce systme linaire est singulier. Les deux dernires lignes montrent que et sont
dtermins de manire univoque par et . Cest donc la singularit du systme form par les
deux premires lignes qui doit tre examine. Une rapide tude de son dterminant montre que
cette singularit est obtenue dans deux situations :
3. Comparer avec le calcul du 9.4.

10.3 Un exemple quasi-analytique : le trou de potentiel

161

(i) K = k tan(ka) : les solutions du systme global sont alors obtenues avec = 6= 0 ;
(ii) K = k cot(ka) : les solutions du systme global sont alors obtenues avec = 6= 0.
Ces deux conditions sont en fait deux quations de quantification de lnergie : elles fixent des
conditions que E doit respecter pour pouvoir tre associe un tat stationnaire (rappelons en
effet que k et K sont donnes par (10.1)).
Il est commode, au lieu de rsoudre ces quations (par une mthode numrique ici car il ny
a pas de solution analytique), de les discuter graphiquement, en se plaant dans le plan (ka, Ka)
(voir figure 10.7). On considre alors
Ka = ka tan(ka),

Ka = ka cot(ka).

Par ailleurs,
2mE 2 2m(E + V0 ) 2
2mV0 2
a +
a =
a .
2
2
~
~
~2
Quand E dcrit [V0 , 0], le couple (ka, Ka)
dcrit donc, dans le quart de plan des coordon
2mV0
nes positives, un quart de cercle de rayon
a. Les nergies E autorises correspondent aux
~
intersections de cet arc de cercle avec les courbes dfinies par chacune des deux quations de
quantification.
(Ka)2 + (ka)2 =

Fig. 10.7. Rsolution graphique des quations de quantification dans le plan (ka, Ka). Larc de cercle peut
tre vu comme une courbe paramtre par lnergie E quand elle varie dans lintervalle [V0 , 0]. Lextrmit
de larc en haut gauche correspond lnergie E = V0 . Lextrmit en bas droite correspond lnergie
E = 0. Les intersections de cet arc avec les autres courbes fixent les valeurs dnergie quantifies.

Dans lexemple ci-dessus, 6 points dintersection apparaissent, qui signifient lexistence de 6


tats stationnaires dnergies diffrentes, chacun dordre de multiplicit 1. Dans le cas gnral, on
dduit de la reprsentation graphique que le nombre dtats stationnaires est donn par :


2a 2mV0
N =1+E
,
~
o E(x) dsigne la partie entire de x. En particulier, il existe toujours au moins un tat stationnaire
dans le trou.

162

10 La particule quantique confine

Forme des tats dnergie lis


Le dtail prcis des calculs serait sans intrt ici. Contentons nous den donner les grandes
lignes. Quelle que soit la valeur de V0 , on trouve que les tats stationnaires dnergie ngative
peuvent tre dcrits, un dphasage global prs, par des fonctions donde (x) valeurs relles.
Nous en donnons en figure 10.8 lallure dans une situation 4 tats stationnaires.

Fig. 10.8. Etats dnergie dun trou de potentiel possdant 4 tats lis. Tous les tats lis sont reprsents.
Noter la caractre alternativement symtrique et antisymtrique des fonctions donde associes. En haut
du schma, la fonction donde dnergie positive donne lallure typique dun tat de diffusion.

A lintrieur du trou, les tats stationnaires ont une allure similaire celle trouve dans le cas
du puits infini. Pour autant, ces fonctions ne sont pas ici strictement contenues dans le puits. Elles
peuvent stendre gauche et droite, montrant des ailes exponentielles dcroissantes, dautant
plus larges que lnergie de ltat considr est importante. Ainsi, ltat fondamental reste relativement bien confin, alors que ltat 4 stend de manire plus gnreuse lextrieur. Ceci est une
consquence de leffet tunnel, qui autorise la particule quantique faire des excursions modres
l o son nergie est infrieure lnergie potentielle.
Lalternance de fonctions donde symtriques et antisymtriques nest pas un hasard. Cette
curiosit est une consquence directe, bien que technique dmontrer, du fait que le paysage de
potentiel utilis est symtrique autour du point origine de lespace.
Tous les tats obtenus dcrivent une particule qui reste essentiellement localise au voisinage du
trou, avec une probabilit de prsence qui tend rapidement vers 0 linfini. On les appelle tats lis.
En tant qutats propres dun oprateur auto-adjoint, ils forment une famille dtats orthonorms,
et constituent une base sur laquelle peuvent se dcomposer toutes les fonctions donde dcrivant
une particule pige dans le trou. La fonction donde de la particule quantique place dans un des
ces tats, ou dans une combinaison linaire de ces tats, a la proprit de ne pas staler dans le
temps.
10.3.3 Etats dnergie de diffusion
On examine le cas E > 0. La thorie spectrale enseigne que ces valeurs de E correspondent
aux lments du spectre essentiel. La forme gnrale des solutions de lquations de Schrdinger
est :

10.3 Un exemple quasi-analytique : le trou de potentiel

0
ik0 x

+ eik x
e
(x) = eikx + eikx

0
ik0 x
e
+ eik x

163

si x < a,
si a x a,
si x > a.

p
2m(E + V0 )
2mE
,
k=
.
~
~
On trouve de part et dautre du trou de potentiel une superposition dondes de De Broglie. Elles
signifient, par leur caractre compltement dlocalis, que la particule a la possibilit dexplorer
tout lespace, sans restriction. Cela correspond bien lintuition de la physique classique, selon
laquelle une particule peut accder toutes les zones o son nergie E est suprieure lnergie
potentielle. De mme que les ondes de De Broglie, cette forme de solution conduit des fonctions
dondes qui ne sont pas normalisables. Nanmoins, comme les ondes de De Broglie, elle reste
physiquement pertinente en tant que limite de suite de Weyl. Les conditions de raccordement en
x = a scrivent :
ik0 a
0
+ eik a = eika + eika ,
e

0
k 0 (eik a eik0 a ) = k(eika eika ),
0
0

eika + eika = eik a + eik a ,

0
0

k(eika eika ) = k 0 (eik a eik a ).

avec

k0 =

Il sagit dun systme linaire de 4 quations 6 inconnues. Lespace des solutions est donc au
moins de dimension 2. Ainsi, toute nergie E positive possde plusieurs tats stationnaires associs.
A linverse des tats lis, pour qui apparaissait le phnomne de quantification, les tats stationnaires que nous trouvons ici peuvent prendre nimporte quelle valeur dnergie positive. Cela peut
sassocier au fait physique quils ne correspondent plus des tats confins, mais des tats dans
lesquels la particule explore librement tout lespace. Ils sont appels tats de diffusion. Lensemble
des nergies qui leurs sont associes forme un continuum dnergies. Notons les paquets donde
construits partir des tats de diffusion stalent, au contraire des tats lis.
On reprsente schmatiquement en figure 10.9 le diagramme nergtique complet du trou quantique. On retrouve la forme trs caractristique prdite par la thorie spectrale : on a un continuum
dtats de diffusion, associs au spectre essentiel, et qui occupe tout le domaine o la particule a
une nergie suffisante pour se dplacer librement partout dans lespace. En dessous, se trouvent
quelques tats lis, associs au spectre ponctuel, dont lnergie est donc quantifie, et qui dcrivent
physiquement une particule pige dans un minimum du potentiel. Quelque soit la taille du trou
(largeur a et profondeur V0 ) il existe toujours au moins un niveau dnergie quantifi.

Fig. 10.9. Structure du spectre nergtique complet du trou de potentiel une dimension. Les nergies
ngatives sont quantifies. Les nergies positives sont toutes accessibles, et forment un continuum dtats
de diffusion. Cette structure est rapprocher de celle du spectre nergtique du potentiel Coulombien.

164

10 La particule quantique confine

Cette forme de diagramme est de porte assez universelle. Elle se retrouve qualitativement
quelque soit la forme de trou considre (voir par exemple le spectre du potentiel Coulombien,
figure 10.5).

10.4 Universalit et implications du phnomne de quantification


10.4.1 La quantification
Les tats stationnaires sont les seuls tats pour lesquels lnergie de la particule est connue
sans ambigut. Nous comprendrons au chapitre prochain que mme lorsque, par exemple, une
particule est dans une superposition poids gaux de deux tat stationnaires 1 et 2 dnergies
2
, mais elle possde simultanment, poids
E1 et E2 , elle nacquiert pas lnergie moyenne E1 +E
2
sont donc les seules autorises.
gaux, les nergies E1 et E2 . Les nergies du spectre de H
Il ressort en particulier que lorsquune portion du spectre du Hamiltonien est ponctuelle, la
particule na accs quaux quelques valeurs du spectre. Les autres valeurs lui sont interdites. Ce
phnomne est nomm quantification de lnergie.
Il a une porte trs gnrale qui dpasse largement la seule grandeur nergie. Nous verrons quil
existe, pour toutes les grandeurs physiques, un ensemble restreint de valeurs autorises. Comme
pour lnergie, ces valeurs sont uniquement dictes par la masse m de la particule et la forme du
potentiel V (r) dans lequel elle volue.
10.4.2 Caractre gnral du phnomne de pigeage
La quantification est une consquence du pigeage dune particule dans un espace restreint.
Dans la nature, les phnomnes de pigeage sont trs courants, car les trous de potentiels sont
lgion :
potentiel Coulombien des noyaux atomiques, qui retient les lectrons dans les atomes et les
molcules ;
lectrons pigs dans un corps solide. Les parois du solide agissent alors comme des frontires
que llectron ne peut franchir sans apport important dnergie ;
en astrophysique, neutrons confins dans une toile neutrons.
Dans toutes ces situations, des phnomnes de quantification apparaissent, plus ou moins marqus.
Souvent, le comportement des particules chappe alors compltement la description donne par
la mcanique classique, donnant toute leur richesse aux proprits des matriaux (lectriques,
thermiques, mcaniques, optiques, . . . )
10.4.3 Quantification et dynamique de la particule
Solution gnrale de lquation de Schrdinger dans le cas discret
est purement ponctuel (cela correspond notament au cas dun HamiltoLorsque le spectre de H
nien diagonalisable, par exemple auto-adjoint dinverse compact, comme cest le cas si le potentiel
est confinant, voir sections 10.1.1 et 10.1.2), on peut rsoudre lquation de Schrdinger par une
dcomposition sur une base orthonormale dtats stationnaires 4 .
auto-adjoint diagonalisable sur L2 (R3 ), et une base hilbertienne dtats
Considrons donc H
stationnaires (n )n0 L2 (R3 ) dnergies (En )n0 relles tels que
n = E n n .
H
Pour un tat initial 0 L2 (R3 ), on a la dcomposition
4. Cette base ntant pas unique si certaines valeurs propres ont une multiplicit suprieure ou gale
2.

10.4 Universalit et implications du phnomne de quantification

0 (r) =

+
X

165

(10.2)

an n (r),

n=0

o les coefficients complexes an sont donns par


Z
an =
n (r)0 (r) dr C.
R3

Lunique solution de lquation de Schrdinger avec condition initiale 0 est alors donne par
(r, t) =

+
X

an n (r)ei

En
~

(10.3)

n=0

Cette formule peut tre vue comme une simple consquence du principe de superposition.
Remarque 10.3 (Schma numrique). La dcomposition de la fonction donde sur la base dtats
stationnaires donne un schma numrique de rsolution de lquation de Schrdinger : on peut
en effet, pour une condition initiale donne, calculer les N premiers modes propres de la condition initiale selon (10.2), et en dduire une approximation de en tronquant la somme (10.3)
lordre N .
est un oprateur auto-adjoint quelRemarque 10.4 (Formulation spectrale gnrale). Lorsque H
conque, et que son spectre comporte une composante continue, il est possible de gnraliser la
dcomposition en modes propres (10.3). Partant de (r, t = 0) = 0 (r), la thorie spectrale donne
Z

(r, t) =
ei ~ t dP 0 (r),
R

(voir Appendice C.5).


o (P )R est la famille spectrale associe au Hamiltonien H
Frquences propres dvolution
Calculons lvolution temporelle de la probabilit de prsence de la particule. Il vient :
! +
!
+
X
X
E
E
i ~l t
i ~k t
al l (r)e
(r, t) =
ak k (r)e
l=0

k=0

+
X

ak al k (r)l (r)ei

El Ek
~

k,l=0

La densit (r, t) apparat ainsi comme une superposition de composantes oscillantes de pulsations
kl =

El Ek
.
~

La probabilit de prsence nest capable, dans son volution, de nexhiber quun nombre restreint
de frquences. Il en irait en fait de mme pour toutes les autres grandeurs physiques (position,
acclration, courant de probabilit,. . .) Les pulsations kl sont les pulsations propres dvolution
du systme, et sont soumises au phnomne de quantification.
10.4.4 Proprits spectrales des atomes, des molcules, et des corps denses
Corrolaire de la quantification des frquences propres dvolution, la quantification de lnergie
a une consquence directe sur la capacit dun systme absorber ou mettre des rayonnements
lectromagntiques.

166

10 La particule quantique confine

Le spectre dabsorption-mission
Mme si ce cours ne traite pas doptique quantique, nous savons tous, de manire plus ou moins
prcise, quune manire quantique de regarder une onde lectromagntique de pulsation est de
dire que celle-ci est divise en fines particules, appeles photons, chacun portant individuellement
une nergie
Ephoton = ~.
Vis vis de llectromagntisme classique, lnergie du photon correspond donc la frquence
de londe. Cest le nombre de photons transports qui dtermine quant lui le flux dnergie du
faisceau lumineux.
Labsorption ou lmission dun rayonnement par un systme quantique ne peut se faire que
photon par photon (voir figure 10.10). Du fait de la quantification des nergies, pour quun photon
puisse tre absorb ou mis, il faut que son nergie corresponde la diffrence entre deux niveaux
dnergie du systme, cest dire quil existe 2 indices n et m tels que
Ephoton = Em En = ~nm .
Si les nergies accessibles forment un continuum, toutes les frquences sont ainsi susceptibles
dtre absorbes ou r-mises. En revanche, en prsence du phnomne de quantification, seules
les frquences propres nm dvolution du systme sont autorises. Le terme courant pour les
dsigner est celui de spectre dabsorption-mission du systme.

Fig. 10.10. Les mcanismes dabsorption et dmission de rayonnement de pulsation par transition
dun systme quantifi entre deux niveaux dnergie En et Em .

Exemple du puits quantique infini


Dans le cas du puits quantique infini unidimensionnel, de largeur a, les pulsations permises
sont donnes par

~ 2
nm =
m2 n2 ,
n, m N .
2
2ma
On peut se limiter, pour navoir que des pulsations positives, prendre n m . On dmontre
alors (petit exercice intressant darithmtique), que les pulsations obtenues sont de la forme :
N =

~ 2
N,
2ma2

avec comme valeurs possibles pour N :


0;
les nombres impairs suprieurs ou gaux 3 ;
les multiples de 4 suprieurs ou gaux 8.
Lallure du spectre correspondant est donne la figure 10.11.

10.4 Universalit et implications du phnomne de quantification

167

Fig. 10.11. Structure du spectre dmission/absorption du puits de potentiel infini une dimension.

Importance du spectre en physique et en chimie


En prsence dnergies quantifies, le spectre prend donc, en fonction du systme quantique,
une structure trs particulire. Tout une gamme de techniques exprimentales danalyse de la
matire, dites techniques de spectroscopie, retiennent ces spectres comme des signatures des espces
chimiques mises en jeu. On peut citer notamment :
la spectroscopie dabsorption de rayonnement infrarouge, visible, et ultraviolet ;
la spectroscopie dmission par fluorescence ;
la rsonance magntique nuclaire (voir figure 10.12).
Historiquement, les spectres dmission-absorption de certains atomes taient connus bien avant
lavnement de la mcanique quantique. On comprend aisment quils aient beaucoup intrigu
leurs observateurs lpoque.

Fig. 10.12. Spectres de rsonance magntique nuclaire (RMN) de la molcule dthanol CH3 -CH2 -OH.
En RMN, le systme quantique tudi volue sur un nombre fini dtats quantifis. Le spectre ne possde
ainsi quun nombre fini de raies.

10.4.5 La quantification comme lment stabilisateur de la matire


Nous remarquons, dans tous les exemples abords dans ce chapitre (puits de potentiel, oscillateur harmonique, potentiel Coulombien, trou de potentiel) que lnergie la plus basse accessible
la particule reste toujours strictement suprieure lnergie potentielle rgnant au fond de la
zone de pigeage. Dune certaine manire, le phnomne de quantification empche la particule de
tomber tout au fond du trou. Par ailleurs, nous avons vu que dans les trous de potentiel, lexistence dtats lis permet de contrecarrer le phnomne dtalement des paquets donde. Ce double
phnomne est lourd de consquence, et en mme temps salutaire, pour la stabilit de la matire :
dans les atomes, il est ainsi interdit aux lectrons de tomber au fond du potentiel attractif
du noyau. Les lectrons sont quantiquement maintenus bonne distance de ce dernier. Par

168

10 La particule quantique confine

ailleurs, le potentiel retient les lectrons prs de lui dans des tats lis. Cest cela qui explique
que la structure de latome est stable, avec toujours une taille de lordre de lAngstrm (voir
aussi le 11.5.4 pour une dmonstration mathmatique de ces considrations physiques) ;
en astrophysique, ltoile neutrons est un assemblage compact de neutrons qui contient dans
une sphre de 10 km de diamtre une masse quivalente celle du soleil. Une telle masse
devrait en temps normal seffondrer encore plus sous son propre poids. Le niveau fondamental
de ce corps possde en fait une nergie norme qui oblige les neutrons maintenir une
agitation minimale mme dans la limite des trs basses tempratures, et entretient dans la
sphre une pression qui compense les forces de gravitation.
10.4.6 Et la limite classique ?
La quantification des nergies prend contre pied la mcanique classique, qui considre que
cette quantit peut prendre toutes les valeurs, du moment quelle reste suprieure au potentiel.
Pour examiner ce rsultat classique avec un oeil quantique, nous pouvons utiliser la rgle heuristique consistant regarder ce que devient le spectre des nergies lorsque la masse m de la particule
tend vers +.

Fig. 10.13. Densification du spectre quantifi du Hamiltonien lors du passage la limite classique (cas
du puits infini et de loscillateur harmonique unidimensionnel).

Reprenons par exemple les nergies propres du puits quantique unidimensionnel de largeur a :
En =

~2 2 2
n ,
2ma2

n 1.

~
Ces valeurs sont toutes espaces entre elles dun nombre entier de fois la quantit 2ma
2 . Lorsque
m crot, cette quantit tend vers 0. Les nergies En se rapprochent donc les unes des autres
(voir figure 10.13), pendant que lnergie du niveau fondamental tend vers 0. Au final, le spectre
nergtique tout entier se densifie ainsi sur le domaine [0, +[. Cela sobserve de mme dans le
cas de loscillateur harmonique, avec les nergies
r 

1
k
n+
.
En = ~
m
2
2

Dans la limite m +, on a ainsi limpression que toutes les nergies sont nouveau accessibles
au systme, comme en physique classique. Pour autant, la quantification ne disparait pas : elle
nest simplement plus mesurable.

10.4 Universalit et implications du phnomne de quantification

169

10.4.7 Et ce nest pas tout. . .


L ne sarrtent pas les consquences de la quantification. Nous aurons loisir dans la suite de
ce cours de montrer quelle est lorigine des proprits chimiques des atomes et des molcules,
expliquant par exemple le phnomne de liaison chimique. Elle dterminera aussi le caractre
conducteur ou isolant lectrique de la matire, ainsi que ses ventuelles proprits de transparence
optique. Ce phnomne est enfin au coeur des technologies de llectronique semi-conducteurs
et . . . du four micro-ondes !

170

10 La particule quantique confine

Exercices
Exercice 10.1 (Ingalit de Hardy).
On va montrer ici lingalit de Hardy

u

|x|

u H1 (R3 ),
(1) Montrer que, dans Rd ,

x
|x|2

2kukL2 (R3 ) .
L2 (R3 )


=

d1
.
|x|2

(2) En utilisant la formule ci-dessus et en effectuant une intgration par parties, montrer alors
lingalit de Hardy (on utilisera galement une ingalit de Cauchy-Schwarz).
Exercice 10.2. Montrer que la norme
kukH2 (R3 ) = (kukL2 (R3 ) + kukL2 (R3 ) )1/2
est bien quivalente la norme usuelle (somme L2 de toutes les drives).
Exercice 10.3. Montrer que si u H2 (R3 ), alors pour tout  > 0, il existe M > 0 tel que
kukL (R3 ) kukL2 (R3 ) + M kukL2 (R3 ) .
On pourra passer en variables de Fourier, utiliser une ingalit de Cauchy-Schwarz avec (1 + |k|2 )
u
et (1 + |k|2 )1 pour montrer

k
ukL1 (R3 ) c k|k|2 ukL2 (R3 ) + kukL2 (R3 ) ,
et conclure en considrant u
n (k) = n3 u
(nk). Montrer alors que laffirmation de la Remarque 10.2
en sinspirant de la preuve donne dans lExemple 10.1.
Exercice 10.4 (Particule dans la boite).
On considre dans lespace R3 une particule de masse m confine dans le domaine paralllpipdique [0, a] [0, b] [0, c] avec a, b et c les longeurs des cts de la boite. A lintrieur de la
boite, le potentiel est nul. Il est infini lextrieur.
(1) Calculer les tats stationnaires qui peuvent se mettre sous la forme factorise :
(r) = x (x)y (y)z (z)
ainsi que les nergies associes.
(2) Montrer que lon peut extraire de cette famille dtats factoriss une base complte dtats

propres du Hamiltonien H.
Exercice 10.5 (Superposition dtats dans le puits quantique).
On considre, dans le fond dun puits quantique unidimensionnel infini de largeur a, une particule de masse m dont ltat t = 0 est donn par :
1
(x, t = 0) = (1 (x) + 2 (x)) ,
2
avec 1 et 2 les deux premiers tats dnergie du puits.
(1) Rappeler lexpression analytique de 1 et 2 .
(2) Donner, en explicitant 1 et 2 , lexpression de (x, t) pour t > 0.
(3) Calculer, en fonction de t, la probablit de prsence (x, t), le courant de probabilit J(x, t)
et la vitesse de probabilit v(x, t).

10.4 Universalit et implications du phnomne de quantification

171

(4) Montrer que la particule est anime dun mouvement priodique dont on donnera la priode T .
(5) Reprsenter graphiquement lallure de (x, t), J(x, t) et v(x, t) pour t = 0, t =
t = 3T
4 .

T
4

,t=

T
2

et

Exercice 10.6 (Le puits de Dirac).


On considre une particule de masse m place dans le champ de potentiel unidimensionnel
suivant :
V (x) = (x),
0,
cest dire un potentiel nul partout, sauf au point x = 0, ou il prend la forme dun pic de Dirac
ngatif. Nous recherchons les tats stationnaires dnergie E ngative.
= ~2 + V est autoadjoint de domaine D(H)
= H1 (R). En dduire que les
(1) Montrer que H
0
2m
parties spatiales des tats stationnaires de la particule restent des fonctions continues de x
(2) Ecrire lquation de Schrdinger indpendante du temps pour la partie spatiale (x) dun tat
dnergie E.
(3) Pour E < 0, donner, sans se proccuper des conditions de raccordement en x = 0, la forme
gnrale des tats stationnaires dans les domaines x < 0 et x > 0. Lesquels
sont physiquement

)
acceptables vis vis de la condition de normalisation ? (On posera K = 2mE
~
(4) En intgrant lquation de Schrdinger sur un petit intervalle [, ], puis en faisant tendre 
vers 0, montrer que :
d
d +
2m
(0 )
(0 ) = 2 (0).
dx
dx
~
(5) En tenant compte, par ailleurs, de la continuit de (x) en x = 0, en dduire une condition de
quantification sur lnergie E.
(6) Combien existe-t-il dtats stationnaires dnergie ngative ?
(7) Vrifier quaucune condition de quantification ne sapplique pour les nergies positives.
Exercice 10.7 (Le spectre de loscillateur harmonique est purement ponctuel). Considrons, pour f L2 (R3 ), le problme
Trouver u D0 (R3 ) tel que

= f,
Hu

pos sur le sous-espace vectoriel




V = u L2 (R3 ) | |u|V < + ,
o la semi-norme | |V est donne par
Z
Z
|u|2V =
|r|2 |u(r)|2 dr +
R3

R3

|k|2 |
u(k)|2 dk.

On voudrait appliquer un thorme de Lax-MilgramD pour Echercher u V tel que a(u, v) = l(v)
v et la forme linaire l(v) = hf, vi, et
pour tout v V, avec la forme bilinaire a(u, v) = Hu,
dfinir ainsi une application T : L2 (R3 ) V L2 (R3 ), qui f associe u.
(1) Vrifier que | |V est une norme.
(2) Vrifier que a est bilinaire continue et coercive.
(3) Montrer que l est linaire et continue pour la norme | |V . On pourra montrer que kukL2 (R3 )
|u|V en remarquant que
Z
Z
d
u2 = 2
u r u ;
R3

R3

(4) Montrer que linjection V L2 (R3 ) est compacte.


(5) Montrer finalement que T est auto-adjoint et positif et conclure.

172

10 La particule quantique confine

Exercice 10.8 (Exercice de rvision sur la thorie spectrale).


On considre lespace de Hilbert H = L2 (R3 ). On dfinit sur H le Hamiltonien
1
Ha,R = + Va,R ,
2
o le potentiel Va,R est dfini, pour a R et R 0, par

a si |x| R,
Va,R (x) =
0 si |x| > R.
(1) Prciser le domaine de Ha,R . Montrer que Ha,R est autoadjoint sur D(Ha,R ) (on pourra utiliser
le thorme de Kato-Rellich). Que peut-on en dduire pour (Ha,R ) et res (Ha,R ) ?
(2) Quel est le spectre essentiel de Ha,R ? (on pourra montrer que Va,R est une perturbation
-compacte de Ha,R ).
(3) Montrer que d (Ha,R ) = si a 0 (on pourra utiliser le principe du min-max).
(4) Montrer que d (Ha,R ) nest pas vide lorsque a < 0 si R est choisi assez grand. Comment
peut-on interprter physiquement ce rsultat en comparaison de la situation voque la
Question 3 ?
(5) Comment ces rsultats sont-ils modifis si lespace ambiant est de dimension 1 ou 2 ?

11
Le formalisme de Dirac

Les fonctions donde que nous avons utilises jusqu prsent ne sont aptes dcrire quune
particule en translation. On montre dans ce chapitre quil est possible, au moyen dune reformulation plus abstraite, dobtenir un formalisme capable de plus de gnralit. Le formalisme vectoriel
introduit ici, dit encore formalisme de Dirac, permet, au travers dune srie de postulats, dasseoir
de manire rigoureuse lensemble des concepts que nous avons entrevus en mcanique ondulatoire.
Il donne une description prcise des phnomnes quantiques survenant lors de la mesure dune
grandeur physique, et explique, au travers des relations dincertitude de Heisenberg, pourquoi certaines de ces grandeurs ne peuvent tre connues simultanment. Ce formalisme permet dtendre
la thorie quantique des situations autres que la particule en translation, et autorise par exemple
la description des systmes plusieurs particules ou la rotation des particules sur elles-mme. Au
plan technique, on verra que les nouveaux outils introduits permettent de mener des calculs plus
efficacement.

11.1 Formalisme vectoriel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173


11.1.1 Grandeurs physiques et observables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
11.1.2 Notations vectorielles : bra-ket . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
11.1.3 Gnralit du formalisme vectoriel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
11.2 Construction des observables : principe de correspondance . . . . . . . 175
11.3 Equation de Schrdinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
11.4 La mesure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
11.4.1 Observable spectre discret . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
11.4.2 Observable gnrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
11.5 Commutation des observables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
11.5.1 Crochets de commutation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
11.5.2 Evolution dune observable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
11.5.3 Relations dincertitude de Heisenberg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
11.5.4 Commutation et stabilit de latome dhydrogne . . . . . . . . . . . . . . . . . . . 183
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185

11.1 Formalisme vectoriel


11.1.1 Grandeurs physiques et observables
On a vu quelques exemples dexpressions de moyennes dune quantit physique dans les chapitres prcdents. Rappelons par exemple, les expressions respectives des moyennes des composantes selon x de la position, limpulsion, et lacclration moyenne du paquet donde dune particule de masse m dcrite par une fonction donde (r, t) :

174

11 Le formalisme de Dirac

Z
X(t) =

(r, t)x(r, t) dr,


R3

dX
~

=
(r, t)
(r, t), dr,
dt
i R3
x
Z
d2 X
1
V
(r, t)
=
(r, t) (r, t) dr.
dt2
m R3
x

On peut remarquer que toutes ces quantits sont de la forme :


Z

moyenne(t) =
(r, t) A(r,
t) dr.
R3

avec A un oprateur agissant sur la fonction (r, t). Nous avons dans le cas prsent :

pour la position, A(r,


t) = x(r, t) ;
~

(r, t) ;
pour limpulsion, A(r,
t) =
i x
1 V

pour lacclaration, A(r,


t) =
(r, t)(r, t).
m x
De tels oprateurs sont omniprsents dans le formalisme quantique. Ils sont appels observables,
et sont le pendant quantique des quantits scalaires usuelles de la mcanique classique.
Dfinition 11.1 (Observable en mcanique ondulatoire). A chaque grandeur scalaire A de
la mcanique classique est associ un oprateur auto-adjoint sur lespace dtats L2 (R3 ), appel
pour un systme physique plac
observable. La valeur moyenne au temps t dune observable A(t)
dans ltat (r, t) est note :
Z
d
hA(t)i =
(r, t) A(t)(r,
t) dr.
R3

Dans les exemples qui prcdent, le caractre symtrique et autoadjoint des observables position, impulsion et acclration est une proprit qui peut effectivement tre dmontre (voir
Exercice 11.1).
11.1.2 Notations vectorielles : bra-ket
Dans lexemple des fonctions donde, nous voyons que ltat dun systme quantique est dcrit
par un vecteur de norme 1 dans un espace de Hilbert H (typiquement ici, H = L2 (R3 )). Pour
dsigner ce vecteur, sans faire rfrence la complexit du dtail de la fonction (r, t), le formalisme
vectoriel utilise la notation | i. On le prononce "ket". Le ket | (t) i dsigne donc ltat quantique
(r, t) linstant t. Dans ce formalisme, le vecteur conjugu de | i est not h |. On le prononce
"bra" 1 . Le bra h (t) | correspond au vecteur dtat conjugu (r, t).
Le produit scalaire sur cet espace entre un bra h | et un ket | i est not
Z
(h |, | i) = h | i
(r, t) (r, t) dr.
R3

Le bra h | est ainsi identifi une forme linaire H R


h| : |i h|i.
La valeur moyenne dune observable pour un systme physique plac dans ltat | i est alors
donne par

 D
E Z
d
d
d
hA(t)i = h |, A(t)| i = | A(t) | =
(r, t) A(t)(r,
t) dr.
R3

Le formalisme bra/ket est une manire (un peu ludique) de rcrire les formules prcdentes.
Mais on verra que ce formalisme se montre extrmement puissant pour nombre de manipulations
mathmatiques ncessites par la thorie quantique.
1. Le jeu de mot fond sur langlais braket naura chapp personne. Ces appellations sont devenues
lusage en mcanique quantique.

11.2 Construction des observables : principe de correspondance

175

11.1.3 Gnralit du formalisme vectoriel


Dans le contexte de la mcanique ondulatoire, les notations fonctionnelle (r, t) et vectorielle | (t) i sont videmment redondantes. Lutilisation de lune ou de lautre relve du contexte
et/ou dun choix tout a fait subjectif. Pour autant, alors que le formalisme des fonctions donde est
spcifique de la seule description des particules en translation, le formalisme vectoriel se gnralise
la description de systmes quantiques plus gnraux.
Postulat 11.1 (Description vectorielle des systmes quantiques).
(1) Tout systme physique voit ses tats dcrits par les vecteurs | i de la sphre unit dun
espace de Hilbert H. La nature prcise de H, ainsi que sa dimension, varient selon la nature
du systme considr.
(2) A chaque grandeur physique scalaire classique A se rapportant au systme est associ un
oprateur auto-adjoint A de H, appel observable associe. Cet oprateur est tel que la
valeur moyenne de la grandeur physique pour un systme dans ltat | i est :
D
E
| .
hA(t)i = | A(t)
Ainsi, la rotation dune particule physique sur elle-mme (le spin), que nous abordons au
chapitre 12, se dcrit dans un espace de Hilbert judicieusement choisi de dimension finie. Ce sont
les vecteurs | i de norme unit de cet espace qui deviennent les reprsentants des tats physiques
accessibles au systme.

11.2 Construction des observables : principe de correspondance


Dans le cas de la mcanique ondulatoire, les calculs que nous avons mens avec les fonctions
donde ont permis didentifier lexpression de quelques observables. Notamment, celles associes
aux composantes des vecteurs position et impulsion, respectivement notes x
, y, z et px , py , pz ,
sexpriment selon

px : (r, t)
(r, t),

i x

: (r, t) x (r, t),


x

~
(r, t),
py : (r, t)
y : (r, t) y (r, t),

i y

z : (r, t) z (r, t),

p : (r, t) ~ (r, t).


z
i z
Il nexiste malheureusement pas de principe ni de mthode gnrale pour fixer la forme des observables relevant dun systme quantique quelconque : seul lempirisme est de rigueur. . . Toutefois,
lorsque pour un systme donn, quelques observables sont dj connues, une rgle de construction
se dgage. Nous en donnons un nonc dans le contexte de la mcanique ondulatoire.
Postulat 11.2 (Principe de correspondance en mcanique ondulatoire). Pour toute grandeur classique qui sexprime comme une fonction des vecteurs position r et impulsion p, lobservable associe sobtient en remplaant dans lexpression classique les composantes x, y, z et px ,
py , pz par les observables x
, y, z et px , py , pz .
Remarque 11.1. On fera bien attention au fait que les observables ne commutent pas en gnral !
est donc important. Pour
Ainsi par exemple, x
px 6= px x
. Lordre dans les notations de type AB
appliquer le principe de correspondance la quantit classique x px , la thorie quantique propose,
pour conserver lobservable son caractre auto-adjoint, de symtriser son expression selon :
x
px + px x

.
2
Ces considrations ne tiennent que pour des formules relativement simples. Dans le cas dune
fontion gnrale f (x, p), trouver lobservable associe peut demander beaucoup plus de travail.
x
d
px =

176

11 Le formalisme de Dirac

Ce principe se gnralise tous les autres espaces vectoriels utiliss en mcanique quantique,
a cela prs que les observables de rfrence ne sont alors plus la position et limpulsion, mais
dautres oprateurs adapts chaque situation. Pour un systme physique quelconque, seule la
construction des quelques premires observables de rfrence relve donc dun vritable travail de
recherche tant exprimentale que thorique, les observables suivantes sobtenant, pour la plupart,
par dduction.
En mcanique ondulatoire, lapplication de ce principe quelques grandeurs usuelles mne
au Tableau 11.1. Notons quil nexiste pas en tant que telle dobservable vectorielle. Aux grandeurs classiques vectorielles sont en fait systmatiquement associes trois observables (une par
composante).
Tableau 11.1. Principe de correspondance entre les grandeurs physiques et les observables quantiques
associes.
Grandeur physique

Notation classique a(r, p)

Observable A

Position
Impulsion
Energie cintique
Energie potentielle
Energie totale
Force (drive du potentiel)
Composantes Fx , Fy , Fz
Moment cintique total
Moment cintique selon x
Moment cintique selon y
Moment cintique selon z

x, y, z
px , py , pz
p2
Ec = 2m
V (r, t)
E = Ec + V (r, t)
F = V
V
, V
, V
x
y
z
L=rp
Lx = ypz zpy
Ly = zpx xpz
Lz = xpy ypx

multiplication par x, y, z
px = i~x , py = i~y , pz = i~z
c = ~2
E
2m
Vd
(t) = multiplication par V (r, t)
[ = ~2 + V (r, t)
H(t)
2m
multiplication par V
, V
, V
x
y
z
x = i~(yz zy )
L
y = i~(zx xz )
L
z = i~(xy yx )
L

11.3 Equation de Schrdinger


Le Tableau 11.1 montre quen mcanique ondulatoire, lobservable nergie du systme est
donne par loprateur
2
2
[ = p + V (t) = ~ + V (r, t).
H(t)
2m
2m
Cet oprateur est prcisement celui qui apparat dans lquation de Schrdinger. Cette proprit
srige en principe gnral, et se transpose tous les systmes quantiques, quelque soit leur espace
de description.
Postulat 11.3 (Hamiltonien et quation de Schrdinger). Lvolution du vecteur dtat | i
associe lnergie totale, selon lquation
de tout systme physique est rgie par lobservable H
de Schrdinger :

[ i.
(11.1)
i~ | i = H(t)|
t
est appel oprateur Hamiltonien ou encore Hamiltonien du systme.
Loprateur H

11.4 La mesure
La thorie spectrale sapplique aux oprateurs que sont les observables. Ce faisant, elle permet
de prciser un postulat fondamental de la mcanique quantique, le postulat de la mesure. Curieusement, ce postulat ne possde un nonc rigoureux que dans le cas o le spectre de lobservable

11.4 La mesure

177

est compltement discret. Cest cette situation que nous nous intressons en premier lieu. Dans
un second temps, nous discutons de la difficult gnraliser cet nonc au cas dobservables dont
le spectre possde des composantes continues.
11.4.1 Observable spectre discret
de spectre purement discret
On rappelle que la mesure spectrale associe une observable A(t)
est dfinie laide de la famille de projecteurs
X
P =
PE ,
R,

, (A(t))

o E est lespace propre associ la valeur propre et PE est le projecteur orthogonal sur E
(voir Appendice C.5).
Postulat 11.4 (Mesure dune grandeur physique : cas dune observable spectre dis
cret). Soit un systme physique plac linstant t dans un tat |avant i, et une observable A(t)
de spectre discret se rapportant ce systme. Alors :
(1) lorsque lon mesure linstant t la grandeur physique A, on ne peut trouver quun point du
;
spectre de A(t)

(2) le rsultat de la mesure rsulte dun tirage alatoire parmi les valeurs propres de A(t).
La
probabilit p quune valeur propre donne soit tire vaut :
p = kPE |avant i k2 ;
(3) si est la valeur propre tire lors de la mesure, ltat du systme immdiatement aprs la
mesure devient :
1
|apres i = PE |avant i .
p
Il apparat au travers de ce postulat que le rsultat dune mesure est fondamentalement probabiliste. Le choix se fait au prorata du carr des poids de dcomposition de ltat | avant i sur
La Dfinition C.11 et le Thorme C.3 assurent
les divers sous espaces propres de lobservable A.
que la somme des probabilits ainsi obtenues pour les diverses valeurs propres est bien gale 1 :
X
X
p =
kPE |avant i k2 = k |avant i k2 = 1

(A(t))

(A(t))

Ce principe choqua les physiciens du dbut du 20me sicle. Lhistoire dit quil ne fut notament
jamais accept par Einstein qui aurait dclar : "Dieu ne joue pas aux ds !" Et pourtant, un sicle
de physique la cl, force est de constater que. . . a marche !
La seule situation dans laquelle le rsultat dune mesure est compltement prdictible est
Cest le cas, par exemple, des tats
celui o le ket |avant i est dj un vecteur propre de A.

stationnaires | i des Hamiltoniens H indpendants du temps. Construits par dfinition comme


des tats propres selon
|i = E |i,
H
ce sont les seuls tats pour lesquels lnergie totale du systme est connue sans ambigut.
Sil faut se rsoudre au fait que le rsultat dune mesure est probabiliste, on peut en revanche
remarquer que si lon rpte un grand nombre de fois la mme exprience, en partant des mmes
conditions
p intiales, le rsultat moyen de la mesure est bien hAi, avec un cart quadratique moyen
A = Var(A). La variance Var(A) sur les rsultats de mesure dune observable A est pour un
tat initial | i est
D
E

2
2
2
Var(A) (A hAi) = A2 hAi = h| A2 |i h| A |i .

178

11 Le formalisme de Dirac

Ceci provient du fait que loprateur A peut scrire (voir Appendice C)


X
A =
PE ,

(A)

et plus gnralement,
An =

n PE .

(A)

Ainsi, le moment dordre n sur le rsultat de la mesure sexprime de manire gnrale :


X
p n = h| An |i .

(A)

Une autre nouveaut est le fait que la mesure engendre une modification de ltat du systme,
qui se trouve instantanment projet et renormalis selon un vecteur propre associ au rsultat
trouv. Ce phnomne porte le nom de rduction du paquet donde. Aussi choquant quil puisse
paratre, on peut toutefois se rassurer en se disant que la projection engendre par la mesure
assure que si on remesure le systme immdiatement aprs une premire mesure, on retrouve le
mme rsultat avec une probabilit gale 1. Encore mal comprise dun point de vue physique, la
rduction du paquet donde fait toujours lobjet de recherches au plan exprimental, visant en
percer la vritable nature.
A cause du phnomne de rduction du paquet donde, la mesure simultane de deux grandeurs
physiques A et B peut prendre des allures insolubles : si on observe dabord la grandeur A, on va
Si on veut ensuite mesurer la quantit B
projeter ltat du systme dans un sous espace propre de A.

ce nouveau vecteur dtat sera alors projet une seconde fois selon un sous espace propre de B.

Rien ne garantit alors que ce nouvel tat soit encore un tat propre de A. Si on remesure A, on
aura ainsi en gnral une valeur diffrente de la premire valeur mesure ! Lobservation selon B
perturbe le rsultat de la mesure selon A . . .
commutent. En
Une exception importante concerne cependant le cas o les observables A et B

effet, les sous espaces de A sont alors stables par la projection perpendiculaire sur les sous espaces
et rciproquement. Plusieurs mesures successives de A et B donnent alors toujours le mme
de B,
rsultat, quelque soit lordre des mesures. On parle, selon que les observables commutent ou ne
commutent pas, de mesures compatibles ou incompatibles.
11.4.2 Observable gnrale
Certaines parties du postulat de la mesure (Postulat 11.4) se transposent assez directement
au cas dobservables auto-adjointes gnrales, dont le spectre peut comporter des composantes
continues. Ces parties sont celles qui traitent des rsultats possibles et de leurs probabilits de
tirages. Nous faisons appel ci-dessous la notion de mesure spectrale dun oprateur auto-adjoint
quelconque (voir Appendice C.5).
Postulat 11.5 (Valeurs mesurables dune grandeur physique : cas gnral). Pour une
grandeur physique A, et son observable A associe sur H, on a les proprits suivantes :
(1) lorsque lon mesure la grandeur physique A, on ne peut trouver quun point du spectre de A ;
(2) si le systme se trouve linstant t prcdant la mesure dans ltat |avant i, alors le rsultat
de la mesure est dans lintervalle ]a, b] avec une probabilit k(PbA PaA ) |avant i k2 , o

(PA )R est la famille spectrale associe A.


On retrouve bien lide dun tirage alatoire du rsultat de la mesure parmi les points du
spectre. La vritable adaptation de lnonc concerne la gnralisation de la notion de poids de

dcomposition de |avant i sur les sous-espaces propres de A.

11.5 Commutation des observables

179

Concernant la nature de ltat |apres i, tous les noncs que nous connaissons [28, 13, 6] font
intervenir une certaine erreur de mesure de lappareil physique, contrairement au cas dobservables
spectre purement discret. . . mais ncessaire pour la normalisation de la fonction donde aprs
mesure.
Tentative de postulat (Rduction du paquet donde : cas gnral). Pour une grandeur
physique A, et son observable A associe sur H, si le rsultat de la mesure est a a prs, ltat
du systme aprs la mesure est
|apres i =

A
A
Paa
) |avant i
(Pa+a
.
P A ) |avant i k
k(P A
a+a

aa

Lerreur de mesure est motive par le fait que tous les appareils donnent en effet en pratique
un rsultat de mesure avec une prcision finie (penser aux fentes dYoung par exemple, qui, si
troites soient-elles, ont toujours une largeur donne). Cet nonc soulve cependant un certain
nombre de questions :
faire dpendre |apres i de lerreur de mesure a est une ide angoissante voire inacceptable
pour nombre de physiciens : il est en effet possible, pour la mesure dobservables spectres
purement discret de supposer que les appareils sont de prcision infinie, pourquoi devrait-il
en tre autrement dans le cas gnral ? Et si cette erreur doit effectivement tre prise en
compte, pourquoi ne concerne-t-elle que la nature de |apres i, alors quelle ninflue pas sur
les probabilits de tirage des valeurs mesures ?
cependant, sans cette notion de prcision finie, on ne pourrait pas normaliser les paquets
donde lorsquon les projette en utilisant la mesure spectrale sur le spectre continu de lobservable. Un cas pratique o se pose cette difficult est celui on lon mesure la position
moyenne x0 dun paquet donde, avec une prcision x0 . Dans ce cas,
apres (t, x) =

1|xx0 |x0 avant (t, x)


.
k1|x0 |x0 avant (t, )k

On voit que cette expression nest pas dfinie dans la limite x0 0. Pour autant que
certains puissent la juger suspecte, lerreur de mesure est ncessaire pour assurer que |apres i
reste physiquement acceptable.
La physique quantique et la physique en gnral sont riches de tels dbats quasi-philosophiques,
o seule la dmonstration exprimentale peut faire figure de juge de paix. Malheureusement, la
difficult concevoir et mettre en place les bonnes expriences fait que lheure du jugement peut
parfois se faire attendre plusieurs dcennies.

11.5 Commutation des observables


11.5.1 Crochets de commutation
Nous lavons dj mentionn dans le 11.2, le produit de deux observables nest pas toujours
commutatif. Prenons par exemple le cas du produit x
px , et appliquons le la fonction donde
(r). On a alors


~
~
~ ~
~
= x
6= px x
=
(x) = x
+ .
x
px = x
i x
i x
i x
i x
i
Les crochets de commutation permettent de caractriser les proprits de commutation ou de
non-commutation des observables.
on apDfinition 11.2 (Crochets de commutation). Etant donns deux oprateurs A et B,
loprateur dfini par :
pelle crochet de commutation de A et B
h
i
B
= AB
B
A.

A,

180

11 Le formalisme de Dirac

Lorque que ce crochet de commutation est loprateur nul, cela signifie que les oprateurs A

et B commutent.
sont des observables, cest dire, des oprateurs auto-adjoints, on montre que
Lorsque A et B
le crochet de commutation est encore un oprateur autoadjoint, et que son spectre est valeurs
imaginaires pures (voir Exercice 11.4). On tablit sans peine les relations suivantes :
B
et C oprant sur le mme espace de
Proprit 11.1. Pour trois oprateurs quelconques A,
Hilbert,
h
i
h
i
B
= B,
A ,
A,
h
i h
i h
i
B
+ C = A,
B
+ A,
C ,
A,
i
i h
i h
h
C .
C + B,
C = A,
A + B,
Commutation position-impulsion
Les relations de commutation entre les observables position et impulsion sont la base de
nombre de calculs en mcanique quantique. Il est utile de les connatre par coeur :
[
x, x
] = 0,

[
x, y] = 0,
[
y , y] = 0,

[
x, z] = 0,
[
y , z] = 0,
[
z , z] = 0,

[
px , px ] = 0,

[
x, px ] = i~,
[
y , px ] = 0,
[
z , px ] = 0,

[
x, py ] = 0,
[
y , py ] = i~,
[
z , py ] = 0,

[
px , py ] = 0,
[
py , py ] = 0,

[
px , pz ] = 0,
[
py , pz ] = 0,
[
pz , pz ] = 0,

[
x, pz ] = 0,
[
y , pz ] = 0,
[
z , pz ] = i~.

Dans ces formules, i~ dsigne par abus de notation loprateur multiplication par le scalaire i~.
11.5.2 Evolution dune observable
Le commutateur entre une observable donne et le Hamiltonien dtermine elle seule lvolution temporelle de la valeur moyenne de cet observable.
Proposition 11.1 (Thorme dEhrenfest). Soit un systme physique dont on note |(t)i

une obserltat au cours du temps, H(t)


le Hamiltonien autoadjoint sous lequel il volue, et A(t)
2
vable. EOn suppose
que le problme
dvolution temporelle est bien pos . Alors la valeur moyenne
D
D
E

A(t)
= (t)|A(t)|(t)
volue au cours du temps selon

D
E

d A(t)

dt

A
(t)
t

+
+

E
i D

[H(t), A(t)]
.
~

(11.2)

1
Preuve. Cette galit dcoule simplement de lquation de Schrdinger t | i = i~
H| i et (par
1

conjugaison) t h | = i~ h |H. Il vient alors


D
E
!





d A(t)

d
dh

|
d
A
d| i

= h (t) |A(t)|
(t) i =
A(t)|
i + h|
| i + h |A(t)
dt
dt
dt
dt
dt
!

dA
i 
A(t)|

H(t)|

= h (t) |
| (t) i +
h (t) |H(t)
(t) i h (t) |A(t)
(t) i ,
dt
~

ce qui donne le rsultat.

constant avec H
autoadjoint.
2. Ceci est par exemple le cas si H(t)
H

u
t

11.5 Commutation des observables

181

Remarque 11.2. Il dcoule de ce thorme que toute grandeur physique dont lobservable est indpendante du temps et commute avec le Hamiltonien voit sa valeur moyenne conserve au cours
du temps. Parmi les grandeurs ne dpendant pas du temps, seules celles qui ne commutent pas
sont susceptibles dvoluer. Comme [H,
H]
= 0, on montre que la dynamique de Schravec H
dinger conserve lnergie moyenne du systme pour autant que le Hamiltonien ne dpende pas du
temps.
Application : dynamique de la position moyenne dun paquet donde
Pour la particule de masse m se dplaant dans un champ de potentiel V (r, t), on montre
facilement que
i~
i~
i
[H, x
] =
((x) x) = x ,
~
2m
m
On montre de mme que :
i
i
[H, px ] = [V , px ] = x V.
~
~
On a bien sr des relations analogues selon y et z. On en dduit, par le thorme dEhrenfest
(Proposition 11.2),

hpx i
d

dt hxi = m ,


(11.3)
d
V

.
dt hpx i = x

Ainsi que des relations similaires selon y et z. Nous laissons le lecteur libre dapprcier la facilit
avec laquelle on retrouve le rsultat du 9.2.
11.5.3 Relations dincertitude de Heisenberg
Une des consquences du principe de la mesure dune observable A est que le rsultat de la
mesure connat une dispersion statistique dcart type A :
q
p
2
A = Var(A) = hA2 i hAi .
La quantit A est aussi appele incertitude de la mesure. Elle traduit uniquement le fait que
et nest lie daucune manire
ltat | i peut tre rparti sur plusieurs sous espaces propres de A,
une ventuelle limite de prcision de lappareil servant la mesure. Le seul cas o cette incertitude
On a alors A = 0, et le rsultat de la mesure est
est nulle est celui o | i est tat propre de A.

certain et gal h |A| i dans ce cas.


Il se trouve que pour un tat | i donn, les incertitudes A et B obtenus pour deux
ne sont pas totalement indpendantes 3 . On a en effet la
observables diffrents A et B
B
donnes et | i
Thorme 11.1 (Relation dincertitude). Pour deux observables A,

D(A) D(B),


1 D E
A B [A, B] .
2

simultanment, mais de mesurer au choix A ou B,


le systme
3. Lide ici nest pas de mesurer A et B
tant dans un tat initial | i donn, et de se poser la question de lincertitude obtenue selon que lun ou
lautre des deux observables soit choisi. La thorie quantique rejette dailleurs lide de mesures simultanes.
Dire que deux mesures ont lieu au mme moment signifiera au mieux que lon effectue lune, puis lautre,
de manire trs rapproche dans le temps, et dans un ordre donn qui a toute son importance. Ces mesures
successives constituent alors un tout autre problme que celui que nous nous posons ici.

182

11 Le formalisme de Dirac

Preuve. Le ket | i tant fix, on considre, pour R, la quantit



2


hBi ) | i = 2 (B)2 + ih |[A,
B]|
i + (A)2 .
Q() = (A hAi ) + i(B

Le deuxime terme du dveloppement ci-dessus est rel, car


D
E


B]

i .
i [A,
= 2Im h |AB|

(11.4)

Le polynme coefficients rels Q() tant positif pour tout , on en dduit que son discriminant
est ngatif, et donc
D
E2
B]

4(A)2 (B)2 [A,


0.

u
t

Ceci donne le rsultat escompt.

Une consquence est la fameuse relation dincertitude de Heisenberg position-impulsion, qui


= px (ou B
= py , pz ). On rappelle que
correspond au cas particulier A = x
(ou A = y, z) et B
[
x, px ] = i~.
Corollaire 11.1 (Relation dincertitude position-impulsion). Pour tout tat | i D(
x)
D(
px ) dcrivant une particule en translation dans lespace, on a
xpx

~
,
2

et des relations analogues sur les axes y, z.


Notons que cette relation dincertitude ne sapplique qu des composantes prises sur le mme
axe. Si on applique la relation dincertitude aux opbservables y et px , par exemple, il vient :
ypx 0.
Rien nempche (mais rien noblige non plus) de connatre parfaitement limpulsion dune particule
sur un axe, et sa position sur un axe perpendiculaire.
Les relations de commutation font quil est parfois physiquement impossible quun systme ait
deux caractristiques A et B parfaitement dtermines. Cela traduit le fait quil est mathmati Dans le cas
quement impossible que son tat | i soit simultanment tat propre de A et de B.
de la position et de limpulsion dune particule selon un axe donn, cette impossibilit est systmatique. Dans le cas limite o la position est connue avec une prcision arbitraire, on na donc
aucune information sur limpulsion (et rciproquement). Cette situation est extrme, et en pratique, positions et impulsions sont gnralement chacunes distribues autour dune moyenne fixe.
Rptons que ces dispersions de valeurs sont des proprits intrinsques des systmes quantiques,
et nont rien voir avec une quelconque incertitude du procd de mesure.
On peut remarquer aussi que la relation dincertitude dans sa formulation positions/vitesses
est
~
x vx
.
2m
La relation dincertitude position-vitesse se montre donc dautant plus contraignante que la particule considre est lgre. Cest ainsi quelle est omniprsente lorsquon tudie des lectrons,
alors quelle peut parfaitement tre nglige pour des corps plus lourds obissant la mcanique
classique.

11.5 Commutation des observables

183

11.5.4 Commutation et stabilit de latome dhydrogne


Un grand nombre de rsultats de la physique quantique reposent, au plan thorique, sur les
proprits de commutations entre observables. Nous venons den voir quelques exemples. En guise
de conclusion ce chapitre, nous donnons ici un rsultat concernant non des thormes gnraux,
mais ltude dun systme physique particulier : latome dhydrogne. Nous montrons que les
relations de commutations permettent de prouver sa stabilit en tablissant une borne infrieure
pour lnergie de son lectron (lectron qui ne peut par consquent pas tomber sur le noyau).
Apprcions une fois de plus la puissance du formalisme de Dirac.
Thorme 11.2. Sur L2 (R3 ), on a
1
,
4|r|2

au sens o, pour un sous-espace dense E de L2 (R3 ),


 
E,
,

1
4|r|2

 
0.

3
Preuve. On prend E = C
0 (R ). Dans ce cas, on peut vrifier que toutes les expressions ci-dessous
= (
ont un sens. On calcule en premier lieu, pour r = (r1 , . . . , rd ) et p
p1 , . . . , pd ) dans un espace
de dimension d = 3,


d
X
1
1
~d
i
pj , rj = 2 .
|r| |r|
|r|
j=1

On en dduit, par (11.4),


~dk|r|1 k2 = 2

d
X


Im

j=1


1
1
pj , rj .
|r| |r|

Comme [
pj , |r|1 ] = i~|r|3 rj , on a alors
~(d 2)k|r|1 k2 = 2

d
X
j=1



rj
Im pj , 2 .
|r|

Une ingalit de Cauchy-Schwarz montrant que




X



d
rj
1/2

k|r|1 k,
pj , 2 h, i

|r|

j=1
on a alors, avec lingalit prcdente,
~|d 2|k|r|1 k 2 h, i

1/2

On obtient donc finalement


h, i
Le rsultat sen dduit pour d = 3.

|d 2|2
4



1
, 2 .
|r|
u
t

Latome dhydrogne est instable dans la description classique de la matire. On dcrit en effet
llectron comme une particule ponctuelle dans le champ coulombien cr par un noyau ponctuel de
charge e, i.e. on a une dynamique newtonienne dans un champ de potentiel V (r) = e2 (40 |r|)1 .
Comme lnergie potentielle dcrot quand la distance au noyau |r| dcrot, on voit que cette

184

11 Le formalisme de Dirac

dynamique est instable par rapport aux perturbations normales une orbite dans la direction du
noyau.
Dans le formalisme de la mcanique quantique au contraire, on montre avec le Thorme 11.2
que le Hamiltonien est born infrieurement, ce qui assure la stabilit de latome dhydrogne. En
effet, au sens des oprateurs sur L2 (R3 ),
2
2
~2
e2
= ~ e
H

.
2m
40 |r|
8m|r|2
40 |r|

Le minorant ci-dessus atteint son minimum en |r|1 = 0 ~2 /(me2 ), et ainsi


4
me .
H
2
2
8 0 ~2

54.5 eV. Cette valeur est en accord avec lnergie trouve


Lapplication numrique donne H
exprimentalement pour ltat fondamental de llectron : 13.6 eV.

11.5 Commutation des observables

185

Exercices
Exercice 11.1 (Caractre autoadjoint des observables). Montrer, dans le formalisme fonction donde, le caractre autoadjoint des observables px et x V .
Exercice 11.2 (Crochets de commutation). Calculer pour une particule de masse m en trans c ], [
c ], [
c
lation dans un champ de potentiel V (r) les commutateurs [
px , H
x, H
px , V ] et [
x, V ], o H
p
b2

dsigne lobservable nergie cintique Hc = 2m . Parmi la position, limpulsion, et les nergies


potentielle et cintique, quelles familles de grandeurs est-il possible de connatre avec prcision
simultanment ?
Exercice 11.3 (Mesure). On considre un systme physique dcrit par un espace de Hilbert

2 dimensions. On se donne une base orthonorme dtats (| 1 i , | 2 i), et deux observables A et B


qui scrivent dans cette base :




1 0
0 i

A=a
,
B=b
,
0 2
i 0
avec a et b deux constantes.

(1) Calculer les vecteurs propres et les valeurs propres de A et B.


1
On place le systme dans ltat | avant i = 5 (| 1 i + 2 | 2 i).
Quels rsultats peut on mesurer, et avec quelles
(2) On mesure sur | avant i lobservable A.
probabilits ? calculer A.
on mesure B.
Calculer B.
(3) Mme question si au lieu de mesurer A,
B],
et vrifier lingalit de Heisenberg.
(4) Calculer le commutateur [A,
et on trouve la grandeur 2a. On dcide alors de
(5) Partant de ltat | avant i, on mesure A,
Quelles sont les nouvelles probabilits sur les rsultats de cette deuxime mesure ?
mesurer B.
B
deux obserExercice 11.4 (Spectre du commutateur de deux observables). Soient A,
D(B).
En calculant
vables, de domaines D(A),
E Z
D

[A,
B] =
C dr,
R3

montrer que C est auto-adjoint et que (C) iR.

12
Le moment cintique en mcanique quantique :
Moment orbital et Spin

Le formalisme de la fonction donde dcrit la dynamique de translation dune particule dans le


vide. Il ignore cependant un aspect essentiel du mouvement des corps : leur rotation sur eux-mmes.
Cest cet aspect, apprhend en mcanique classique par le concept de moment cintique, que nous
abordons ici. Le prsent chapitre fait quelques rappels sur la manire dont la mcanique classique
traite du moment cintique. Nous voyons ensuite comment la mcanique quantique distingue le
moment cintique autour dun point dune particule en translation, dit moment orbital, et le
moment cintique interne des corps, dit spin.

12.1 Le moment cintique en mcanique classique . . . . . . . . . . . . . . . . . . . . 187


12.1.1 Moment cintique dune particule ponctuelle autour dun point . . . . . . 187
12.1.2 Rotation dun objet rigide sur lui-mme . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
12.2 Le moment cintique orbital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
12.2.1 Relations de commutation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
12.2.2 Liens avec la mcanique classique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
12.3 La dfinition tendue du moment cintique en mcanique quantique193
12.4 Quantification du moment cintique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
12.4.1 Que quantifier ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
12.4.2 Le rsultat de quantification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
12.4.3 Elments de dmonstration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
12.5 Quantification du moment cintique orbital . . . . . . . . . . . . . . . . . . . . . . 199
12.6 Le spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
12.6.1 Dfinition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
12.6.2 Espace de spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
12.6.3 Manifestations physiques du spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
12.6.4 Un exemple despace de spin : lespace du spin 21 . . . . . . . . . . . . . . . . . . 205
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207

12.1 Le moment cintique en mcanique classique


Le moment cintique est une grandeur vectorielle qui permet de dcrire les mouvements de
rotation des corps rigides.
12.1.1 Moment cintique dune particule ponctuelle autour dun point
Considrons une particule ponctuelle de masse m en mouvement dans R3 . Son tat classique
de translation est repr par sa position r(t) et son impulsion p(t). Considrons par ailleurs un

188

12 Le moment cintique en mcanique quantique :

Moment orbital et Spin

point de lespace, de position r0 , qui, pour une raison quelconque, revt pour nous une importance
particulire. Si un observateur, post en r0 , suit des yeux la trajectoire de la particule, il sera
certainement, la manire dun spectateur de course automobile, forc au cours du temps de
tourner progressivement la tte. Dune certaine manire, mme dans le cas o la particule se
dplace en ligne droite, la direction dans laquelle lobservateur doit orienter son regard tourne au
cours du temps. Ce mouvement de rotation apparent autour du point r0 est dcrit par le moment
cintique L(t) selon :
L = (r r0 ) p.
La figure 12.1 prsente graphiquement le moment cintique.

Fig. 12.1. Moment cintique L autour dun point r0 dune particule en translation.

La seule situation dans laquelle la particule ne semble pas tourner est celle o, soit elle se dirige
droit sur le point r0 , soit elle sloigne droit de ce point. Trs souvent, pour des raisons pratiques,
le point r0 sert dfinir le point origine de lespace. On a alors simplement :
L = r p.

(12.1)

Le vecteur L(t) est une nouvelle grandeur, mais nest pas proprement parler un nouveau paramtre de description de ltat du systme. En effet, il se dduit entirement de r(t) et de p(t), et
napporte donc pas dinformation physique supplmentaire sur la particule. Cependant, il jouit de
proprits remarquables qui en font un outil de raisonnement et de calcul intressant. La relation
fondamentale de la dynamique pour une particule soumise des forces Fi implique pour lvolution
temporelle de L :
!
X
dL
dr
dp
1
Fi ,
=
p+r
= pp+r
dt
dt
dt
m
i
soit

X
dL X
=
r Fi =
Mi .
dt
i
i

(12.2)

Le vecteur L(t) obit ainsi, linstar de p(t), une relation conceptuellement proche de la relation
fondamentale de la dynamique. Chaque force Fi est lorigine dun effort en rotation Mi = r Fi ,
dit moment exerc par la force autour du point de rfrence (ici, le point origine de lespace).
La quantit L est particulirement utile en astronomie ou en lectromagntisme pour tudier la
trajectoire dune particule en interaction avec un centre attractif ou rpulsif. Dans cette situation,
si ce centre est pris comme rfrence, les forces appliques sont toujours colinaires r. Le moment
appliqu est nul, et L devient donc une constante du mouvement. De mme, le moment cintique
dun systme isol est galement une constante du mouvement.
Remarque 12.1. Que lon considre ou pas le moment cintique, lnergie cintique de la particule
ponctuelle continue invariablement scrire :
Ec =

p2
.
2m

12.1 Le moment cintique en mcanique classique

189

Remarque 12.2. Le point matriel considr ici peut aussi bien tre une vraie particule ponctuelle,
que le centre de gravit dun objet, ou encore la particule rduite dun systme de deux corps en
interaction.
12.1.2 Rotation dun objet rigide sur lui-mme
Moments cintiques interne et externe
Pour un objet rigide qui occupe chaque instant un certain volume (t) dans lespace, le
moment cintique est dfini comme lintgrale des moments cintiques lmentaires
Z
L(t) =
r v(r, t) (r, t) dr,
(t)

o v(r, t) est le champ de vitesse dans lobjet linstant considr et (r, t) est la masse volumique
locale du corps tudi. Mme pour un objet rigide, et voluent au cours du temps du seul fait
des mouvements de lobjet (mais resteraient constants dans un rfrentiel fix lobjet !).
Une particularit de ce moment cintique est quil est possible de le scinder en deux parties
externe et interne au corps tudi. Si on note G le centre de gravit de lobjet, rG (t) sa position,
vG (t) sa vitesse, et m la masse totale de lobjet, il vient en effet :
Z
L(t) = mrG vG +
(r rG (t)) (v(r, t) vG (t)) (r, t) dr = Lext + Lint .
(t)

Le vecteur Lext = mrG vG est le moment cintique du centre de gravit autour du point
dobservation. Il est exclusivement d la translation de lobjet dans lespace, et se calcule en
fonction de limpulsion totale pG = mvG . Le moment cintique Lint est appel moment cintique
interne de lobjet. Il dcrit uniquement le mouvement de rotation autour du centre de gravit (voir
la figure 12.2).

Fig. 12.2. Moments cintiques externe Lext et interne Lint dun corps rigide en translation/rotation
autour du point origine O.

Les quations dvolution de Lext et Lint peuvent galement tre dcouples. Pour un objet
soumis une densit volumique de forces f (r, t) :
Z
dLext
= rG Ftotale = Mext ,
avec Ftotale =
f (r, t) dr,
dt

o Ftotale reprsente donc la somme intgre de toutes les forces volumiques appliques au solide.
On a galement
Z
dLint
=
(r rG (t)) f (r, t) dr = Mint .
dt

Le moment global appliqu lobjet peut donc tre lui mme scind en deux composantes Mext
et Mint qui agissent respectivement sur le mouvement du centre de gravit et sur le mouvement
de rotation du solide autour de ce centre de gravit.

190

12 Le moment cintique en mcanique quantique :

Moment orbital et Spin

Energie cintique de rotation


Le moment cintique Lext est une fonction de la position rG et de limpulsion pG et nest donc
pas une nouvelle variable de description du systme. En revanche, le moment cintique interne Lint
apprhende un nouvel aspect de la dynamique de lobjet qui chappe la description par le centre
de gravit. Cest un paramtre supplmentaire de description de ltat du systme. Pour le corps
rigide en mouvement, il sous-tend en particulier un terme dnergie cintique supplmentaire,
selon :
p2
Ec = G + Erot .
2m
Le terme Erot est lnergie cintique de rotation du solide sur lui mme. Dans le cas dun corps
symtrie sphrique, elle sexprime selon :
Erot =

Lint 2
,
2I

o I est une grandeur scalaire (de dimension kg m2 ), et appele moment dinertie. Au mme titre
que la masse, cest une caractristique intrinsque de lobjet. Dans le cas gnral de corps non
symtriques, I prend une forme tensorielle. 1

12.2 Le moment cintique orbital


Nous revenons prsent dans le monde quantique. Nous nous intressons ici une particule
en simple translation dans lespace.
Dfinition 12.1. Pour une particule de masse m en mouvement de translation dans lespace, et
dcrite par sa fonction donde (r, t), on appelle moment cintique orbital par rapport lorigine
x, L
y , et L
z dfinies par :
le triplet dobservables L

x = ypz zpy = y ~ z ~ ,

i z
i y

y = zpx x
(12.3)
L
pz = z
x
,

i x
i z

~
~

z = x
py ypx = x
y
,
L
i y
i x
En vertu du principe de correspondance, elle constituent les observables associs aux trois composantes classiques du moment cintique.
Le moment cintique orbital dcrit le mouvement du centre de gravit de la particule, lexclusion de tout mouvement de rotation de la particule sur elle mme (notion qui de toute faon,
chappe au formalisme des fonctions donde). Il est galement utile de dfinir, toujours laide du
principe de correspondance, lobservable norme au carr du moment cintique, selon
2 = L
2x + L
2y + L
2z .
L

(12.4)

12.2.1 Relations de commutation


La commutation des observables sera au coeur de ce chapitre. Nous donnons en annexe D un
formulaire des principales relations impliquant les oprateurs position, impulsion, moment cintique, nergie, et force applique. Soulignons qu ce stade du cours, nous en savons suffisamment
pour dmontrer une une chacune de ces relations (ce qui constitue par ailleurs un excellent
1. Nous renvoyons le lecteur intress aux ouvrages de mcanique de second cycle.

12.2 Le moment cintique orbital

191

exercice). La plupart se dduisent des 9 relations de commutation position-impulsion dsormais


connues :
(
[
x, px ] = [
y , py ] = [
z , pz ] = i~,
[
x, py ] = [
x, pz ] = [
y , px ] = [
y , pz ] = [
z , px ] = [
z , py ] = 0.
Donnons titre dexemple le dtail des calculs pour trois de ces relations.
x , px ] = 0. Pour cela, on explicite lobservable L
x en fonction des
Exemple 12.1. Montrons que [L
observables position et impulsion :
x , px ] = [
[L
y pz zpy , px ] = (
y pz zpy )
px px (
y pz zpy ) = ypz px zpy px px ypz + px zpy .
Or px commute avec y et pz donc ypz px = ypx pz = px ypz . De mme, px commute avec z et py
donc zpy px = zpx py = px zpy . Ceci donne le rsultat escompt.
x , py ] = i~
x :
Exemple 12.2. Montrons que [L
pz . On explicite nouveau lobservable L
x , py ] = (
[L
y pz zpy )
py py (
y pz zpy ) = ypz py zpy py py ypz + py zpy .
Comme py commute avec z et pz , on a py zpy = zpy py et ypz py = ypy pz . Finalement,
x , py ] = ypy pz py ypz = [
[L
y , py ]
pz = i~
pz .
x , V ] = i~(
Exemple 12.3. Montrons enfin [L
y Fz zFy ). On applique le crochet de commutation
3

une fonction test quelconque C0 (R ) :


h
i


x , V = (
L
y pz zpy )V V (
y pz zpy )




~

=
y (V ) z (V ) V
y z
i  z
i
z
y
y
~
V
V
=
y
z
= i~(
y Fz zFy ),
i
z
y
o Fx , Fy et Fz sont les observables associes la force applique au systme.
Principales relations utiles
Nous rcapitulons ci-dessous les principales relations qui nous serviront dans ce chapitre :
h
i h
i h
i
x , r2 = L
y , r2 = L
z , r2 = 0,
L
h
i h
i h
i
x , p2 = L
y , p2 = L
z , p2 = 0,
L
i
i h
i h
h
2z , r2 = 0,
2y , r2 = L
2x , r2 = L
L
i
i h
i h
h
2 , p2 = 0,
2 , p2 = L
2 , p2 = L
L
z
y
x
h
i h
i h
i
2
2
,L
x = L
,L
y = L
2, L
z = 0,
L
ainsi que les relations de non-commutation :
h
i


h
i


x , V = i~ yFz zFy ,
y , V = i~ zFx x
L
L
Fz ,
h
i
h
i
x, L
y = i~L
z,
y, L
z = i~L
x,
L
L

h
i


z , V = i~ x
L
Fy yFx ,
h
i
z, L
x = i~L
y,
L

avec p2 = p2x + p2y + p2z et r2 = x


2 + y2 + z2 . Dautres formules sont donnes en Appendice D.

192

12 Le moment cintique en mcanique quantique :

Moment orbital et Spin

12.2.2 Liens avec la mcanique classique


Equations dvolution du moment cintique
Le thorme dEhrenfest montre que
D E D
E
d

L
=
y

F
,
x
z
y

dt

D E D
E
d
Ly = zFx x
Fz ,

dt

D E D
E

d L
z = x
Fy yFx .
dt
x par exemple,
En effet, pour loprateur L
d D E
1 Dh iE
Lx =
Lx , H ,
dt
i~
=
o le Hamiltonien H
h

p2
2m

+ V . En utilisant les relations de commutation, il vient :

i
h
i h
i


x, H
= 1 L
x , p2 + L
x , V = 0 + i~ yFz zFy ,
L
2m

y et L
z.
do le rsultat. La dmonstration se fait de mme pour les oprateurs L
On observe, en accord avec le principe de correspondance, que les termes de droite ne sont rien
dautre que les valeurs moyennes des observables associes au composantes du moment classique :

yFz zFy

M = r F = zFx xFz .
xFy yFx
Lquation dvolution de la moyenne des grandeurs quantiques apparat donc comme une transposition directe de lquation classique t L = M.
Stabilit du moment cintique dans un potentiel central
Dfinition 12.2. Un potentiel central est un potentiel V (r) qui nest fonction que de la norme r
du vecteur position r.
Le potentiel Coulombien et le potentiel de gravitation centrs sur lorigine sont des exemples
de potentiels centraux.
x, L
y, L
z et L
2 commutent avec
Proposition 12.1. Dans un potentiel central, les observables L
2
p

=
le Hamiltonien H
2m + V .
x, L
y, L
z et L
2 commutent dj avec le terme p2 du Hamiltonien,
Preuve. Comme les observables L
2

x.
il suffit de montrer que Lx , Ly , Lz et L commutent avec V . Traitons par exemple le cas de L
x , V ]), et on calcule
Pour ce faire, on considre D([L
i h i
Lx , V = [yz zy ](V (r)) V (r)[yz zy ] = [yz zy ](V (r)) .
~
Or, [yz zy ](V (r)) = V 0 (r)[yz r zy r], et y r = y/r, z r = z/r. Ceci montre finalement que
x , V ] = 0.
u
[L
t
En consquence, dans un potentiel central, en mcanique quantique comme en mcanique
classique, les composantes et la norme du moment cintique sont des constantes du mouvement.

12.4 Quantification du moment cintique

193

12.3 La dfinition tendue du moment cintique en mcanique


quantique
x, L
y et L
z vrifient les trois
Nous avons pu montrer pour le moment cintique orbital que L
relations de commutation suivantes :
h
i
h
i
h
i
x, L
y = i~L
z,
y, L
z = i~L
x,
z, L
x = i~L
y,
L
L
L
cest dire

i~Lx = Ly Lz Lz Ly ,

z,
i~Ly = Lz Lx Lx L


xL
y L
yL
x.
i~Lz = L

Ces relations revtent en fait une importance toute particulire. Nous allons voir en effet qu elles
seules, elles dterminent pour une large part la forme du spectre de quantification du moment
cintique. On a coutume de les noter sous la forme contracte (cela nest quune notation formelle) :
=L
L,

i~L
x, L
y, L
z ) dsigne loprateur vectoriel dont les composantes sont les trois observables
= (L
o L

Lx , Ly et Lz .
Pour le moment cintique orbital, il sagit de relations dmontres. En revanche, lorsque nous
nous intresserons aux objets en rotation sur eux mmes, il faudra construire de toutes pices un
formalisme spcifique au traitement quantique du moment cintique interne, mettant en jeu de
nouveaux espaces quantiques et de nouveaux oprateurs de moment cintique. Dans ce contexte,
la thorie quantique considre alors ces relations de commutation comme postulat de base sur
les proprits des nouveaux oprateurs introduits. La notion de moment cintique prend ainsi la
dfinition largie suivante :
Dfinition 12.3. En mcanique quantique, on nomme oprateur de moment cintique tout triplet
= (Jx , Jy , Jz ) qui vrifient la relation de commutation fondamentale :
dobservables J
=J
J.

i~J
Du seul fait de ces relations de commutation, dautres proprits de commutation du moment
orbital sont galement conserves. On montre en effet la proprit suivante :
= (Jx , Jy , Jz ) vrifie les relations de commutation :
Proprit 12.1. Tout moment cintique J
h
i h
i h
i
J2 , Jx = J2 , Jy = J2 , Jz = 0,
avec J2 = Jx2 + Jy2 + Jz2 .
Remarque 12.3. La relation i~a = a a pour un vecteur a peut paratre choquante (Chacun sait
en effet que pour des vecteurs a R3 , on a a a = 0). Ici, cette relation est vraie dans un espace
doprateurs o le produit nest pas commutatif. Cette bizarrerie est donc parfaitement possible...
est traditionnelle en mcanique quantique pour dsigner un opRemarque 12.4. La notation J
est rserve aux seuls moments
rateur de moment cintique dans le cas gnral. La notation L
cintiques orbitaux.

12.4 Quantification du moment cintique


Nous considrons un oprateur moment cintique dans sa dfinition la plus large, savoir un
= (Jx , Jy , Jz ) dont la seule proprit connue est i~J
=J
J.

triplet dobservables J

194

12 Le moment cintique en mcanique quantique :

Moment orbital et Spin

12.4.1 Que quantifier ?


Quantifier le moment cintique revient chercher la nature de ses tats propres et de ses
ntant pas directement un observable, cest plus prcisment les
valeurs propres. Loprateur J
oprateurs composantes Jx , Jy et Jz qui nous intressent. Le terme de quantification prsume dj
(mais il sagit dun des rsultats que nous montrerons ici) du caractre discret des spectres de ces
oprateurs.
Ce nest pas la premire fois que nous avons affaire un triplet dobservables. En effet, limpulsion p de la particule qui se dplace dans un espace 3 dimensions est elle mme prise en
compte en mcanique quantique comme une association de trois oprateurs px , py et pz . Dans le
cas de limpulsion, les ondes de De Broglie fournissent une base dtats |k (r)i = eikr qui sont
simultanment tats propres (gnraliss) des 3 oprateurs, selon :
px |k i = ~kx |k i,

py |k i = ~ky |k i,

pz |k i = ~kz |k i.

On pourrait de mme se demander sil existe une base de kets orthogonaux |n i et de valeurs
propres an , bn et cn telles que
Jx |n i = an |n i,

Jy |n i = bn |n i,

Jz |n i = cn |n i.

Malheureusement, les seules familles doprateurs pouvoir tre diagonaliss simultanment dans
une mme base sont les familles doprateurs qui commutent deux deux. Ceci tait le cas de px ,
py et pz , mais ce nest en revanche pas celui de Jx , Jy et Jz .
Le traitement du problme de quantification passe ainsi par la diagonalisation dun seul de ces
oprateurs, traditionnellement Jz . Le rsultat de quantification se transpose ensuite Jx et Jy au
prix de changements de bases dans lespace des kets, changements de base qui correspondent en
fait des changes daxes dans lespace 3D. Il existe toutefois une relation de commutation qui
permet de simplifier le travail : celle entre entre Jz et J2 . Comme ces deux oprateurs commutent,
il est possible de leur rechercher une base dtats propres commun. Certes, seul Jz paraissait nous
importer, mais nous avons l un plus dont la thorie quantique trouve dommage de se priver.
Cest ainsi quen thorie quantique, on nomme quantification du moment cintique le travail
de diagonalisation simultane de Jz et J2 .
12.4.2 Le rsultat de quantification
= J
J,
il est possible de montrer le
Sur la base des seules relations de commutation i~J
rsultat suivant :
= (Jx , Jy , Jz ), les
Thorme 12.1. Etant donn un triplet doprateurs de moment cintique J
2
2
2
2
oprateurs Jz et J = Jx + Jy + Jz sont diagonalisables dans une mme base, avec les proprits
suivantes :
(1) Leurs valeurs propres sont de la forme gnrale m~ pour Jz et j(j + 1)~2 pour J2 , avec j et
m deux nombres rels sans dimension.
(2) Les seules valeurs possibles pour j sont les nombres positifs entiers ou demi-entiers, cest
dire :
1
3
5
j = 0, , 1, , 2, , . . .
2
2
2
(3) Pour une valeur de j fixe, les seules valeurs possibles pour m sont les (2j + 1) nombres relatifs
entiers ou demi-entiers :
m = j, j + 1, j + 2, . . . , j 2, j 1, j
(4) Pour une valeur de j fixe, les sous espaces propres Vj,m communs Jz et J2 obtenus pour
diffrentes valeurs de m ont mme dimension, nulle, finie ou infinie, et note dj .

12.4 Quantification du moment cintique

195

Ce rsultat signifie quil existe, pour lespace de Hilbert sur lequel les observables Jz et J2
oprent, une base orthonormale de vecteurs que nous notons |j, m, ki, indics par les nombres j
et m autoriss ci-dessus ainsi que par un troisime nombre entier positif k tel que 1 k dj , qui
vrifient :
(
Jz |j, m, ki = m~|j, m, ki,
j, m, k,
J2 |j, m, ki = j(j + 1)~2 |j, m, ki.
Les indices entiers ou semi entiers j et m permettent de dsigner le sous espace propre Vj,m dappartenance du vecteur considr. Lindice entier k distingue, en cas de sous espaces de dimension dj
suprieure 1, les diffrents vecteurs de base de ce sous espace.
Remarque 12.5. Nous apprenons ici quelles sont les valeurs propres mathmatiquement autorises
= J
J.
Cela ne signifie pas pour
pour un moment cintique, au vu de la relation fondamentale i~J
autant que face une situation concrte, toutes ces valeurs apparaissent. Cest situation physique
par situation physique que sont dtermines les dimensions dj des sous espaces, et ainsi quelles
sont les valeurs propres qui se manifestent effectivement.
Remarque 12.6. Pour noncer ce rsultat, loprateur Jz a t choisi de manire arbitraire. Il est
aussi possible de diagonaliser simultanment Jx et J2 dune part, et Jy et J2 dautre part. Les
valeurs propres et les dimensions dj trouves restent alors les mme. Les sous espaces propres de
Pj
J2 forms par la somme despaces Vj = m=j Vj,m restent galement inchangs. Seul le dtail
des sous espaces Vj,m obtenus pour les diffrentes valeurs de m se trouve modifi.
Remarque 12.7. Ce rsultat montre que quelque soit la situation considre, nous sommes en prsence de spectres discrets. Ces spectres sont entirement dicts par la valeur de la constante de
Planck, lexclusion de tout paramtre spcifique au systme. Ces spectres ont donc la particularit
de ne pas pouvoir tendre vers un continuum quand on se dplace vers des situations classiques.
Le pas de discrtisation des composantes, qui vaut ~ 1034 kg m2 s1 nest cependant pas trs
contraignant, et passe bien souvent inaperu !
12.4.3 Elments de dmonstration
Nous donnons ici la trame gnrale de la dmonstration du rsultat de quantification. On
suppose tout dabord que le spectre des oprateurs de moment cintique est purement discret.
Tous les rsultats utiliss ne sont pas dmontrs dans le dtail. Le point essentiel est de mesurer
la prcision des renseignements laquelle on peut parvenir uniquement grce un usage habile
des relations de commutation.
Etape 1 : (J2 ) [0, +[

D
E
Pour D(Jx2 ), on a |Jx2 | = kJx k2 car Jx est auto-adjoint. Ceci montre que Jx2 est
positif. Ainsi, J2 = Jx2 + Jx2 + Jx2 est galement positif. On peut ainsi rechercher les valeurs propres
de J2 sous la forme j(j + 1)~2 avec j un rel positif ou nul. En effet, lapplication j 7 j(j + 1)
dfinit bien une bijection de R+ sur R+ .
Nous pouvons donc utiliser les notations |j, m, ki et Vj,m introduites dans le thorme. En effet,
comme Jz et J2 commutent, il existe une base commune de diagonalisation de ces deux oprateur.
On peut alors chercher une base orthonormale de vecteurs |j, m, ki telle que
(
Jz |j, m, ki = m~|j, m, ki,
J2 |j, m, ki = j(j + 1)~2 |j, m, ki.
La diffrence avec le thorme vient cependant qu ce stade de la dmonstration, j et m ne sont
a priori que des nombres rels dont nous ne connaissons rien (hormis j 0). Nous ne savons rien
non plus des dimensions dj,m des sous espaces Vj,m .
Afin de nous reprer dans lvolution de la dmonstration, nous dessinons dans le plan (j, m)
les lieux reprs comme possibles pour les valeurs propres (voir la figure 12.3).

196

12 Le moment cintique en mcanique quantique :

Moment orbital et Spin

Fig. 12.3. Etape 1 de la dmonstration : Plan des nombres quantiques j et m : la zone des couples (m, j)
identifis comme impossibles au vu du rsultat sur la positivit de j est hachure. La zone des couples
(m, j) encore potentiellement valables reste en blanc. Cette dernire zone inclue laxe vertical j = 0.

Etape 2 : j m j
On dfinit les deux oprateurs, conjugus lun de lautre
J+ = Jx + iJy ,

J = Jx iJy .

Notons quils ne sont pas hermitiens, et ne peuvent donc pas correspondre des observables. Du
fait des relations de commutation entre Jx , Jy et Jz , on peut montrer que ces deux oprateurs
commutent avec J2 . On peut calculer sur la base des relations de commutation que :
J+ J = J2 Jz2 + ~Jz ,

J J+ = J2 Jz2 ~Jz .

Il vient alors

2


J+ |j, m, ki = hj, m, k|J J+ |j, m, ki = j(j + 1)~2 m2 ~2 m~2

(12.5)

= ~2 [j(j + 1) m(m + 1)] 0.


De mme,


2


J |j, m, ki = ~2 [j(j + 1) m(m 1)] 0.

On dduit de ces ingalits respectivement que (j + 1) m j et j m j + 1, soit


j m j.
Etape 3 : (j m) est un nombre entier positif ou nul
Examinons quelques proprits du vecteur J+ |j, m, ki. Tout dabord, on dduit des deux rsultats prcdents, que J+ |j, m, ki est nul la seule condition que j = m. On peut par ailleurs
calculer que :




Jz J+ = Jz Jx + iJz Jy = i~Jy + Jx Jz + i i~Jx + Jy Jz = ~J+ + J+ Jz .
Ainsi,



Jz J+ |j, m, ki = (m + 1)~J+ |j, m, ki.

En outre, comme J+ et J2 commutent,

12.4 Quantification du moment cintique

197

Fig. 12.4. Etape 2 de la dmonstration : Reprsentation graphique de la condition j m j dans


le plan des nombres quantiques j et m. La zone hachure indique les couples (j, m) identifis comme
impossibles. Les demi-droites m = j et m = j (j 0) restent des lieux possibles.



J2 J+ |j, m, ki = J+ J2 |j, m, ki = j(j + 1)~2 J+ |j, m, ki.
Dans la mesure o J+ |j, m, ki nest pas le vecteur nul (cest dire m 6= j), ceci montre quil est
vecteur propre commun de Jz et J2 pour les valeurs propres (m + 1)~ et j(j + 1)~2 respectivement.
Pour une valeur de j fixe, si on dispose dun vecteur |j, m, ki dj identifi comme lment
de la base recherche, il est possible de construire des vecteurs de type J+ |j, m + 1, ki, J+ |j, m +
2, ki,. . . ,J+ |j, m + p, ki,. . . (p entier), prouvant par l mme lexistence des couples de valeurs
propres (j, m + 1), (j, m + 2),. . . , (j, m + p),. . . Cette construction ne peut tre arrte que sil
existe un nombre entier positif p tel que m + p = j. Dans ce cas en effet J+ |j, m + p, ki = 0
(par (12.5)), et lorsquon itre par J+ , on ne gnre plus que des vecteur nuls. Le dernier couple
dindices gnr par la rcurrence est alors le couple (j, m + p) = (j, j).
Or, les valeurs propres vrifient m j. La rcurrence ne peut donc jamais se poursuivre
indfiniment. Quel que soit le vecteur |j, m, ki pris dans la base orthonormale recherche, il existe
donc un entier p positif ou nul tel que j = m + p (voir la figure 12.5).

Fig. 12.5. Etape 3 de la dmonstration : Action de loprateur J+ sur les couples de valeurs (j, m). Les
seules zones restant autorises pour ces valeurs sont les demi droites m = j-entier (m j).

198

12 Le moment cintique en mcanique quantique :

Moment orbital et Spin

Etape 4 : j est un nombre entier ou demi-entier


On montre tout dabord que (j + m) est un nombre entier positif ou nul, de mme manire que
le rsultat prcdent, mais en considrant loprateur J qui induit une rcurrence descendante sur
les valeurs de m, et ce, toujours j fix. Ainsi, 2j est entier, et on conclut laide du dessin de la
figure 12.6. A ce stade, nous avons dj prouv les rsultats 1, 2 et 3 du thorme de quantification.

Fig. 12.6. Etape 4 de la dmonstration : Seuls subsistent les points dintersection entre les demi-droites
m = j entier avec m j et m = j+entier avec m j. On observe que lensemble de ces points sont
de coordonnes entires ou demi-entires.

Etape 5 : Pour j m < j, les espaces Vj,m et Vj,m+1 ont mme dimension
Il reste prciser les dimensions des sous espaces propres. Il peut se produire en premier lieu
que les deux sous espaces soient de dimension nulle. Il ny a alors rien dmontrer. Nous nous
interessons au cas o au moins un des sous-espaces, Vj,m par exemple, a une dimension dj,m 1.
La dmonstration qui suit sadapte sans difficult au cas o linformation initiale est dj,m+1 1.

Fig. 12.7. Etape 5 de la dmonstration : Egalit des dimensions des sous espaces associs des mmes
valeurs de j.

12.5 Quantification du moment cintique orbital

199

Considrons J+ comme une application de Vj,m vers Vj,m+1 uniquement. Nous allons montrer
que J+ est injective. On a dj tabli que
|i Vj,m ,

J J+ |i = ~2 [j(j + 1) m(m + 1)] |i Vj,m .

Comme ici j m j 1, le terme [j(j + 1) m(m + 1)] nest pas nul. Loprateur J J+
restreint Vj,m est donc un simple oprateur de multiplication par une constante diffrente de 0,
donc une injection. Loprateur J+ est donc lui mme injectif. Ceci montre que
dj,m+1 dj,m .
Lingalit inverse stablit en montrant de mme que lapplication J est injective de Vj,m+1
vers Vj,m (voir la figure 12.7).

12.5 Quantification du moment cintique orbital


La recherche des tats propres du moment cintique orbital peut se faire de manire analytique.
Les rsultats snoncent dans le systme de coordonnes sphriques (r, , ) (voir la figure 12.8).
z, L
2 et L
sexpriment selon :
Dans le formalisme des fonctions donde, les oprateurs L
 2


1
1 2
2
2

L = ~
+
+
,
2
tan sin2 2
z = ~ ,
L
i


= ~ei + i cot .
L

Le rsultat de quantification apparat un cas particulier du rsultat gnral de quantification


(Thorme 12.1) :

Fig. 12.8. Dfinition des coordonnes sphriques , et .

z et L
2 sont diagonalisables
Proposition 12.2. Les observables de moment cintique orbital L
dans une mme base orthonorme, avec les proprits suivantes :
z et L
2 sont de la forme m~ et l(l + 1)~2 respectivement, avec l N, et
(1) les valeurs propres de L
m Z tel que l m l. Les nombres l et m sont appels nombres quantiques. Ils indicent
les sous espaces propres communs aux deux oprateurs ;

200

12 Le moment cintique en mcanique quantique :

Moment orbital et Spin

(2) les sous espaces propres Vl,m sont de dimension infinie ;


(3) La forme gnrale des tats propres du sous-espace Vl,m est, dans le formalisme des fonctions
donde,
(r, , ) = Ylm (, )f (r),
avec f (r) une fonction quelconque de la variable radiale r, dite partie radiale de la fonction donde, et Ylm (, ) une famille de fonctions indices par l et m, dites harmoniques
sphriques (voir le 12.5).
On pourra remarquer, cest une tradition en mcanique quantique, que le nombre quantique
que nous avions not j dans le cas gnral se note l dans le cas particulier du moment orbital. La
liste des valeurs propres et des dimensions de sous espaces qui apparaissent ici est rsume dans
le diagramme de la figure 12.9.

Fig. 12.9. Dimensions des sous espaces Vj,m pour le moment cintique orbital : seules les valeurs propres
entires sont autorises, avec des dimensions de sous-espace infinies.

Cest le fait que, dans la forme gnrale des tats propres, la partie radiale puisse tre choisie
de manire arbitraire, qui implique que les sous espaces propres sont de dimension infinie. Le fait
que les nombres quantiques l et m ne puissent prendre que des valeurs entires est quant lui
une consquence de ce que nous travaillons dans un espace de fonctions donde de lespace trois
dimensions (variables (r, , ) en coordonnes sphriques), comme le montre la dmonstration qui
suit. La recherche analytique des tats propres du moment cintique orbital fait plein usage des
rsultats gnraux sur la quantification des moments cintiques. Nous en donnons ici les grandes
lignes.
Etape 1 : Forme factorise des tats du type |l, l, ki
Les tats |l, l, ki, cest dire, les tats du type |l, m, ki pour lesquels m = l, sont tels que
(
J+ |l, l, ki = 0,
Jz |l, l, ki = l~ |l, l, ki.
Notant l,l,k (r, , ) la fonction associe |l, l, ki, on a alors, dans le formalisme des fonctions
donde,

12.5 Quantification du moment cintique orbital

201




l,l,k
l,l,k
i

~e
+
i
cot

=0

~ l,l,k = l~ l,l,k .
i
On constate en premier lieu quaucune drive en r nintervient dans ce systme. Il est donc
possible de factoriser l,l,k selon : l,l,k (r, , ) = f (r)g(, ), avec f (r) arbitraire. On obtient
pour la partie angulaire g(, ) :

g
g
g

+ i cot
=
lg cot = 0,

g = ilg.

De la seconde quation, on dduit que g(, ) se factorise lui mme en g(, ) = h()eil , avec
h() une nouvelle fonction quil reste dterminer.
Etape 2 : l est entier
En tant que partie angulaire dune fonction de lespace, g(, ) doit vrifier g(, ) = g(, +
2). Il est donc ncessaire, au vu de la forme factorise de g(, ), que ei2l = 1. On en dduit que
l est obligatoirement un nombre entier. Alors mme que le thorme gnral de quantification du
=L
L
autorisent a priori les
moment cintique montre que les relations de commutation i~L
valeurs demi-entires de l, ces valeurs se rvlent ici interdites.
Etape 3 : Forme gnrale des tats |l, l, ki
Cette forme est obtenue en rsolvant, l entier fix, lquation sur h(), i.e. h = l~ cot . La
solution gnrale obtenue pour l,l,k (r, , ) est ainsi
l

l,l,k (r, , ) = Cl,k (sin ) eil fk (r),


avec Cl,k une constante de normalisation. On peut vrifier quil sagit galement bien dtats
2 avec la valeur propre l(l + 1)~2 .
propres de loprateur L
Etape 4 : Forme gnrale des autres tats |l, m, ki
Elle peut sobtenir en appliquant la rcurrence descendante :
1
l,m1,k (r, , ) = p
J l,m,k (r, , ).
~ l(l + 1) m(m 1)
Dans cette rcurrence, la variable r nest quun paramtre. Avec cette manire de procder, l et
k fixs, toutes les fonctions donde l,m,k (r, , ) obtenues pour m = l, . . . , l ont ainsi la mme
partie radiale fk (r), et ne diffrent que par leur partie angulaire.
Application : les orbitales atomiques pour les atomes hydrognodes
Nous prcisons ici la forme des orbitales atomiques pour des atomes hydrognodes, cest--dire
dans le cas o une charge positive Z e est place en x = 0. Dans ce cas, le Hamiltonien du systme
est
2
2
= ~ Ze .
H
2m
40 |x|
On se place par la suite en units atomiques (voir Appendice A, A.2). Dans ce cas, on a en
coordonnes sphriques :

202

12 Le moment cintique en mcanique quantique :

Moment orbital et Spin

2
= 1 Z = 1 (r) 1 S Z .
H
2
|x|
2r r2
2r2
r

Loprateur S est loprateur de Laplace-Beltrami, qui est lanalogue du Laplacien sur la


2 , et cet oprateur a pour vecteurs propres les harmoniques
sphre S2 . On montre que S = L
sphriques.
Dfinition-Proposition 12.1 (Harmoniques sphriques). Les harmoniques sphriques sont
les vecteurs propres de S , et on les note (Yl,m )l0, lml . Ces fonctions forment une base
hilbertienne de L2 (S2 ) :
pour tous couples (l, m), (l0 , m0 ) tels que l, l0 0, l m l, l0 m0 l0 ,
D

Ylm , Ylm
0

E
L2 (S2 )

=
0

Ylm (, )Ylm
(, ) sin d d = ll0 mm0 ;
0

toute fonction f L2 (S2 ) se dcompose de manire unique sur la base des harmoniques
sphriques :
+ X
l
X
f=
hYlm , f iL2 (S2 ) Ylm ,
l=0 m=l

la srie ci-dessus tant convergente au sens de L2 (S2 ).


2 et L
z :
les fonctions Ylm sont des vecteurs propres de L
S Ylm = l(l + 1)Ylm ,

i Ylm = mYlm .

Lexpression analytique des harmoniques sphriques est



Ylm (, )

2l + 1 (l m)!
4 (l + m)!

1/2
Plm (cos ) eim ,

o les fonctions Plm (cos ) sont obtenues partir des polynmes de Legendre
Pl (x) =
par m drivations :

Pl (cos ) =


(1)l dl 
(1 x2 )l
l
l
2 l! dx

(m)

(sin )m Pl

(cos )

(l + m)! m

Plm (cos ) = (1)m


P
(cos )
(l m)! l

si 0 m l,
si l m 0.

et L
2, L
z commutent. On peut donc chercher des vecteurs propres
On vrifie facilement que H
communs tous ces oprateurs, qui sont donc de la forme :
(r, , ) = R(r)Ylm (, ).
= E donne une quation sur la partie radiale R du vecteur propre :
Ainsi, H

l(l + 1)
Z
1 d2
(rR(r)) +
R(r) R(r) = ER(r).
2r dr2
2r2
r

On peut montrer (voir par exemple [6, 6.1.2]) qu l fix, on a une famille de parties radiales
(Rn,l )n>l de la forme gnrale
Rn,l (r) = Qn,l (Zr) eZr ,
Z
associes une nergie En,l = 2n
2 qui ne dpend pas de l. Les fonctions Qn,l sont des polynmes
de degr n l 1 0. En rsum,

12.6 Le spin

203

forment une suite (En )n1 avec En = Z2 ;


les valeurs propres de H
2n
la valeur propre En est de multiplicit n2 , et les n2 vecteurs propres nlm (r, , ) =
Qnl (r) eZr Ylm (, ) (0 l n 1, l m l) forment une base du sous-espace associ ;
sont galement vecteurs propres de L
2 et L
z , associs respective ces vecteurs propres de H
ment aux valeurs propres l(l + 1) et m.
On classifie les tats propres de nombres quantiques n, l, m selon le nombre quantique principal n,
suivi dune lettre correspondant au nombre quantique azimutal l (l = 0, 1, 2, 3 correspondent
respectivement aux lettres s,p,d,f). Par exemple, le vecteur propre 100 reprsente lorbitale 1s, et
les cinq vecteurs propres 32m sont les orbitales 3d.

12.6 Le spin
12.6.1 Dfinition
Les particules du monde physique, telles que les protons, les neutrons, les lectrons et plus
gnralement - et de manire non exhaustive - tous les noyaux datomes sont porteurs dun moment
cintique interne. Au mme titre que le moment Lint des corps rigides en mcanique classique, il
constitue pour ces particules un nouveau degr de libert. Il ne remet pas en cause la description par
la fonction donde, qui reste le bon outil pour apprhender les tats de translation travers lespace
tridimensionnel, mais vient complter cette dernire, en apportant une information supplmentaire
sur ltat du systme. Ce moment cintique sort donc du cadre de description donn par la fonction
donde, et ne correspond pas un moment orbital. En dpit de son analogie avec un moment
cintique interne, il na dailleurs aucun rel quivalent en mcanique classique. Cest un moment
cintique dun nouveau type, purement quantique, que lon nomme spin.
Vis vis du formalisme quantique, qui dit nouveau degr de libert dit nouvel espace de Hilbert
pour le dcrire. Par bonheur, alors que maintenant, fonction donde et spin dcrivent conjointement
la particule, ces deux aspects peuvent tre dissocis en premire approche. On peut ainsi construire
un nouvel espace quantique propre au spin, nomm espace de spin. Ce sont les vecteurs norms
de cet espace qui sont reprsentatifs des diffrents tats de spin accessibles au systme.
Sur cet espace, le spin prend la forme dun oprateur de moment cintique au sens largi, cest
dire, un triplet dobservables :
= (Sx , Sy , Sz ).
S
Ces oprateurs de spin vrifient, comme tout moment cintique, les relations de commutation 2 :
=S
S.

i~S
12.6.2 Espace de spin
Nous acceptons les principes suivants, historiquement issus de lexprience :
Dfinition 12.4. Lespace de spin dune particule est dfini par les quatre principes :
(1) toute particule est associ un nombre I entier ou demi entier, et positif ou nul : le nombre
de spin ;
(2) lespace de spin de la particule est un espace de Hilbert de dimension 2I + 1 ;
2. Voil qui est un peu flou. Nous ne savons toujours pas exactement sur quel espace nous travaillons,
et lon dfinit dj des oprateurs. Cest cependant le maximum que peuvent apporter les principes de la
mcanique quantique. Plus choquant, ou plus puissant peut tre, est mme le fait que nous connaissons dj
pratiquement les spectres de ces oprateurs de spin, avant mme de savoir quel espace ils sappliquent.
Il y a aujourdhui des thories physiques (hors programme !) qui permettent de prdire la forme de ces
espaces. Historiquement, ce nest pourtant pas la thorie, mais simplement lexprience, qui a permis den
deviner la nature.

204

12 Le moment cintique en mcanique quantique :

Moment orbital et Spin

(3) dans cet espace, les nombres quantiques (j, m) autoriss pour les tats propres des oprateurs Sz
et S2 sont uniquement ceux vrifiant :
(
j = I,
m = I, I + 1, . . . , I 1, I ;
(4) les sous espaces VI,m obtenus pour les 2I + 1 valeurs possibles de m sont de dimension 1.
Le nombre de spin nest pas une proprit qui dpend des circonstances. Cest une caractristique intrinsque du type de particule considr. Par exemple,
tous les lectrons, tous les protons, et tous les neutrons ont un spin 21 ;
tous les noyaux de deutrium (isotope de lhydrogne, dont le noyau est form dun proton
et dun neutron) ont un spin 1.
On peut par ailleurs remarquer que pour tout ket | i de lespace de spin :
S2 | i = I(I + 1)~2 | i.
Tous les kets de lespace de spin sont donc tats propres de S2 pour la valeur propre I(I + 1)~2 .
On peut interprter cela avec les mains comme le fait que le moment cintique interne dune
particule possde une norme parfaitement fixe quaucun facteur physique externe ne peut venir
modifier. La vitesse de rotation dune particule sur elle mme ne peut ainsi tre ni ralentie, ni
acclre. Tout au plus peuvent avoir lieu des modifications dorientation de laxe de rotation.
Base orthonormale de lespace de spin
Une base orthonormale naturelle de lespace de spin dune particule de nombre de spin I est
obtenue en prenant les vecteurs propres (tous dordre de multiplicit 1) de Sz (voir la figure 12.10).
Pour le spin 32 , on les note par exemple :


  
3
1
1
3




,
2
2 , 2 , 2 .
On ne fait alors rfrence quau nombre quantique m = 23 , 12 ,
grande importance.

1
2,

3
2,

puisque j ici na plus

Le spin : un moment venu dailleurs


Il est possible, et mme assez courant, davoir des nombres de spin demi-entiers. Ces nombres
quantiques sont pourtant strictement interdits pour les moments orbitaux. Il faut accepter lide
que les particules ne tournent pas dans notre espace trois dimensions, mais ailleurs. Spins et
moments orbitaux ont donc bien une nature diffrente.
12.6.3 Manifestations physiques du spin
Pour autant quil vive ailleurs, le spin sait se manifester dans notre monde. Il confre en effet
la particule qui le porte un certain nombre de proprits physiques bien palpables :
la particule de spin non-nul (cest dire I > 0) est porteuse dun moment magntique
diplaire. Ce vecteur moment magntique est rgi par la mcanique quantique. Il est proportionnel au spin selon la relation formelle :

= S.
On le dcrit, au mme titre que le moment cintique ou limpulsion, par un triplet dobservables
= (
x ,
y ,
z ). La constante qui apparat est dite rapport gyromagntique de la
particule. Elle est, au mme titre que I, une caractristique intrinsque de cette dernire ;

12.6 Le spin

Fig. 12.10. Dimensions des sous espaces Vj,m dans lexemple du spin de nombre I =
espaces pour lesquels j = 23 sont autoriss. Ils sont chacun de dimension 1.

3
2

205

: seuls les 4

la particule de spin I 1 est galement porteuse dun quadriple lectrique.


Le spin des particules est ainsi capable de ragir lorsquon lui applique des champs lectromagntiques, et peut en retour lui mme en crer. Cette proprit concerne sans distinction les particules
charges lectriquement et les particules neutres. Le neutron, de spin 12 , a donc droit lui aussi
son diple magntique.
Historiquement, cest une interaction avec un champ magntique qui a permis pour la premire
fois aux spins des noyaux atomiques de trahir leur prsence. Depuis, diffrentes techniques de spectroscopie ont t dveloppes, notamment la rsonance magntique nuclaire (RMN, developpe
partir des annes 80), qui font usage des ces proprits pour sonder la matire. Elles permettent
danalyser avec une facilit tonnante la structure chimique des composs, ou encore, depuis peu,
de dterminer la conformation spatiale des protines dans les tissus vivants. Citons galement
la branche cousine de la RMN quest lImagerie par Rsonance Magntique (IRM), technique de
tomographie 3D, ne au mme moment, qui a rvolutionn le diagnostic mdical.
Outre leurs proprits lectromagntiques, les spins ont des implications profondes sur le comportement des systmes quantiques plusieurs particules (voir le chapitre 13, o il sera question
du principe de Pauli).
12.6.4 Un exemple despace de spin : lespace du spin

1
2

Lespace de spin 12 , premier espace de spin non nul, nest pas le moindre cependant car il correspond au cas des protons, des lectrons, des neutrons,
plusieurs noyaux atomiques. Cest
et de 
un espace de dimension 2. La base dtats propres 12 , 12 de loprateur Sz est traditionnellement note
| i, | i.
On prononce : spin up et spin down. Ces notions de up et down font rfrence lorientation du
spin de long de laxe z. Attention cependant, car dans lespace de spin, | i et | i sont des kets
orthogonaux, et ne sont donc en aucun cas les opposs lun de lautre. Nous touchons l encore au
fait que les kets rendent compte de ltat du spin, mais ne sont pas le spin. Tout tat de spin | i
normalis sexprime ainsi selon :
| i = | i + | i,

||2 + ||2 = 1.

206

12 Le moment cintique en mcanique quantique :

Moment orbital et Spin

Il est parfois utile, dans cet espace de dimension 2, de travailler avec des notations matricielles.
Dans la base | i, | i on note ainsi
!

|i =
.

Les observables Sx , Sy et Sz sont galement reprsentes sous forme matricielle :








~ 0 1
~ 0 i
~ 1 0
Sx =
,
Sy =
,
Sz =
.
2 1 0
2 i 0
2 0 1
Ces formes de matrices, que nous nous contentons ici dadmettre, prennent le nom de matrices de
Pauli.
On peut galement prciser le Hamiltonien dans lespace de spins. En labsence de toute sollicitation extrieure, celui ci-est nul. 3 Ltat de spin est donc stationnaire au cours du temps. En
revanche, en prsence dun champ lectromagntique, des termes apparaissent. Par exemple, dans
un champ magntique uniforme B, on a, en vertu du principe de correspondance,
= B
[
H
= Bx
x By
y Bz
z


= Bx Sx + By Sy + Bz Sz ,
soit, en notations matricielles,
= ~
H
2

Bz
Bx iBy
Bx + iBy
Bz

Lhistoire a donn des noms aux divers Hamiltoniens susceptibles dagir sur les espaces de spins.
Le Hamiltonien dinteraction avec B sappelle ici Hamiltonien de Zeeman.

3. Attention, ceci ne veut pas dire que loprateur Hamiltonien est nul dans lespace des fonctions
dondes ! On sintresse ici seulement son action sur les spins.

12.6 Le spin

207

Exercices
Exercice 12.1. Dmontrer la Proprit 12.1
Exercice 12.2 (Satellite terrestre et quantification).
Comme nimporte quel systme matriel li, un satellite artificiel de la Terre voit ses mouvements quantifis. On considre ici un satellite de masse m en orbite circulaire basse (r R =rayon
de la Terre).
(1) Rappeler, en fonction de la constante de gravitation terrestre g 10 N m1 , la relation entre
la vitesse v du satellite, et le rayon r de sa trajectoire.
(2) Calculer approximativement le nombre quantique l correspondant au moment cintique dune
telle orbite.
(3) Quelle est la distance qui spare deux orbites voisines ?
(4) Calculer lnergie ncessaire pour passer dune orbite basse lorbite quantifie voisine.
(5) A quelle variation de l correspondrait une modification daltitude de 1 m ?
Exercice 12.3 (Le four micro-ondes).
On approxime une molcule deau H2 O comme lassemblage rigide dun atome doxygne
(nombre de masse A = 16) et de deux atomes dhydrognes (nombre de masse A = 1). Les
\
noyaux dhydrogne sont situs une distance denviron 1 de celui doxygne, et langle HOH
est denviron 105.
(1) On assimile le noyau doxygne au centre de masse de la molcule. Calculer le moment dinertie I de la molcule lorsque celle-ci tourne sur elle-mme autour dun axe perpendiculaire
son plan HOH.
(2) Le moment cintique de la molcule deau est quantifi la manire dun moment orbital.
Exprimer en fonction de I et de ~ lnergie cintique Erot de rotation de la molcule en
fonction de son nombre quantique l.
(3) Quel est lordre de grandeur de lcart dnergie entre les niveaux les plus bas ?
(4) A quelle longueur donde et quelle frquence f de photon cette nergie correspond-elle ? (La
gamme des micro-ondes correspond des frquences entre 0.4 et 250 GHz.)
Exercice 12.4 (Loscillateur harmonique).
Les techniques de calcul utilises pour extraire les proprits spectrales des oprateurs de moment cintique partir des proprits de commutations peuvent sappliquer de manire fructueuse
dautres systmes. Nous tudions ici le cas unidimensionnel de loscillateur harmonique, dans
lequel une particule de masse m est confine dans un potentiel de la forme :
V (x) =

1
m 2 x2 .
2

Nous allons montrer que les niveaux dnergie quantifis pour cette particule sont


1
~,
n N.
En = n +
2
(1) Donner, en fonction des oprateur position x
et impulsion px , lexpression du Hamiltonien
qui gouverne la particule.
unidimensionnel H
(2) On introduit les oprateurs a
+ et a
, dits respectivement oprateurs de cration et dannihilation
(cette appelation vient de la thorie quantique des champs, dans laquelle ces deux oprateurs
sont abondament utiliss) :


r
r
1
m
px
m
px
1
+
,
a
=
.
x
+ i
x
i
a
=
~
~
2
2
m~
m~

208

12 Le moment cintique en mcanique quantique :

Moment orbital et Spin

=a
Donner, en fonction de x
et px , lexpression de loprateur N
+ a
. En dduire que


= N
+ 1 ~.
H
2
] et [
].
(3) Calculer les commutateurs [
a, a
+ ], [
a, N
a+ , N
, et | i un tat propre normalis associ. Montrer que :
(4) Soit une valeur propre de N
| i) ;
est ncessairement positif (Considrer
la quantit h |N

a
| i est un vecteur de norme ;

si 6= 0, a
| i est un vecteur propre de N
pour la valeur propre ( 1) ;
+
pour
si 6= 0, a
| i est un vecteur de norme + 1, et galement un vecteur propre de N
la valeur propre ( + 1).
(5) En dduire, laide dun raisonnement inspir de la dmonstration de la quantification des
sont entires et que le spectre de N
est
moments cintiques, que les valeurs propres de N

constitu de tous les entiers positifs ou nuls. Conclure sur les valeurs propres de H.

13
Le principe de Pauli : fermions et bosons

Le Spin, assimilable au moment cintique interne des particules, est un concept purement
quantique. On ne peut quimparfaitement lapprhender dans le monde de la physique classique,
et il droute notre intuition par le fait que ses nombres quantiques puissent prendre des valeurs
demi-entires interdites aux moments orbitaux. Nous voyons dans ce chapitre, quoutre leurs manifestations lectromagntiques, les spins sont lorigine de phnomnes dinteractions particulires
entre particules de mme type. Le principe de Pauli explicite ces nouveaux phnomnes, et classe,
en fonction des interactions dveloppes, les particules physiques en deux groupes : les fermions et
les bosons. Nous dtaillons sur un exemple simple deux consquences essentielles de ce principe :
les rgles de remplissage des niveaux dnergie lectroniques dans les atomes et les molcules, et
le phnomne dit dinteraction dchange, qui conditionne lexistence des aimants temprature
ambiante.

13.1 Systme de plusieurs particules identiques . . . . . . . . . . . . . . . . . . . . . . . 209


13.1.1 Position du problme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
13.1.2 Description quantique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
13.1.3 Indiscernabilit des particules et symtrie de la fonction donde . . . . . . 210
13.2 Principe de Pauli : spin, fermions et bosons . . . . . . . . . . . . . . . . . . . . . 211
13.3 Systme de deux particules sans spin . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
13.3.1 Deux particules discernables sans spin dans le fond dun puits
quantique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
13.3.2 Paire de bosons dans le fond dun puits quantique . . . . . . . . . . . . . . . . . . 213
13.3.3 Paire de fermions dans le fond dun puits quantique . . . . . . . . . . . . . . . . 215
13.3.4 Principe de Pauli et quation de Schrdinger . . . . . . . . . . . . . . . . . . . . . . 217
13.4 Paire dlectrons dans un systme deux tats . . . . . . . . . . . . . . . . . . 217
13.4.1 Etats quantiques spin de llectron unique . . . . . . . . . . . . . . . . . . . . . . 218
13.4.2 Etats quantiques accessibles la paire dlectrons . . . . . . . . . . . . . . . . . . 218
13.5 Rgles de remplissage des niveaux lectroniques . . . . . . . . . . . . . . . . . 220
13.6 Interaction dchange et magntisme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222

13.1 Systme de plusieurs particules identiques


13.1.1 Position du problme
Les systmes physiques que nous avons abords jusqu prsent ntaient toujours constitus
que dune seule particule. Ce type de systme, certes plaisant dans le cadre dun cours introductif
la physique quantique, nest cependant rencontr en pratique que dans quelques rares expriences

210

13 Le principe de Pauli : fermions et bosons

de laboratoire. Car mme dans lespace, le vide nest en gnral pas assez pouss pour dire que les
quelques particules qui sy trouvent ninteragissent pas entre elles.
Peu nombreux sont dans la nature les systmes qui ne sont pas constitus dau moins quelques
milliards de milliards de particules. Une seule goutte deau, par exemple, contient dans un volume
lgrement infrieur 50 mm3 environ 3 1021 noyaux dhydrogne (protons seuls), 1, 5 1021
noyaux doxygne, et 1, 5 1022 lectrons, tous en interactions mutuelles. Sans mme aller jusque
l, la majorit des atomes et des petites molcules sont dj en gnral constitus de quelques
dizaines quelques centaines de particules.
Nous souhaitons ici faire un pas vers ltude de tels systmes, en nous limitant cependant
dans le cadre de ce cours au cas o toutes les particules sont de mme nature - par exemple,
uniquement les lectrons dans le champ de potentiel Coulombien dun noyau atomique ou dune
petite molcule.
13.1.2 Description quantique
En mcanique quantique, le systme plusieurs particules est dcrit dans toute sa globalit par
un ket | i appartenant un certain espace de Hilbert. Cet espace est de dimension plus grande
que ceux que nous avons rencontrs jusquici, du fait du plus grand nombre de degrs de liberts
dont il doit rendre compte : position, impulsion, et spin de chaque particule.
Par exemple, omettant la variable de spin, ltat dun systme de N particules de masse m est
dcrit par une fonction donde N corps :
(r1 , r2 , . . . , rN , t) ,
avec r1 , r2 , . . . , rN les vecteurs position des particules i = 1, . . . , N . La quantit | (r1 , r2 , . . . , rN , t) |2
sinterprte ici comme la densit de probabilit de trouver au temps t, lors dune mesure, les N
particules aux positions respectives r1 , r2 , . . . , rN . La phase de reste quant elle porteuse de
linformation sur la dynamique instantane du systme. Le principe de correspondance continue
sappliquer, et le Hamiltonien des N particules sans spin scrit en gnral :
2
2
2
= ~ r ~ r ~ r + V (r1 , r2 , . . . , rN ) ,
H
1
2
2m
2m
2m N

o V (r1 , r2 , . . . , rN ) est lnergie potentielle dinteraction des N particules. Par exemple, si on


considre N lectrons dans le vide, ce potentiel dinteraction est la somme des interactions coulombiennes lmentaires
V (r1 , r2 , . . . , rN ) =

X
1i<jN

e2
.
40 |ri rj |

13.1.3 Indiscernabilit des particules et symtrie de la fonction donde


Un problme conceptuel pour la construction de la fonction donde dun systme plusieurs
particules vient du fait quen physique, des particules de mme nature sont en principe indiscernables. Cela signifie quon ne change pas ltat du systme si on change les rles de deux
particules. Or, dans lexemple qui prcde, la fonction donde (r1 , r2 , . . . , rN , t), qui affecte
chaque particule un numro, semble bien loin de cette ide dindiscernabilit. Comment concilier
les deux ?
Si, on remplace dans (r1 , r2 , . . . , rN , t), par exemple, la particule 1 par la particule 2, et la
particule 2 par la particule 1 (cest lchange des particules 1 et 2), on construit pour le systme
un nouvel tat, dcrit par la nouvelle fonction donde
12 (r1 , r2 , r3 , . . . , rN , t) = (r2 , r1 , r3 , . . . , rN , t) .

13.3 Systme de deux particules sans spin

211

Lchange de particules ne devant pas modifier ltat du systme, et 12 doivent dcrire le mme
tat. En vertu de la proprit 8.2, ces deux fonctions ne doivent donc diffrer au plus que par un
dphasage global. Il existe ainsi 12 C tel que |12 | = 1 et
r1 , r2 , r3 , . . . , rN

(r1 , r2 , r3 , . . . , rN , t) = 12 (r2 , r1 , r3 , . . . , rN , t) .

Echangeant les variables r1 et r2 , on obtient


r1 , r2 , r3 , . . . , rN

(r2 , r1 , r3 , . . . , rN , t) = 12 (r1 , r2 , r3 , . . . , rN , t) ,

do finalement
r1 , r2 , r3 , . . . , rN

2
(r1 , r2 , r3 , . . . , rN , t) = 12
(r1 , r2 , r3 , . . . , rN , t) .

2
On a alors 12
= 1 et donc 12 = 1. Il en ressort que, ncessairement,

r1 , r2 , r3 , . . . , rN

(r1 , r2 , r3 , . . . , rN , t) = (r2 , r1 , r3 , . . . , rN , t) ,

ou
r1 , r2 , r3 , . . . , rN

(r1 , r2 , r3 , . . . , rN , t) = (r2 , r1 , r3 , . . . , rN , t) .

Nous aboutissons au rsultat suivant :


Proposition 13.1. Pour satisfaire au principe dindiscernabilit, la fonction donde dcrivant
ltat dun systme de plusieurs particules identiques doit tre soit symtrique, soit antisymtrique
pour lchange 2 2 des particules.

13.2 Principe de Pauli : spin, fermions et bosons


Le principe de Pauli enseigne que le caractre symtrique ou antisymtrique de la fonction
donde, ou plus gnralement, lorsque nous rintroduirons la variable de spin, du ket qui dcrit
un systme de plusieurs particules identiques ne doit rien au hasard, mais dpend directement, et
uniquement, de la nature des particules en prsence. Bien que ses fondements soient complexes et
sortent largement du cadre de ce cours, son nonc est trs simple :
Dfinition 13.1. Les particules du monde physique se sparent en deux familles :
les particules de nombre de spin entier, nommes bosons. Leurs fonctions donde sont symtriques pour lchange 2 2 des particules. Le noyau de Deutrium, par exemple, est un
boson ;
les particules de nombre de spin demi-entier, nommes fermions. Leurs fonctions donde
sont antisymtriques pour lchange 2 2 des particules. Les protons, les neutrons, et les
lectrons sont des fermions.
Cest tout ? Oui, cest tout. Voyons sans attendre les considrables consquences physiques de
ce principe sur un systme deux particules.

13.3 Systme de deux particules sans spin


Afin de se fixer les ides sur le principe de Pauli, nous tudions en dtail un systme quantique
dans lequel deux particules sont en prsence. Pour simplifier lexpos, nous supposons que les
particules nont pas de spin, et quelles se dcrivent entirement dans un formalisme de fonctions
donde. Cette petite entorse la ralit physique est nanmoins trs instructive.

212

13 Le principe de Pauli : fermions et bosons

13.3.1 Deux particules discernables sans spin dans le fond dun puits quantique
Rappel : systme une seule particule
Nous considrons un puits quantique unidimensionnel de largeur a. Les tats dnergie pour une
particule unique de masse m sont donns par les fonctions donde stationnaires 1 (x), 2 (x), . . .
et les nergies associes E1 , E2 , . . . Ces fonctions sont des tats propres du Hamiltonien une
particule
2
2
=~ ,
H
0 x a.
2m x2
Supposons que seuls les deux niveaux de plus basse nergie sont accessibles, et notons 1 et 2 ces
niveaux (voir les rsultats plus prcis du 10.1.1). Le puits quantique devient ce que lon appelle
un systme deux niveaux, dont le diagramme dnergie peut se reprsenter selon le schma de la
figure 13.1. Supposant aussi que la particule na pas de spin, le ket | i qui la dcrit volue dans
un espace de dimension 2, et sa forme gnrale est
| i = 1 (x) + 2 (x),

||2 + ||2 = 1.

Fig. 13.1. Les deux premiers niveaux dnergie du puits quantique unidimensionnel.

Paire de particules discernables dans un systme deux niveaux


Plaons prsent deux particules dans le fond du puits quantique, toujours en ne gardant que
les niveaux 1 et 2 accessibles. Lespace dans lequel volue le ket de ce nouveau systme est un
espace de fonctions donde deux variables (x1 , x2 ), o (x1 , x2 ) [0, a]2 dcrit les positions des
particules 1 et 2 respectivement. On rappelle que (x1 , x2 ) sannule sur les bords du domaine [0, a]
(voir 9.1.2).
Si les deux particules sont sans interactions, le Hamiltonien du systme scrit, en vertu du
principe de correspondance, comme la simple somme de deux Hamiltoniens une particule :
2
2
2
2
=~ ~ ,
H
2m x21
2m x22

(x1 , x2 ) [0, a]2 .

Supposons pour linstant que les deux particules sont discernables, de sorte pouvoir momentanment oublier les contraintes sur la symtrie ou lantisymtrie de la fonction donde. On peut
demble, en sappuyant sur les tats propres une particule 1 (x) et 2 (x), construire pour le
nouvel Hamiltonien des tats propres deux particules :

13.3 Systme de deux particules sans spin

|11i :
|12i :

11 (x1 , x2 ) = 1 (x1 ) 1 (x2 ),


12 (x1 , x2 ) = 1 (x1 ) 2 (x2 ),

dnergie 2E1 ,
dnergie E1 + E2 ,

|21i :
|22i :

21 (x1 , x2 ) = 2 (x1 ) 1 (x2 ),


22 (x1 , x2 ) = 2 (x1 ) 2 (x2 ),

dnergie E1 + E2 ,
dnergie 2E2 .

213

Lhypothse que seuls les deux premiers niveaux du puits sont accessibles la particule individuelle
se traduit ici par le fait que ces quatre tats forment une base pour les tats accessibles la
paire. On vrifie facilement quils constituent bien une famille orthonorme au sens du produit
scalaire L2 ([0, a]) :
Z
h(x1 , x2 )|(x1 , x2 )i =
(x1 , x2 )(x1 , x2 ) dx1 dx2 .
[0,a]2

Ainsi, tout tat | i du systme deux particules se dcompose selon :


|i = |11i + |12i + |21i + |22i,

||2 + ||2 + ||2 + ||2 = 1.

La fonction donde deux particules associe | i est


(x1 , x2 ) = 11 (x1 , x2 ) + 12 (x1 , x2 ) + 21 (x1 , x2 ) + 22 (x1 , x2 ).
Diagrammes nergtiques
La lecture des formules mathmatiques dcrivant chaque tat de base nest pas toujours chose
agrable. Il est devenu dusage, en physique quantique, de reprsenter le contenu physique de
chacune de ces fonctions de base sous la forme de diagrammes nergtiques (voir les figures 13.2
et 13.3). Ils font apparatre les 2 niveaux accessibles la particule unique, et font figurer chaque
particule sur le niveau quelle occupe dans la fonction donde. Cette reprsentation ne vaut cependant que pour les tats de base, et ne se gnralise pas une superposition des tats | 1 1 i,
| 1 2 i, | 2 1 i et | 2 2 i. Si lon cherche ici se donner une rgle heuristique pour dessiner sans calcul
pralable les diagrammes des tats de base deux particules, on peut dire quil suffit de ranger
de toutes les manires possibles les particules 1 et 2 sur les deux niveaux disponibles.

Fig. 13.2. Diagrammes nergtiques reprsentatifs des 4 tats de base du systme de deux particules
discernables, dans le cas o seuls 2 niveaux sont accessibles la particule isole.

13.3.2 Paire de bosons dans le fond dun puits quantique


Que se passe-t-il quand le principe de Pauli impose que la fonction donde soit symtrique ou
anti-symtrique pour lchange des deux particules ? Examinons le cas de deux bosons. La fonction
donde doit tre symtrique :
x1 , x2 ,

(x1 , x2 ) = (x2 , x1 ).

Cherchons, dans lespace de Hilbert de dimension 4 dfini par la base | 1 1 i, | 1 2 i, | 2 1 i et | 2 2 i,


la forme gnrale des tats vrifiant cette condition. Dans le formalisme des fonctions donde, il
faut que :

214

13 Le principe de Pauli : fermions et bosons

Fig. 13.3. Fonctions donde deux particules reprsentatives des 4 tats de base du systme de deux
particules discernables.

x1 , x2 ,

(x1 , x2 ) = 11 (x1 , x2 ) + 12 (x1 , x2 ) + 21 (x1 , x2 ) + 22 (x1 , x2 )


= 11 (x2 , x1 ) + 12 (x2 , x1 ) + 21 (x2 , x1 ) + 22 (x2 , x1 ).

Or, on vrifie facilement que


11 (x1 , x2 ) = 11 (x2 , x1 ),
12 (x1 , x2 ) = 21 (x2 , x1 ),

21 (x1 , x2 ) = 12 (x2 , x1 ),
22 (x1 , x2 ) = 22 (x2 , x1 ).

Une condition ncessaire et suffisante pour que la condition de symtrie soit satisfaite est donc
= . La fonction donde deux particules scrit dans ce cas
(x1 , x2 ) = 11 (x1 , x2 ) + [12 (x1 , x2 ) + 21 (x1 , x2 )] + 22 (x1 , x2 ).
Proposition 13.2. Les fonctions donde dcrivant une paire de deux bosons sans spin dans le
puits quantique unidimensionnel deux niveaux sont contenues dans un sous espace de dimension 3
de lespace des fonctions donde. Une base orthonorme 1 de ce sous espace des fonctions donde
symtriques est donne par
|11i,

+
1
12
= (| 1 2 i + | 2 1 i) ,
2

|22i.

La forme gnrale des tats dcrivant la paire de bosons est




| i = | 1 1 i + 12+ + | 2 2 i ,
||2 + ||2 + ||2 = 1.
Une reprsentation graphique de ces tats est prsente en figure 13.4, les fonctions dondes
tant traces en figure 13.5. Comme les particules sont indiscernables, il nest plus lgitime de les
1. Proprit dont la vrification est laisse au lecteur.

13.3 Systme de deux particules sans spin

215

numroter 1 et 2. On observe que les 3 diagrammes nergtiques pourraient ici tre obtenus de
manire heuristique en rangeant de toutes les manire possibles deux particules non numrotes et
interchangeables sur les deux niveaux disponibles. Une diffrence essentielle avec le cas discernable
vient de ce quil ny a ici plus quun seul tat dans lequel les particules sont sur des niveaux
diffrents.

Fig. 13.4. Diagrammes nergtiques reprsentatifs des 3 tats de base du systme de deux bosons, dans
le cas o seuls 2 niveaux sont accessibles la particule isole.

Fig. 13.5. Fonctions donde deux particules reprsentatives des 3 tats de base du systme de deux
bosons.

Les deux tats | 1 2 i et | 2 1 i se retrouvent en quelque sorte forcs, du fait de lindiscernabilit,


de ne reprsenter plus quun seul tat pour le systme. Cela se traduit par la perte dune dimension
despace, et par la construction de ltat symtris | 12+ i. La relation entre | 12+ i et son diagramme
est cependant subtile. Dans cet tat, il nest en effet pas lgitime de dire que nous avons une
particule dans ltat 1 et une particule dans ltat 2. Car si lon regarde de prs la forme de la
fonction donde associe :
1
+
12 (x1 , x2 ) = (1 (x1 )2 (x2 ) + 2 (x1 )1 (x2 ))
2
on constate que chaque particule est dans une situation de superposition quantique parts gales
entre les tats 1 et 2. Le diagramme dnergie ne reprsente donc pas deux particules sur des
niveaux spars, mais plutt, se contente dindiquer quels sont les niveaux dnergie simultanment
accessibles aux deux particules.
Remarquons enfin le comportement grgaire de nos bosons sans spin : pour les fonctions
donde de la figure 13.5, la diagonale x1 = x2 est toujours un lieu de valeurs extrmales. La
physique statistique enseigne que les bosons sont des particules qui aiment bien prendre des tats
identiques. Ce phnomne se prpare en fait dj au niveau quantique.
13.3.3 Paire de fermions dans le fond dun puits quantique
Dans le cas des fermions, la fonction donde (x1 , x2 ) est antisymtrique. Cherchons nouveau,
dans lespace de Hilbert de dimension 4 dfini par la base | 1 1 i, | 1 2 i, | 2 1 i et | 2 2 i, la forme

216

13 Le principe de Pauli : fermions et bosons

gnrale des tats vrifiant cette condition. Dans le formalisme des fonctions donde, il faut que
x1 , x2

(x1 , x2 ) = 11 (x1 , x2 ) + 12 (x1 , x2 ) + 21 (x1 , x2 ) + 22 (x1 , x2 )


= 11 (x2 , x1 ) 12 (x2 , x1 ) 21 (x2 , x1 ) 22 (x2 , x1 ),

soit
= = 0,

= .

La fonction donde deux fermions scrit alors :


(x1 , x2 ) = [12 (x1 , x2 ) 21 (x1 , x2 )] .
Proposition 13.3. Les fonctions donde dcrivant une paire de deux fermions sans spin dans
le puits quantique unidimensionnel deux niveaux sont contenues dans un sous espace de dimension 1 de lespace des fonctions donde. Un vecteur de base de ce sous espace des fonctions donde
antisymtriques est donn par :

1
12
= (| 1 2 i | 2 1 i) .
2
La forme gnrale des tats dcrivant la paire de fermions est


| i = 12 ,
|| = 1.
La forme de la fonction donde associe | 12 i est
1

12 = (1 (x1 )2 (x2 ) 2 (x1 )1 (x2 )) .


2
Sa reprsentation graphique est donne en figure 13.6. Remarquons que le diagramme nergtique
associ est lunique diagramme que lon peut construire lorsque que lon cherche ranger sur les
deux niveaux deux particules non numrotes et interchangeables en sinterdisant den mettre deux
sur le mme niveau. Il sagit de la mme reprsentation graphique que pour ltat symtrique | 12+ i.
Ce diagramme doit encore se comprendre comme le fait que les niveaux 1 et 2 sont simultanment
accessibles chaque particule. En gnral, le risque de confusion avec ltat | 12+ i nexistera pas,
car dans une situation physique donne, on sait si lon travaille avec des fermions ou des bosons.
Remarquons par ailleurs que les fermions sans spin, non contents de sviter sur le diagramme
dnergie, svitent galement dans lespace, avec une fonction donde qui sannule le long de la
droite x1 = x2 .

Fig. 13.6. A gauche : diagramme nergtique reprsentatif de lunique tat du systme de deux fermions,
dans le cas o seuls 2 niveaux sont accessibles la particule isole. A droite : la fonction donde deux
particules associe.

On peut enfin vrifier sur lexemple du puits infini unidimensionnel que lorthogonalit de | 12 i
avec chacun des trois tats symtriques | 1 1 i, | 12+ i et | 2 2 i implique que

13.4 Paire dlectrons dans un systme deux tats

217

Proprit 13.1 (Orthogonalit des tats symtriques et antisymtriques). Les sous espaces des fonctions donde symtriques et antisymtriques, qui dcrivent respectivement les tats
de bosons et de fermions, sont orthogonaux.
Preuve. On omet encore les variables de spin. Soit = (r1 , . . . , rN ) antisymtrique et =
(r1 , . . . , rN ) symtrique. Alors,
Z
Z
(r1 , r2 , . . . , rN )(r1 , r2 , . . . , rN ) dr =
(r2 , r1 , . . . , rN )(r2 , r1 , . . . , rN ) dr
R3N
R3N
Z
=
(r1 , r2 , . . . , rN )(r1 , r2 , . . . , rN ) dr
R3N

par change des particules 1 et 2. On en dduit immdiatement


Z
(r1 , r2 , . . . , rN )(r1 , r2 , . . . , rN ) dr = 0,
R3N

ce qui donne le rsultat escompt.

u
t

13.3.4 Principe de Pauli et quation de Schrdinger


A linstar de la proprit de normalisation pour les fonctions donde, il est important de se
demander si lquation de Schrdinger est compatible avec la conservation au cours du temps du
caractre symtrique ou antisymtrique dune fonction donde plusieurs particules. Dans le cas
prsent, nous avons pu construire pour les sous espaces symtriques et antisymtriques des bases
Hilbertiennes dont les vecteurs sont aussi des tats propres du Hamiltonien. Ces vecteurs de base
ont la proprit dtre stables dans le temps. En vertu du principe de superposition, on sait alors
que les sous espaces symtrique et antisymtrique sont galement stables.
Proposition 13.4 (Proprit gnrale). Le principe de Pauli et lquation de Schrdinger sont
compatibles :
une fonction donde initialement symtrique reste symtrique au cours du temps ;
une fonction donde initialement antisymtrique reste antisymtrique au cours du temps.
La dmonstration de cette proprit dans le cas gnral est la suivante. Traitons par exemple le
cas des fermions. Soit S une permutation de r = (r1 , . . . , rN ) : Sr = (rs(1) , . . . , rs(N ) ) ; alors, pour
0 L2 (R3N ), 0 (Sr) = (1)(S) 0 (r) o (S) est la signature de la permutation S. On note (t)
~2
la
la solution de lquation de Schrdinger i~t = 2m
de condition initiale (0) = 0 , (t)
2
~
0

solution de lquation de Schrdinger i~t = 2m de condition initiale (0, r) = (Sr), et


et S (t) satisfont lquation de Schrdinger avec la mme
S (t, r) = (t, S(r)). On vrifie que (t)
condition initiale, et sont donc gales. Ceci montre bien que le caractre antisymtrique initial est
prserv au cours du temps.
Cette proprit est valable quelque soit le systme physique considr. La thorie quantique
reste donc cohrente. Ouf ! 2

13.4 Paire dlectrons dans un systme deux tats


Nous examinons une situation plus physique o la variable de spin est explicitement prise en
compte. On considre ici des lectrons, qui sont des fermions, et on les dispose nouveau dans un
systme deux niveaux.
2. Une manire plus abstraite de voir la chose est de remarquer que loprateur dchange de deux
particules est un oprateur auto-adjoint, et donc une observable. On montre ensuite facilement que cette
observable commute avec le Hamiltonien.

218

13 Le principe de Pauli : fermions et bosons

13.4.1 Etats quantiques spin de llectron unique


Nous sommes face une situation nouvelle, dans laquelle il faut rendre compte, au niveau de la
description quantique, de ltat de spin de llectron. Le formalisme quantique propose simplement
dassocier la fonction donde | i qui dcrit la dynamique de translation de llectron dans
lespace, un tat de spin | i. Cette association est faite par le biais du produit tensoriel | i| i.
Les choses peuvent se compliquer ensuite lorsque lon considre les superpositions dtats. Nous
ne chercherons cependant pas ici entrer plus avant dans les dtails. Nous admettons que pour
un lectron introduit seul dans notre puits quantique 2 niveaux, une base orthonormale dtats
quantiques une particule est alors obtenue en associant les tats dnergie | 1 i et | 2 i de la
particule sans spin avec les tats de base | i et | i de lespace du spin 21 . On obtient la base
orthonorme dun espace de Hilbert de dimension 4 :
| 1 i | i,

| 1 i | i,

| 2 i | i,

| 2 i | i.

Par rapport au cas de la particule sans spin, on peut dire, dune certaine faon, que la prsence
du spin ddouble chaque tat. A ces tats peuvent tre associs les diagrammes dnergie de la
figure 13.7.

Fig. 13.7. Diagrammes nergtiques des 4 tats de base pour une particule de spin
systme deux niveaux.

1
2

place sur un

13.4.2 Etats quantiques accessibles la paire dlectrons


Les lectrons tant des fermions, le ket qui les reprsente doit tre antisymtrique. La mcanique
quantique construit une base de ces kets en associant :
dune part une base de fonctions donde ( deux particules cette fois) symtriques avec une
base dtats de spins ( 2 spins) antisymtriques ;
dautre part une base de fonctions donde antisymtriques avec une base dtats de spins
symtriques.
Nous connaissons dj les bases symtrique et antisymtrique pour la fonction donde. Quen est-il
pour lespace de spin ?
Etats triplets et singulet dun systme deux spins
Pour dcrire conjointement un systme form de deux spins 12 , une base naturelle est celle qui
combine les tats | i et | i de chaque particule. On obtient une base orthonorme dun espace
de Hilbert de dimension 4 :
| i :

deux spins dans ltat | i,

| i :
| i :

deux spins dans ltat | i,


premier spin dans ltat | i, deuxime spin dans ltat| i,

| i :

premier spin dans ltat | i, deuxime spin dans ltat | i.

De mme que pour les fonctions donde 2 particules, les deux derniers tats peuvent tre combins
pour former un tat symtrique, et un tat antisymtrique de spins :

13.4 Paire dlectrons dans un systme deux tats

+
1

= (| i + | i)
2

219


1

= (| i | i) .
2

On construit ainsi une base orthonorme de lespace deux spins, forme de trois tats symtriques :
+

| i,
| i,
(tats triplets),
et dun tat antisymtrique :

(tat singulet).

Spins parallles et anti-parallles


Une particularit des tats triplets et singulets est quils peuvent sinterprter en terme dorientation relative des deux spins lun par rapport lautre. Les tats triplets correspondent des tats
de spins parallles, cest dire, si on se les figure comme des petits vecteurs, qui pointent dans la
mme direction. Le paralllisme selon laxe z se comprend bien pour les tats | i et | i. Pour
ltat | + i, on montre que le paralllisme ne se joue plus selon z, mais dans le plan (x, y). Sans
rentrer dans les dtails, cest le signe + dans lexpression 12 (| i + | i) qui permet de crer
un tat dans lequel les 2 spins pointent encore dans la mme direction.
Ltat singulet | i correspond quant lui un tat de spins antiparallles, cest dire, qui
pointent dans des directions opposes, ou encore, dont la somme est nulle. Cest le signe dans
lexpression 12 (| i | i) qui est lorigine de cette orientation relative. 3
Etats quantiques complets de la paire dlectrons
Procdons prsent au regroupement des fonctions donde et des tats de spin. Nous trouvons
pour dcrire les tats quantiques de la paire dlectrons sur un systme 2 niveaux une base
orthogonale forme de six niveaux dnergie, classs ci-dessous par nergie dcroissante :
Energie 2E2 :
Energie E1 + E2 :
+
12


12
| i,
Energie 2E1 :



| 2 2 i


12
| i,


| 1 1 i

(spins antiparallles),

+
12
,

(spins antiparallles),
(spins parallles),

(spins antiparallles).

Voyons comment il est possible de rendre compte de ces tats au moyens de diagrammes nergtiques. Si nous plaons de toutes les manires possibles des particules non numrotes de spins | i
ou | i sur les deux niveaux du diagramme dnergie, tout en sinterdisant de mettre deux particules de mme spin sur le mme niveau, on obtient les 6 diagrammes de la figure 13.8.
Certains de ces diagrammes peuvent tre associs de manire assez vidente des tats de la
base. La vritable ambigut concerne les tats du centre de la deuxime ligne : tous deux dsignent
3. Une approche plus rigoureuse demande considrer, dans cet espace de spin de dimensions 4, loprateur norme au carr de la somme des spins, qui vaut, dans la base | i, | i, | i, | i :

2 0 0 0
0 1 1 0

(S1\
+ S2 )2 = ~2
0 1 1 0
0 0 0 2
On sapperoit alors que les tats triplets et singulet forment une base dtats propres de (S1\
+ S2 )2 , avec
2
2
les valeurs propres 2~ et 0 respectivement. On retrouve, dans la valeur 2~ , la norme au carr I(I + 1)~2
dun spin de nombre de spin I = 1.

220

13 Le principe de Pauli : fermions et bosons

Fig. 13.8. Les 6 diagrammes nergtiques qui peuvent tre construits pour deux fermions de spin 12
placs sur un systme
niveaux.
Quatre
identifiables aux tats
deux


directement

de ces diagrammes sont

, 12 | i, 12 | i et | 1 1 i . Lidentification avec les tats
de
base
|
2
2
i

+



12

et 12 + est plus dlicate. Cest l une limite de ce systme de reprsentation
graphique (la vrit tant dans la forme mathmatique des tats).

bien une occupation mutuelle des niveaux 1 et 2 par les 2 lectrons, mais ne sont pas capables de
rendre compte du caractre parallle ou antiparallle des spins. Nous touchons l une limite de
ce type de reprsentation. Bien que ces dessins soient une aide prcieuse la comprhension du
contenu physique des tats avec lesquels nous travaillons, le dtail de linformation se trouve bel
et bien dans les formules !
Remarque 13.1. Le lecteur attentif aura remarqu qu aucun moment nous navons parl de linteraction lectrostatique rpulsive entre les deux lectrons. Il est clair que pour la vraisemblance
physique de ce modle, il aurait t indispensable de prendre en compte cet aspect dans le Hamiltonien deux particules. Notre but ntait cependant pas tant ici davoir un modle vraisemblable,
quun systme simple pour illustrer la mise en pratique concrte du principe de Pauli. Mentionnons
toutefois, quen dpit de la complexit apporte par la prise en compte des interactions coulombiennes, on constate que pour des objets tels que les atomes et les molcules, tout se passe, en
premire approximation, comme si il existait bel et bien des niveaux lectroniques une particule, sur lesquels viendraient se ranger un un les lectrons comme nous lavons fait ici. Cette
approximation, trs courante, porte le nom dapproximation orbitale.

13.5 Rgles de remplissage des niveaux lectroniques


Il est remarquable, au regard de la lourdeur du formalisme quantique, en particulier lorsquon
commence mlanger fonctions donde et espaces de spins, que la forme des tats de base dun
systme plusieurs lectrons puisse tre, non seulement dcrite, mais galement prdite, au moins
dans ses grandes lignes, par des diagrammes schmatiques. Quelque soit la complexit du systme
considr, on constate en fait que les diagrammes prdisant les tats lectroniques peuvent sobtenir
avec la rgle heuristique de construction suivante :

13.6 Interaction dchange et magntisme

221

Regle 13.1. Les lectrons se rangent librement dans les niveaux dnergie, en adoptant chacun
un tat de spin up ou down, et en sinterdisant uniquement que deux lectrons de mme spin
co-existent sur un mme niveau.
Cette rgle permet en particulier de construire dans des systmes tels que les atomes et les molcules, la forme de ltat lectronique temprature ambiante. En gnrale, lagitation thermique
est insuffisante pour faire sortir ces systmes de leurs tats fondamentaux. On obtient ainsi leur
structure en empilant dans le fond du diagramme dnergie les lectrons les uns sur les autres,
en commenant par le niveau le plus bas et en procdant ensuite par niveaux dnergie croissante.
En dpit de leurs imperfections, et notamment, leur incapacit expliciter de manire univoque
lorientation relative de deux spins, ces diagrammes sont toujours bien plus lisibles que la forme
exacte de la fonction donde sous jacente, surtout lorsquon passe des systmes 3 particules ou
plus. Leur utilisation fin de raisonnements physiques est trs rpandue.

13.6 Interaction dchange et magntisme


On a vu au 12.6 que le Hamiltonien associ la variable de spin tait nul en labsence de
champs lectromagntiques. Pourtant, si nous regardons bien le diagramme dnergie obtenu pour
la paire dlectrons, nous nous apercevons que, du fait du principe de Pauli, le niveau dnergie le
plus bas du systme est atteint pour une configuration de spins anti-parallles. La configuration
parallle, elle, napparat que pour des niveaux dnergie suprieurs.
Il nest donc pas quivalent nergtiquement pour les lectrons davoir leurs spins antiparallles
ou parallles. Bien quil nexiste pas explicitement de Hamiltonien portant directement sur les
tats de spins, il se cre une sorte dinteraction cache, due au principe de Pauli, qui pnalise ou
favorise certaines orientations relatives.
Cette interaction est dite interaction dchange. Elle existe dans les atomes, dans les molcules,
mais se fait tout particulirement sentir dans les corps solides. Dans certains dentre eux, la
diffrence dnergie mise en jeu peut tre de lordre de 0.1 eV. Ceci est considrable 4 , si lon
sait que lagitation thermique nest comparativement capable de contrer cette nergie qu des
tempratures de lordre de 1000 K. Lorientation parallle est parfois lorientation privilgie. A
temprature ambiante, linteraction dchange peut alors, si les circonstances sont favorables, tre
lorigine dun alignement massif de spins lectroniques. Du fait du moment magntique port
par ces spins, lobjet tout entier se transforme alors en aimant.
Linteraction dchange, et donc, le principe de Pauli, sont tout fait fondamentaux dans
ce phnomne. En leur absence, si nous ne devions compter que sur les interactions dorigine
magntique entre spins voisins pour les orienter, il faudrait descendre des tempratures proche
du zro absolu pour voir un corps sauto-aimanter. Le magntisme spontan des corps est un
exemple de phnomne purement quantique qui sexprime lchelle macroscopique.

4. Rappelons quune nergie de E = 0.1 eV correspond une temprature de T = E/kB ' 1150 K.

222

13 Le principe de Pauli : fermions et bosons

Exercices
Exercice 13.1 (Un modle dEtoile Neutrons).
En fin de vie, lorsquelles sarrtent de briller, les toiles dont la masse est suprieure 1,44
fois la masse du Soleil seffondrent brutalement sur elles-mmes. Par effet de rebond, une quantit
colossale dnergie et de matire est alors expulse dans lespace : cest lexplosion de la super-nova.
En lieu et place de ltoile initiale, la matire restante se condense tel point que de nouvelles
ractions entre particules ont lieu, dans lesquelles tous les lectrons et tous les protons fusionnent
pour former des neutrons. Un nouveau corps prend forme : ltoile neutrons. Ce corps quasi
exclusivement form de neutrons ne possde plus datome. Nous nous proposons ici, laide du
principe de Pauli, destimer sa densit et sa taille.
Nous assimilons ltoile neutrons une sphre de rayon R, de densit homogne, contenant un
nombre N de neutrons ltat fluide. Cette sphre peut tre regarde comme un espace confinant.
De fait, lnergie des neutrons est quantifie. On admet sans dmonstration que, pour une particule
sans spin confine dans un espace de volume V , le nombre de niveaux dnergie compris entre le
niveau fondamental et une nergie donne E peut tre approxim, quand le volume est grand,
par :
3
4 (2mE) 2
N (E) = V
,
3
h3
avec h = 2~. On rappelle enfin que les neutrons sont des fermions, de spin 12 .
(1) Calculer, dans ltat fondamental de ltoile, lnergie Emax maximale accessible aux neutrons
en fonction du rayon R.
(2) Montrer que lnergie cintique totale des neutrons sexprime selon :
Z Emax
dN
Etot =
2E
dE.
dE
0
Calculer Etot en fonction de R et dautres paramtres du problme.
(3) On peut montrer que lnergie potentielle de gravitation dune sphre homogne de masse
volumique et de rayon R est
8 2 2 5
Egrav =
G R ,
15
avec G la constante de gravitation universelle. En dduire lnergie totale de ltoile neutrons
en fonction de R. On notera m la masse dun neutron.
(4) Pour quel rayon cette nergie est-elle minimale ?
(5) Si la masse de ltoile neutron est de 2 masses solaires (Msoleil 2 1030 kg), quel est son
rayon ? Quelle est sa densit ?
Exercice 13.2 (Ferro et Paramagntisme : le modle de Curie).
Certains corps solides peuvent, selon les circonstances, dvelopper des proprits magntiques
lchelle macroscopique. Cest notament le cas des aimants, qui prsentent spontanment une
aimantation et crent de forts champs magntiques dans leur voisinage : ces corps sont dits ferromagntiques. Cest galement le cas des solides dits paramagntiques, dans lesquels laimantation
nest pas spontane, mais peut tre induite par lapplication dun champ magntique extrieur. Ce
phnomne peut servir amplifier des champs magntiques : cest, par exemple, la raison dtre
des blocs de fer doux que lon place lintrieur des bobines des transformateurs lectriques.
La physique statistique montre que lapparition de ces aimantations ne peut pas tre explique
par la mcanique classique, et constitue un phnomne purement quantique. Un des principaux
mcanismes pouvant tre mis en jeu est lorientation massive de diples magntiques microscopiques contenus dans le solide. Ces diples sont induits conjointement par le moment orbital et le
spin dlectrons pigs dans les couches profondes de certains atomes (chrome, cobalt,. . . ).
Nous considrons ici un solide contenant en son sein un nombre N de tels diples, que nous
supposons tous identiques. On admet que les moments cintiques Ji de ces diples (1 i N )
se comportent comme des spins, tous de mme nombre quantique I, et on pose ici pour simplifier
I = 21 .

13.6 Interaction dchange et magntisme

223

Diples indpendants
(1) Les diples, supposs sans interaction les uns avec les autres, sont placs dans un champ
magntique B orient selon laxe z. Ecrire, dans la base (| i, | i), la matrice du Hamiltonien
i dinteraction du diple i avec B. Quels sont les tats dnergie ? (On introduira le rapport
H
gyromagntique )
(2) En vertu des principes de physique statistique, ces tats propres sont occups au prorata du
facteur de Boltzman eE/kB T , avec kB la constante de Boltzman, T la temprature, et E lnergie de ltat considr. Calculer, pour lassemble de diples, la valeur moyenne hmz (T, B)i de
leur composante selon laxe z.
(3) Tracer lallure de hmz (T, B)i en fonction de B pour diffrentes valeurs de la temprature T .
(4) On dfinit une susceptibilit magntique selon

hmz i
.
=
B B=0
Calculer . Comment dpend-il de la temprature ? La dpendance en
loi de Curie.

1
T

obtenue est dite

Diples en interaction dchange


En ralit, les diples interagissent entre eux via linteraction dchange Nous admettons que
le Hamiltonien total du systme devient :
'
H

N
X
i=1

i
H

N
X

Jz,i hmz i,

~2
i=1

avec une constante nergtique dite nergie dchange.


(5) Montrer que cela revient placer des diples indpendants dans un champs magntique effectif Beff que lon dterminera en fonction de B et hmz i.
(6) En dduire une quation permettant de calculer hmz i en fonction de B et de la temprature T .
Proposer une mthode graphique de rsolution.
(7) Montrer de manire graphique que :
selon le signe de , et selon la temprature T , il peut apparatre une aimantation dans le
solide mme quand B = 0 ;
il existe une temprature Tc (dite temprature de Curie) au del de laquelle laimantation
spontane devient impossible. Calculer Tc en fonction des donnes du problme. Application
numrique : = 0.3 eV ;
pour T < Tc , la solution hmz i = 0 est instable.

14
La liaison chimique : des molcules diatomiques aux corps
solides

Le phnomne de quantification, dont un des effets est de fixer une valeur dnergie minimale
pour les systmes physiques usuels (lnergie fondamentale), est lorigine dinteractions particulires entre les atomes. En se rapprochant les uns des autres, les noyaux atomiques parviennent
en effet parfois abaisser en commun lnergie de leurs nuages lectroniques : cest le phnomne
de liaison, dite chimique ou ionique selon les circonstances.
Ce chapitre constitue une brve introduction aux domaines de la chimie quantique et de la
physique des solides. Nous traitons dans un premier temps le mcanisme de formation de la liaison chimique. Nous expliquons en particulier pourquoi elle ne peut se former quentre certains
atomes compatibles. Ensuite, nous montrons que le processus de modification des tats lectroniques concerne galement les corps solides. Des structures particulires dtats lectroniques
peuvent alors tre observes, qui expliquent notamment les proprits de conduction lectrique ou
la transparence optique de certains objets.

14.1 La molcule diatomique : liaison chimique et liaison ionique . . . . . . 225


14.1.1 Description quantique du systme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
14.1.2 Lapproximation des Combinaisons Linaires dOrbitales Atomiques
(CLOA) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
14.1.3 Cas de la combinaison de deux tats : traitement CLOA . . . . . . . . . . . . 227
14.1.4 Orbitales liante et antiliante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
14.1.5 Hybridation de deux niveaux atomiques proches en nergie : la liaison
chimique covalente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
14.1.6 Hybridation de niveaux atomiques peu compatibles : liaison ionique . . 231
14.1.7 Compatibilit des orbitales atomiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
14.1.8 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
14.2 Structure lectronique des corps solides : thorie des bandes . . . . . . 235
14.2.1 Approximation CLOA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
14.2.2 Le cas particulier des solides cristallins . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
14.2.3 proprits lectroniques des solides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

14.1 La molcule diatomique : liaison chimique et liaison ionique


14.1.1 Description quantique du systme
Nous considrons deux noyaux datomes A et B disposs dans lespace lun ct de lautre.
Nous nommons lensemble molcule AB, sans aucun a priori sur les ventuelles consquences
physiques de ce rapprochement. Nous notons nA et nB les nombres de charge de ces atomes, et rA

226

14 La liaison chimique : des molcules diatomiques aux corps solides

et rB leurs positions. Vis vis dun lectron qui viendrait passer prs de la molcule, le potentiel
dinteraction Coulombienne rsultant est (voir la figure 14.1) :
V (r) = VA (r) + VB (r) =

nA e2
1
nB e2
1

.
40 |r rA |
40 |r rB |

Nous nous intressons aux tats dnergie accessibles un lectron qui se trouverait plac dans ce
potentiel, et tout particulirement les tats lis (dnergie ngative), car ce sont eux qui dterminent
la structure lectronique de la molcule. Comme nous cherchons les tats dun lectron seul, on
omet dans la suite la variable de spin, et on ne considre que la fonction donde spatiale. Le
Hamiltonien scrit alors
2
+ VA + VB .
= ~ + VA (r) + VB (r) = h
H
2m

Fig. 14.1. Le double trou de potentiel cr par la juxtaposition des noyaux A et B. Sur ce schma,
nB > nA . Le puits de latome B sen trouve plus large et plus profond.

14.1.2 Lapproximation des Combinaisons Linaires dOrbitales Atomiques (CLOA)


Pour tudier les tats lis de la molcule AB, il est commode de se servir de linformation que
lon connat pour les atomes isols A et B. On va ainsi dcrire la partie spatiale de la fonction donde
associe la molcule AB dans la base forme par les tats propres (lis) {| A,n i , | B,n i}nN
des atomes A et B. On emploie le terme dorbitales pour dsigner les tats lis (atomiques ou
molculaires). On peut donc dire que lon cherche ici obtenir des orbitales molculaires comme
des combinaisons linaires des orbitales atomiques (voir la figure 14.2).
Lapproximation des combinaisons linaires dorbitales atomiques (CLOA) consiste rsoudre
le problme sur une base tronque {| A,n i , | B,m i}(n,m) , N2 tant de cardinal fini. Un
critre permettant de choisir les vecteurs introduits dans cette base consiste, en se fixant a priori
une gamme dnergie dans laquelle on dcide de rechercher des orbitales molculaires, ne retenir
que les orbitales atomiques dont lnergie tombe dans cette mme gamme. Nous pourrons justifier
cette manire de pratiquer a posteriori.
Mathmatiquement, une telle approche se place dans le cadre plus gnral des mthodes de
synthse modale : pour trouver une base de Galerkin pour rsoudre un problme donn, on divise
ce problme en sous-problmes plus facilement solubles, et on se sert des solutions de ces sousproblmes comme base de Galerkin sur laquelle on va rsoudre le problme initial. La base ainsi
construite est parfois appele base rduite, dans la mesure o cest une base de fonctions souvent
de trs petite taille par rapport une discrtisation plus conventionnelle, mais toutefois trs
bien adapte la rsolution du problme. Pour de plus amples dveloppements thoriques sur la
synthse modale, on renvoit [6, Chapitre 7]. Remarquons toutefois que la mme la base non
tronque {| A,n i , | B,n i}nN nest pas une base complte de L2 (R3 ).

14.1 La molcule diatomique : liaison chimique et liaison ionique

227

Fig. 14.2. Lapproximation CLOA : les diagrammes nergtiques de latome A isol, de la molcule
AB, et de latome B isol sont reprsents de manire juxtapose. On constate en pratique que chaque
orbitale | AB i de la molcule sapproxime comme une combinaison linaire de niveaux atomiques nergtiquement proches, dsigns par les flches en pointills. Par exemple, ltat not | AB,3 i est quasiexclusivement une combinaison linaire de | A,2 i, | B,1 i et | B,2 i. Il ne sagit ici que dun dessin de
principe. Des schmas plus prcis sont donns dans la suite du cours.

14.1.3 Cas de la combinaison de deux tats : traitement CLOA


Nous considrons le cas particulier o les atomes A et B possdent chacun un tat (nots
respectivement | A i et | B i), isols dans leurs diagrammes nergtiques respectifs, et avec, en
revanche, des nergies associes EA et EB proches lune de lautre. Lapproximation CLOA assure
que la base de fonctions {| A i, | B i} est suffisante pour rechercher de manire semi-quantitative
toutes les orbitales molculaires dont lnergie est proche de EA et EB . On cherche donc les
orbitales de la forme :
| i = cA | A i + cB | B i,
cA , cB C.
(14.1)
Avant de poursuivre, prcisons quelques proprits de | A i et | B i. En tant qutats dnergie
des atomes indpendants, ils vrifient :


+ VA | A i = EA | A i,
h


+ VB | B i = EB | B i.
h
Nous supposons par ailleurs que les fonctions donde qui reprsentent | A i et | B i sont valeurs
relles (ce qui est toujours possible pour les tats propres du Hamiltonien atomique).
Energies des Orbitales molculaires
pour une nergie E dterminer :
On cherche | i tat propre de H
i = E| i.
H|
Cette criture ne peut tre que formelle, car, la CLOA tant une mthode approche, cette identit
ne peut tre vrifie exactement. Il faut donc entendre cette relation comme une galit approximative : on demande que lgalit devienne vraie en formulation faible sur lespace engendr par | A i
et | B i. Ceci signifie que

228

14 La liaison chimique : des molcules diatomiques aux corps solides

D
E

A |H|
= hA |E|i ,
D
E

B |H|
= hB |E|i .
Utilisant la dcomposition (14.1), on arrive
D
E
D
E
A + cB A |H|
B = cA hA |E|A i + cB hA |E|B i ,
cA A |H|
D
E
D
E
A + cB B |H|
B = cA hB |E|A i + cB hB |E|B i .
cA B |H|
Cette criture peut se simplifier :
(1) tant donn que les fonctions donde associes | A i et | B i sont valeur relles,
et tant
D
E
est un oprateur diffrentiel coefficients rels, on a A |H|
B =
donn que le Hamiltonien H
D
E
A R. Quitte changer le signe de | A i par exemple, on peut supposer que
B |H|
D
E D
E
B = B |H|
A 0.
= A |H|
La constante R est homogne une nergie ;
(2) on fait lapproximation que les proprits des orbitales atomiques des atomes isols sont peu
prs prserves lorsque les atomes forment une molcule. Ceci est vrai au premier ordre, et on
pourrait prendre en compte des termes de corrections (ce qui nest pas trs important pour
une premire comprhension du phnomne de liaison). On suppose donc
D
E
D
E
A EA ,
B EB ,
A |H|
B |H|
et
hA |B i = hB |A i 0.
Avec ces approximations, on obtient
(
EA cA + cB = EcA ,
cA + EB cB = EcB .
Le rcherche des tats dnergie pour llectron situ au voisinage des noyaux atomiques A et B
se rsume ainsi un problme de recherche de vecteurs propres (cA , cB ) et de valeurs propres E
dans un espace de dimension 2, pour la matrice symtrique coefficient rels :


EA
.
EB
Tant que 6= 0 ou EA 6= EB , il existe pour cette matrice deux sous espaces propres de dimension 1,
orthogonaux entre eux, et associs deux valeurs propres E1 , E2 :
p
p
(EA EB )2 + 4 2
(EA EB )2 + 4 2
EA + EB
EA + EB

,
E2 =
+
. (14.2)
E1 =
2
2
2
2
Le calcul des vecteurs propres associs ne pose ensuite plus de difficult de principe. Nous interrompons toutefois les calculs, et nous discutons la signification physique de ce rsultat.
14.1.4 Orbitales liante et antiliante
Dans la molcule AB, les niveaux dnergie atomiques | A i et | B i perdent leur qualit dtats
propre du Hamiltonien. Ils se combinent pour crer deux nouveaux tats dnergie, que nous notons
| 1 i et | 2 i associs aux nouvelles nergies E1 et E2 . Dans ces tats, du fait du mlange de | A i

14.1 La molcule diatomique : liaison chimique et liaison ionique

229

et | B i, llectron se retrouve cheval, ou plutt rparti sur les deux atomes de la molcule. Ce
mlange des tats | A i et | B i est dit phnomne dhybridation.
Lorsque les tats | A i et/ou | B i sont initialement porteurs dlectrons, une grande partie
de la physique du rapprochement des atomes A et B se joue dans la manire dont E1 et E2 se
comparent aux nergies initiales EA et EB . Dans ce qui suit, nous supposons, quitte changer
les atomes A et B, que EA < EB .
Proprit 14.1. Les nergies E1 , E2 , EA et EB sont ranges dans lordre suivant :
E1 EA EB E2 .
Proprit 14.2. Les nergies E1 , E2 sont rparties de manire symtrique autour des nergies
EA , EB , au sens o
EA + EB
E1 + E2
=
.
2
2
p
La premire proprit provient simplement de la minoration (EA EB )2 + 4 2 EA EB
0. On a ainsi E2 EB et E1 EA . La seconde proprit rsulte directement de la dfinition (14.2)
des nergies E1 , E2 .
On reprsente les orbitales atomiques | A i et | B i et les orbitales molculaires | 1 i et | 2 i
dans le diagramme nergtique de la figure 14.3. La nouvelle orbitale | 1 i a une nergie plus
basse que les niveaux atomiques. Elle offre une situation nergtiquement plus favorable pour un
lectron. Elle est dite orbitale liante. La nouvelle orbitale | 2 i a une nergie plus haute que les
niveaux atomiques. Elle offre une situation nergtiquement moins favorable pour un lectron. Elle
est dite orbitale anti-liante.

Fig. 14.3. Eclatement des niveaux atomiques des atomes A et B en deux orbitales molculaires. Laxe
dnergie du diagramme nergtique de la molcule nest pas reprsent.

On peut se demander ce qui dtermine la diffrence dnergie note E = E2 E1 . Posant 1


x=
on a
E =

x +

EA EB
0,

x2 + 4

= ||

.
x + x2 + 4

1. Pour mmoire, les signes de | A i et | B i ont t choisis pour imposer la convention 0.

230

14 La liaison chimique : des molcules diatomiques aux corps solides

On voit que le caractre stabilisant de lorbital liante (et D


de mme, E
le caractre dstabilisant

de lorbitale antiliante) est proportionnel lnergie || = A |H|B , avec une constante de


proportionnalit dautant plus grande que les nergies atomiques EA et EB sont initialement
proches.
14.1.5 Hybridation de deux niveaux atomiques proches en nergie : la liaison
chimique covalente
Maintenant que nous connaissons les nergies des orbitales molculaires, cherchons dterminer
leur forme. Le calcul gnral na pas grand intrt, et il est plus instructif de se concentrer sur
quelques situations extrmes. Dans ce paragraphe, nous considrons le cas o les niveaux atomiques
qui se mlangent ont initialement la mme nergie : EA = EB .
Forme des orbitales
Les nergies des orbitales molculaires sont ici simplement :
E1 = EA + ,

E2 = EB .

Utilisant toujours la forme gnrale des orbitales molculaires (14.1), on obtient, pour le vecteur
propre associe E1 , le systme dquation dinconnues cA et cB :
(
EA cA + cB = E1 cA = (EA + )cA ,
cA + EA cB = E1 cB = (EA + )cB .
On voit donc que cA = cB . On en dduit la forme normalise dun reprsentant de lorbitale liante
(moyennant lapproximation dune quasi-orthogonalit de | A i et | B i)
1
| 1 i = (| A i + | B i)
2

(orbitale liante, nergie E1 ).

On calcule de mme ltat propre associ lnergie E2 :


1
| 2 i = (| A i | B i)
2

(orbitale anti-liante, nergie E2 ).

Il est remarquable que ces deux orbitales fassent chacune intervenir les tats atomiques | A i
et | B i avec des poids gaux. Un lectron qui se situe dans ltat liant | 1 i se retrouve ainsi
simultanment prsent sur les deux atomes. On dit quil y a mise en commun de cet lectron. Le
diagramme dnergie obtenu est prsent en figure 14.4.
Liaison chimique covalente
Considrons le cas o les niveaux | A i et | B i sont initialement chacun porteurs dun lectron.
Lors du rapprochement, la formation de lorbitale liante permet ces deux lectrons dabaisser progressivement leur nergie. La rpartition schmatique obtenue ( laide de la rgle de remplissage)
est donne en figure 14.5.
La paire dlectrons se retrouve mise en commun entre les deux atomes. Il en rsulte un abaissement de lnergie lectronique totale dune quantit 2||, qui peut valoir en pratique jusqu 1 eV.
Comparativement, lnergie dagitation thermique kB T la temprature ambiante de T = 300 K
nest que de 0.026 eV. Cette situation, extrmement stable et favorable, pousse les deux atomes
rester en permanence accrochs lun lautre : cest la liaison chimique covalente. Elle est trs
difficile casser sans important apport extrieur dnergie.

14.1 La molcule diatomique : liaison chimique et liaison ionique

231

Fig. 14.4. Diagramme nergtique de la molcule issue de lhybridation de deux orbitales atomiques de
mme nergie.

Fig. 14.5. Liaison chimique : mise en commun des lectrons de chaque atome sur lorbitale molculaire
liante.

14.1.6 Hybridation de niveaux atomiques peu compatibles : liaison ionique


Nous considrons ici le cas o la diffrence EB EA entre les niveaux dnergie devient grande :
x=

EA EB
 1.

Nous supposons toujours que EB > EA .


Forme des orbitales
Les nergies des orbitales liante et antiliante sexpriment en fonction de et x selon

x + x2 + 4
x + x2 + 4
E1 = EA +
,
E2 = EB
.
2
2
Comme x  1, on peut effectuer un dveloppement limit en  =
E1 = EA +  + O(3 ),

1
x

des nergies E1 , E2 :

E2 = EB  + O(3 ).

232

14 La liaison chimique : des molcules diatomiques aux corps solides

Les nergies molculaires E1 , E2 restent ainsi trs proches des nergies atomiques. Procdons
au calcul de la forme des orbitales | 1 i et | 2 i. Les quations sur cA et cB scrivent ici, pour
lnergie E1 :
(
EA cA + cB = E1 cA ' (EA + )cA ,
cA + EB cB = E1 cB ' (EA + )cB .
De ces deux quations on tire, lordre 1 en , que cB = cA + O(2 ). On en dduit la forme,
normalise lordre 1 en , de lorbital liante :
| 1 i ' | A i + | B i

(orbitale liante, nergie E1 ).

On calcule de mme pour lnergie E2 :


| 2 i ' | B i | A i

(orbitale anti-liante, nergie E2 ).

Non seulement les nergies, mais galement les orbitales molculaires elles-mme restent trs
proches des tats atomiques | A i et | B i. Ces derniers se mlangent en fait peine. Ltat
liant | 1 i est ainsi essentiellement ltat | A i, perturb au premier ordre par | B i, et ltat
antiliant | 2 i est ltat | B i perturb au premier ordre par | A i. Un lectron se trouvant dans
une de ces orbitales molculaires reste donc essentiellement localis sur lun ou lautre des atomes.
Il ny a presque pas de mise en commun. Le diagramme dnergie correspondant est prsent en
figure 14.6.

Fig. 14.6. Diagramme nergtique de la molcule issue de lhybridation de deux orbitales atomiques trs
dcales en nergie.

Liaison ionique
Considrons nouveau le cas o, avant dtre rapprochs, les niveaux | A i et | B i sont
chacun porteurs dun lectron. La paire dlectrons vient se placer dans lorbitale liante. Comme
elle correspond peu de choses prs ltat | A i, cela revient dire que les deux lectrons se
regroupent sur latome A : latome A gagne un lectron, et latome B en perd un. La molcule
ressemble ainsi la simple juxtaposition de deux ions A et B + .
Que se passe-t-il prsent si lon cherche casser la molcule en sparant les deux atomes ?
Il est peu probable quun lectron retourne se placer sur ltat | B i. Lnergie reprendre est
souvent de lordre de 1 eV, ce qui est extrmement couteux. Une solution bien plus rentable pour
la paire dlectrons consiste rester sur latome A, et de continuer ne peupler que ltat | A i.

14.1 La molcule diatomique : liaison chimique et liaison ionique

233

Le cot nergtique de la sparation de la molcule nest plus que 2||, soit en pratique quelque
chose de lordre de 0.1 eV. Les deux ions A et B + se sparent, sans se restituer leurs lectrons
(voir la figure 14.7).

Fig. 14.7. Liaison ionique : llectron de latome B tombe dans lorbitale liante de la molcule. La
diffrence essentielle avec la liaison chimique vient de ce quici, cette orbitale liante est en premire approximation ltat | A i de latome A.

Un nouveau rapprochement des deux ions reformera la molcule, mais en ne mettant plus en
jeu que lnergie 2||, typiquement 10 fois infrieure lnergie de la liaison chimique. Ce type de
liaison assez fragile dans laquelle un atome donne un lectron lautre est nomm liaison ionique.
Elle peut garder une certaine solidit temprature ambiante. Nanmoins, une lgre perturbation
de lenvironnement de la molcule (sa dilution dans leau, notament) peut suffire la dissocier.
Dune certaine manire, la liaison ionique est une liaison chimique rate. . .
14.1.7 Compatibilit des orbitales atomiques
Nous voyons que lors de la formation dune molcule, deux tats atomiques ne se mlangent
rellement que sils sont initialement suffisament proches en nergie lun de lautre. Nous trouvons
l une justification a posteriori de lapproximation CLOA.
Par ailleurs mme Ddans le casE extrme o EA = EB , lhybridation nest pas systmatique. Le
B soit non nul, et surtout, ait une valeur significative, loin daller
fait que le terme = A |H|
de soit, est en fait un phnomne spcifique dune certaine compatibilit des tats | A i et | B i
pouvoir se combiner. Cette compatibilit dpend pour beaucoup des proprits de symtrie des
fonctions donde qui dcrivent | A i et | B i, et il nest pas rare quentre deux tats quelconques,
soit si petit quil puisse tre considr comme nul au regard des nergies caractristiques du
problme. Dans le cas particulier des molcules diatomiques, on peut mme avoir exactement
gal zro !
Malgr la profusion des tats lectroniques en prsence, la plupart des orbitales molculaires
des molcules diatomiques sont ainsi :
soit des tats atomiques qui nont pas trouv shybrider ;
soit des hybrides mettant en jeu un seul tat de latome A et un seul tat de latome B (le
seul qui leur soit compatible, tant du point de vue de la condition EA EB , que du point
de vue 6= 0).
Dans les molcules trois atomes et plus, des situations dhybridation plus complexes peuvent
survenir, dans lesquelles trois orbitales atomiques ou plus se combinent avec des poids comparables.
Il nen reste pas moins quune compatibilit pralable des atomes est ncessaire pour garantir la
stabilit de lensemble.

234

14 La liaison chimique : des molcules diatomiques aux corps solides

14.1.8 Exemples
Molcules homonuclaires
Ce sont les molcules qui rassemblent deux atomes de mme nature (atomes A et B identiques).
Les niveaux atomiques mis en prsence sont alors les mmes de part et dautre de la molcule. En
gnral, ces niveaux shybrident par paires, chaque niveau de latome A salliant son homologue
de latome B pour former les nouvelles orbitales molculaires.
Le schma de la figure 14.8 vaut pour tous les atomes, et montre de manire schmatique
comment fusionnent les 5 premiers niveaux atomiques. Les chimistes ont dvelopp pour dsigner
ces orbitales atomiques et molculaires toute une nomenclature que nous indiquons ici.

Fig. 14.8. Les premires orbitales molculaires hybrides de la molcule homo-nuclaire. Les hybridations
sont systmatiques entre niveaux atomiques homologues de chaque atome. Ce diagramme de principe vaut
quelque soit la molcule considre.

Sur la base de ce schma, tudions par exemple la formation de la molcule dhydrogne. On


peut dessiner pour cette molcule le diagramme de la figure 14.9. Les deux lectrons mis en jeu
tombent dans lorbitale liante 1 , et abaissent leurs nergies : il y a donc bien liaison chimique.
Nous avons confirmation thorique de lexistence de la molcule H2 .

Fig. 14.9. Diagramme nergtique de la liaison chimique dans la molcule H2 .

14.2 Structure lectronique des corps solides : thorie des bandes

235

Essayons nous au mme exercice pour crer une molcule diatomique avec des atomes dhlium
(2 lectrons par atome). Du fait des rgles de remplissage, les quatre lectrons du systme sont
obligs de peupler non seulement lorbitale liante, mais galement lorbitale antiliante (voir la
figure 14.10). Lnergie lectronique totale de la molcule reste ainsi trs proche de celle des atomes
spars. Si lon tient compte par ailleurs de la rpulsion lectrostatique entre les noyaux atomiques,
de lagitation thermique et de lintrt, au plan entropique, de laisser les atomes spars, il apparat
que cette molcule nest pas stable. Nous comprenons ainsi qualitativement pourquoi la molcule
He2 nexiste pas.

Fig. 14.10. Diagramme nergtique de la molcule He2 . Lorbitale antiliante, qui reoit deux lectrons,
empche labaissement nergtique ncessaire pour la liaison chimique.

Molcules htronuclaires
Nous donnons ici lexemple de la molcule dacide fluorhydrique HF. Cette molcule, ltat
de gaz dans les conditions normales de temprature et de pression, se dissout facilement dans leau
en se dissociant de manire totale selon :
HF H+ + F
Latome de fluor porte lorigine 9 lectrons, et celui dhydrogne un seul. Dans le diagramme de la
figure 14.11, aucune des orbitales atomiques du fluor ne se trouve directement en face du niveau 1s
de lhydrogne. Dans le rapprochement, quasiment aucun tat atomique nest ainsi modifi. On
note juste une discrte hybridation entre un des niveaux 2p du fluor et le niveau 1s de lhydrogne.
Lorbitale molculaire liante dans laquelle llectron de lhydrogne descend nest ainsi autre quune
des orbitales 2p du fluor. Cet lectron reste pig sur le fluor lors de la sparation des deux atomes,
pour un cot nergtique modeste. Ceci explique la facile dissociation de la molcule en ions F
et H+ .

14.2 Structure lectronique des corps solides : thorie des bandes


Lorsquun corps solide se forme, ce ne sont en gnral pas un, mais des milliards datomes qui
sont mis cte cte.
14.2.1 Approximation CLOA
Considrons pour commencer le cas simple o les atomes rapprochs sont tous les mmes. Cette
situation correspond par exemple au cas du graphite ou du diamant (corps uniquement forms
datomes de carbone), au cas des mtaux purs (aluminium, cuivre, fer, zinc, plomb, or, platine,. . . ),
ainsi quau cas de certains semiconducteurs utiliss dans llectronique, comme le silicium ou le
germanium. De mme que dans la molcule diatomique, les niveaux homologues des divers atomes

236

14 La liaison chimique : des molcules diatomiques aux corps solides

Fig. 14.11. Diagramme nergtique de la molcule dacide fluorhydrique HF. Elle ne doit son existence
qu un lger abaissement dun des niveaux 2p du fluor, par discrte hybridation avec lorbitale 1s de
lHydrogne, pourtant dj loigne en nergie.

se mlangent entre eux pour former de nouveaux tats dnergie lectroniques. La diffrence vient
cependant du fait que ce ne sont pas 2, mais N tats qui shybrident simultanment, et que ce ne
sont pas 2 orbitales, mais N orbitales qui sont formes chaque fois, avec N souvent de lordre
de NA 1023 ! Si lon considre les nergies de ces orbitales, on constate par ailleurs quelles ne
sont pas beaucoup plus disperses que les orbitales liante et antiliante de la molcule diatomique.
On obtient ainsi schmatiquement le diagramme nergtique de la figure 14.12.

Fig. 14.12. Formation de bandes dnergie par hybridation des orbitales atomiques dans un corps form
dun seul type datome.

14.2 Structure lectronique des corps solides : thorie des bandes

237

Bandes dnergies
Par hybridation, chaque niveau atomique donne naissance un petit continuum dnergie,
dextension limite : la bande dnergie. Une bande rsultant de lhybridation de 1 tat par atome
contient exactement N orbitales, une bande rsultant de lhybridation de 2 tats par atome contient
exactement 2N orbitales, etc.
Densit dtat D(E)
Plutt que de considrer sparment les niveaux dngergie de toutes les orbitales, on a coutume
de dfinir une fonction D(E) dite densit dtat, telle que le nombre dorbitale ayant une nergie
RE
comprise entre E1 et E2 soit gal E12 D(E) dE. Sur cette densit dtats, chaque bande prend
lallure dune courbe en cloche.
Dune manire gnrale, le dtail des structures de bande dpend du solide tudi. La forme
prcise, la largeur, et la hauteur des bandes dans la diagramme dnergie est en effet trs sensible,
non seulement la nature de latome dont le solide est constitu, mais galement la manire
dont ces atomes sont rpartis dans lespace. Cest ainsi que la graphite et le diamant, pourtant
deux solides forms de carbone pur, ont des structures de bandes diffrentes.
Pour les solides forms datomes diffrents, ces structures de bandes sont galement observes.
Pour autant, selon la compatibilit chimique des niveaux dnergie des atomes en prsence, les
bandes peuvent parfois tre plus fines, beaucoup plus spares les unes des autres, et leurs nergies
plus calques sur celles des niveaux atomiques sous jacents que dans le cas des corps purs.
14.2.2 Le cas particulier des solides cristallins
Lapproximation CLOA est la seule mthode permettant de donner une premire approximation de la structure de bandes dans dans un solide quelconque. Dans le cas particuliers des solides
cristallins, il existe en revanche un certain nombre de rsultats mathmatiques permettant de
calculer la forme gnrale des tats dnergie lectronique et la structure de bande associe.
Dfinition 14.1 (Rseau de Bravais et solide cristallin). Un solide cristallin est un corps
dont les atomes sont disposs selon un motif qui se rpte priodiquement travers lespace. Plus
prcisment, pour un cristal donn, il existe trois vecteurs indpendants a, b, c R3 (dits vecteurs
de base) tels que quelque soit latome que lon trouve en un point donn r0 de lespace, cet atome
se rpte en tous les autres points r0 + n1 a + n2 b + n3 c, (n1 , n2 , n3 ) Z3 . Le rseau priodique
dfini par les vecteurs a, b, c est appel rseau de Bravais (voir la figure 14.13), et est not R :
R = {n1 a + n2 b + n3 c, (n1 , n2 , n3 ) Z3 }.
Il dfinit la priodicit de larrangement atomique du cristal.
Ceci nest pas quune dfinition mathmatique. Cette proprit sapplique rellement tout un
ensemble de corps, dont nombre sont dorigine naturelle. Ils se forment sur des temps gologiques,
au bnfice de conditions particulires de tempratures et de pression qui favorisent la mise en
ordre priodique des atomes. Cest le cas par exemple des cristaux de quartz, de mica et de
feldspath qui constituent le granit, roche forme dans les profondeurs de lcorce terrestre, ainsi
que de beaucoup de pierres prcieuses. Il sagit alors tout fait de limage traditionnelle du
cristal, qui peut naturellement prendre la forme dun polydre avec des faces planes de diverses
orientations. Certains, plus rares, peuvent galement tre synthtiss : le diamant artificiel, par
exemple, utilis pour la fabrication doutils de meulage nest cependant produit qua ltat de fine
poudre. Le silicium, galement, seul lment dont on sait produire des cristaux de plusieurs dizaines
de centimtres. La plupart des mtaux sont quant eux constitus, lchelle microscopique, dun
micro-assemblage de petits cristaux colls les uns aux autres (les grains, colls entre eux par des
joints de grains, chers la mtallurgie physique).

238

14 La liaison chimique : des molcules diatomiques aux corps solides

Fig. 14.13. Rseau de Bravais pour un cristal maille paralllpipdique rectangle (on parle de rseau
rhombodrique).

Ltude thorique des cristaux se montre ainsi riche denseignements sur de nombreux mtaux et
alliages. La priodicit de larrangement atomique dont il est question ici sarrte bien videmment
sur les bords du corps considr. Cela interfre peu avec les proprits du cristal, du moment
que celui-ci est de taille suffisament grande. Dans ce qui suit, par simplicit, le cristal sera ainsi
rellement suppos de taille infinie. Un cristal est alors caractris par un motif gnrateur, la
cellule unit.
Dfinition 14.2 (Cellule unit). Etant donn un rseau de Bravais R, on peut partitionner
tout lespace en considrant un polyhdre semi-ouvert Q, appel cellule unit, et ses images par le
rseau R :
[
(Q + R) = R3 ,
(R, S) R2 , S 6= R (Q + R) (Q + S) = .
RR

Il existe une infinit de tels polyhdres 2 .


Nous considrons ici la cellule unit particulire
(
Q=

xa + yb + zc,


3 )
1 1
(x, y, z) ,
.
2 2

La connaissance du rseau R et de la disposition des atomes dans le domaine Q suffisent dfinir


compltement la rpartition de tous les atomes du cristal (voir la figure 14.14).

Fig. 14.14. Diffrents choix possibles de cellule unit pour un mme rseau bi-dimensionnel. Le choix
dune cellule de forme simple ( gauche) est une commodit pratique, mais pas une obligation.

2. Il y a une infinit de cellules units, certes. . . Mais certaines constructions sont univoques : cest le cas
de la cellule de Wigner-Seitz, qui a de plus le mrite de conserver les symtries de R. Nous ne prtendons
surtout pas que le choix que nous ferons par la suite est le meilleur !

14.2 Structure lectronique des corps solides : thorie des bandes

239

Il est utile pour la suite de dfinir un rseau obtenu partir du rseau de Bravais : le rseau
rciproque.
Dfinition 14.3 (Rseau rciproque). Le rseau rciproque R0 dun rseau de Bravais R est
lensemble


R0 = n1 a0 + n2 b0 + n3 c0 , (n1 , n2 , n3 ) Z3 ,
o les vecteurs a0 , b0 et c0 , homognes des vecteurs donde, sont dfinis par les relations :

a a0 = 2, b b0 = 2, c c0 = 2,
a b0 = a c0 = b a0 = b c0 = c a0 = c b0 = 0.
La proprit essentielle sous jacente cette dfinition, est que le rseau rciproque regroupe
lensemble des vecteurs donde k tels que :
R R,

eikR = 1.

Cas du rseau rhombodrique


Afin de simplifier lanalyse, on se limite dans la suite au cas du rseau rhombodrique, cest
dire, au cas o les vecteurs de base du rseau de Bravais dfinissent un rpre orthogonal de
lespace :
a = Lx ex , b = Ly ey , c = Lz ez .
Dans ce cas, le rseau rciproque est simplement :


2
2
2
0
3
R = n1 ex + n2 ey + n3 ez , (n1 , n2 , n3 ) Z .
Lx
Ly
Lz
On note ZDB ("zone de Brillouin") la cellule unit 3 de R0 :
(

3 )
1
1
ZDB = xa0 + yb0 + zc0 , (x, y, z) ,
.
2 2
Etats dnergie lectroniques
Pour un lectron introduit dans le potentiel Coulombien priodique du cristal, le Hamiltonien
est de la forme
2
per = ~ + Vper ,
H
2m
o Vper est un potentiel R-priodique, i.e. tel que pour tout R R, Vper (r + R) = Vper (r) presque
partout (en r). Dun point de vue mathmatique, on ne prcise pas pour linstant dans quel espace
fonctionnel se trouve Vper .
Thorme 14.1 (Ondes de Bloch). Une famille libre dtats propres de loprateur Hamiltonien
peut tre construite au moyens de fonctions donde (r) de la forme :
(r) = (r)eikr ,
avec k ZDB, et (r) une fonction R-priodique de lespace. Ces tats gnralisent les ondes de
De Broglie dans le vide, et sont dits ondes de Bloch.

3. On appelle cette cellule la (premire) zone de Brillouin dans les ouvrages de physique.

240

14 La liaison chimique : des molcules diatomiques aux corps solides

Preuve. On prsente ici un argument formel (Pour une dmonstration complte, on renvoie [29]).
Pour L2loc (R3 ) par exemple, on introduit la translation R de vecteur R :
R (r) = (r R).
per commutent,
Du fait de la priodicit du potentiel, on peut montrer que R et le Hamiltonien H
quel que soit le vecteur R R choisi. Il est par ailleurs facile de voir que les oprateurs R
commutent 2 2. Il est donc possible de trouver une base commune de vecteurs propres au
per et tout lensemble des translations R (R R), sous la forme de fonctions
Hamiltonien H
solutions de 4

per = E,
H
(14.3)
R = (R), R R.
Entant donns deux vecteurs R, S R, la seconde condition ci-dessus implique (R + S) =
(R)(S) (car R+S = R S = S R ), et |(R)| = 1 (car ||
R || = ||||, en norme L2 (Q) par
exemple). Ainsi, il existe k R3 tel que (R) = eikR . Le systme (14.3) devient ainsi

per = E,
H
R = eikR , R R.
Posant alors (r) = (r)eikr , on vrifie facilement que pour tout vecteur R du rseau de Bravais,
R (r) = (r), cest dire que est R-priodique. Les tats propres communs au Hamiltonien
et tous les oprateurs de translation sont donc de la forme
(r) = (r)eikr
avec une fonction R-priodique.
On peut naturellement indicer le vecteur donde par k R3 . Pour viter les redondances, il
faut toutefois se restreindre k ZDB, quitte translater k dun vecteur q du rseau rciproque
selon
q R0 , k0 = k + q ZDB.
En effet,

ik r

k0 (r) = (r)eikr = (r)e


,

u
t

et (r)
= (r) eiqr est bien R-priodique.
Structure de bandes

Pour un vecteur donde k ZDB donn, la recherche des ondes de Bloch associes conduit
pour la partie priodique (r) lquation :



~2
i~2
~2 |k|2

Gk =

k + Vper (r) +
= E.
2m
m
2m
per sont dtermines par celles de G
k , pour tous les k ZDB,
Ainsi, les proprits spectrales de H
au sens o
[
per ) =
k ).
(H
(G
kZDB

k est auto-adjoint dinverse compact (en essence, parce que les termes
On peut vrifier que G
0 = ~2 , qui est dinverse compact pour des
supplmentaires sont des perturbations de H
2m
problmes poss sur des ensembles borns).
k est une suite croissante de
On montre alors que pour k ZDB fix, le spectre de G
per en rassemblant les
rels (n (k))nN , homognes des nergies. On obtient le spectre de H
4. On se souviendra pour cela de linterprtation du spectre comme "ensemble des vecteurs propres
gnraliss".

14.2 Structure lectronique des corps solides : thorie des bandes

241

k (k ZDB). Comme on peut montrer par ailleurs que k 7 n (k) est continue
spectres des G
pour tout n 1, on en dduit que In = {n (k), k ZDB} est un intervalle de R, not [n , n ].
Finalement,
[
per ) =
(H
[n , n ].
n1

per est compos de bandes (voir la figure 14.15). De tels


On retrouve ainsi que le spectre de H
diagrammes permettent de discuter du comportement des lectrons.

Fig. 14.15. Structure de bandes (droite) et densit dtats associe (gauche) pour un compos BC3 N3 en
cellule rhombodrique [3]. Sur la structure de bandes sont reprsentes les courbes n (k) obtenues le long
dune ligne brise qui explore les divers recoins de la zone de Brillouin. La courbe la plus basse correspond
n = 0, celle immdiatement suprieure n = 1, etc. Ces courbes ont tendance ne plus voluer de
manire strictement monotone au del de n = 4. Ici, la plupart des bandes se recouvrent les unes les
autres, et la densit dtats prsente lallure dune courbe trs accidente, avec de nombreux pics. A noter
toutefois, sur la densit dtats, un trou aux alentours de -15 eV. Cette particularit est appele gap
dnergie. Elle est lorigine des proprits lectroniques et optiques des matriaux.

14.2.3 proprits lectroniques des solides


Remplissage des bandes
La structure de bandes du spectre nergtique des lectrons dans un solide est lorigine de
proprits lectroniques et/ou optiques remarquables. Du fait que, dans le solide qui ne contient
quun seul type datomes, chaque bande contient exactement un nombre dtats gal un multiple
du nombre total N datomes, et que par ailleurs, le nombre total dlectrons qui viennent remplir
ces bandes est galement multiple de N , il est possible selon les circonstances que le remplissage
sarrte exactement en limite de bande.
Sur les schmas de la figure 14.16, nous reprsentons la manire dont les lectrons viennent
remplir les bandes dnergie dans le lithium (3 lectrons par atome) et dans le graphite (6 lectrons
par atome).
Dans la cas du lithium, le nombre total dlectrons dans le solide est 3N si on a N atomes
dans le solide. La bande la plus basse comporte N orbitales, et du fait du spin, peut accueillir
2N lectrons. La bande immdiatement suprieure accueille les N lectrons restant, et se retrouve
ainsi moiti remplie.

242

14 La liaison chimique : des molcules diatomiques aux corps solides

Fig. 14.16. Remplissage des bandes dnergie par les lectrons dans le lithium et le Graphite. Le remplissage commence par les orbitales les plus basses en nergie, raison de 2 lectrons par orbitale, et se
poursuit progressivement vers les orbitales immdiatement suprieures. Les bandes, ou portions de bandes
ainsi occupes apparaissent en gris.

Dans le cas du carbone, la structure de bande est lgrement diffrente. La bande suprieure
connat une anomalie, qui la spare en deux sous bandes. La sous bande infrieure porte extactement N orbitales. Les 6N lectrons viennent ainsi remplir en entier les 2 bandes du bas et cette
sous bande. Le remplissage sarrte exactement au ras de la 2me sous bande.
Matriaux conducteurs, matriaux isolants
Considrons la structure lectronique qui a t obtenue dans le lithium. Le remplissage des
lectrons sarrte mi-bande, un niveau nomm nergie de Fermi. Le niveau de Fermi F est
dfini par la relation
+ Z
2 X
1  (k) dk = Ncel ,
|ZDB| n=1 ZDB F n
o Ncel est le nombre dlectrons par cellule. Cette nergie se situe en plein continuum, et il existe,
juste au dessus delle, un foisonnement dorbitales libres. Il est ainsi possible de communiquer au
systme dlectrons de trs petites quantits dnergie. Il suffit pour cela de prendre des lectrons
juste en dessous du niveau de Fermi, et de les faire passer juste au dessus, en les excitant.
Communiquer une trs faible quantit dnergie, cest prcisment ce que lon fait lorsque
lon cherche crer un courant lectrique, cest dire imprimer aux lectrons un mouvement
densemble. Dans le cas du lithium, le remplissage des bandes est tel que ces faibles montants
dnergie peuvent tre accepts. Le lithium est ainsi un matriau conducteur lectrique.
La situation est en revanche trs diffrente lorsque le remplissage des bandes sarrte sur une
bande pleine. Il peut en effet se produire quun vide existe entre la dernire bande remplie et la
bande suivante (voir la figure 14.17) : on parle de gap dnergie. Il est alors impossible de fournir
au systme dlectrons une nergie infrieure la largeur E du gap. Dans certains corps E
peut tre de lordre de quelques eV. Cest peine perdue que de chercher y crer des courants
lectriques de manire douce, les lectrons refusant systmatiquement lapport dnergie propos.
Le matriau est dit isolant lectrique 5 .
Il existe des situations intermdiaires, dans lesquelle un gap existe, mais de largeur plus modeste, typiquement infrieure ou gale 1 eV (1,21 eV dans le silicium). Les matriaux sont alors
5. Un courant lectrique peut toujours nanmoins tre cr dans les isolants en appliquant de trs
fortes tensions. Il ne sagit alors plus de conduction lectrique proprement dite, mais de claquage, qui
saccompagne gnralement dun endomagement du matriau l ou le courant est pass.

14.2 Structure lectronique des corps solides : thorie des bandes

243

Fig. 14.17. Le gap dnergie : le remplissage des orbitales lectroniques sarrte exactement sur un bord
de bande. Lorbitale dnergie immdiatement suprieure est distante dun intervalle E.

dits semi-conducteurs. Il est possible, par des sollicitations extrieures modres, ou par des modifications chimiques mineures lors de leur fabrication, de leur faire prendre sur commande des
proprits de conducteurs lectriques ou disolants. Cest l ce qui fait leur intrt dans les machines
lectroniques.
Transparence optique des isolants grand gap
De mme quil est difficile un isolant daccepter de lnergie pour produire un courant lectrique, il est aussi difficile ce mme isolant daccepter dabsorber un photon. Toujours cause
de la prsence du gap, seuls les photons dnergie ~ E ont de relles possibilits de pouvoir
tre absorbs (voir la figure 14.18).

Fig. 14.18. Absorption ou transmission dun rayonnement dans un isolant en fonction de lnergie du
photon incident. A gauche, lnergie ~ est infrieure au gap. Aucune absorption ne peut avoir lieu. A
droite, lnergie est suffisante pour pouvoir porter un lectron de la bande pleine dans un des tats dnergie
de la bande suprieure. Labsorption a lieu.

Dans le diamant, par exemple, il existe un gap de 7 eV de largeur. Les photons de la lumire
visible ont eux des nergies typiquement comprises entre 1.5 eV (lumire rouge) et 3 eV (lumire
violette). Ces nergies sont trop faibles pour tre absorbes, et nous comprenons ainsi lexceptionnelle transparence optique du diamant. Les premiers rayonnements absorbables correspondent
des photons de 7 eV, ce qui se situe dj loin dans lultraviolet. Il en va de mme pour le quartz
et le verre, qui sont respectivement les formes cristalise et amorphe de la silice (dioxide de silicium SiO2 ). Le verre ne laisse passer que la lumire visible, alors que le quartz, dont le gap
nergtique est plus grand, se laisse aussi traverser par le rayonnement ultraviolet. Cela explique
pourquoi il est impossible de bronzer derrire une vitre, et pourquoi les lampes bronzer (lampes
UV) doivent tre fabriques en quartz.

244

14 La liaison chimique : des molcules diatomiques aux corps solides

A loppos, les matriaux qui possdent des gaps plus faibles, et en particulier, tous les matriaux conducteurs, ne peuvent pas tre transparents la lumire. 6

6. Une nuance peut cependant tre apporte : sil est vrai que labsence de gap fait que tout rayonnement
est susceptible dtre absorb, le mcanisme dabsorption rclame cependant quune certaine paisseur de
matriau soit traverse pour que labsorption soit totale. Cette paisseur varie selon les longueurs donde.
De quelques microns pour la lumire visible, elle passe plusieurs centimtres pour les rayons X, voire
plusieurs mtres pour les rayons . Cest ainsi que les minces films dor dont sont recouvertes les visires
de certains avions restent globalement transparents la lumire visible, en dpit de leur conductivit,
et quil est illusoire de vouloir se cacher derrire une feuille de papier daluminium pour se protger de
rayonnements issus de sources radioactives.

14.2 Structure lectronique des corps solides : thorie des bandes

245

Exercices
Exercice 14.1 (Un modle simple de liaison chimique).
Prliminaire
On considre, dans lespace tridimensionnel (x, y, z), la bote quantique paralllpipdique
(x, y, z) [0, a]3 . Le potentiel est nul lintrieur, et on rappelle que la fonction donde dune
particule de masse m confine dans la bote doit sannuler sur les bords de celle-ci.
(1) Ecrire lquation de Schrdinger indpendante du temps qui dfini la partie spatiale (x, y, z)
dun tat stationaire dnergie E.
(2) On admet que ces tats dnergie peuvent tre recherchs sous la forme factorise
(x, y, z) = x (x)y (y)z (z).
Calculer la forme gnrale de ces tats, et en dduire lnergie de ltat fondamental.
Liaison entre deux botes
(1) On considre deux botes spares, qui reprsenteront pour nous deux atomes, chacune de
dimensions aaa avec a = 1 , et contenant chacune un lectron dans son tat fondamental.
Calculer lnergie lectronique totale des deux botes.
(2) On fait se toucher les deux botes, de sorte ce quelles ne forment plus quune seule grande
bote de dimensions a a 2a. Quelle est la nouvelle nergie lectronique ?
(3) Quel est le gain nergtique du rapprochement (nergie de liaison) ? Faire lapplication numrique.
Exercice 14.2. On peut montrer directement quil ny a pas de spectre discret pour le solide priodique. Ceci montre au passage que lespace de Hilbert usuel nest pas le bon espace considrer,
car on ne peut pas avoir dtats lis.
et E = Ker(H
Id) (de dimension N ). Montrer que si f E, alors fp E
(1) Soit d (H)
avec fp (x) = f (x + p) si p R.
PN
(2) En considrant une base (ui )i=1,...,N de E, en dduire quon peut crire fp (x) = i=1 p,i ui
PN
2
| = 1.
avec i=1 |p,i
(3) Montrer que pour tout  > 0, il existe R > 0 tel que
Z




1 i, j N,
ui uj ij .

BR

(4) En calculant
+.

R
BR

|fp |2 de deux manire diffrentes, obtenir une contradiction lorsque |p|

Exercice 14.3 (Cassage des molcules diatomiques par exposition la lumire).


Il arrive quune molcule claire en lumire visible ou ultraviolette voie certaines de ses liaisons chimiques se rompre. En prenant lexemple de la molcule H2 , pouvez-vous proposer une
explication pour ce mcanisme de dissociation ? Exprimer la frquence de rayonnement minimale
utiliser en fonction de lnergie de liaison de la molcule.
Exercice 14.4 (Formation dune bande dnergie dans une chane atomique).
On considre une chane linaire de N atomes identiques, et on cherche, dans le cadre de lapproximation CLOA, calculer les orbitales molculaires rsultant de lhybridation des N exemplaires dun de leurs niveaux atomiques. On note |i i lorbitale atomique porte par latome i
(1 i N ). On suppose que :

246

14 La liaison chimique : des molcules diatomiques aux corps solides

hi |j i = 0 si i 6= j,

j
i |H|

E
=

si i = j,
si i = j 1,
sinon.

On cherche les orbitales molculaires sous la forme


|i =

N
X

ci |i i .

i=1

(1) Ecrire dans la base {|1 i, |2 i, , |N i} la matrice N N reprsentant le Hamiltonien H


du systme.
(2) Vrifier que les N vecteurs propres de cette matrice peuvent tre recherchs sous la forme :
ci = Cste sin(k i),
pour des nombres k sans dimension dterminer. Quelles sont les nergies Ek associes ?
(3) Reprsenter lallure de la rpartition des nergies Ek sur un diagramme nergtique. Quelle
est la largeur de la bande obtenue ?
(4) Chaque niveau |i i est initialement porteur dun lectron. Quel est le gain nergtique de la
formation de la chane ?

A
Constantes physiques fondamentales

A.1 Constantes physiques les plus utilises


Le Tableau A.1 rappelle des constantes utiles en physique statistique et quantique.
Tableau A.1. Principales constantes physiques utiles en physique statistique et quantique.
Grandeur physique

Notation usuelle

Valeur

Nombre dAvogadro
Constante de Boltzmann
Constante de Planck
Charge de llectron
Masse de llectron
Masse du proton
Masse du neutron
Permittivit dilectrique du vide
Electron-Volt
Constante de gravitation
Vitesse de la lumire

NA
kB
~
e
me
mp
mn
0
eV
G
c

6, 02 1023
1, 381 1023 J/K
1, 054 1034 Js
-1, 602 1019 C
9, 11 1031 kg
1, 672 1027 kg
1, 674 1027 kg
8, 854 1012 F/m
1, 602 1019 J
6, 67 1011 m3 kg1 s2
2, 998 108 m/s

A.2 Units atomiques


On travaille usuellement, en chimie quantique, dans le systme dunits o
me = 1,

e = 1,

~ = 1,

1
= 1.
40

Dans ce cas, lunit de masse est 9, 11 1031 kg, lunit de longueur est le rayon de Bohr
a0 = 5, 29 1011 m, lunit de temps est 2, 42 1017 s, et lunit dnergie est le Hartree
Ha = 4, 36 1018 J = 27,2 eV = 627 kcal/mol. Ce changement dunit permet de travailler avec
des valeurs intuitives des grandeurs physiques : ainsi, les distances moyennes typiques entre un
lectrons et le noyau auquel il est rattach sont de lordre du rayon de Bohr, et les nergies des
tats fondamentaux (en valeur absolue) de lordre de quelques Ha pour les petits systmes.

B
Analyse numrique des schmas dintgration

Nous rappelons ici (brivement) des notions importantes pour lanalyse numrique des schmas
dintgration des EDO. Le lecteur intress par plus de dtails pourra par exemple se rfrer [9].
On considre ici une mthode numrique un pas, pour un pas de temps constant t et des temps
tn = nt :
y n+1 = t (tn , y n ),
(B.1)
dont le flot t est une approximation du flot t de lEDO
t [0, T ],

y = f (t, y(t)),

y(0) = y 0 + ,

(B.2)

o est un petit paramtre prcisant lapproximation de la condition initiale. Ainsi, y n est une
approximation au temps tn de la solution exacte y(tn ) de (B.2).
On suppose par la suite que le champ de force f est globalement Lipschitzien. Dans ces conditions, le problme de Cauchy (B.2) est bien pos sur des temps t T , T < + fix, et on peut
tudier thoriquement la convergence des schmas numriques. Une tude dans un cas plus gnral
demande un traitement spcifique au systme considr.

B.1 Consistance et ordre


Dfinition B.1 (Consistance). Soit T > 0 fix et N = T /t un entier. On dit que la mthode
numrique (B.1) est consistante avec lquation diffrentielle (B.2) si
N
X

|y(tn + t) y(tn ) tt (tn , y(tn ))| 0

n=1

lorsque t 0.
La quantit |y(tn+1 ) y(tn ) tt (tn , y(tn ))| est lerreur de consistance locale, et reprsente
lerreur intrinsque dapproximation du schma numrique. La dfinition prcdente signifie que
lerreur de consistance est ngligable pour t suffisamment petit.
En pratique, pour vrifier la consistance, on a souvent recours la notion dordre dun schma :
Dfinition B.2 (Ordre). Soit t > 0. On dit que la mthode numrique (B.1) est dordre p si
|y(tn + t) y(tn ) tt (tn , y(tn ))| Ktp+1
pour t t0 suffisamment petit.
Ainsi, une mthode dordre 1 ou suprieur est consistante (si on peut montrer que la constante
K dans la dfinition B.2 est uniforme).

250

B Analyse numrique des schmas dintgration

Exemple B.1 (Schma dEuler explicite). Pour le schma dEuler explicite et f autonome (ne dpendant pas explicitement du temps), on a, par un dveloppement de Taylor,
y(tn + t) y(tn ) tt (y(tn )) =

t2 00
t2 0
y (tn )) + O(t3 ) =
f (y(tn ))f 00 (y(tn )) + O(t3 ).
2
2

Ceci montre que le schma dEuler explicite est dordre 1. Dans le cas o le champ de force f est
drives bornes, on obtient galement la consistance de la mthode numrique.

B.2 Convergence
Dfinition B.3 (Stabilit). On dit quune mthode numrique est stable sil existe une constante
M > 0 telle que pour toutes suite y n , z n , n (n 0) vrifiant
 n+1
y
= y n + tt (tn , y n ),
n+1
z
= z n + tt (tn , y n ) + n ,
on ait
max |z y | M
n

0nN

|y z | +
0

!
| | .
n

n<N

La stabilit prcise la robustesse du schma face laccumulation des erreurs locales (ou darrondi). Cest une notion pertinente sur un temps T > 0 donn.
Remarque B.1. En particulier, une instabilit ventuelle "en temps long" (T +, t fix) ne
contredit pas la consistance, qui est une convergence trajectorielle dans le cas limite t 0 pour
T fix.
Dfinition B.4 (Convergence). On dit que la mthode numrique est convergente si
max |y(tn ) y n | 0

0nN

lorsque 0, t 0.
On montre facilement quune mthode stable et consistante est convergente.

B.3 Stabilit linaire en temps long


En pratique, on ne sait caractriser facilement la stabilit de manire simple que dans le cas de
champs de force globalement Lipschitziens. Ceci revient en fait caractriser la limite de stabilit
pour des champs de force linaires. Dans ce cas,
y n+1 = A(t)y n
en supposant toujours le champ de force f autonome.
On voit alors facilement quune mthode est stable sur des temps longs si et seulement si
les valeurs propres de la matrice A(t) sont de module infrieur ou gal 1 (|(A(t))| 1).
Considrant une autre solution, partant de z 0 et ne subissant pas de perturbations chaque pas
de temps, et pour une norme euclidienne par exemple, on a en effet
|y n+1 z n+1 | |(A(t))| |y n z n |,
et donc
|y N z N | |(A(t))|N |y 0 z 0 |.

B.3 Stabilit linaire en temps long

251

Pour un potentiel gnral V rgulier, ayant un minimum local en q0 , on a le dveloppement de


Taylor en q0 :
1
V (x) = V (q0 ) + (q q0 )T 2 V (q0 ) (q q0 ) + O(|x x0 |3 ).
2
La stabilit linaire studie alors en considrant le potentiel
1
Vlin (x) = V (q0 ) + (q q0 )T 2 V (q0 ) (q q0 ),
2
qui conduit en effet un champ de forces linaire
Vlin (q) = 2 V (q0 ) (q q0 ).
On peut ensuite se ramener ltude de la stabilit linaire en dimension 1 au travers dun
changement de base diagonalisant la matrice symtrique relle 2 V (q0 ).

C
Elements de thorie spectrale

On prsente dans ce chapitre les fondements de la thorie spectrale, en insistant tout particulirement sur les oprateurs auto-adjoints. On prendra garde au fait que nombre de raisonnements
ou de proprits vrais dans le cas dun espace de dimension finie, ne le sont plus pour des espaces de dimension infinie ! On peut citer par exemple le fait que toutes les normes ne sont pas
quivalentes, que les oprateurs linaires ne sont pas forcment continus, quune application peut
tre injective sans tre surjective (et rciproquement) - et donc en particulier, ce nest pas parce
quune application a un noyau rduit {0} que lon peut linverser ! Ce chapitre est donc lire
et relire tranquillement. . . jusqu ce que les affirmations ci-dessus vous semblent honteusement
contingentes aux espaces de dimension finie !
La thorie spectrale est un outil fondamental pour ltude des systmes quantiques. Citons
deux applications particulirement importantes :
(i) la rsolution de lquation de Schrdinger par dcomposition spectrale (on prsente un cas
particulier en Section 10.4.3) ;
(ii) ltude qualitative voire quantitative de ltat fondamental du systme (voir Chapitre 14) ;
(iii) la caractrisation possible des rsultats de la mesure, dcrite par une observable auto-ajointe
(voir Chapitre 11).

C.1 Oprateurs sur des espaces de Banach


On rappelle quun espace de Banach est un espace vectoriel norm complet (pour la distance
issue de sa norme), et quun espace de Hilbert est un espace de Banach muni dun produit scalaire.
Pour deux espaces de Banach E, F , un oprateur T : E F est une application linaire de E
vers F . Lespace vectoriel L(E, F ) des oprateurs linaires de E vers F est muni de la norme
kT kEF =

kT ukF
.
uE\{0} kukE
sup

(C.1)

Lorsque cette quantit est finie, on a un oprateur born :


Dfinition C.1 (Oprateur born). Un oprateur T est un oprateur born si kT kEF < +.
Un oprateur born est un oprateur continu. Bien sr, tous les oprateurs ne sont pas borns.
Pour de tels oprateurs, on introduit la notion de domaine D(T ), qui est le sous-espace vectoriel
de E pour lequel T peut tre dfini et prend ses valeurs dans F . Si D(T ) 6= E, loprateur est dit
non-born. Si D(T ) est dense dans E, loprateur est domaine dense.
Remarque C.1. Un oprateur born sur un sous-espace dense stend de manire unique en un
oprateur born sur tout lespace.

254

C Elements de thorie spectrale

Dans le cas gnral, la notion dextension dun oprateur est dfinie par rapport au domaine
(non-ncessairement dense) de loprateur que lon cherche tendre.
Dfinition C.2 (Extension dun oprateur). On dit que T2 est une extension de T1 si D(T1 )
D(T2 ) et si les deux oprateurs concident sur le domaine de T1 .
On dfinit enfin la notion doprateur ferm :
Dfinition C.3 (Oprateur ferm). On dit quun oprateur T de E dans F de domaine D(T )
est ferm si son graphe
(T ) = {(u, T u), u D(T )}
est un ferm de E F . Un oprateur est dit fermable sil possde une extension ferme.
Ainsi, T est ferm si pour toute suite (un ) de D(T ) telle que un u dans E et Aun v
dans F , on a u D(T ) et Au = v.
Exemple C.1. On considre E = F = L2 (]0, 1[) et T u = u0 . Alors D(T ) = H1 (]0, 1[). Si un u
dans L2 (]0, 1[) et u0n v dans L2 (]0, 1[), alors (un ) est une suite de Cauchy dans H1 (]0, 1[), qui
est complet. Ceci montre que u H1 (]0, 1[) et v = u0 au sens de L2 (]0, 1[).
En revanche, si on prenait comme domaine D(T ) = C1 (]0, 1[), alors la suite

x

un (x) =
converge au sens de H1 (]0, 1[) vers

1
2



u(x) = x

1
n2

1/2


1
,
2

qui nest pas dans D(T ). Ceci montre que loprateur T , avec ce domaine, nest pas ferm (le
domaine de dfinition est trop petit). En revanche, il est fermable quitte tendre le domaine de
dfinition H1 (]0, 1[).
Remarque C.2. Tout oprateur nest pas fermable. On peut mditer par exemple le cas de T :
L2 (R+ ) R de domaine D(T ) = C
0 (R+ ) et donn par T u = u(0). En effet, la suite un (x) =
exp(nx) converge vers u = 0 au sens de L2 (R+ ), et T u = 0 ; alors que T un = 1 pour tout n.

C.2 Adjoint dun oprateur


Dfinition C.4 (Adjoint dun oprateur). Soit H un espace de Hilbert, et T un oprateur
domaine dense sur H. Soit D(T ) lensemble dfini par
D(T ) = {u H,

v H,

w D(T ), hT w, ui = hw, vi}.

Loprateur linaire T sur H de domaine D(T ) et dfini par


T u = v
est appel ladjoint de T . Notons que la dfinition de T u = v a un sens par le thorme de Riesz
(qui donne lunicit dun tel v lorsquil existe).
Dfinition C.5 (Oprateur symtrique). On dit quun oprateur T domaine dense est symtrique si T est une extension de T , autrement dit si
(u, v) D(T )2 ,

hT u, vi = hu, T vi .

C.3 Spectre dun oprateur

255

La grande majorit des oprateurs donns par la physique sont formellement symtriques (i.e
3
symtriques sur un espace de fonctions suffisamment rgulires, tel que C
0 (R )). Cette notion
nest pas suffisante dans la majorit des cas, et on voudra souvent avoir affaire des oprateurs
auto-adjoints.
Dfinition C.6 (Oprateur auto-adjoint). Un oprateur est auto-adjoint si T = T . Un oprateur T est essentiellement auto-adjoint si T admet une unique extension auto-adjointe.
Remarque C.3. Un oprateur T est auto-adjoint si et seulement sil est symtrique et D(T ) =
D(T ). En pratique, il est souvent plus ais de vrifier la symtrie que le caractre auto-adjoint,
cette dernire notion demandant en plus de montrer lgalit des domaines D(T ) et D(T ).
Remarque C.4. On peut montrer (voir [29, Section VIII.2]) quun oprateur symtrique est toujours
fermable, mais quil peut avoir plusieurs extensions auto-adjointes. . .

C.3 Spectre dun oprateur


On se place par la suite dans le cas o E = F = H, H tant un espace de Hilbert. Limage
dun oprateur T est lensemble
Im(T ) = {T u, u D(T )}
Dfinition C.7 (Inverse dun oprateur). Un oprateur R est linverse dun oprateur T si
D(R) = Im(T ), D(T ) = Im(R) et
T R = IdIm(T ) ,

RT = IdIm(R) .

On dduit de la dfinition ci-dessus que linverse dun oprateur est unique sil est dfini, et on
note un tel oprateur T 1 . Trouver linverse dun oprateur revient rsoudre lquation T u = f
pour tout f Im(T ). Un critre dexistence dinverse de T est alors que T u = 0 implique u = 0
(T tant alors bijectif H Im(T )). Lexistence dun inverse se rsume ainsi linjectivit de
T : D(T ) H.
Dfinition C.8 (Ensemble rsolvant et spectre). Soit T un oprateur linaire non-born,
ferm, de domaine D(T ). Lensemble rsolvant (T ) de T est lensemble des C tels que
(1) loprateur T Id a un inverse (T Id)1 , cest--dire que (T Id)u = f a une unique
solution pour tout f Im(T Id) (injectivit) ;
(2) le domaine de (T Id)1 (i.e. limage de D(T ) par T Id) est dense dans H (presque
surjectivit) ;
(3) loprateur (T Id)1 est born de (T Id)(D(T )) (muni de la topologie induite de H) dans
H ( continuit de linverse).
Le complmentaire de (T ) dans C est le spectre de T , et on le note (T ).
On montre que lensemble rsolvant est un ouvert de C, et par consquent, le spectre (T ) est
un ferm de C.
Remarque C.5 (Bornes sur le spectre dun oprateur born). Pour un oprateur born, on peut
montrer que
(T ) { C, || kT k}.
Un lment C est dans le spectre de T si une des conditions de la Dfinition C.8 nest pas
remplie. Ceci conduit la classification suivante des lments de (T ) :
Dfinition C.9. Le spectre (T ) est la runion disjointe de trois sous-ensembles :

256

C Elements de thorie spectrale

le spectre ponctuel, not p (T ), qui est lensemble des (T ) pour lesquels T Id nest
pas injectif. De telles valeurs de sont appeles des valeurs propres de T ;
le spectre rsiduel, not res (T ), qui est lensemble des (T ) pour lesquels (T Id)1 est
de domaine non dense dans H. On a alors dfaut de presque surjectivit : Im(T Id) 6= H ;
le spectre continu, not cont (T ), st lensemble des (T ) pour lesquels (T Id)1 est
un oprateur non born de domaine dense dans H (dfaut de continuit).
On peut ventuellement considrer une autre partition du spectre en termes de spectre discret d (T ), qui est lensemble des valeurs propres isoles, de multiplicit finie (i.e. dim Ker(T
Id) < +), et son complmentaire, appel spectre essentiel ess (T ). Le spectre essentiel est donc
lunion des spectres rsiduels et continus, ainsi que des valeurs propres de multiplicit infinie et
des points daccumulation des valeurs propres de multiplicit finie. On a une caractrisation des
lments du spectre essentiel via le
Lemme C.1 (Weyl). Soit T un oprateur auto-adjoint sur un espace de Hilbert H. Alors
ess (T ) si et seulement sil existe une suite (un )n0 de H telle que
kun k = 1,

un * 0,

k(T )un k 0.

La suite (un ) est appele suite de Weyl de T pour la valeur .


Ce Lemme montre que les valeurs ess (T ) sont des "quasi-valeurs propres" au sens o il
existe une suite (un ) dlments de norme 1 telle que Aun un 0.
Remarque C.6 (Lien entre spectre ponctuel dun oprateur et spectre rsiduel de son adjoint). Dans
le cas o (T )\p (T ), on distingue le cas Im( T ) dense (spectre continu) ou non (spectre
rsiduel). Ainsi, par dfinition, res (T ) si et seulement sil existe v 6= 0 tel que
u D(T ),

h( T )u, vi = 0.

T ) 6= {0}, ce qui revient


Donc, pour (T )\p (T ), res (T ) si et seulement si Ker(

p (T ).
Le spectre peut donc tre prcis dans le cas dun oprateur auto-adjoint (voir la Remarque C.6) :
Thorme C.1. Pour un espace de Hilbert sparable 1 H, le spectre dun oprateur auto-adjoint
est contenu dans la droite relle, et son spectre rsiduel est vide.
La premire assertion est rapprocher du fait que les matrices symtriques relles sont diagonalisables et valeurs propres relles. Pour un oprateur auto-adjoint, le spectre essentiel comprend
donc le spectre continu, les valeurs propres plonges dans le spectre continu, et les valeurs propres
isoles de multiplicit infinie.
Exemples
Exemple de spectre rsiduel.
On considre lespace de Hilbert
(
2

l (C) =

(un )n0

+
)
X

2
|un | < + ,


n=0

et loprateur de shift droite T : l2 (C) l2 (C) de domaine D(T ) = l2 (C) donn par
1. Rappelons quun espace de Hilbert H est sparable sil possde un sous-ensemble dnombrable dense,
i.e. sil existe E H dnombrable tel que Vect(E) = H.

C.3 Spectre dun oprateur

257


0 si n = 0,
(T u)n =
un1 sinon.


On a bien sr p (T ) = . Par ailleurs, Im( T ) = (0, u), u l2 (C) nest pas dense dans C,
on sattend donc ce que T possde un spectre rsiduel. Nous allons prciser le spectre de T en
calculant son adjoint et en utilisant la Remarque C.6. Pour trouver ladjoint de T , on crit
X
hT u, vi =
un vn+1 = hu, T vi .
n0

Loprateur T est donc loprateur de shift gauche (T u)n = un+1 , de domaine l2 (C) galement.
On vrifie facilement que kT k = kT k = 1, do
(T ), (T ) {|| 1}.
Par ailleurs, tout C tel que || < 1 est valeur propre de T associ au vecteur propre
(un ) = (n ). On montre galement que T ne peut pas avoir de valeur propre de module suprieur
ou gal 1 (pour des questions de normalisation du vecteur propre). Ainsi,
p (T ) = {|| < 1},
et donc, utilisant la Remarque C.6,
res (T ) = {|| < 1}.
Comme le spectre est ferm, on a galement
(T ) = (T ) = {|| 1}.
Il est dlicat de caractriser la partie {|| = 1} des deux spectres (on pourra consulter [29,
Section VI.3]).
Exemple de spectre continu.
Soit T : L2 (R3 ) L2 (R3 ) dfini par
T u(x) = xu(x),
de domaine
D(T ) = {u L2 (R3 ) | xu L2 (R3 )}.
On montre tout dabord que (T ) R. En effet, soit C\R, alors si ( T )u = v, on a
v(x) = ( T )1 u =

u(x)
.
x

Ceci montre que ( T )1 est continu et de domaine L2 (R3 ). On montre en fait que cest un
oprateur born, de borne k( T )1 k = |Im()|1 .
Montrons prsent (T ) = c (T ) = R. Soit R. On remarque en premier lieu que 6 p (T ),
car (x )u(x) = 0 implique u = 0 au sens de L2 (R3 ). Ensuite, on peut se rendre compte que T
est auto-adjoint, donc que son spectre rsiduel est vide. On conclut alors en trouvant une suite de
3
Weyl pour : par exemple, un = n3/2 u
(n(x )) avec u
C
0 (R ) support dans B(0, 1) et de
norme k
ukL2 (R3 ) = 1, est telle que kun kL2 (R3 ) = k
ukL2 (R3 ) = 1, et
Z
Z
1
|y|2 |
u(y)|2 dy 0,
k(T )un k2L2 (R3 ) =
|x |2 |
u(n(x ))|2 n dx = 2
n R3
R3
et un * 0 car, pour w L2 (R3 ),

Z
Z






u
w
=
u
w
ukL2 (R3 )

n k
3 n
1

R
|x|
n

!1/2

Z
1
|x| n

|w|

0.

258

C Elements de thorie spectrale

C.4 Diagonalisation des oprateurs autoadjoints compacts


Dfinition C.10 (Oprateur compact). On dit quun oprateur T : E F est compact si
limage de la boule unit de E est dadhrence compacte 2 , i.e. de toute suite borne (un )n0 de
E, on peut extraire une sous-suite (Aunk )k0 convergeant dans F .
Bien sr, un oprateur compact est un oprateur born. On dispose dun thorme de diagonalisation des oprateurs compacts :
Thorme C.2 (Diagonalisation des oprateurs compacts). Soit H un espace de Hilbert
sparable de dimension infinie et T : H H un oprateur born auto-adjoint compact. Alors il
existe une suite (n )n0 de rels tendant vers 0, et une base hilbertienne (en )n0 de H telle que
(T ) = (n ) {0},

avec n N, T en = n en .

Par ailleurs, pour tout (T )\{0}, lespace propre E = Ker( T ) est de dimension finie.
Remarque C.7. Le spectre des oprateurs auto-adjoints compacts peut tre de cardinal fini (on dit
quon a un oprateur de rang fini), auquel cas il est de la forme (T ) = p (T ) = {1 , . . . , n }{0}.
Si T nest pas de rang fini, il est possible quil soit injectif si son spectre ponctuel est de la forme
{1 , . . . , n , . . .} avec n 0 lorsque n +. Dans ce cas, c (T ) = {0}.
En pratique, on utilisera surtout le
Corollaire C.1. Soit H est un espace de Hilbert sparable de dimension infinie, et T un oprateur
auto-adjoint non-born sur H. Sil existe (T )R tel que (T )1 soit un oprateur compact,
alors il existe une suite (n )n0 de rels non nuls telle que |n | +, et une base hilbertienne
(en )n0 de H telle que
(T ) = {n } {0},
avec
n N,

T en = n en .

Par ailleurs, pour tout n 0, lespace propre En = Ker(n T ) est de dimension finie.

C.5 Dcomposition des oprateurs auto-adjoints quelconques


On note P lensemble des projecteurs orthogonaux sur H, i.e. P P si P est un oprateur tel
que P = P = P 2 .
Dfinition C.11 (Famille spectrale). Une famille spectrale est une famille (P )R de projecteurs orthogonaux sur H tels que
(1) P P = Pinf(,) ;
(2) s lim,> P = P ;
(3) s lim P = 0,

s lim+ P = Id ;

La limite forte (strong limit) s lim est entendre au sens suivant : s limn+ Tn = T si et
seulement si pour tout x H, Tn x T x.
On notera par la suite S lensembles des familles spectrales. Pour une famille spectrale donne,
on peut dfinir un oprateur T de domaine


Z +
D = x H,
||2 dkP xk2 < +

2. On parle densemble relativement compact lorsque ladhrence de cet ensemble est compact. Cela
revient dire que lensemble en question est contenu dans un compact.

C.5 Dcomposition des oprateurs auto-adjoints quelconques

par

Z
x D,

259

Tx =

dP x.

La mesure borlienne () = (, P ) est not d(, P ). Les intgrales ci-dessus sont des
intgrales au sens de Riemann : pour f continue, et un intervalle < a < b < +,
Z

K
X

f ()dP x =
a

lim

K+

f (k )(Pk+1 Pk )x

k=1

pour une partition de [a, b] de pas tendant vers 0 lorsque K +. Lintgrale est bien dfinie
car 7 P x est une fonction variations bornes. On considre ensuite la limite a et
b + de ces intgrales. On vrifie que T x est bien dfini si x D(T ) et que les oprateurs ainsi
construits sont linaires auto-adjoints non-borns. On dfinit ainsi une application S A, o on
a not A lensemble des oprateurs auto-adjoints non-borns.
Thorme C.3. Lapplication F dfinit une bijection entre les familles spectrales et les oprateurs
auto-adjoints.
Les oprateurs auto-adjoints quelconques sont donc caractriss de manire quivalente par
leur mesure spectrale, qui est une mesure borlienne valeur projecteurs. Pour un oprateur T
auto-ajoint, on considre
P T : B(R) P
telle que |P T (B)|2 soit la probabilit que T prenne ses valeurs dans B. On a en fait
Z
T
P (B) =
dP .
B

Notons galement que dans ce formalisme


Z +
Id =
dP ,

T =

dP .

Exemple C.2. Dans le cas dun oprateur auto-adjoint compact, on a un spectre purement ponctuel,
et dans ce cas
X
P =
PEk
k

o PEk est le projecteur orthogonal sur le sous-espace propre Ek associ la valeur propre k .
Exemple C.3. On prsente ici la dcomposition explicite de certains oprateurs quantiques :
pour loprateur x
k , on a (Pxk u)(x) = 1xk u(x) ;
pour loprateur pk , on a Ppk u = F 1 1k Fu ;
R + 1 2
(k)eikx dk,
pour le Hamiltonien H0 = 21 de la particule libre, on a H0 u = (2)3/2 0
2 |k| u
H0
1 1
et donc P u = F 1 2 ||2 Fu.
Dans ce cadre, la nomenclature du spectre devient plus parlante :
Thorme C.4. Soit H un espace de Hilbert sparable, T un oprateur auto-adjoint sur H
et (P )R la famille spectrale qui lui est associe. Alors
p (T ) si est seulement si lim0,>0 P 6= P ;
c (T ) si et seulement si lim0,>0 P = P et P 6= P+ pour tout  > 0.
Ainsi, les lments du spectre ponctuel sont les points o la mesure spectrale saute, alors
quelle varie continment aux points du spectre continu.

D
Quelques relations de commutation entre observables

Relations de commutations les plus importantes


[
x, px ] = i~,

[
x, py ] = 0,

[
x, pz ] = 0,

[
y , px ] = 0,
[
y , py ] = i~, [
y , pz ] = 0,
[
z , px ] = 0,
[
z , py ] = 0,
[
z , pz ] = i~,
h
i
h
i
h
i
y = i~L
z, L
y, L
z = i~L
x, L
z, L
x = i~L
y.
x, L
L
Autres relations de commutation
h

i
h
i
h
i
x, x
x , y = i~
x , z = i~
L
= 0,
L
z,
L
y,
h
i
h
i
h
i
y, x
y , y = 0,
y , z = i~
L
= i~
z,
L
L
x
h
i
h
i
h
i
z, x
z , y = i~
z , z = 0,
L
= i~
y,
L
x,
L
h
i
h
i
h
i
x, x
x , y2 = 2i~
x , z2 = 2i~
L
2 = 0,
L
y z,
L
y z,
h
i
h
i
h
i
y, x
y , y2 = 0,
y , z2 = 2i~
L
2 = 2i~
xz,
L
L
xz,
h
i
h
i
h
i
z, x
z , y2 = 2i~
z , z2 = 0,
L
2 = 2i~
xy,
L
xy,
L
h
i
h
i
h
i
x , px = 0,
x , py = i~
x , pz = i~
L
L
pz ,
L
py ,
h
i
h
i
h
i
y , px = i~
y , py = 0,
y , pz = i~
L
pz ,
L
L
px ,
h
i
h
i
h
i
z , px = i~
z , py = i~
z , pz = 0,
L
py ,
L
px ,
L
h
i
h
i
h
i
x , p2x = 0,
x , p2y = 2i~
x , p2z = 2i~
L
L
py pz ,
L
py pz ,
h
i
h
i
h
i
y , p2x = 2i~
y , p2y = 0,
y , p2z = 2i~
L
px pz ,
L
L
px pz
h
i
h
i
h
i
z , p2x = 2i~
z , p2y = 2i~
z , p2z = 0,
L
px py ,
L
px py ,
L
i
i
h
i
h
h
2z , x
2y , x
2x , x
L
2 + y2 + z2 = 0,
L
2 + y2 + z2 = 0,
L
2 + y2 + z2 = 0,
h
i
h
i
h
i
2x , p2x + p2y + p2z = 0,
2y , p2x + p2y + p2z = 0,
2z , p2x + p2y + p2z = 0,
L
L
L
h
i
h
i
h
i
2, L
x = 0, L
2, L
y = 0, L
2, L
z = 0,
L
h
i

 h
i

 h
i


x , V = i~ yFz zFy , L
y , V = i~ zFx x
z , V = i~ x
L
Fz , L
Fy yFx .

Bibliographie

[1] M. P. Allen et D. J. Tildesley, Computer Simulation of Liquids (Oxford Science Publications, 1987).
[2] R. Balian, Du microscopique au macroscopique (cours de physique statistique de lcole
Polytecnique) (Ellipses, 1982).
[3] E. Betranhandy, Proposition et tudes ab initio des stabilits relatives de nouveaux matriaux par gomimtisme structural : modlisation des proprits physico-chimiques, Thse de
doctorat (Universit Sciences et Technologies - Bordeaux I, 2005).
[4] Ham Brzis, Analyse fonctionnelle : thorie et applications (Dunod, 1999).
[5] E. Cancs, F. Legoll, et G. Stoltz, Theoretical and numerical comparison of sampling
methods for molecular dynamics, accepted for publication in M2AN (2007).
[6] Eric Cancs, Claude Le Bris, et Yvon Maday, Mthodes mathmatiques en chimie
quantique, volume 53 of Mathmatiques & Applications (Springer-Verlag, Berlin, Heidelberg,
2006).
[7] Philippe Chartier et Erwan Faou, Intgration symplectique des systmes hamiltoniens
intgrables : comportement en temps long, Cours de DEA Niveau II (2003). (disponible
ladresse http://www.irisa.fr/ipso/perso/faou/publis/NotesDEA03.ps).
[8] O. Coussy et F. Chevoir. Physique des tats de la Matire. Cours de premire anne,
ENPC.
[9] M. Crouzeix et A.L. Mignot, Analyse numrique des quations diffrentielles (Masson,
1984).
[10] B. Diu, C. Guthman, D. Lederer, et B. Roulet, Physique statistique (Hermann, 1989).
[11] A. Douady, Dterminisme et indterminisme dans un modle mathmatique, In Chaos et
dterminisme, A. Dahan-Dalmenico and P. Arnoux, Eds. (Le Seuil, 1992), pp. 1118.
[12] S. Duane, A. D. Kennedy, B. J. Pendleton, et D. Roweth, Hybrid Monte-Carlo,
Phys. Lett. B 195(2) (1987) 216222.
[13] R. Dautray et J.L. Lions, Analyse mathmatique et calcul numrique pour les sciences et
les techniques. I. Modles physiques (Masson, 1987).
[14] H. Flyvberg et H. G. Petersen, Error estimates on averages of correlated fata, J. Chem.
Phys. 91 (1989) 461466.
[15] D. Frenkel et B. Smit, Understanding Molecular Simulation (Academic Press, 2005).
[16] C. J. Geyer, Practical Markov chain Monte Carlo (with discussion), Stat. Sci. 7(4) (1992)
473511.
[17] W. R. Gilks, S. Richardson, et D. J. Spiegelhalter, Markov Chain Monte Carlo in
practice (Chapman and Hall, 1996).
[18] E. Hairer, C. Lubich, et G. Wanner, Geometric numerical integration illustrated by the
stormer-verlet method, Acta Numerica 12 (2003) 399450.

264

BIBLIOGRAPHIE

[19] Ernst Hairer, Christian Lubich, et Gerhard Wanner, Geometric Numerical Integration : Structure-Preserving Algorithms for Ordinary Differential Equations, volume 31 of
Springer Series in Computational Mathematics (Springer-Verlag, Berlin, Heidelberg, 2006).
[20] J.-P. Hansen et I. R. McDonald, Theory of Simple Liquids (Academic Press, 1986).
[21] W. K. Hastings, Monte Carlo sampling methods using Markov chains and their applications,
Biometrika 57 (1970) 97109.
[22] J. Israelashvili, Intermolecular and surface forces (Academic Press, 1992).
[23] L. Landau et E. Lifchitz, Physique statistique (Ellipses, 1994).
[24] B. J. Leimkuhler et S. Reich, Simulating Hamiltonian dynamics, volume 14 of Cambridge
monographs on applied and computational mathematics (Cambridge University Press, 2005).
[25] S.-K. Ma, Statistical Mechanics (World Scientific, 1985).
[26] N. Metropolis, A. W. Rosenbluth, M. N. Rosenbluth, A. H. Teller, et E. Teller,
Equations of state calculations by fast computing machines, J. Chem. Physics 21(6) (1953)
10871091.
[27] S. P. Meyn et R. L. Tweedie, Markov chains and stochastic stability, Communications
and control engineering series (Springer-Verlag, London, New York, 1993).
[28] J. Von Neumann, Mathematical foundations of quantum mechanics, Princeton landmarks
in mathematics and physics (Princeton university press, 1996).
[29] M. Reed et B. Simon, Methods of modern mathematical physics, volume I - IV (Academic
Press, 1980).
[30] G. Roberts et R. Tweedie, Exponential convergence of langevin diffusions and their
discrete approximations, Bernoulli 2 (1997) 314363.

You might also like