You are on page 1of 110

ANALISI VETTORIALE

Giovanni Maria Troianiello


10 dicembre 2014

Indice
1 Derivazione delle funzioni composte

2 Formula di Taylor

3 Massimi e minimi locali

4 Approfondimenti sullintegrale di Riemann

14

5 Integrali impropri e serie

16

6 Criterio del confronto, convergenza assoluta, convergenza condizionata

18

7 Integrali di Riemann dipendenti da parametri

21

8 Successioni uniformemente convergenti

26

9 Integrali impropri dipendenti da parametri

28

10 Il Teorema di Dini per funzioni scalari

30

11 Il Teorema di Dini per sistemi

34

12 Massimi e minimi vincolati

38

13 Un primo rapido approccio agli integrali doppi

41

14 Misurabilit`
a secondo PeanoJordan e domini normali

44

15 Integrale delle funzioni a scala, integrale superiore e integrale inferiore

49

16 Lintegrale doppio di Riemann e le sue propriet`


a

52

17 Alcune estensioni

55

18 Cambiamenti di variabili

59

19 Richiami su curve ed integrali curvilinei

67

20 Lunghezza di una curva

75

21 La formula di GaussGreen

77

22 Serie di funzioni

82

23 Serie di potenze

83

24 Serie di Taylor e Maclaurin

86

25 Una prima separazione delle variabili

90

26 La separazione della variabili in generale

91

27 Equazioni differenziali esatte e fattori integranti

94

28 Sistemi 2 2 e diagrammi di fase

98

29 Esistenza in grande e unicit`


a per il problema di Cauchy

104

30 Estensioni e applicazioni

107

31 Esistenza in piccolo

108

Derivazione delle funzioni composte

Il caso scalare
Sia A un aperto di RN . Una funzione f : A R `e differenziabile in x0 A se esiste un
vettore a tale che
f (x) f (x0 ) a (x x0 ) = o(kx x0 k).
Questa propriet`
a determina univocamente a: ogni a0 RN tale che
f (x) f (x0 ) a0 (x x0 ) = o(kx x0 k)
deve verificare
(a0 a) (x x0 ) = o(kx x0 k)
ovvero
(a0 a)

x x0
0
kx x0 k

per x x0 ,

(1)

e ci`o implica a0 = a. Per semplificare le notazioni, verifichiamo tale implicazione nel caso N = 2.
La (1) si riscrive
(a0 a)(x x0 ) + (b b0 )(y y0 )
p
0
(x x0 )2 + (y y0 )2

per (x, y) (x0 , y0 ) :

prendendo x 6= x0 , y = y0 si ha
(a0 a)(x x0 )
0
|x x0 |

per x x0 ,

il che `e impossibile a meno che non si abbia a0 = a, e analogamente si ottiene b0 = b. Dunque la


differenziabilit`
a di f in x0 implica lesistenza di ununica funzione lineare x 7 x0 + a (x x0 ) che
approssima meglio di ogni altra la x 7 f (x) quando x x0 .
Dalla differenziabilit`
a segue che in x0 la f `e sia continua, sia derivabile in ogni direzione, in
particolare con f (x0 ) = a, per cui
f (x) f (x0 ) f (x0 ) (x x0 ) = o(kx x0 k).
La prima implicazione non si inverte per nessun valore di N , e la seconda solo quando N = 1. (In
tal caso, infatti, la derivabilit`
a in x0 ]c, d[, cio`e
f (x) f (x0 )
R
x x0

per x x0

e quindi
f (x) f (x0 ) (x x0 )
0
x x0

per x x0 ,

`e la stessa cosa della differenziabilit`


a.)
Riscriviamo la differenziabilit`
a di f prendendo N = 2:
p
f (x, y) = f (x0 , y0 ) + fx (x0 , y0 )(x x0 ) + fy (x0 , y0 )(y y0 ) + o( (x x0 )2 + (y y0 )2 .

01

Dalla propriet`
a di migliore approssimazione lineare vista un attimo fa segue che il piano di equazione
z = f (x0 , y0 ) + fx (x0 , y0 )(x x0 ) + fy (x0 , y0 )(y y0 ) `e quello che per (x, y) (x0 , y0 ) meglio
approssima il grafico della funzione z = f (x, y), e per questo viene detto piano tangente.
In R3 riscriviamo la differenziabilit`
a di f con le notazioni P = (x, y, x), P0 = (x0 , y0 , x0 ):
f (P ) f (P0 ) fx (P0 )(x x0 ) fy (P0 )(y y0 ) fz (P0 )(z z0 ) = o(kP P0 k).

(2)

2.1

Date tre funzioni s 7 x(s), y(s), z(s) definite in un intervallo ]a, b[ con (x(s), y(s), z(s)) A
per s ]a, b[, sia s0 ]a, b[ con (x(s0 ), y(s0 ), z(s0 )) = P0 . Se si aggiunge allipotesi che f sia
differenziabile in P0 quella che le x(s), y(s), z(s) siano differenziabili, ovvero derivabili, in s0 , allora
la funzione composta F : s 7 f (x(s), y(s), z(s)) `e differenziabile, ovvero derivabile, in s0 con
derivata
F 0 (s0 ) = fx (P0 )x0 (s0 ) + fy (P0 )y 0 (s0 ) + fz (P0 )z 0 (s0 ).
(3)

2.2

Infatti dalla (2) con P = (x(s), y(s), z(s)) si deduce, scrivendo lo(kP P0 k) come (P )kP P0 k
con : A R continua in P0 , (P0 ) = 0, che
F (s) F (s0 ) = fx (P0 )(x(s) x(s0 )) + fy (P0 )(y(s) y(s0 )) + fz (P0 )(z(s) z(s0 ))
p
+(x(s), y(s), z(s)) (x(s) x(s0 ))2 + (y(s) y(s0 ))2 + (z(s) z(s0 ))2 .
A questo punto, tenendo conto che in s0 la funzione composta s 7 (x(s), y(s), z(s)) `e continua e
vale 0, basta dividere per s s0 6= 0 e far tendere s a s0 per ottenere la (3).
Passiamo a introdurre tre funzioni (s, t) 7 x(s, t), y(s, t), z(s, t) definite in un aperto B del piano
con (x(s, t), y(s, t), z(s, t)) A per ogni (s, t) B. Sia (s0 , t0 ) B con (x(s0 , t0 ), y(s0 , t0 ), z(s0 , t0 )) =
P0 . Aggiungendo allipotesi che f sia differenziabile in P0 quella che le x(s, t), y(s, t), z(s, t) siano
differenziabili in (s0 , t0 ), si vede subito che la funzione composta F : (s, t) 7 f (x(s, t), y(s, t), z(s, t))
`e dotata in (s0 , t0 ) delle derivate parziali
Fs (s0 , t0 ) = fx (P0 )xs (s0 , t0 ) + fy (P0 )ys (s0 , t0 ) + fz (P0 )zs (s0 , t0 ),

(4)

2.3

Ft (s0 , t0 ) = fx (P0 )xt (s0 , t0 ) + fy (P0 )yt (s0 , t0 ) + fz (P0 )zt (s0 , t0 ).

(5)

2.4

Basta infatti applicare il risultato precedente alle funzioni di una variabile


s 7 (x(s, t0 ), y(s, t0 ), z(s, t0 )),

t 7 (x(s0 , t), y(s0 , t), z(s0 , t)).

Possiamo ancora affermare che in (s0 , t0 ) la F , oltre che derivabile (rispetto a s ed a t), `e anche
differenziabile? La risposta `e S`, ma qui, per giustificarla senza allontanarci dalle tecniche che
stiamo utilizzando, introduciamo lipotesi supplementare che le x(s, t), y(s, t), z(s, t) siano di classe
C 1 in B e la f (x, y, z) lo sia in A. Allora le due identit`a precedenti valgono al variare di (s0 , t0 )
in B con i secondi membri delle (4),(5), funzioni continue, per cui F C 1 (B), e il Teorema del
differenziale totale garantisce che F `e differenziabile in ogni punto di B .
Il caso vettoriale
Un vettore (u1 , . . . , uN ) si pu`
o anche intendere come una matrice 1 N oppure N 1:

u1
.

[u1 . . . uN ] oppure
.
.
uN
4

Con queste notazioni le (2), (3) si riscrivono, omettendo lindice 0,

xs (s, t)
Fs (s, t) = [fx (P ) fy (P ) fz (P )] ys (s, t) , Ft (s, t) = [fx (P )
zs (s, t)

fy (P )

xt (s, t)
fz (P )] yt (s, t)
zt (s, t)

e quindi possiamo fare economia:


[Fs (s, t) Ft (s, t)] = [fx (P )

xs (s, t) xt (s, t)
fy (P ) fz (P )] ys (s, t) yt (s, t) .
zs (s, t) zt (s, t)

E se oltre ad f abbiamo unaltra funzione g C 1 (A)? Leconomia


sensata:


 xs (s, t)
Fs (s, t) Ft (s, t)

= fx (P ) fy (P ) fz (P ) ys (s, t)
gx (P ) gy (P ) gz (P )
Gs (s, t) Gt (s, t)
zs (s, t)

diventa lunica strategia

xt (s, t)
yt (s, t)
(6)
zt (s, t)

2.5

dove G : (s, t) 7 g(x(s, t), y(s, t), z(s, t)).


Per generalizzare ulteriormente conviene introdurre la nozione della matrice jacobiana, indicata (ad esempio) con Jh , di una funzione vettoriale
h(y) = (h1 (y1 , . . . , yN ), . . . , hM (y1 , . . . , yN ))
differenziabile in un punto y0 di un aperto C:


hi
Jh (y0 ) =
(y0 )
.
yj
i=1,...,M ;j=1,...,N
Possiamo dunque riscrivere la (2.5) cos`:
JF (s) = Jf (x(s))Jx (s)

(7)

dove abbiamo posto


s = (s, t),

x(s) = (x(s, t), y(s, t), z(s, t)),

f (x) = (f (x, y, z), g(x, y, z)),

F(s) = f (x(s)).

A questo punto si generalizza facilmente, ottenendo il seguente


Teorema 1.1. Siano f : A RQ di classe C 1 in A aperto di RN e x : B RN di classe C 1 in
B aperto di RM , con x(B) A. Allora s 7 F = f (x(s)) `e di classe C 1 in B, e la sua matrice
jacobiana verifica la (2.6).
Particolarmente importante `e il caso M = N = Q se la f `e un diffeomorfismo, ovvero `e dotata
di inversa f 1 anchessa di classe C 1 (in B = f (A)). La F(s) vale allora f (f 1 (s)) = s, per cui JF
`e la matrice identit`
a I: dalla (2.6), che diventa
I = Jf (x(s))Jf 1 (s),
segue che in ogni punto s B la matrice Jf 1 (s) `e invertibile, cio`e ha determinante diverso da 0, e
verifica
Jf 1 (s) = [Jf (x(s))]1 .
(8)
Si tratta di unidentit`
a ben nota per le funzioni reali di una variabile reale. E gi`a in tal caso
sappiamo che `e essenziale la richiesta che linversa sia C 1 : la funzione f : x 7 x3 `e invertibile in
tutto R, ma la sua inversa s 7 s1/3 non sta in C 1 (R), e f 0 (0) = 0.

2.6

Formula di Taylor

P
Dato il generico vettore1 u = (u1 , . . . , uN ) RN , indichiamo con u loperatore N
i=1 ui Di =
PN

n , n 1, in un aperto A di RN associa la
u
che
ad
ogni
funzione
reale
f
di
classe
C
i=1 i xi
funzione
N
N
X
X
(u )f = u f =
ui Di f =
ui fxi .
i=1

Per n 2 il quadrato (u

i=1

P
2 e definito attraverso lidentit`
a
=( N
i=1 ui Di ) `

)2

(u )2 f = (u )[(u )f ]
ovvero
N
X

!2
ui Di

f=

i=1

N
X

!"
ui Di

i=1

N
X

! #
ui Di

f .

(9)

tay1

i=1

Operando sui simboli Di come se fossero dei numeri, che commutano cogli ui perch`e questi ultimi
sono fissati, cio`e non dipendono dalle variabili rispetto a cui si deriva, vediamo che la quantit`
a (9)
`e uguale alla forma quadratica
N
X

ui uj Di Dj f =

i,j=1

N
X

ui uj fxi xj = u Hu = ut Hu

i,j=1

con H matrice hessiana di f :

fx1 x1 (x) . . .
H(x) = . . .
fxN x1 (x) . . .

fx1 xN (x)

fxN xN (x)

La potenza (u )k con 2 k n `e poi definita per ricorrenza attraverso lidentit`a


(u )k f = (u )[(u )k1 f ].
Per indicare il valore di (u )k f in un punto x0 di A usiamo la notazione (u )k f (x0 ) invece
della [(u )k f ](x0 ), pi`
u corretta ma poco maneggevole.
k
La notazione (u) si rivela molto conveniente quando si devono eseguire derivazioni successive
della funzione composta
t 7 [u] (t) = f (x0 + tu).
(10)

tay2

.
tetay1

Teorema 2.1. Se f `e una funzione di C n (A) e A contiene tutto il segmento che congiunge i punti
x0 , x0 + u la funzione (10) `e di classe C n nel segmento [0, 1] e verifica
(k)

[u] (t) = (u )k f (x0 + tu)

(11)

per ogni k = 1, . . . , n.
DIM. Quando k = 1 la (11) segue subito dalla regola di derivazione delle funzioni composte. Per k >
1 arbitrario si procede induttivamente, tenendo conto che a sinistra compare d/dt[dk1 [u] (t)/dtk1 ]
e a destra (u )[(u )k1 f (x0 + tu)].

1

Inteso, quando il contesto lo richiede, come la colonna delle sue componenti, ovvero come matrice N 1.

tay3

Teorema 2.2. Se A contiene tutto il segmento che congiunge i punti x0 , x0 + u e f C 1 (A),


esiste un numero ]0, 1[ tale che
f (x0 + u) = f (x0 ) + (u )f (x0 + u).

(12)

tay4

1
1
f (x0 +u) = f (x0 )+(u)f (x0 )+ (u)2 f (x0 + u) = f (x0 )+(u)f (x0 )+ uH(x0 + u)u. (13)
2
2

tay5

Se poi f C 2 (A) esiste un numero ]0, 1[ tale che

In generale: se f C n (A) esiste un numero ]0, 1[ tale che


f (x0 + u) = f (x0 ) + (u )f (x0 ) + +

1
1
(u )n1 f (x0 ) + (u )n f (x0 + u). (14)
(n 1)!
n!

tay6

DIM. Siccome [u] (1) = f (x0 + u) e [u] (0) = f (x0 ), la (12) segue dallidentit`a
[u] (1) = [u] (0) + 0[u] ( )
(Teorema del valor medio) e dal Teorema 2.1. Abbiamo poi
1
[u] (1) = [u] (0) + 0[u] (0) + 00[u] ( )
2
per n = 2 e
[u] (1) = [u] (0) + 0[u] (0) + +

1
1 (n)
(n1)
[u] (0) + [u] ( )
(n 1)!
n!

per n qualunque (formula di Taylor), sicche ancora una volta basta applicare il Teorema 2.1.

Per le funzioni di N variabili la (12) esprime il teorema del valor medio, mentre le (13) e
(14) sono gli sviluppi di Taylor (rispettivamente di ordine 2 e di ordine n) con il resto di
Lagrange.
Si faccia attenzione: la richiesta che il segmento di estremi x0 e x0 + u sia tutto contenuto in A
`e essenziale per garantire per la validit`
a delle (12), (13) e (14)2 . A questo riguardo introduciamo la
seguente nozione. Un sottoinsieme U di RN `e convesso se contiene ogni segmento di cui contiene
gli estremi. Ad esempio, ogni sfera `e convessa. Con questa terminologia si ottiene dal Teorema 2.1
il
valmed

Corollario 2.1. Siano A convesso e f C 1 (A) con


kf (x)k K <

per x A.

(15)

Allora f verifica la condizione di Lipschitz


kf (x) f (y)k Kkx yk

per x, y A.

In particolare, f ha tutte le derivate nulle in A se e solo se `e una costante.


2

Per esempio, indichiamo con A il piano privato della semiretta x = 0, y 0 e con f la funzione A R uguale a
per y < 0 ed a (segno di x)y 2 per x 6= 0, y 0. Siano x0 > 0, x = x0 : la quantit`
a f (x0 , 1) f (x, 1) vale 2, mentre
fx `e identicamente nulla e quindi f (, 1), 6= 0, ha prodotto scalare nullo con (x0 , 1) (x, 1) = (2x0 , 0). Dunque
non vale la tesi del Teorema di Lagrange.

lip

DIM. Disuguaglianza di CauchySchwarz nella (12) per x = x0 + u e y = x0 :


kf (x) f (y)k = k(x y) f (y + (x y))k kx ykkf (y + (x y))k kx ykK.

In effetti anche se, come abbiamo detto, il teorema non vale in un generico aperto, lipotesi di
convessit`a si potrebbe indebolire un po per il primo enunciato e ancora di pi`
u per il secondo.
Noi ci interessiamo soprattutto al caso N = 2, sicche la (10) `e la funzione
[u] (t) = f (x0 + tu1 , y0 + tu2 )

(16)

tay2

senzaltro ben definita per 1 < t < 1 e u = (u1 , u2 ) tale che kuk < r R se R > 0 `e cos` piccolo
che tutto il disco di centro (x0 , y0 ) e raggio R sia contenuto in A. Per k = 1 la (11) si riscrive
0[u] (t) = u1 fx (x0 + tu1 , y0 + tu2 ) + u2 fy (x0 + tu1 , y0 + tu2 ) = u f (x0 + tu1 , y0 + tu2 )
e per k = 2
00[u] (t) = u21 fxx (x0 + tu1 , y0 + tu2 ) + 2u1 u2 fxy (x0 + tu1 , y0 + tu2 ) + u22 fyy (x0 + tu1 , y0 + tu2 )
= u H(x0 + tu1 , y0 + tu2 )u;

(17)

tay5

la (12) e la (13) si riscrivono rispettivamente


f (x0 + u1 , y0 + u2 ) f (x0 , y0 ) = u1 fx (x0 + u1 , y0 + u2 ) + u2 fy (x0 + u1 , y0 + u2 )
= u f (x0 + u1 , y0 + u2 )
e
f (x0 + u1 , y0 + u2 ) f (x0 , y0 ) = u1 fx (x0 , y0 ) + u2 fy (x0 , y0 )

1 2
u1 fxx (x0 + u1 , y0 + u2 ) + 2u1 u2 fxy (x0 + u1 , y0 + u2 ) + u22 fyy (x0 + u1 , y0 + u2 )
2
1
= u f (x0 , y0 ) + u H(x0 + u1 , y0 + u2 )u.
(18)
2
Lultimo termine scritto qua sopra `e uguale a
+

1
1
u H(x0 , y0 )u + u [H(x0 + u1 , y0 + u2 ) H(x0 , y0 )]u
2
2

(19)

con la norma3
kH(x0 + u1 , y0 + u2 ) H(x0 , y0 )k
infinitesima per r 0 uniformemente in grazie alla continuit`a delle derivate seconde di f .4
3

La norma kBk di una matrice B = [bij ] `e

qP

ij

b2ij , e la norma del vettore prodotto di B per un vettore v verifica

la disuguaglianza di CauchySchwarz kBvk kBkkvk.


4
Consideriamo ad esempio fxx . Dato comunque > 0, esiste un r = r ]0, R[ tale che |fxx (x, y) fxx (x0 , y0 )| <
per ogni (x, y) tale che (x x0 )2 + (y y0 )2 < r2 , quindi in particolare per x = x0 + u1 e y = y0 + u2 se | | < 1 e
u21 + u22 < r2 .

tay5

rest

Massimi e minimi locali

Sia f una funzione C 1 (A), dove A R2 `e aperto. Diciamo che in un punto (x0 , y0 ) A la f
assume un estremo locale, e pi`
u precisamente un minimo locale o un massimo locale, se esiste
un intorno aperto U A di (x0 , y0 ) tale che per ogni (x, y) U risulti, rispettivamente, f (x, y)
f (x0 , y0 ) oppure f (x, y) f (x0 , y0 ) (e aggiungiamo laggettivo proprio se le disuguaglianze sono
soddisfatte in senso stretto nei punti (x, y) 6= (x0 , y0 )). Ci`o equivale a richiedere che per r > 0
sufficientemente piccolo tutte le funzioni (16) con 1 < t < 1 e u = (u1 , u2 ) tale che kuk < r
assumano rispettivamente un minimo o un massimo locale nel punto t = 0.
Le precedenti nozioni trasferiscono immediatamente alla dimensione 2 quelle analoghe viste in
dimensione 1. Ma per le funzioni di pi`
u di una variabile pu`o presentarsi unulteriore eventualit`
a:
quella che un punto ne di minimo ne di massimo (in nessun suo intorno) sia per`o un punto di
sella, cio`e di minimo in una direzione e di massimo in unaltra, ovvero ancora che esistano due
diversi vettori u tali che in corrispondenza ad uno di essi la [u] (t) assuma in t = 0 un minimo
locale proprio e in corrispondenza allaltro un massimo locale proprio.
ind

Esempio 3.1. Lorigine degli assi `e un punto di sella per la funzione f (x, y) = (x2 y 2 )/2: la
restrizione f (x, 0) = x2 /2 allasse x (vettore u = (1, 0)) ha minimo (assoluto) per x = 0, mentre
la restrizione f (0, y) = y 2 /2 allasse y (vettore u = (0, 1)) ha massimo (assoluto) per y = 0. (Il
grafico di f (x, y) `e il celeberrimo paraboloide a sella, detto anche iperbolico.)

La condizione necessaria di estremalit`a del primo ordine per f (x, y) segue subito da quella gi`
a
nota per le funzioni di una variabile.
Teorema 3.1. Affinche un punto (x0 , y0 ) A sia di minimo o massimo locale per una funzione
f C 1 (A) `e necessario che f (x0 , y0 ) = 0.
DIM. In t = 0 ogni funzione ] 1, 1[3 t 7 [u] (t) = f (x0 + tu1 , y0 + tu2 ) con u = (u1 , u2 ) di norma
< r `e dotata di estremo, e quindi ha derivata nulla:
0[u] (0) = fx (x0 , y0 )u1 + fy (x0 , y0 )u2 = 0.
Dallarbitrariet`
a della scelta di (u1 , u2 ) segue che f (x0 , y0 ) = (fx (x0 , y0 ), fy (x0 , y0 )) = (0, 0).

Ogni punto di A in cui f `e dotata di gradiente nullo `e un punto critico o stazionario o anche
un estremale di f , e come per le funzioni di una variabile non `e detto che si tratti di un minimo
o di un massimo locale: si pensi a 0 per f (x) = x3 , ovvero a (0, 0) per f (x, y) = x3 ...
Per poter passare alle condizioni del secondo ordine introduciamo la seguente terminologia. Se
B `e una matrice simmetrica N N , la forma quadratica RN 3 u 7 u Bu si dice:
semidefinita positiva o semidefinita negativa a seconda che per ogni u RN risulti
u Bu 0 o u Bu 0;
definita positiva o definita negativa a seconda che per ogni u RN \{0} risulti uBu > 0
o u Bu < 0.

E fin qui si direbbe che stiamo semplicemente estendendo al caso di una qualunque dimensione
N delle banali nozioni unidimensionali sulla funzione R 3 u 7 Bu2 legate al segno dello scalare B.
Ma non `e cos`: quando N = 1 la funzione pu`o solo essere soltanto 0 o 0, mentre gi`a per N = 2
incontriamo semplici forme quadratiche che non sono semidefinite, bens` verificano u Bu > 0 o
u Bu < 0 a seconda della scelta di u.
ind

Esempio 3.2. Per




1 0
B=
0 1
risulta u Bu = u21 u22 , e questa quantit`a `e positiva o negativa a seconda che si prenda u = (u1 , 0)
con u1 6= 0 o u = (0, u2 ) con u2 6= 0.

Le precedenti nozioni sulle forme quadratiche si riformulano senza difficolt`a in termini di autovalori delle matrici B. Grazie alla simmetria di B sappiamo infatti dallAlgebra Lineare che
la matrice = diag (1 , . . . , N ) dei suoi autovalori `e reale ed uguale a C t BC, con C matrice
ortogonale: C t = C 1 . Dato comunque v RN abbiamo
v v = vt v = vt C t BCv = (Cv)t BCv = (Cv) BCv = u Bu
per u = Cv, e siccome il primo membro verifica
2

mkvk v v =

N
X

i vi2 M kvk2 ,

i=1

dove M e m sono rispettivamente il pi`


u grande ed il pi`
u piccolo autovalore di B, otteniamo
mkuk2 u Bu M kuk2

per u RN

grazie allisometria kuk = kvk; la prima (la seconda) disuguaglianza debole diventa lidentit`a quando u `e un autovettore associato allautovalore m (M ). Dunque richiedere che B sia semidefinita
positiva (semidefinita negativa) equivale a richiedere che m 0 (M 0), per cui B non `e semidefinita se e solo se m < 0 < B; richiedere che B sia definita positiva (definita negativa) equivale a
richiedere che m > 0 (M < 0).
nec

Teorema 3.2. Affinche un punto (x0 , y0 ) A sia di minimo oppure di massimo locale per una
funzione f C 2 (A) `e necessario non solo che (x0 , y0 ) sia un punto critico, ma anche che la forma
quadratica u H(x0 , y0 )u sia rispettivamente semidefinita positiva oppure negativa, ovvero che tutti
gli autovalori di H(x0 , y0 ) siano 0 oppure 0.
DIM. Supponiamo che (x0 , y0 ) sia di minimo per f . Allora ogni funzione t 7 [u] (t), essendo dotata
di minimo in t = 0, verifica non solo 0[u] (0) = 0 ma anche 00[u] (0) 0, e quindi
u H(x0 , y0 )u = u21 fxx (x0 , y0 ) + 2u1 u2 fxy (x0 , y0 ) + u22 fyy (x0 , y0 ) = 00[u] (0) 0.
Analogo discorso se (x0 , y0 ) `e di massimo.


10

controes

Osservazione 3.1. Nelle dimostrazioni di entrambi i teoremi precedenti abbiamo sfruttato limplicazione:
la f (x, y) ha un minimo locale in (x0 , y0 ) = tutte le [u] (t) hanno un minimo locale in (x0 , y0 ).
Ebbene, vale la pena di notare che questa implicazione non si inverte. Siano ad esempio A = R2 ,
f (x, y) = (y x2 )(y 2x2 ). In (0, 0) il gradiente di f `e nullo e lhessiana vale


0 0
,
0 2
per cui `e semidefinita positiva. Ma (0, 0) non `e di minimo per f , perche ogni intorno dellorigine
contiene punti in cui f `e positiva ed altri in cui `e negativa. Invece in t = 0 tutte le
[u] (t) = f (tu1 , t2 ) = t2 (u2 tu21 )(u2 2tu21 )
hanno minimo locale (proprio) uguale a 0: infatti t2 (u2 tu21 )(u2 2tu21 ) con |t| > 0 abbastanza
piccolo ha il segno di di u22 > 0 se u2 6= 0, mentre per vale 2t4 u41 > 0 per t 6= 0, u1 6= 0, u2 = 0.

Col Teorema 3.2 abbiamo ottenuto una condizione solo necessaria perche un punto critico sia di
estremo locale. NellOsservazione 3.1 abbiamo gi`a visto un controesempio, e altri ne menzioneremo
nellOsservazione 3.2. Passiamo alla condizione sufficiente.

suf

Teorema 3.3. Un punto critico (x0 , y0 ) A per una funzione f C 2 (A) tale che la forma quadratica u H(x0 , y0 )u sia definita positiva oppure negativa, ovvero che tutti gli autovalori di H(x0 , y0 )
siano > 0 oppure < 0, `e rispettivamente di minimo o massimo locale proprio.
DIM. Applichiamo la formula di Taylor di ordine 2 con f (x0 , y0 ) = (0, 0) (il punto `e critico): dato
comunque u = (u1 , u2 ) R2 con kuk < r esiste un ]0, 1[ tale che
1
f (x0 + u1 , y0 + u2 ) f (x0 , y0 ) = u H(x0 + u1 , y0 + u2 )u
2
1
1
= u H(x0 , y0 )u + u [H(x0 + u1 , y0 + u2 ) H(x0 , y0 )]u
2
2
con la norma
kH(x0 + u1 , y0 + u2 ) H(x0 , y0 )k
infinitesima per r 0 uniformemente in (cfr. (18) e (19)).
Supponiamo che la forma quadratica u 7 u H(x0 , y0 )u sia definita positiva, ovvero che il
minimo autovalore m di H(x0 , y0 ) sia > 0. Fissiamo un r = rm/2 > 0 tale che
kH(x0 + u1 , y0 + u2 ) H(x0 , y0 )k <

m
2

e quindi
u [H(x0 + u1 , y0 + u2 ) H(x0 , y0 )]u kH(x0 + u1 , y0 + u2 ) H(x0 , y0 )kkuk2 <
per kuk < r. Siccome
u H(x0 , y0 )u mkuk2
11

m
kuk2
2

come abbiamo visto con le considerazioni che precedono il Teorema 3.25 , otteniamo
f (x0 + u1 , y0 + u2 ) f (x0 , y0 )

m
m
m
kuk2 kuk2 kkuk2 = kuk2 ,
2
4
4

da cui f (x, y) > f (x0 , y0 ) per 0 < k(x x0 )2 + (y y0 )2 k < r2 . Ne segue che la f `e dotata in
(x0 , y0 ) di minimo (per di pi`
u proprio).
Il ragionamento per il massimo `e del tutto analogo.

semidef

Osservazione 3.2. A differenza di quanto accade in dimensione 1, in dimensione 2 un punto critico


pu`o essere associato ad una forma quadratica che non `e semidefinita, e in tal caso (condizione
sufficiente!) il punto `e di sella. Infatti la corrispondente funzione [u] (t) verifica 0[u] (0) > 0
o 0[u] (0) < 0 a seconda che il vettore u sia stato scelto in modo tale che u H(x0 , y0 )u > 0
o u H(x0 , y0 )u < 0, e questo, insieme alla condizione di stazionariet`a, implica che t = 0 `e
` il caso considerato nellEsempio 3.1:
rispettivamente di minimo o di massimo (locale) per [u] (t). E
2
2
in (0, 0) la funzione f (x, y) = (x y )/2 ha gradiente nullo e hessiana uguale alla B dellEsempio
3.2. Ma un punto pu`
o essere di sella anche se l` la forma quadratica `e semidefinita: insomma, nel
caso della forma semidefinita pu`
o succedere quasi tutto, o addirittura tutto. Infatti se si aggiunge
la richiesta che lhessiana non sia nulla rimane escluso solo che il punto possa essere di massimo
o di minimo, a seconda che la forma sia semidefinita positiva o negativa: si pensi alle funzioni
(x4 y 2 ). Se poi lhessiana `e nulla ovvero la forma, valendo identicamente zero, `e semidefinita
positiva e negativa , non si esclude proprio niente: si pensi alle funzioni (x4 y 4 ) e x3 nonche
alla (y x2 )(y 2x2 ) dellOsservazione 3.1...

Osservazione 3.3. Per lo studio della forma quadratica associata allhessiana `e utile, fintantoche
siamo in dimensione 2, ricorrere semplicemente alla formula risolutiva per le equazioni di secondo
grado. Infatti lo studio del segno del polinomio omogeneo di secondo grado in due variabili
u 7 u H(x0 , y0 )u = fxx u21 + 2fxy u1 u2 + fyy u22
si riconduce a quello di un polinomio di secondo grado in una variabile, per la precisione fxx 2 +
2fxy + fyy se fxx 6= 0 (con = u1 /u2 per u2 6= 0) o fyy 2 + 2fxy + fxx se fyy 6= 0 (con = u2 /u1
2 f f : a seconda
per u1 6= 0). In ogni caso si tratta di studiare il segno del discriminante = fxy
xx yy
che in (x0 , y0 ) il risulti negativo, nullo o positivo il polinomio non ha nessuna radice reale, ne ha
una o ne ha due, e di conseguenza la forma quadratica `e definita (positiva o negativa a seconda che
fxx > 0, e quindi fyy > 0, oppure fxx < 0, e quindi fyy < 0, per cui (x0 , y0 ) `e rispettivamente punto
di minimo oppure di massimo locale proprio), semidefinita, o non semidefinita (per cui (x0 , y0 ) `e
un punto di sella).

5

Alla stessa disuguaglianza possiamo


p arrivare, senza parlare di autovalori, nel modo seguente. Indichiamo con m
il minimo sulla circonferenza kuk = u21 + u22 = 1 della funzione continua di 2 variabili u 7 u H(x0 , y0 )u, sempre
positiva fuori da 0, per cui m > 0 grazie al Teorema di Weierstrass. Preso allora u 6= 0, per cui u/kuk ha norma 1,
otteniamo
u H(x0 , y0 )u
u
u
=
H(x0 , y0 )
m.
kuk2
kuk
kuk

12

Tutto il contenuto di questa sezione, ad eccezione della precedente osservazione, si estende senza
difficolt`a da 2 a pi`
u variabili.
Esempio 3.3. Siano A = R2 , f (x, y) = x2 + y 3 xy. I punti critici di f sono le soluzioni del
sistema
fx (x, y) = 2x y = 0, fy (x, y) = 3y 2 x = 0,
ovvero (0, 0) e (1/12, 1/6). Studiamo il discriminante
2
(x, y) = fxy
(x, y) fxx (x, y)fyy (x, y) = (1)2 2 6y.

Siccome (0, 0) = 1 e (1/12, 1/6) = 1 con fxx (1/12, 1/6) = 2, lorigine `e un punto di sella e
(1/12, 1/6) `e un punto di minimo locale (ma non assoluto: nel piano la f `e illimitata sia inferiormente
che superiormente!) Si noti che lhessiana di f nel punto generico (x, y) vale


2 1
H(x, y) =
,
1 6y
per cui

2 1
,
H(0, 0) =
1 0


2 1
H(1/12, 1/6) =
1 1

e quindi u H(0, 0)u = 2u21 2u1 u2 non `e semidefinita (basta prendere u1 6= 0 e u2 una volta uguale
a u1 /2 e unaltra a 2u1 ), mentre u H(1/12, 1/6)u = 2u21 2u1 u2 + u22 = u21 + (u1 u2 )2 `e definita
positiva.

Esempio 3.4. Siano A =]0, 2[2 , f (x, y) = x2 + 2y 2 4xy + 2x. Imponendo il sistema
fx (x, y) = 2x 4y + 2 = 0,

fy (x, y) = 4y 4x = 0

si trova un unico punto critico (1, 1), che appartiene ad A. Il discriminante


2
(x, y) = fxy
(x, y) fxx (x, y)fyy (x, y) = (4)2 2 4

vale identicamente 8, e quindi (1, 1) `e un punto di sella.



Esempio 3.5. In R3 lorigine `e punto di minimo assoluto per f (x, y, z) = x2 + 3y 2 + 2z 4 ed
`e di sella per per f (x, y, z) = x2 3y 2 + 2z 4 .


13

Approfondimenti sullintegrale di Riemann

sec1

Nello studio dellintegrabilit`


a secondo Riemann e di tanti altri argomenti! un ruolo fondamentale `e svolto dalla nozione di uniforme continuit`
a in un insieme I. Si tratta della propriet`
a
di cui diciamo che gode una funzione f : I R se ad ogni > 0 si pu`o associare un = > 0
tale che |f (x0 ) f (x00 )| < per ogni coppia di punti x0 , x00 I con |x0 x00 | < .
Ogni f lipschitziana in I, cio`e tale che esista una costante K > 0 per la quale |f (x0 ) f (x00 )|
K|x0 x00 | al variare di x0 , x00 in I, `e uniformemente continua: basta prendere = /K.
Se I `e un intervallo sia chiuso che limitato una f C 1 (I) vi `e uniformemente continua. Infatti
la sua derivata f 0 `e dotata in I di massimo e di minimo assoluti per il Teorema di Weierstrass, e
di conseguenza `e soddisfatta la condizione di Lipschitz: |f (x0 ) f (x00 )| (maxI |f 0 |)|x0 x00 | per
x0 , x00 I grazie al Teorema di Lagrange.

Notiamo tuttavia che una comunissima funzione come x non `e C 1 , e non `e lipschitziana, in
I = [0, 1]. Vi `e, comunque, uniformemente continua? S`, semplicemente perche vi `e continua.
Infatti vale limportantissimo Teorema di HeineCantor, il quale afferma che quando I `e un
sottoinsieme sia chiuso che limitato di R, anzi pi`
u in generale di un qualunque RN (con la distanza
tra due punti al posto del modulo della differenza di due numeri), ogni f : I R continua in I vi
`e uniformemente continua.
Affrontiamo alla luce delluniforme continuit`a il criterio di integrabilit`a di una funzione f definita
e limitata nellintervallo chiuso e limitato I = [a, b]. Affinche esista lintegrale (di Riemann) di f `e
necessario e sufficiente che ad ogni > 0 si possa associare una partizione {x0 = a < x1 < x2 <
< xm = b} di [a, b] tale che
!
m
X
sup f inf f (xh xh1 ) < .
(20)
h=1

]xh1 ,xh [

]xh1 ,xh [

Sia f continua negli [xh1 , xh ]: allora


sup
]xh1 ,xh [

f = max f = f (x0h ),
[xh1 ,xh ]

inf

f=

]xh1 ,xh [

min f = f (x00h )

[xh1 ,xh ]

per opportuni x0h , x00h [xh1 , xh ], sicche la condizione (20) che bisogna ottenere diventa
m
X


f (x0h ) f (x00h ) (xh xh1 ) < .

h=1

Ebbene, questultima disuguaglianza effettivamente vale perche, grazie al Teorema di HeineCantor,


f `e uniformemente continua in [a, b]: richiedendo che xh xh1 < per h = 1, . . . , m, con > 0
tale che |f (x0 ) f (x00 )| < /(b a) per ogni coppia di punti x0 , x00 I con |x0 x00 | < , si ottiene
infatti
m
m
X

X
0
00
f (xh ) f (xh ) (xh xh1 ) <
(xh xh1 ) = .
ba
h=1

h=1

` facile convincersi che luniforme continuit`a in un insieme I implica la continuit`a in (ogni punto
E
di) I: anzi, a prima vista verrebbe fatto di dire che si tratti proprio della stessa cosa. E invece no,
perche non vale il viceversa, come mostrano i seguenti esempi.
Esempio 4.1. Sia I =]0, 1] (intervallo limitato, ma non chiuso). La funzione f (x) = sin(1/x) `e
di classe C 0 (I), ovvero continua in ogni punto di I, ma non uniformemente in I: la quantit`
a
14

sum

f (1/(2n + /2)) f (1/(2n)) = sin(2n + /2) sin(2n) `e sempre = 1, dunque > non
appena < 1, nonostante che per ogni scelta di > 0 si possano sempre trovare infiniti n tali che
0 < 1/(2n) 1/(2n + /2) < .

Esempio 4.2. Sia I = [0, [ (intervallo chiuso, ma non limitato). La funzione f (x) = x2 `e di
classe C 0 (I), ovvero continua in ogni punto di I, ma non uniformemente in I: per ogni scelta di
> 0 e di x0 1/ la quantit`
a f (x0 + /2) f (x0 ) = (2x0 + /2)/2 `e > x0 1, dunque > non
appena < 1, e questo nonostante tutti i punti x0 , x0 + /2 con x0 1/ distino meno di .

Si noti che in ciascuno dei due esempi la f `e di classe C 1 , anzi C , nellintervallo I in cui
`e stata definita, ma con derivata f 0 illimitata com`e ovvio, altrimenti il teorema di Lagrange implicherebbe la lipschitzianit`
a (con costante di Lipschitz K = supI |f 0 |) e quindi luniforme
continuit`a.
Ai fini dei prossimi sviluppi ritorniamo ora sul criterio generale di integrabilit`a secondo Riemann,
e dimostriamo il
tint

Teorema 4.1. Siano < a < b < . Una funzione limitata f : [a, b[ R, se `e integrabile
secondo Riemann su [a, B] per ogni B ]a, b[, lo `e anche su tutto [a, b], con
Z b
Z B
f (x) dx = lim
f (x) dx.
(21)
Bb

DIM. Dato arbitrariamente > 0, scegliamo innanzitutto un B ]a, b[ tale che

2 sup |f |(b B) < .


2
[a,b]

(22)

Sia poi {x0 = a < < xm1 = B} una partizione di [a, B] per la quale, grazie allipotesi di
integrabilit`a su [a, B], risulti
!
m1
X

sup f inf f (xh xh1 ) < .


2
]x
,x
[
h1 h
]xh1 ,xh [
h=1

Allora {x0 = a < < xm1 = B < xm = b} `e una partizione di [a, b] per la quale risulta
!
m
X
sup f inf f (xh xh1 )
]xh1 ,xh [

h=1

m1
X
h=1

]xh1 ,xh [

!
sup
]xh1 ,xh [

inf
]xh1 ,xh [

!
(xh xh1 ) + 2 sup |f | (b B) <
[a,b]


+ = .
2 2

Ne segue che la (20) `e soddisfatta, e quindi che f `e integrabile. Che poi valga la (21) `e conseguenza
immediata di
Z b

Z b
Z B




f (t) dt sup |f |(b B) < /2.
f (x) dx
f (x) dx =

a

[a,b]


15

int2

b-B

Dal precedente risultato `e facile dedurre il


tint

Teorema 4.2. Una funzione limitata f : [a, b] R `e integrabile se `e continua al di fuori di un


numero finito di punti 0 , . . . , n .
DIM. Ci si convince facilmente ricorrendo se necessario ad una opportuna suddivisione dellintervallo in sottointervalli che non `e restrittivo limitarsi al caso che f sia di classe C 0 in tutto
[a, b] privato solo di un estremo, diciamo di 0 = b per fissare le idee. Ma in tal caso f `e di classe
C 0 , dunque integrabile, in ogni [a, B] con a < B < b, e grazie al Teorema 4.1 ci`o garantisce la sua
integrabilit`a su tutto [a, b].

Integrali impropri e serie

Per < a < b indichiamo con f una funzione [a, b[ R integrabile secondo Riemann da a
a B per ogni B ]a, b[.
Come abbiamo visto col Teorema 4.1, se aggiungiamo le ipotesi che (i) b sia finito e (ii) f sia
limitata, la funzione `e dotata di integrale di Riemann da a a b, e vale la (21).
Lasciamo cadere almeno una tra la (i) e la (ii). Il primo membro della (21) non ha pi`
u senso
come integrale di Riemann: lo chiamiamo integrale improprio di f da a a b. Il limite nel secondo
membro (con lintesa che b si legga come se b = ) non `e detto che esista, ne, se esiste, che
sia finito. Se esiste diciamo che il suo valore `e quello dellintegrale improprio a primo membro, che
chiamiamo convergente o divergente a seconda che sia finito o no.
In maniera analoga a quanto abbiamo appena visto si affronta poi il caso di una funzione f
definita su un ]a, b], dove a < b < , e integrabile secondo Riemann su ogni sottointervallo
[A, b], a < A < b, col valore dellintegrale improprio dato da
Z

f (x) dx = lim

Aa+

f (x) dx

(23)

int3

nel caso che il limite esista (e con lintesa che a+ si legga come se a = ).
Se infine f `e una funzione definita su un ]a, b[ con a < b e integrabile secondo
Riemann su ogni sottointervallo [A, B] con a < A < B < b, il suo integrale improprio da a a b vale
Z

Z
f (x) dx =

lim

Aa+ ,Bb

f (x) dx

(24)

nel caso che entrambi i limiti indipendenti! esistano senza essere uguali uno a + e laltro
a .
e2.1

Esempio 5.1. (i) Sia f (x) = x , 0 < K x < . La funzione


Z

x dx

16

int4

vale (B 1 K 1 )/(1 ) se 6= 1 e log B log K se = 1. Ne segue che x `e dotata di


integrale improprio da 1 a convergente (e uguale a K 1 /( 1)) o divergente (a +) a seconda
che > 1 o 1.
(ii) Sia f (x) = x , 0 < x K < . La funzione
K

x dx

vale (K 1 A1 )/(1 ) se 6= 1 e log K log A se = 1. Ne segue che x `e dotata di


integrale improprio da 0 a 1 convergente (e uguale a K 1 /(1 )) o divergente (a +) a seconda
che < 1 o 1. Da qui deduciamo poi che per < a < b < gli integrali impropri di
1/(x a) e di 1/(b x) da a a b convergono o divergono a seconda che < 1 o 1. Infatti si
vede, sostituendo y = x a nel primo e y = b x nel secondo, che entrambi sono uguali a
Z

ba

(iii) Lintegrale improprio


Z

|x|

dy
.
y

Z
dx = 2

ex dx

converge: il suo valore `e 2[ex ]0 = 2.



P
Una serie reale
e qualche naturale) si pu`o scrivere come integrale improprio
n=K an (dove K `
della funzione che vale an per n x < n + 1[, n = K, K + 1, . . . , ovvero
[K, [3 x 7

an 1[n,n+1[ (x)

n=K

(che su ogni intervallo limitato soddisfa lipotesi del Teorema 4.1 e di conseguenza `e integrabile). Ci`
o
rende interessante, nel contesto dellintegrazione impropria, approfondire alcune questioni relative
alle serie.
Ricordiamo il criterio del confronto per le serie a termini non negativi : se due successioni
reali {an } e {bn } verificano definitivamente
0 an bn
P
P
P
la convergenza
della
b
implica
quella
della
a
,
mentre
la
divergenza
della
an implica quella
n
n
P
della
bn .
Quando i termini di una serie soddisfano, da un certo punto in poi, le disuguaglianze strette
an > 0, unutile applicazione
del criterio del confronto `e il criterio del rapporto: condizione
P
sufficiente affinche
an converga `e che esista un numero % ]0, 1[ tale che
an+1 /an % per n K
dove K `e un opportuno naturale. Infatti dalle disuguaglianze
aK+1 aK %,

aK+2 aK+1 %,

17

...,

an+K an1+K %

(25)

rapporto

si ricava che
an+K an+K1 % aK+1 %n1 aK %n
P
P
e quindi che la serie n an+K `e maggiorata termine a termine dalla serie convergente n aK %n
(prodotto di una costante per la serie geometrica di ragione %). Se il rapporto an+1 /an tende a
un limite L < 1, la (25) vale con un qualunque % fissato in ]L, 1[ a patto di prendere K = K(%)
sufficientemente grande.
Esempio 5.2. (i) Siccome
1
1
n! =
0
(n + 1)!
n+1

per n

P
la serie n 1/n! P
converge (e si dimostra che la sua somma `e e).
(ii) La serie n n!/nn converge perche

n 
n
(n + 1)! nn
n
1
1
=
=
< 1.
1

(n + 1)n+1 n!
n+1
n+1
e

Se an+1 /an tende a un limite L > 1 la serie diverge, perche per un opportuno N i suoi
addendi verificano an+1 /an 1 per n , e quindi a+p a per p N: viene meno la condizione
an 0 che sappiamo essere necessaria per la convergenza.
P
Se an+1 /an P1 pu`
o accadere sia che la serie converga, come la
n
con > 1, e sia che
diverga, come la
n con 1.
P E se i termini an della serie non sono di segno costante? Si pu`o passare allo studio della serie
|an | dei moduli e controllare se converge. In tal caso converge anche la serie a termini positivi
o nulli An = |an | + an , che verificano An 2|an |. Ne segue allora anche la convergenza, che
chiamiamo assoluta, della originaria serie degli an = An |an |.

Criterio del confronto, convergenza assoluta, convergenza condizionata

Torniamo agli integrali impropri. Nella maggior parte dei casi di specifiche funzioni bisogna aspettarsi che il calcolo esplicito dei limiti che compaiono nelle formulazioni generali a secondo membro
` dunque utile poter disporre
della (21) o della (23) o della (24) si riveli semplicemente impossibile. E
di un criterio di convergenza/divergenza di integrali impropri, che riguarda funzioni non negative
e costituisce la generalizzazione del criterio del confronto per serie a termini non negativi.
tint1

Teorema 6.1 (del confronto). Siano f, g : [a, b[ R, dove < a < b , funzioni entrambe
integrabili secondo Riemann da a a B per ogni B [a, b[, con
0 f (x) g(x)

per a x < b.

(26)

Allora lintegrale improprio da a a b di f converge se converge quello di g, mentre quello di g diverge


se diverge quello di f .

18

int5

DIM. Dalla (26) segue che


Z

f (x) dx
a

g(x) dx.
a

Entrambi gli integrali sono funzioni crescenti della B dal momento che i loro integrandi sono 0,
e di conseguenza ammettono limite per B b . La conclusione segue subito.

Il passaggio ai casi f, g :]a, b] R con a < b < , e f, g :]a, b[ R con a < b
si fa in un attimo.
Il prossimo esempio estende, a partire dallEsempio 5.1, la classe delle funzioni su cui appoggiarsi
per lutilizzo pratico del criterio del confronto.
Esempio 6.1. (i) Lintegrale improprio su R di 1/(1 + |x| ) converge o diverge a seconda che
> 1 o 1. Per convincersene basta limitarsi alla semiretta x 1 (per 1 x 1 non ci sono
problemi e per x 1 si utilizza la simmetria del modulo): siccome
1
1
1

2x
1+x
x

per x 1

basta tener conto dellEsempio 5.1 (i).

(ii) Per 1 e |x| 1 vale la maggiorazione e|x| e|x| , e quindi la convergenza del

lintegrale improprio di e|x| da a segue dallEsempio 5.1 (iii).



In effetti il primo approccio allutilizzo del criterio del confronto, quando si ha a che fare con
funzioni f, g entrambe di segno costante, conviene tentarlo ricorrendo allo studio del limite del
rapporto tra le due. Poniamoci ad esempio nel caso di f, g :]a, b] R, a < b < ,
con f 0 e g > 0 in ]a, b], entrambe integrabili secondo Riemann da A a b per ogni A ]a, b].
Supponiamo che esista L = limxa+ f (x)/g(x) (necessariamente 0) . Allora:
se 0 < L < , cosa che esprimiamo scrivendo che f (x) g(x) per x a+ e quindi esiste
un A tale che Lg(x)/2 f (x) (L + 1)g(x) per a < x A , allora lintegrale improprio
di f converge o diverge se e solo se, rispettivamente, converge o diverge quello di g;
se L = 0 sicche, fissato comunque > 0, esiste un A tale che f (x) g(x) per a < x A
allora la convergenza dellintegrale improprio di g implica quella dellintegrale improprio
di f , mentre la divergenza dellintegrale improprio di f implica quella dellintegrale improprio
di g;
se L = sicche, fissato comunque K > 0, esiste un A tale che f (x) Kg(x) per a < x A
allora la convergenza dellintegrale improprio di f implica quella dellintegrale improprio
di g, mentre la divergenza dellintegrale improprio di g implica quella dellintegrale improprio
di f .
Proseguiamo con lanalogia al (e in effetti con la generalizzazione del) caso delle serie. Su
[a, B] [a, b[ lintegrabilit`
a secondo Riemann di f implica quella del modulo |f |, della parte positiva
+
f e della parte negativa f ; se da a a b converge lintegrale improprio di |f | diciamo che quello
di f converge assolutamente, e grazie al Teorema del confronto vale il
19

tint2

Teorema 6.2. Per < a < b lintegrale improprio di una f : [a, b[ R, integrabile secondo
Riemann da a a B per ogni B [a, b[, se `e assolutamente convergente `e anche convergente.
DIM. Siccome
0 f + , f |f |
la convergenza dellintegrale improprio di |f | implica quella degli integrali impropri di f + e di f ,
dunque quella di f = f + f .

Il precedente enunciato non si inverte: pu`o ben accadere che un integrale improprio converga
ma non assolutamente, ovvero che converga condizionatamente.

ex32

Esempio 6.2. Lintegrale improprio (detto di Dirichlet)


Z
sin x
D=
dx
x
0
converge condizionatamente. Per vedere questo basta limitarsi allintervallo di integrazione [1, [,
visto che lintegrando, posto uguale a un qualunque numero reale per x = 0, `e integrabile secondo
Riemann da 0 a 1.
Per 1 < K < si ottiene, integrando per parti,
Z K
Z K
cos x K
cos x
sin x
dx =
dx.

x
x
x2
1
1
1
Siccome lintegrando nel secondo membro `e maggiorato in valore assoluto dalla funzione x2 che `e
dotata di integrale improprio convergente da 1 a , il limite per K esiste finito. Dunque D
`e un integrale improprio convergente. Non assolutamente convergente, per`o:
Z (2k+1)
Z (2k+1)
| sin x|
sin x
dx =
dx
x
x
2k
2k
Z (2k+1)
(2k+1)
1
1
2

sin x dx =
cos x
=
(2k + 1) 2k
(2k + 1)
(2k + 1)
2k
e quindi
D

Z
X
k=1

(2k+1)

2k

X
| sin x|
1
dx
= .
x
(k + 1)
k=1

In maniera analoga si verifica che anche gli integrale impropri


Z
Z
sin x
cos x
dx, J2 =
dx
J1 =
x
x
0
1
convergono, ma non assolutamente.
A questo punto si verifica anche che converge, ma non assolutamente, lintegrale improprio
Z
F =
sin x2 dx :
1

la sostituzione y = x2 d`
a infatti
1
F =
2

Z
1

sin y
1
dy = J1 .
y
2
20


Il criterio del
P confronto per la convergenza/divergenza degli integrali impropri si pu`o trasportare
ad una serie n an (a termini 0) quando esiste una funzione f continua e decrescente in una
semiretta [K, [ (K N) che verifica f (n) = an e quindi an+1 f (x) an . In tal caso infatti
risulta
Z
n+1

f (x) dx an

an+1
n

da cui

f (x) dx

an+1
K

n=K

an ,

n=K

e si arriva al criterio P
integrale di convergenzaP
o divergenza per le serie: se lintegrale improprio
P di
f converge, converge n an+1 e quindi anche n an ; se lintegrale improprio di f diverge, n an
diverge.
Questo criterio pu`
o rivelarsi uno strumento prezioso quando gli altri criteri
sono di applicazione
P
un po troppo complicata. Si pensi gi`
a alla serie armonica generalizzata
n : dallEsempio 5.1
segue subito laPconvergenza o la divergenza a seconda che 1 o > 1. Ancora pi`
u illuminante
`e il caso della (n log n)1 : il confronto con le serie armoniche generalizzate non fornisce nessuna
informazione che permetta di concludere, mentre basta osservare che la funzione (x log x)1 , essendo
la derivata di log(log x), ha integrale improprio divergente, per ottenere la divergenza della serie.
Lanalogia tra P
integrali impropri e serie deve peraltro essere maneggiata con cautela. Se, ad
esempio, una serie an converge, sia pure solo semplicemente, il suo termine generale an `e infinitesimo per n , mentre se lintegrale improprio di una funzione f su un intervallo superiormente
illimitato converge non `e affatto detto che f (x) 0 per x : si pensi a f (x) = sin x2 , 1 x <
(Esempio 6.2), o ancora meglio alla funzione
f (x) =

n1[n,n+1/n3 ] (x),

n=1

addirittura illimitata su
[K, [ eppure dotata di integrale improprio assolutamente
P ogni semiretta
2 . Dunque non si pu`
1/n
o pensare di estendere dalle serie agli integrali
convergente uguale a
n=1
impropri una qualche versione puntuale! del criterio di convergenza di Cauchy (e infatti
per dimostrare col Teorema 6.2 che la convergenza assoluta implica la convergenza siamo ricorsi al
Teorema del confronto 6.1, mentre per le serie si utilizza tranquillamente Cauchy).

Integrali di Riemann dipendenti da parametri

Nel corso di Calcolo 1 si incontrano delle particolari,


e importantissime, funzioni definite mediante
Rx
integrali: quelle della forma [c, d] 3 x 7 c f (t) dt. Passiamo adesso allambito delle funzioni di
pi`
u variabili, servendoci in maniera rilevante delluniforme continuit`a di una funzione continua in
un chiuso e limitato C garantita dal Teorema di HeineCantor 6 .
Cominciamo col
6

Anche in pi`
u variabili luniforme continuit`
a in C segue, senza passare per HeineCantor, da propriet`
a pi`
u forti
della continuit`
a, come la lipschitzianit`
a. Ma questultima, senza qualche ulteriore ipotesi su C, come ad esempio la
convessit`
a che consente di applicare su ogni segmento contenuto in C il Teorema del valor medio in una variabile,
non `e pi`
u a sua volta conseguenza automatica della regolarit`
a C1.

21

T6

Teorema 7.1. Sia f una funzione continua in I [c, d] con I intervallo chiuso e limitato, <
c < d < . Allora
Z d
F (x) =
f (x, t) dt
c

`e continua in I. Se poi si suppone che per ogni t [c, d] esista la derivata fx (x, t) di I 3 x 7 f (x, t)
e che fx C 0 (I [c, d]), allora anche F `e dotata di derivata continua
Z d
fx (x, t) dt
(27)
F 0 (x) =

in I.
DIM. Siano x0 , x I. Grazie alluniforme continuit`a della funzione f nel rettangolo chiuso e
limitato I [c, d] possiamo associare ad ogni > 0 un = > 0 tale che
|f (x, t) f (x0 , t)|

per t [c, d]

e quindi, maggiorando in modulo lincremento


Z d
F (x) F (x0 ) =
[f (x, t) f (x0 , t)] dt,
c

ottenere
Z
|F (x) F (x0 )|

|f (x, t) f (x0 , t)| dt (d c)


c

purche x I verifichi |x x0 | . Ci`


o mostra la continuit`a in x0 .
Passiamo alla derivabilit`
a in x0 , sfruttando stavolta luniforme continuit`a in I [c, d] della
funzione fx . Sia dunque dato arbitrariamente > 0, e sia = > 0 tale che
|fx (x, t) fx (x0 , t)| per t [c, d]

(28)

se x I con |x x0 | . Sia 0 < |h| tale che x0 + h I. Applichiamo il teorema di Lagrange:


ad ogni t [c, d] corrisponde un ]0, 1[, che dipende anche da h, tale che
f (x0 + h, t) f (x0 , t)
= fx (x0 + h, t)
h
(e, sebbene non si sappia nulla della dipendenza di da t, la funzione t 7 fx (x0 + h, t), essendo
uguale a (f (x0 + h, t) f (x0 , t))/h, `e continua, e dunque integrabile secondo Riemann, in [c, d]).
Dunque, maggiorando in modulo la differenza

Z d
Z d
F (x0 + h) F (x0 )
f (x0 + h, t) f (x0 , t)

fx (x0 , t) dt =
fx (x0 , t) dt
h
h
c
c
Z d
=
[fx (x0 + h, t) fx (x0 , t)] dt
c

otteniamo

Z d
Z b
F (x0 + h) F (x0 )

fx (x0 , t) dt
|fx (x0 + h, t) fx (x0 , t)| dt < (d c).

h
a
c
A questo punto la (27) per x = x0 segue dallarbitrariet`a di . Applicando poi a fx (x, t) il precedente
risultato di continuit`
a si ottiene anche la continuit`a di F 0 in I.
22


Naturalmente nel Teorema 7.1 gli estremi di integrazione possono essere scambiati tra di loro:
questo significa semplicemente passare da F e F 0 a G = F e G0 = F 0 .
Adesso facciamo variare gli estremi di integrazione.
T66

Teorema 7.2. Sia f continua in I [c, d]. In C = I [c, d] [c, d] la funzione


Z z
f (x, t) dt
(x, y, z) =
y

`e continua e dotata di derivate parziali continue


y (x, y, z) = f (x, y),

z (x, y, z) = f (x, z).

(29)

Se poi si aggiunge lipotesi che per ogni t [c, d] esista la derivata fx (x, t) di I 3 x 7 f (x, t) e che
fx C 0 (I [c, d]), allora per ogni (y, z) [c, d] [c, d] la I 3 x 7 (x, y, z) `e dotata anche della
derivata
Z z
x (x, y, z) =
fx (x, t) dt,
(30)

a sua volta continua in C.


DIM. Per (x0 , y0 , z0 ), (x, y, z) C scriviamo (x, y, z) (x0 , y0 , z0 ) come somma
Z z0
Z y0
Z z
[f (x, t) f (x0 , t)] dt +
f (x, t) dt +
f (x, t) dt.
y0

(31)

z0

Il secondo e terzo addendo sono rispettivamente maggiorati in modulo dai prodotti di |y y0 | e di


|z z0 | per il massimo di |f | su I [c, d]. Sia un qualunque reale positivo. Grazie al Teorema
7.1 sappiamo che il primo addendo della (31) `e maggiorato in valore assoluto da purche |x x0 |
sia maggiorato da un opportuno = > 0. Poich`e nulla impedisce di prendere , la quantit`
a
|(x, y, z) (x0 , y0 , z0 )| `e maggiorata dal prodotto di una costante per non appena (x, y, z) K
verifica |x x0 | , |y y0 | , |z z0 | , e questo dimostra che in ogni punto (x0 , y0 , z0 ) K
la `e continua.
Le (29) sono conseguenze immediate del teorema fondamentale del calcolo integrale applicato,
per ogni fissato x, alla funzione t 7 f (x, t).
Per ottenere la (30) in un punto (x0 , y0 , z0 ) di K basta applicare il risultato di derivazione del
Teorema 7.1 alla funzione
Z z0
x 7
f (x, t) dt;
y0

applicando poi il precedente risultato di continuit`a con sostituita da x si ottiene la continuit`


a
di questultima in (x0 , y0 , z0 ).

oss42

Osservazione 7.1. Nelle due precedenti dimostrazioni `e stata utilizzata lipotesi che I sia, oltre
che chiuso, anche limitato. Per`
o esse si ripetono tali e quali con le intersezioni [x0 r, x0 + r] I,
r > 0, al posto di I, per cui i Teoremi 7.1 e 7.2 continuano a valere con lintervallo I chiuso ma
non limitato.

23

Dal teorema precedente possiamo finalmente dedurre il


T5

Teorema 7.3. Sia f C 0 (I [c, d]) con I intervallo chiuso, < c < d < , e siano ,
C 0 (I) tali che c (x), (x) d. La funzione
Z (x)
f (x, t) dt
G(x) =
(x)

`e continua su I; se poi si aggiungono le ipotesi che per ogni t [c, d] esista la derivata fx (x, t) di
I 3 x 7 f (x, t) continua in I [c, d] e che , appartengano a C 1 (I), allora G `e dotata di derivata
continua
Z
G0 (x) =

(x)

fx (x, t) dt + f (x, (x)) 0 (x) f (x, (x))0 (x)

(x)

in I.
DIM. Continuit`
a della funzione composta G(x) = (x, (x), (x)); derivabilit`a della funzione
composta (dal momento che `e C 1 ), e dunque
G0 (x) = x (x, (x), (x)) + y (x, (x), (x))0 (x) + z (x, (x), (x)) 0 (x),
poi le (29) e la (30).

Il Teorema 7.3 ha unapplicazione importante nel metodo di Duhamel per la risoluzione di
equazioni differenziali lineari non omogenee a coefficienti costanti. Cominciamo dal I ordine. Per
a R e f C 0 (]c, d[) si verifica in un attimo che la funzione
Z t
y(t) =
ea(ts) f (s) ds
(32)

ord1

t0

soddisfa lequazione lineare y 0 + ay = f (t) (insieme alla condizione di Cauchy y(t0 ) = 1): non c`e
bisogno di ricorrere al Teorema 7.3, visto che il secondo membro si riscrive
Z t
at
e
eas f (s) ds
t0

con lintegrando che non dipende dal parametro t, e di conseguenza si deriva elementarmente.
Tuttavia la (32) `e istruttiva, perche fornisce al I ordine la formula di Duhamel
Z t
y(t) =
Y (t s)f (s) ds
(33)

t0

con Y (t) che qui denota la soluzione eat dellequazione omogenea Y 0 + aY = 0 che soddisfa la
condizione di Cauchy Y (0) = 1.
Passiamo al II ordine.
TDu

Teorema 7.4. Siano a, b R, f C 0 (]c, d[). La funzione (33) con Y (t) soluzione del problema di
Cauchy
Y 00 + aY 0 + bY = 0, Y (0) = 0, Y 0 (0) = 1
`e una soluzione dellequazione non omogenea
y 00 + ay 0 + by = f (t),
e pi`
u esattamente lunica ad annullarsi in t0 insieme alla sua derivata prima.
24

(34)

Du

DIM. Adesso bisogna applicare, per due volte, la regola di derivazione degli integrali dipendenti da
un parametro. Si ottiene prima
Z t
Z t
0
0
Y 0 (t s)f (s) ds,
Y (t s)f (s) ds =
y (t) = Y (0)f (t) +
t0

t0

poi
00

00

Y (t s)f (s) ds = f (t) +

y (t) = Y (0)f (t) +

Y 00 (t s)f (s) ds

t0

t0

e infine
00

y (t) + ay (t) + by(t) = f (t) +

[Y 00 (t s) + aY 0 (t s) + bY (t s)]f (s) ds = f (t)

t0

cio`e la tesi. (Abbiamo utilizzato lequazione omogenea soddisfatta da Y nei punti t s.)

Esempio 7.1. Sia b R. Lintegrale generale dellequazione
y 00 + by = f (t)
vale

c1 sin t b + c2 cos t b +

t0

sin (t s) b

f (s) ds
b

per b > 0, e invece


c1 e

t b

+ c2 e

t b

e(ts)

t0

e(ts)

2 b

f (s) ds

per b < 0.
Prendiamo in particolare b = 1, f (t) = 1/ cos t per /2 < t < /2. La funzione (33) con
t0 = 0 `e allora
Z t
Z t
Z t
sin(t s)
sin t cos s cos t sin s
sin s
ds =
ds = t sin t cos t
ds
cos s
cos s
0
0
0 cos s
= t sin t + cos t log(cos t).
Il metodo di Duhamel che abbiamo finora illustrato per le equazioni del I e del II ordine
si trasporta immediatamente a un qualunque ordine N : per a0 , . . . , aN 1 R e f C 0 (]c, d[)
lequazione
y (N ) + aN 1 y (N 1) + + a1 y 0 + a0 y = f (t)
`e soddisfatta dalla funzione y(t) che ha lespressione (33) con Y (t) soluzione adesso dellomogenea
Y (N ) + aN 1 Y (N 1) + + a1 Y 0 + a0 Y = 0
che soddisfa le condizioni di Cauchy Y (0) = Y 0 (0) = = Y (N 2) (0) = 0, Y (N 1) (0) = 1. La
verifica troppo lunga! si fa con N derivazioni successive attraverso il Teorema 7.3. Qui ci
limitiamo ad osservare che nel caso particolarissimo a0 = = aN 1 = 0 la funzione Y (t) richiesta
`e la tn1 /(n 1)!, per cui
Z t
1
y(t) =
(t s)n1 f (s) ds
(n 1)! t0
`e la soluzione di y (N ) = f (t) che si annulla in t0 insieme a tutte le sue derivate fino all(n1)esima.


25

Successioni uniformemente convergenti

Nella prossima sezione ci serviremo delle definizioni e dei risultati seguenti.


Sia data una successione di funzioni Fn definite su un intervallo I. Preso un x I, ha senso
chiedersi se la successione numerica {Fn (x)} `e convergente; ovvero se esiste un numero reale,
che allora sar`
a lecito indicare con F (x), tale che limn Fn (x) = F (x); ovvero ancora se, dato
comunque > 0, esiste un ,x N tale che
|Fn (x) F (x)|

per n ,x .

Prescindendo dalla conoscenza delleventuale limite F (x), la condizione necessaria e sufficiente per
la convergenza di {Fn (x)} `e fornita dal criterio di Cauchy: dato comunque > 0, esiste un ,x N
tale che
|Fn (x) Fn+p (x)| per n ,x , p N.
Se poi ci interessiamo alla eventuale convergenza di ogni successione numerica {Fn (x)} al variare
di x I detta convergenza puntuale delle Fn in I , le precedenti formule rimangono
inalterate: laspetto cruciale `e che ci si accontenta di poter appurare per ogni e per ogni x
lesistenza di quellindice denotato appunto ,x .
Adesso introduciamo una nozione pi`
u stringente, richiedendo lesistenza di tale indice ancora in
dipendenza da , ma non pi`
u da x. Diciamo dunque che le Fn convergono uniformemente7 in
I a una funzione F se, dato comunque > 0, esiste un N tale che
|Fn (x) F (x)| per x I, n

(35)

unif

sup |Fn (x) F (x)| per n .

(36)

unifsup

La convergenza uniforme implica banalmente quella puntuale, ma non viceversa. Un semplicissimo


esempio di successione che converge puntualmente ma non uniformemente `e fornito dalle Fn (x) = xn
in I = [0, 1[: il limite puntuale `e F (x) = 0, ma per < 1 la (36) `e violata dal momento che
supx[0,1[ |xn | = 1.
Prendendo nella (35) /2 al posto di e poi aggiungendo Fp (x) Fn+p (x) dentro al modulo
si ottiene la condizione necessaria per la convergenza uniforme: dato comunque > 0, esiste un
N tale che
|Fn (x) Fn+p (x)| per x I, n , p N.
(37)

unifcau

ovvero
xI

La condizione `e anche sufficiente per la convergenza uniforme, e viene detta criterio uniforme
di Cauchy: da essa segue essa infatti la convergenza puntuale ad una F (x), e passando al limite
per p si ottiene la (35).8
Il prossimo teorema fornisce condizioni sufficienti per scambiare tra di loro il segno di limite per
n con quello di limite per x x0 , con quello di integrale e con quello di derivata.
T6

Teorema 8.1. (i) Se le funzioni Fn : I R sono continue in un punto x0 I e convergono


uniformemente in I, allora anche F = limn Fn `e una funzione continua in x0 .
7

Per laffinit`
a concettuale con la continuit`
a uniforme di una funzione in un intervallo cfr. la Sezione 4.
Se avessimo optato per la richiesta delle disuguaglianze forti < invece di quelle deboli, assolutamente equivalenti
per larbitrariet`
a di > 0, ci saremmo procurati qualche inutile complicazione, sia pur di minimo conto.
8

26

(ii) Se le funzioni Fn : I R sono continue in ogni punto di I e convergono uniformemente in


I, allora F = limn Fn (continua in I grazie a (i)) verifica
Z b
Z b
Fn (x) dx per a, b I.
(38)
F (x) dx = lim
a

unif

(iii) Se le funzioni Fn : I R sono di classe C 1 in I, con {Fn (x0 )} convergente per qualche
scelta di x0 I e le Fn0 uniformemente convergenti in I, allora in I esiste F = limn Fn di classe
C 1 , con
F 0 (x) = lim Fn0 (x) per x I.
(39)
n

unif

DIM. (i) Fissiamo arbitrariamente un > 0 e associamogli N in modo che valga la (35). Grazie
allipotesi di continuit`
a di ogni Fn in x0 esiste un = , > 0 tale che
|F (x) F (x0 )| < per x I,

|x x0 | < .

Allora (tecnica dei tre )


|F (x) F (x0 )| |F (x) F (x)| + |F (x) F (x0 )| + |F (x0 ) F (x0 )| < 3,
da cui la continuit`
a di F in x0 .
(ii) Innanzitutto sottolineiamo che F `e continua in ogni punto di I grazie al punto (i), e di
conseguenza `e integrabile al pari di tutte le Fn su ogni intervallo chiuso e limitato di I. Fissiamo
poi un arbitrario > 0 e associamogli N in modo che valga la (35). Allora
Z b
Z b

Z b






< |b a| per n .
F
(x)
dx

F
(x)
dx

|F
(x)

F
(x)|
dx
n
n



a

Ci`o prova la (38).


(iii) Per ogni x I il Teorema fondamentale del Calcolo d`a
Z x
Fn (x) = Fn (x0 ) +
Fn0 (t) dt.
x0

Ponendo = limn Fn (x0 ) e G = limn F 0 vediamo che, in virt`


u del punto (ii), il secondo membro
tende a
Z x
+
G(t) dt.
(40)
x0

Ma allora F (x) = limn Fn (x) esiste e assume il valore (40) per ogni x, da cui = F (x0 ) e, derivando,
G(x) = F 0 (x).

Osservazione 8.1. Nel punto (i) del teorema lipotesi di uniforme convergenza delle Fn `e essenziale,
come si vede con semplicissimi esempio: per dirne uno, quello gi`a visto delle funzioni continue
Fn (x) = xn , ma stavolta per x I = [0, 1], che convergono puntualmente alla funzione discontinua
che vale 0 per x [0, 1[ e ad 1 per x = 1. Invece sia la (38) e sia la (39) valgono sotto ipotesi molto
pi`
u deboli delluniforme convergenza rispettivamente delle Fn e delle Fn0 .


27

unif

Integrali impropri dipendenti da parametri

Estendiamo il Teorema 7.1 agli integrali impropri.


T6

Teorema 9.1. Sia f una funzione continua in I]c, d[ con I intervallo chiuso, c < d .
Supponiamo che
|f (x, t)| g(t) per (x, t) I]c, d[
(41)

con g funzione reale 0 dotata di integrale improprio (assolutamente) convergente su ]c, d[. Allora
la funzione
Z d
I 3 x 7 F (x) =
f (x, t) dt
c

`e continua. Se poi si aggiungono le ipotesi che per ogni t ]c, d[ esista la derivata fx (x, t) di
I 3 x 7 f (x, t), che fx C 0 (I]c, d[) e che valga una disuguaglianza
|fx (x, t)| g(t)

per (x, t) I]c, d[,

(42)

eS

allora la funzione F sta in C 1 (I) con


d

F (x) =

fx (x, t) dt.
c

DIM. Innanzitutto, la (41) garantisce, grazie al Teorema del confronto, che per ogni fissato x I
la funzione t 7 f (x, t) ha integrale improprio assolutamente convergente da c a d. Dunque F (x) `e
ben definita. Studiamo la sua regolarit`a al variare di x in I.
Siano {cn }, {dn } ]c, d[ tali che cn c e dn d.
Dal Teorema 7.1 (e alla luce dellOsservazione 7.1 se I `e illimitato) sappiamo che per ogni n la
funzione
Z
dn

I 3 x 7 Fn (x) =

f (x, t) dt

(43)

param

cn

`e continua. Daltra parte, dalla convergenza dellintegrale improprio di g segue che, dato comunque
> 0, esiste un = N tale che
Z

cn

g(t) dt per n .

g(t) dt +
c

(44)

dn

Dunque la (41), oltre a garantire che per ogni x I la funzione t 7 f (x, t) `e dotata di integrale improprio assolutamente convergente, ovvero che F (x) `e ben definita, fornisce anche la
disuguaglianza
Z cn
Z d
|f (x, t)| dt +
|f (x, t)| dt per x I, n .
c

dn

Ma allora
Z

|F (x) Fn (x)|

cn

Z

f (x, t) dt +

dn



f (x, t) dt per x I, n .

Ne segue che in I la successione delle funzioni continue Fn (x) converge uniformemente in I ad F (x),
e quindi (Teorema 8.1 (i)) che questultima `e continua.

28

eqg

In maniera analoga, sotto lipotesi di derivabilit`a di x 7 f (x, t) si ricava innanzitutto, grazie al


Teorema 7.1 (e allOsservazione 7.1 se I `e illimitato) , che per ogni n la funzione (43) `e derivabile
in I con
Z
dn

Fn0 (x) =

fx (x, t) dt.
cn

Dalla (42) segue poi che per ogni x I la funzione t 7 fx (x, t) `e dotata di integrale improprio
assolutamente convergente, ovvero che la funzione
d

Z
I 3 x 7 G(x) =

fx (x, t) dt
c

`e ben definita; inoltre G C 0 (I) grazie alla prima parte del teorema.
Sia > 0 arbitrariamente fissato, e sia di nuovo = N tale che valga la (44). Allora risulta
Z

cn

|fx (x, t)| dt +


c

|fx (x, t)| dt

per x I, n

dn

per cui
|G(x)

Fn0 (x)|

cn

Z

fx (x, t) dt +

dn



fx (x, t) dt per x I, n .

Ne segue che la successione delle funzioni continue Fn0 (x) converge uniformemente a G(x), e quindi
(Teorema 8.1 (iii)) F (x) = limn Fn (x) `e derivabile con F 0 (x) = G(x).

Naturalmente non `e affatto restrittivo richiedere che le disuguaglianze (41) e (42) valgano con
la stessa funzione g(t): se si parte da due diverse funzioni nei secondi membri basta prendere la
loro somma per ricondursi alle ipotesi del teorema.
Esempio 9.1. Fissiamo x in I = [a, [, a > 0. Su ]c, d[=]0, [ sia la funzione t 7 f (x, t) =
t1 etx sin t che la sua derivata t 7 fx (x, t) = etx sin t sono maggiorate in modulo dalla funzione
continua g(t) = eta , che ha integrale improprio assolutamente convergente. Dunque la
Z
sin t
F (x) =
etx
dt
t
0
`e continua e anzi derivabile per x a, con
F 0 (x) =

etx sin t dt.


Esempio 9.2. La funzione f (x, t) = xext soddisfa tutte le ipotesi del Teorema 7.1 con I = R e
[c, d] qualunque. Si pu`
o dedurre da questo che il suo integrale di Riemann su [c, d] `e una funzione
continua, anzi derivabile della x; pi`
u direttamente, basta tener conto che xext = (ext )0 e
applicare il Teorema Fondamentale del Calcolo. Invece
Z


F (x) =
xext dt = ext
0

29

`e definita su [0, [, ma non `e continua in 0:


F (0) = 0,

F (x) = 1

per x > 0

(e in qualunque intervallo [0, b] si ha convergenza puntuale ma non uniforme delle funzioni continue
Z n
n

Fn (x) =
xext dt = ext = 1 enx
0

a F (x): cfr il Teorema 8.1 (i)). Infatti non si applica il Teorema 9.1: non esiste una funzione
]0, [3 t 7 g(t) dotata di integrale improprio convergente e tale che valga la (41), dal momento che
per 1/t b il max0xb xext si ottiene per x = 1/t e vale (et)1 , sicche una qualunque g(t) xext
per (x, t) R [0, [ non pu`
o essere integrabile in quanto deve verificare g(t) (et)1 .

Per gli integrali impropri semplicemente convergenti non vale il teorema di derivazione sotto il
segno di integrale, come mostra il seguente
Esempio 9.3. Per x > 0 la funzione

Z
F (x) =
0

sin tx
dt
t

R
assume costantemente il valore dellintegrale improprio semplicemente convergente 0 [(sin u)/u] du,
come si vede operando il cambiamento u = tx della variabile dintegrazione. Dunque F 0 (x) = 0,
mentre lintegrale improprio della derivata della funzione x 7 (sin tx)/t, cio`e di cos tx, non solo
non vale identicamente 0, ma non `e neppure convergente.


10

Il Teorema di Dini per funzioni scalari

Nel piano euclideo lequazione di una retta


F (x, y) = ax + by + c = 0
con a, b, c numeri reali ed a2 +b2 > 0 `e risolubile rispetto a y in funzione della x (con y = ax/bc/b)
se Fy = b 6= 0, cio`e se la retta non `e verticale, e rispetto a x in funzione della y (con x = by/ac/a)
se Fx = a 6= 0, cio`e se la retta non `e orizzontale. Per farla breve, qui tutto linsieme dei punti del
piano che verificano lequazione `e sempre il grafico di una funzione della x o della y a seconda che
Fy 6= 0 o Fx 6= 0 (senza che un caso escluda necessariamente laltro).
Se per`o F `e una generica funzione R con aperto di R2 non `e affatto detto che linsieme
dei punti (x, y) che soddisfano lequazione F (x, y) = 0 sia sempre il grafico di una funzione
y = f (x) o di una funzione x = g(y) e nemmeno che sia una curva, ne, perfino, che sia 6= .
Per rendersene conto gi`
a basterebbe osservare che un qualunque sottoinsieme S del piano coincide
con linsieme delle soluzioni dellequazione F (x, y) = 1S (x, y) 1 = 0. Ma questa `e una F che in
generale non ha la minima regolarit`
a. Ebbene, prendiamo delle F regolarissime.
30

Esempio 10.1. Sia F (x, y) = x2 y 2 . Linsieme Z delle soluzioni dellequazione F (x, y) = 0 `e


costituito dallunione delle due bisettrici y = x. Ogni suo punto diverso dallorigine ha un intorno
la cui intersezione con Z `e un tratto di retta, dunque un grafico. Invece lintersezione con Z di un
qualunque intorno dellorigine non `e mai un grafico e notiamo che Fx (0, 0) = Fy (0, 0) = 0.

Esempio 10.2. Per ogni r R sia
F (x, y) = x2 + y 2 r.
Linsieme Z delle soluzioni dellequazione F (x, y) = 0 `e vuoto se r < 0 e coincide col solo punto
(0, 0) se r = 0: dunque non `e un grafico in nessuno dei due casi. Sia r > 0. Neanche allora `e vero che

tutto Z, essendo la circonferenza di centro lorigine e raggio r, sia un grafico. Per`o Z `e localmente
grafico di una funzione o della x oppure della y (senza che un caso escluda necessariamente laltro).
Vediamo i dettagli.
In un opportuno intorno aperto A di un punto (x0 , y0 ) Z tale che Fy (x0 , y0 ) = 2y0 6= 0,
per cui la retta tangente
alla circonferenza

nel punto non `e verticale, i punti di Z sono quelli


del grafico di y = r x2 o di y = r x2 a seconda che y0 > 0 (e allora A `e lintero
semipiano delle y > 0) o y0 < 0 (e allora A `e lintero semipiano delle y < 0). Se per`o y0 = 0,

e quindi x0 = r o x0 = r, non esiste nessun intorno del punto, per quanto piccolo, la cui
intersezione con Z sia grafico di una funzione della x.
In un opportuno intorno aperto A di di un punto (x0 , y0 ) Z tale che Fx (x0 , y0 ) = 2x0 6= 0,
per cui la retta tangente p
alla circonferenza nelppunto non `e orizzontale, i punti di Z sono
quelli del grafico di x = r y 2 o di x = r y 2 a seconda che x0 > 0 (e allora A `e
lintero semipiano delle x > 0) o x0 < 0 (e allora A `e lintero semipiano delle x < 0). Invece

non esiste nessun intorno, per quanto piccolo, del punto (0, r) o del punto (0, r) la cui
intersezione con Z sia grafico di una funzione della y.

Il precedente esempio illustra significativamente il caso di una classe abbastanza generale di
equazioni F (x, y) = 0, tranne per un aspetto (non di poco conto). Come vedremo col prossimo
risultato, infatti, sotto opportune ipotesi esiste un intorno di una soluzione (x0 , y0 ) dellequazione
in cui questultima definisce implicitamente una delle due variabili come funzione dellaltra, nel
senso che le soluzioni dellequazione che cadono nellintorno sono tutti e soli punti del grafico di
tale funzione; di questultima per`
o sar`
a impossibile, in genere, dare unespressione esplicita come
invece si `e facilmente fatto nellesempio.
t6.1

Teorema 10.1 (di Dini). Sia F di classe C 1 in un aperto di R2 . Supponiamo che per un
(x0 , y0 ) risulti F (x0 , y0 ) = 0 e Fy (x0 , y0 ) 6= 0. Allora esistono , > 0 tali che in A =
]x0 , x0 + []y0 , y0 + [ (la Fy si mantiene 6= 0 e) lequazione F (x, y) = 0 definisce
implicitamente una funzione y = f (x) continua, ed anzi di classe C 1 ; la derivata di f si ottiene
derivando rispetto ad x lidentit`
a F (x, f (x)) = 0, da cui Fx (x, f (x)) + Fy (x, f (x))f 0 (x) = 0 e quindi
f 0 (x) =

Fx (x, f (x))
Fy (x, f (x))

31

per |x x0 | < .

(45)

der

DIM. Per fissare le idee supponiamo Fy (x0 , y0 ) > 0. Grazie alla continuit`a della Fy in possiamo
applicarle il Teorema della permanenza del segno e trovare due numeri reali positivi a e con
la seguente propriet`
a: per |x x0 | a e |y y0 | risulta Fy (x, y) > 0, e di conseguenza ogni
funzione y 7 F (x, y) ad x fissato `e crescente. Poiche F (x0 , y0 ) = 0, questo implica F (x0 , y0 ) < 0
e F (x0 , y0 + ) > 0. Applichiamo di nuovo il Teorema della permanenza del segno, questa volta
alle due funzioni x 7 F (x, u0 ) e x 7 F (x, y0 + ): se = a `e un numero reale positivo
sufficientemente piccolo (per intendersi, tanto pi`
u piccolo quanto pi`
u piccolo `e ) abbiamo sia
F (x, y0 ) < 0 che F (x, y0 + ) > 0 per x nellintervallo chiuso [x0 , x0 + ]. Fissiamo la x
nellintervallo aperto 9 ]x0 , x0 +[ ed applichiamo il Teorema di esistenza degli zeri alla funzione
continua e strettamente monotona y 7 F (x, y): otteniamo
F (x, f (x)) = 0
per un unico valore f (x) strettamente compreso tra y0 e y0 + , cio`e tale che
|f (x) y0 | < .

(46)

cont

Naturalmente f (x0 ) = y0 .
Passiamo alla dimostrazione della (49). Come `e detto nellenunciato, essa segue subito dallidentit`a F (x, f (x)) = 0 in ]x0 , x0 + [ grazie alla regola di derivazione delle funzioni composte,
a patto per`
o di sapere preliminarmente che f `e derivabile, cosa questa che non abbiamo ancora fatto vedere. Cominciamo col mostrare la continuit`a di f in ]x0 , x0 + [. Per x fissato
in ]x0 , x0 + [ si ha anche x + h ]x0 , x0 + [, e quindi (x + h, f (x + h)) A, se |h|
`e sufficientemente piccolo, diciamo |h| < k. Il teorema del valor medio applicato alla funzione
t 7 (t) = F (x + th, f (x) + t(f (x + h) f (x))) assicura lesistenza di un ]0, 1[ tale che
F (x + h, f (x + h)) F (x, f (x)) = (1) (0) = 0 ( )
= Fx (x + h, f (x) + (f (x + h) f (x)))h + Fy (x + h, f (x) + (f (x + h) f (x)))(f (x + h) f (x)).
Il primo membro di questa identit`
a `e nullo, e dividendo per Fy (x + h, f (x) + (f (x + h) f (x)))
m = minA Fy > 0, otteniamo
f (x + h) f (x) =

Fx (x + h, f (x) + (f (x + h) f (x)))
h.
Fy (x + h, f (x) + (f (x + h) f (x)))

(47)

Il secondo membro si maggiora in modulo con M |h|/m dove M = maxA |Fx |, e questo mostra la
continuit`a di f nel punto x. Grazie ad essa la frazione nel secondo membro `e il rapporto di due
funzioni continue di h ] k, k[. Dividiamo entrambi i membri della (47) per h 6= 0: otteniamo
Fx (x + h, f (x) + (f (x + h) f (x)))
f (x + h) f (x)
=
h
Fy (x + h, f (x) + (f (x + h) f (x)))
e quindi la derivabilit`
a di f facendo tendere h a 0.

9
Naturalmente qui anche lintervallo chiuso andrebbe bene. Per`
o quando poi si passer`
a dalla variabile scalare x
ad una vettoriale far`
a comodo limitare questultima ad un aperto, in modo di poterle associare senza difficolt`
a la
nozione di regolarit`
a C 1 che nei chiusi diventa delicata se le variabili sono pi`
u di una.

32

incr

Osservazione 10.1. Se nel teorema si sostituisce lipotesi Fy (x0 , y0 ) 6= 0 con la Fx (x0 , y0 ) 6= 0,


allora vale la tesi che enunciamo sbrigativamente cos`: lequazione F (x, y) = 0 definisce implicitamente, in un opportuno intorno di (x0 , y0 ), una funzione x = g(y) di classe C 1 , la cui derivata si
ottiene derivando rispetto ad y lidentit`a F (g(y), y) = 0.

Osservazione 10.2. Come abbiamo gi`a fatto presente, in generale non possiamo sperare di riuscire
ad esplicitare la f (x) ottenuta grazie al Teorema di Dini. E questo fa s` che tanto meno possiamo
servirci della (49) per il calcolo di f 0 (x), tranne per x = x0 . Se F `e solo C 1 ci fermiamo l`. Ma se
F `e pi`
u regolare possiamo procedere oltre: deriviamo entrambi i membri della (49) e otteniamo
f 00 (x) =

Fy2 Fxx 2Fx Fy Fxy + Fx2 Fyy


.
Fy3

Tutte le funzioni del secondo membro sono calcolate in (x, f (x)), per cui `e dato il loro valore per
x0 = 0: adesso disponiamo dei valori non solo di f (x0 ) e di f 0 (x0 ), ma anche di f 00 (x0 ). Cos`
procedendo (beninteso nei limiti dellumanamente, e anche numericamente, possibile) possiamo
pensare di arrivare a dare alla f un buono sviluppo di Taylor di punto iniziale x0 .

Osservazione 10.3. Abbiamo visto che se F appartiene a C 1 (), dove `e un aperto di R2 , e
per un (x0 , y0 ) A verifica F (x0 , y0 ) = 0, Fy (x0 , y0 ) 6= 0, allora esiste un intorno di (x0 , y0 ) in cui
linsieme di livello F = 0 coincide col grafico di una funzione y = f (x) di classe C 1 , cio`e con una
curva dotata in (x0 , y0 ) di retta tangente di equazione
y y0 = f 0 (x0 )(x x0 )
ovvero
y y0 =

Fx (x0 , y0 )
(x x0 )
Fy (x0 , y0 )

e quindi
Fx (x0 , y0 )(x x0 ) + Fy (x0 , y0 )(y y0 ) = 0.

(48)

Per ottenere lequazione (48) della retta tangente in (x0 , y0 ) alla curva F = 0 abbiamo utilizzato
il Teorema di Dini sotto lipotesi Fy (x0 , y0 ) 6= 0. Per`o saremmo arrivati allo stesso risultato sotto
lipotesi Fx (x0 , y0 ) 6= 0. Dunque possiamo concludere che ogni punto (x0 , y0 ) di in cui F si
annulla e il gradiente10 (Fx , Fy ) = F non `e il vettore nullo ha un intorno nel quale lequazione
F = 0 definisce una curva regolare con retta tangente (al sostegno) in (x0 , y0 ) data dallequazione
(48) o, ci`o che `e lo stesso, con retta normale di direzione F (x0 , y0 ).

10

Ricordiamo che il gradiente di una funzione u di classe C in un aperto del piano ha, in ogni punto in cui non si
annulla, la direzione e il verso di massima crescita di u. Infatti la derivata in (x0 , y0 ) di u lungo una direzione (, ),
2 + 2 = 1, cio`e 0 (t) = du(x0 +t, y0 +t)/dt calcolata in t = 0, vale, grazie alla disuguaglianza di CauchySchwarz,
p
0 (0) = ux (x0 , y0 ) + uy (x0 , y0 ) ux (x0 , y0 )2 + uy (x0 , y0 )2
col segno = se e solo se (, ) = u(x0 , y0 )/ku(x0 , y0 )k.

33

4.1

Il Teorema di Dini per le funzioni scalari di 2 variabili si estende con ovvie modifiche alle funzioni
di un qualunque numero di variabili. Per le funzioni di 3 variabili, ad esempio, abbiamo il
t4.1

Teorema 10.2. Sia F di classe C 1 in un aperto di R3 . Supponiamo che per un (x0 , y0 , z0 )


risulti F (x0 , y0 , z0 ) = 0 e Fz (x0 , y0 , z0 ) 6= 0. Allora esiste un aperto A = A0 ]z0 , z0 + [
, con A0 aperto di R2 , in cui (la Fz si mantiene 6= 0 e) lequazione F (x, y, z) = 0 definisce
implicitamente una funzione z = f (x, y) di classe C 1 ; le derivate di f si ottengono derivando
rispetto ad x e y lidentit`
a F (x, y, f (x, y)) = 0, da cui Fx (x, y, f (x, y))+Fz (x, y, f (x, y))fx (x, y) = 0,
Fy (x, y, f (x, y)) + Fz (x, y, f (x, y))fy (x, y) = 0, e quindi
fx (x, y) =

Fx ((x, y, f (x, y))


,
Fz (x, y, f (x, y))

fy (x, y) =

Fy ((x, y, f (x, y))


Fz (x, y, f (x, y))

per (x, y) A0 .

(49)

der

Naturalmente questo teorema continua a valere con la variabile z sostituita dalla x o dalla y
nellipotesi che sia diversa da 0 la corrispondente derivata di F nel punto, eccetera.
Osservazione 10.4. Occupiamoci dellequazione F (x, y, z) = 0. Se F appartiene a C 1 () con
aperto di R3 e in un punto (x0 , y0 , z0 ) di si ha F (x0 , y0 , z0 ) = 0, Fz (x0 , y0 , z0 ) 6= 0, il Teorema
10.2 con N = 2 afferma che esiste un intorno di (x0 , y0 , z0 ) in cui linsieme di livello F = 0 coincide
col grafico di una funzione z = f (x, y) di classe C 1 , cio`e con una superficie dotata in (x0 , y0 , z0 ) di
piano tangente di equazione
z z0 = fx (x0 , y0 )(x x0 ) + fy (x0 , y0 )(y y0 )
ovvero
z z0 =

Fy (x0 , y0 , z0 )
Fx (x0 , y0 , z0 )
(x x0 )
(y y0 )
Fz (x0 , y0 , z0 )
Fz (x0 , y0 , z0 )

e quindi
Fx (x0 , y0 , z0 )(x x0 ) + Fy (x0 , y0 , z0 )(y y0 ) + Fz (x0 , y0 , z0 )(z z0 ) = 0.

(50)

4.1

Per ottenere lequazione (50) del piano tangente in (x0 , y0 , z0 ) alla superficie F = 0 abbiamo
utilizzato il Teorema di Dini sotto lipotesi Fz (x0 , y0 , z0 ) 6= 0. Per`o saremmo arrivati allo stesso
risultato sotto lipotesi Fx (x0 , y0 , z0 ) 6= 0 o lipotesi Fy (x0 , y0 , z0 ) 6= 0. Possiamo dunque affermare
che ogni punto (x0 , y0 , z0 ) di in cui F si annulla e F non `e il vettore nullo ha un intorno nel
quale lequazione F = 0 definisce una superficie con piano tangente (al sostegno) in (x0 , y0 , z0 ) dato
dallequazione (50) o, ci`
o che `e lo stesso, con retta normale di direzione F (x0 , y0 , z0 ).


11

Il Teorema di Dini per sistemi

Il Teorema di Dini si estende ai sistemi di P equazioni in P + Q variabili. Qui ci occupiamo di


P = 2 e Q = 1, cominciando dal semplice caso lineare

F (x, y, z) = ax + by + cz + d = 0
(51)
G(x, y, z) = a0 x + b0 y + c0 z + d0 = 0

34

pia

delle equazioni di due piani. Se i due piani sono paralleli, ovvero la matrice jacobiana

 

(F, G)
Fx Fy Fz
a b c
=
= 0 0 0
Gx Gy G z
a b c
(x, y, z)
ha rango 1, la loro intersezione o `e vuota o coincide con entrambi. Supponiamo che il rango sia 2,
diciamo con




(F, G)
Fy Fz
b c
= det
= det 0 0 6= 0
(52)
det
Gy G z
b c
(y, z)

pia

per fissare le idee. Le soluzioni di (51) sono allora tutti e soli i punti di una retta, e possiamo
risolvere il sistema (52) rispetto a y e z (come funzioni di x, ovviamente). Procedendo con lalgebra
lineare otteniamo y = f (x) e z = g(x) da



 

(F, G) 1 ax + d
f (x)
=
.
g(x)
a0 x + d0
(y, z)
Ma possiamo anche ricorrere alle elementari tecniche di sostituzioni successive. Dalla prima delle
equazioni (51), supponendo (non `e restrittivo) c 6= 0 ricaviamo z = (ax by d)/c; sostituendo
nella seconda equazione otteniamo
a0 x + b0 y +
da cui

c0 (ax by d)
+ d0 = 0
c





bc0
ac0
c0 d
b0
y + a0
x + d0
= 0.
c
c
c

Grazie allipotesi (52) il coefficiente di y in questa equazione `e diverso da 0, per cui possiamo
scrivere la y come funzione di x e poi, sostituendola nella precedente espressione della z, ottenere
anche questultima come funzione di x. A questo punto non abbiamo bisogno di esplicitare i calcoli
rimanenti. Quello che interessa `e vedere come le sostituzioni successive permettano di abbordare
lo studio di un pi`
u generale sistema di 2 equazioni scalari in 3 variabili

F (x, y, z) = 0
(53)
G(x, y, z) = 0
indicando con (x0 , y0 , z0 ) una sua soluzione. Abbiamo bisogno di ipotesi che consentano di operare
i seguenti passaggi:
mostrare, servendosi del Teorema 10.2, che in un opportuno intorno (tridimensionale) di
(x0 , y0 , z0 ) la prima delle (53) definisce implicitamente una funzione z = (x, y) di classe C 1 ,
con (x0 , y0 ) = z0 ;
mostrare, servendosi del Teorema 10.1, che in un opportuno intorno (bidimensionale) di
(x0 , y0 ) lequazione (x, y) = G(x, y, (x, y)) = 0 definisce implicitamente una funzione
y = f (x) di classe C 1 , con f (x0 ) = y0 .
Arrivati qui ci basta porre g(x) = (x, f (x)) per verificare che in un opportuno intorno (tridimensionale) di (x0 , y0 , z0 ) il sistema (53) definisce implicitamente due funzioni scalari
y = f (x),

35

z = g(x)

ee4.2

di classe C 1 ; derivando rispetto ad x le identit`a


F (x, f (x), g(x)) = 0,

G(x, f (x), g(x)) = 0

si ottiene il sistema di 2 equazioni



Fx (x, f (x), g(x)) + Fy (x, f (x), g(x))f 0 (x) + Fz (x, f (x), g(x))g 0 (x) = 0
Gx (x, f (x), g(x)) + Gy (x, f (x), g(x))f 0 (x) + Gz (x, f (x), g(x))g 0 (x) = 0
da cui si ricavano le derivate di f e g:
  
 0

(F, G) 1 Fx
f
=
Gx
g0
(y, z)

(54)

con largomento delle funzioni uguale a x nel primo membro ed a (x, f (x), g(x)) nel secondo.
Lipotesi che consente di effettuare i passaggi richiesti `e la trasposizione al caso generale della
(52):


(F, G)
Fy (x0 , y0 , z0 ) Fz (x0 , y0 , z0 )
det
6= 0.
(55)
(x0 , y0 , z0 ) = det
Gy (x0 , y0 , z0 ) Gz (x0 , y0 , z0 )
(y, z)

side

e4.4

Infatti la (55) implica innanzitutto che in (x0 , y0 , z0 ) una almeno delle derivate Fy , Fz sia diversa da
0, e non `e restrittivo supporre che si tratti della Fz . Dunque il Teorema 10.2 pu`o essere applicato
e fornisce lesistenza della , che inoltre sappiamo derivare, in particolare rispetto ad y:
y =

Fy
.
Fz

Calcoliamo
y = Gy + Gz y = Gy Gz

Fy
1
(F, G)
.
= det
Fz
Fz
(y, z)

Grazie di nuovo alla (55), otteniamo y (x0 , y0 ) 6= 0 e possiamo applicare il Teorema 10.1 per
ottenere lesistenza della f . Dunque:
Teorema 11.1. Siano F, G di classe C 1 in un aperto di R3 . Supponiamo che per un (x0 , y0 , z0 )
risulti F (x0 , y0 , z0 ) = G(x0 , y0 , z0 ) = 0 e che valga la (55). Allora esiste un intorno aperto
tridimensionale A di (x0 , y0 , z0 ) in cui (il determinante di (F, G)/(y, z) si mantiene 6= 0 e)
il sistema (53) definisce implicitamente due funzioni y = f (x), z = g(x) di classe C 1 , con f 0 e g 0
date dalla (54).
Con un po pi`
u di sforzo, ma con la stessa tecnica di base, il precedente teorema si generalizza
cos`:
diffeomo

Teorema 11.2. Siano F, G di classe C 1 in un aperto di R4 . Supponiamo che per un (x0 , y0 , u0 , v0 )


risulti F (x0 , y0 , u0 , v0 ) = G(x0 , y0 , u0 , v0 ) = 0 e inoltre


(F, G)
Fu (x0 , y0 , u0 , v0 ) Fv (x0 , y0 , u0 , v0 )
det
(x0 , y0 , u0 , v0 ) = det
6= 0.
Gu (x0 , y0 , u0 , v0 ) Gv (x0 , y0 , u0 , v0 )
(u, v)
Allora esiste un intorno aperto quadridimensionale A di (x0 , y0 , u0 , v0 ) in cui (il determinante
di (F, G)/(u, v) si mantiene 6= 0 e) il sistema

F (x, y, u, v) = 0
(56)
G(x, y, u, v) = 0
36

diffeomo_1

definisce implicitamente due funzioni u = f (x, y), v = g(x, y) di classe C 1 , con f e g dati da



1 

fx fy
Fu Fv
Fx Fy
=
gx gy
Gu Gv
Gx G y
con largomento delle funzioni uguale a (x, y) nel primo membro ed a (x, y, f (x, y), g(x, y)) nel
secondo.
Per illustrare unimportantissima conseguenza del Teorema 11.2 ricordiamo innanzitutto che su
un aperto B di RN un diffeomorfismo (= applicazione iniettiva B RN di classe C 1 con inversa di
classe C 1 ) deve avere matrice jacobiana invertibile su tutto B. Possiamo formulare la congettura
che, viceversa, ogni applicazione B RN di classe C 1 con matrice jacobiana invertibile su tutto B
sia un diffeomorfismo di B? In questi termini ovviamente no: gi`a per N = 1 si danno facilmente
dei controesempi quando B non `e un intervallo. Per`o `e vero che, se B `e un intervallo di R, una
funzione reale di classe C 1 con derivata sempre diversa da 0, quindi sempre positiva o sempre
negativa, `e dotata in tutto B di funzione inversa di classe C 1 . Ebbene, questo risultato globale non
si estende alle dimensioni N > 1, a prescindere dalla regolarit`a (ad esempio la convessit`a) che si
pu`o pensare di imporre a B: basta pensare alla funzione (r, ) 7 (r cos , r sin ), che ha in ogni
punto (r, ) B =]0, [R matrice jacobiana di determinante r > 0 e quindi invertibile, ma per
ogni fissato r `e periodica in e dunque non iniettiva su tutto il suo dominio B.
Il risultato generale che vale in dimensione N maggiore di 1 `e di natura locale, e per N = 2 segue
dal Teorema 11.2, di cui riprendiamo le notazioni. Infatti invertire unapplicazione : B R2 ,
di componenti x = (u, v) e y = (u, v), significa ottenere una coppia di funzioni u = (x, y),
v = (x, y) definite implicitamente dal sistema (56) con A = R2 B e F (x, y, u, v) = x (u, v),
G(x, y, u, v) = y (u, v). Ma noi abbiamo visto che vicino ad un punto (x0 , y0 , u0 , v0 ) con
x0 = (u0 , v0 ) e y0 = (u0 , v0 ) questo `e possibile se nel punto lo jacobiano di , cio`e il determinante
della matrice jacobiana (F, G)/(u, v), `e diverso da 0. Abbiamo cos` dimostrato per N = 2 un
risultato, che enunciamo senza dimostrarlo in tale generalit`a, per N qualunque:
diffeomo

Teorema 11.3. Siano dati un aperto B di RN ed una funzione : B RN di classe C 1 con


jacobiano diverso da 0 in un punto di B. Allora B contiene un intorno aperto del punto su cui la
restrizione di `e un diffeomorfismo.
Vale la pena di insistere: se il determinante jacobiano di `e diverso da 0 in tutto B possiamo
concludere che vicino ad ogni punto di U la restrizione di `e un diffeomorfismo, non che `e un
diffeomorfismo di tutto B!
Il Teorema 11.3 per N = 2 consente di mostrare che, intorno ad ogni suo punto, il sostegno di
una superficie regolare coincide col grafico di una funzione C 1 di due variabili. Per dimostrarlo,
prendiamo unapplicazione B 3 (u, v) 7 ((u, v), (u, v), (u, v)), B aperto di R2 , di classe C 1
con (u , u , u ) (v , v , v ) 6= (0, 0, 0) in B. Sia (u0 , v0 ) un punto di B dove, ad esempio,
u v v u 6= 0. Allora B contiene un intorno aperto V di (u0 , v0 ) su cui lapplicazione : x =
(u, v), y = (u, v) `e dotata di inversa 1 : u = (x, y), v = (x, y) di classe C 1 nellintorno (V )
di (x0 , y0 ) = ((u0 , v0 ), (u0 , v0 )). Ne segue che il sostegno della porzione di superficie V 3 (u, v) 7
((u, v), (u, v), (u, v)) coincide col grafico della funzione (V ) 3 (x, y) 7 ((x, y), (x, y)).
A questo punto `e opportuno fare un sommario riepilogo delle nostre conoscenze sulle curve in
R2 e le superfici in R3 .
Sia C R2 . Allora `e equivalente richiedere che, vicino ad un suo punto, C sia il grafico di
una funzione C 1 di una variabile o il sostegno di una curva regolare o linsieme di livello di una
funzione C 1 di 2 variabili con gradiente 6= (0, 0) nel punto.
37

Sia S R3 . Allora `e equivalente richiedere che, vicino ad un suo punto, S sia il grafico di
una funzione C 1 di 2 variabili o il sostegno di una superficie regolare o linsieme di livello di una
funzione C 1 di 3 variabili con gradiente 6= (0, 0, 0) nel punto.

12

Massimi e minimi vincolati

Quando A `e un aperto di R2 la ricerca dei punti iin cui una f C 1 (A) pu`
o assumere valori estremi
cio`e massimi o minimi locali va ristretta innanzitutto ai punti stazionari, in cui il gradiente
f `e nullo.11
E se si `e interessati agli estremi di f non in tutto A, bens` in un suo sottoinsieme chiuso E
(ad esempio sotto lulteriore ipotesi che E sia limitato, per cui ogni funzione in C 0 (E) `e senzaltro
dotata di massimo e minimo assoluti grazie al teorema di Weierstrass)? Il procedimento appena
visto in A rimane valido nellinterno (se non `e vuoto) di E, ma diventa inapplicabile sulla sua
frontiera. L` bisogna, quando `e possibile, ricorrere alle altre tecniche che costituiscono largomento
di questa sezione.
Indichiamo dunque con S una curva contenuta in A (quale potrebbe ad esempio essere una
porzione della frontiera dellinsieme E di cui si `e precedentemente parlato). Con lutilizzo del
termine tra virgolette intendiamo dire che i punti (x, y) S costituiscono:
(i) o limmagine di un intervallo I in una rappresentazione parametrica t 7 ((t), (t)) di classe
1
C con 0 (t)2 + 0 (t)2 > 0,
(ii) o il grafico di una funzione y = (x) oppure x = (y) di classe C 1 in un intervallo I,
(iii) o un sottoinsieme S dellinsieme di livello F (x, y) = 0 di una F C 1 (A) con F 6= 0 in S.
Nei casi (i) e (ii) la ricerca degli estremanti di una f C 1 (A) sul vincolo S si restringe alla
ricerca dei punti stazionari di funzioni di una variabile. Come `e facile vedere, infatti, richiedere
che un punto (x, y) S sia, per fissare le idee, un massimo locale di f |S , cio`e che tutti i punti di
S (non di A!) distanti da (x, y) meno di un opportuno > 0 soddisfino f (x, y) f (x, y), significa
richiedere:
o (caso (i)) che t I con ((t), (t)) = (x, y) sia un massimo locale di g(t) = f ((t), (t)), e
quindi
g 0 (t) = fx (x, y)0 (t) + fy (x, y) 0 (t) = 0
se t `e interno ad I;
o (primo sottocaso di (ii)) che x I con (x) = y sia un massimo locale di g(x) = f (x, (x)),
e quindi
(57)
g 0 (x) = fx (x, y) + fy (x, y) 0 (x) = 0
se x `e interno ad I;
11

Ricordiamo che se f C 2 (A) la ricerca va ulteriormente ristretta, escludendo quei punti stazionari in cui la
matrice hessiana


fxx fxy
fxy fyy
non `e semidefinita, ovvero siccome siamo in R2 ha determinante < 0; un punto stazionario in cui invece
lhessiana ha determinante > 0 `e di minimo locale o di massimo locale a seconda che in esso la fxx sia > 0 o < 0.

38

lag1

o (secondo sottocaso di (ii)) che y I con (y) = x sia un massimo locale di g(y) = f ((y), y),
e quindi
g 0 (y) = fx (x, y)0 (y) + fy (x, y) = 0
(58)
se y `e interno ad I.
Esempio 12.1. In A = R2 la regolarissima funzione f (x, y) = x + y 2 `e priva di punti stazionari
perche fx non si annulla mai. Dunque non esistono punti di estremo relativo di f in A. Per`
o la
restrizione f |E di f ad un qualunque sottoinsieme chiuso e limitato E del piano `e dotata di massimo
e minimo assoluti. Prendiamo
E = {(x, y) R2 | y x y, x2 + y 2 1}.
Per quello che abbiamo appena visto, gli estremi di f |E non possono cadere allinterno di E.
Scriviamo la frontiera di E come unione dei tre insiemi
S1 = {(x, y) E | x2 + y 2 = 1},

S2 = {(x, y) E | y = x},

S3 = {(x, y) E | y = x}.

S1 `e immagine dellintervallo [/4, 3/4] nella rappresentazione parametrica 7 (cos , sin ).


Per trovare gli estremi di 7 f (cos , sin ) = cos + sin2 nellintervallo cerchiamo innanzitutto
i suoi punti stazionari in ]/4, 3/4[: devessere d(cos + sin2 )/d = sin + 2 sin cos = 0,
cio`e cos = 1/2, e tra i valori di per i quali questo vale c`e /3 ]/4, 3/4[. Calcoliamo:

2
cos /3 + sin2 /3 = 1/2
+
3/4
=
5/4.
Negli
estremi:
cos(/4)
+
sin
(/4)
=
(
2 + 1)/2,

cos /4 + sin2 /4 = ( 2 + 1)/2. Dunque il minimo e il massimo della restrizione di f alchiuso e


limitato
S1 sono rispettivamente il pi`
u piccolo e il pi`
u grande dei tre valori ottenuti, cio`e ( 2+1)/2

e ( 2 + 1)/2.

2
Possiamo anche vedere S1 come grafico di y = 1
x per x [1/ 2,21/ 2]. Allinterno
di questo intervallo cerchiamo i punti stazionari di f (x, 1 x2p
) = x + 1 x : si deve annullare
d(x + 1
x2 )/dx = 1 2x, dal
che x = 1/2, e l`abbiamo f (1/2, 1 1/4) = 1/2 +
1 1/4 = 5/4.
2
+
1

1/2
=
1/
2
+
1/2
=
(
2
+
1)/2
allestremo
sinistro,
1/
2 + 1 1/2 =
Poi:
1/

1/ 2 + 1/2 = ( 2 + 1)/2 allestremo destro.

S2 `e il grafico di y = x per x [1/ 2, 0]; allinterno di questo intervallo non cadono punti
stazionari di f (x, x) = x + x2 , perch`e d(x + x2 )/dx = 1+ 2x si annulla per x = 1/2.
Allestremo sinistro la restrizione di f assume il valore minimo ( 2 + 1)/2 e allestremo destro il
massimo 0.

S3 `e il grafico di y = x per x [0, 1/ 2]; allinterno di questo intervallo non cadono punti
stazionari di f (x, x) = x + x2 , perch`e d(x + x2 )/dx = 1 + 2x si annulla per x = 1/2.Allestremo
sinistro la restrizione di f assume il valore minimo 0 e allestremo destro ilmassimo (
2 + 1)/2.
Conclusione: il minimo e il massimo di f in E sono rispettivamente ( 2 + 1)/2 e ( 2 + 1)/2.

Passiamo a (iii). Siccome le derivate Fx e Fy non si annullano mai contemporaneamente in S,
per il Teorema di Dini ogni punto (x0 , y0 ) di S ha un intorno U (in generale di ampiezza non nota)
la cui intersezione con S `e grafico di una funzione (in generale non nota) x = (y) o y = (x).
Siamo formalmente nella situazione (ii), nel senso che in S U vanno cercati i punti (x, y) in cui
vale la (57) o la (58): per`
o, oltre alle coordinate x e y che stiamo per lappunto cercando, nella
prima `e ignota anche la funzione 0 e nella seconda la 0 ! Per aggirare questo ostacolo ricorriamo
allespressione delle derivate delle funzioni implicite:
0 (x) =

Fx (x, y)
,
Fy (x, y)

0 (x) =
39

Fy (x, y)
.
Fx (x, y)

lag2

Le (57) e (58) diventano cos` rispettivamente


fx (x, y) fy (x, y)

Fx (x, y)
= 0,
Fy (x, y)

fx (x, y)

Fy (x, y)
fy (x, y) = 0
Fx (x, y)

a seconda che nel punto (ignoto!) risulti Fy (x, y) 6= 0 o Fx (x, y) 6= 0, e quindi comunque
fx (x, y)Fy (x, y) fy (x, y)Fx (x, y) = 0.
Questa `e unequazione algebrica nelle sole incognite x e y che ci interessano, e richiede che il determinante jacobiano di f e F in (x, y) si annulli, dunque abbia tanto le righe che le colonne linearmente
dipendenti. Imponiamo la dipendenza lineare delle colonne, che sono f (x, y) e F (x, y). Siccome
abbiamo supposto che il secondo di questi vettori non `e nullo, deve esistere un moltiplicatore di
Lagrange R, che non interessa calcolare, tale che
f (x, y) + F (x, y) = (0, 0).
Riassumiamo:
Teorema 12.1. Siano A un aperto di R2 e f, F C 1 (A). Se in un sottoinsieme S dellinsieme di
livello F = 0 il gradiente di F non `e mai nullo, gli eventuali punti di minimo e di massimo locali
per la restrizione f |S di f ad S vanno cercati tra le soluzioni (x, y) S del sistema

F (x, y) = 0
fx (x, y) + Fx (x, y) = 0

fy (x, y) + Fy (x, y) = 0
per unopportuna costante .
Esempio 12.2. Cerchiamo il minimo e massimo assoluti di f (x, y) = xy nellinsieme E dei punti
(x, y) R2 con x2 xy + y 2 1, che `e chiuso e limitato dal momento che `e costituito dai punti
che cadono su un ellisse o al suo interno. Siccome in tutto A = R2 lunico punto stazionario di f `e
lorigine, e si vede subito che si tratta di un punto di sella, resta solo da applicare i moltiplicatori
sulla frontiera S di E, che `e tutto linsieme di livello F (x, y) = x2 xy + y 2 1 = 0. Imponiamo
y + 2x y = 0,

x + 2y x = 0,

x2 xy + y 2 = 1.

Sommando le prime due equazioni otteniamo (1 + )(x + y) = 0, e quindi:


o = 1, per cui x = y e la terza equazione d`a i due
punti (1,1), (1, 1)
dove
f vale 1;
oppure x = y e la terza equazione d`a i due punti (1/ 3, 1/ 3), (1/ 3, 1/ 3) dove f vale
1/3.
Da qui segue che il massimo `e 1, il minimo `e 1/3.

Passiamo senza difficolt`
a a 3 dimensioni:
Teorema 12.2. Siano A un aperto di R3 e f, F C 1 (A). Se in un sottoinsieme S dellinsieme di
livello F = 0 il gradiente di F non `e mai nullo, gli eventuali punti di minimo e di massimo locali
per la restrizione f |S di f ad S vanno cercati tra le soluzioni (x, y, z) S del sistema

F (x, y, z) = 0

fx (x, y, z) + Fx (x, y, z) = 0
(59)
f (x, y, z) + Fy (x, y, z) = 0

y
fz (x, y, z) + Fz (x, y, z) = 0
per unopportuna costante .
40

**

Esempio 12.3. Siano f (x, y, z) = xyz, F (x, y, z) = xy + yz + zx 1 e


S = {(x, y, z) R3 | x 0, y 0, z 0, F (x, y, z) = 0}.
La restrizione di f ad S `e sempre 0 ed in certi punti di S (ad esempio quelli con z = 0 e
xy = 1) vale 0. Dunque questo `e il suo minimo assoluto. Daltra parte, nei punti di S con z > 0
si ha 0 x 1/z, 0 y 1/z e quindi 0 xyz 1/z. Ne segue che f (x, y, z) 0 quando
(x, y, z) S, x2 + y 2 + z 2 (come si vede cominciando dalle semirette contenute in S con
punto iniziale nellorigine). Dunque, benche il Teorema di Weierstrass non si applichi allinsieme
illimitato S, la f |S `e dotata anche di massimo assoluto. Cerchiamolo coi moltiplicatori. Il sistema
(59) `e adesso

xy + yz + zx = 1

yz + (y + z) = 0
xz + (x + z) = 0

xy + (x + y) = 0.
Dalle ultime 3 equazioni ricaviamo

xyz + x(y + z) = 0
xyz + y(x + z) = 0 .

xyz + z(x + y) = 0
Dunque
x(y + z) = y(x + z)= z(x

+ y),ovvero xy= yz = xz, ovvero ancora x = y = z =


1/ 3, e infine max f |S = f (1/ 3, 1/ 3, 1/ 3) = 1/(3 3). (Questo esempio `e preso da E.Giusti,
Esercizi e complementi di Analisi Matematica, Volume secondo, Bollati Boringhieri 1992, dove se
ne traggono interessanti e profonde conseguenze geometriche.)

Passando a vincoli sotto forma di sistema si ha il seguente risultato:
Teorema 12.3. Siano A un aperto di R3 e f, F, G C 1 (A). Se in un sottoinsieme S dellintersezione degli insiemi di livello F = 0 e G = 0 la matrice jacobiana di F e G ha sempre rango
massimo 2, gli eventuali punti di massimo e minimo locali per la restrizione f |S di f ad S vanno
cercati tra le soluzioni (x, y, z) S del sistema

F (x, y, z) = 0

fx (x, y, z) + Fx (x, y, z) + Gx (x, y, z) = 0


f (x, y, z) + Fy (x, y, z) + Gy (x, y, z) = 0

y
fz (x, y, z) + Fz (x, y, z) + Gz (x, y, z) = 0
per opportune costanti , .

13

Un primo rapido approccio agli integrali doppi

In questa sezione e nelle prossime cinque, quando parleremo di un rettangolo S sottintenderemo:


compatto, salvo esplicita indicazione in altro senso; con S indicheremo linsieme dei punti interni,
ovvero linterno, di S, e con A(S) la sua area (base per altezza) .
41

Sia R il rettangolo [a, b] [c, d]. Una partizione di R `e una famiglia = {(xh , yk ) | x0 =
a < x1 < < xm = b, y0 = c < y1 < < yn = b} (dove m ed n dipendono da ). In
maniera equivalente si pu`
o individuare anche assegnando la famiglia F() dei sottorettangoli
di R `e un raffinamento della
Shk = [xh1 , xh ] [yk1 , yk ] associati a . Unaltra partizione
se la contiene.
Si tratta di nozioni che quasi banalmente trasferiscono alla dimensione 2 quelle utilizzate nel caso
unidimensionale per lo studio dellintegrale di Riemann in una variabile, e noi qui ce ne serviamo
appunto per i primi passi nellintegrazione di Riemann in due variabili. Fissiamo dunque una
funzione limitata f definita sul rettangolo. Con la notazione A(S) per larea (base per altezza) di
un qualunque rettangolo S, definiamo le somme integrali superiore e inferiore di f associate
ad una partizione di R come, rispettivamente, i numeri
!
X
sup f A(Shk )
h,k

hk

o pi`
u concisamente

X 
sup f A(S)
S

SF ()

!
X
h,k

inf f

A(Shk )

hk

o pi`
u concisamente

X 
inf f A(S).
SF ()

P
P
(Qui, come nel seguito, h,k sta per h=1,...,m, k=1,...,n .)
Per ogni scelta di risulta banalmente


X 
X 
sup f A(S)
inf f A(S).
SF ()

SF ()

di R `e un raffinamento di , risulta
Daltra parte `e facile vedere che, se






X
X
X 
X 
sup f A(S)
sup f A(T )
inf f A(T )
inf f A(S).
SF ()

T F ()

T F ()

SF ()

si ottiene aggiungendo a i punti (x0 , yk ), k = 1, . . . , n, con x0 < x0 < x1 ,


Infatti se, ad esempio,
1
1
risulta
!
sup

(x1 x0 )(yk yk1 )

]x0 ,x1 []yk1 ,yk [

sup
]x0 ,x01 []yk1 ,yk [

!
(x01

x0 )(yk yk1 ) +

sup
]x01 ,x1 []yk1 ,yk [

(x1 x01 )(yk yk1 )

e cos` via. Per ogni scelta delle partizioni e 0 si ottiene dunque, passando se necessario al loro
raffinamento comune 0 ,


X 
X 
sup f A(S)
inf f A(T ).
SF ()

T F (0 )

42

Se per ogni > 0 si possono trovare e 0 in modo tale che




X 
X 
inf f A(T ) <
sup f A(S)
S

SF ()

T F (0 )

(60)

(61)

e di conseguenza
inf



X 
X 
inf f A(S)
sup f A(S) = sup
SF ()

SF ()

diciamo che f `e integrabile (secondo Riemann) in R e chiamiamo integrale (doppio di


Riemann) di f in R il valore (61), denotato con
ZZ
Z
Z
f (x, y) dxdy oppure
f (x, y) dxdy oppure
f dxdy.
R

Ecco un classico esempio di funzione limitata non integrabile secondo Riemann.


e1

Esempio 13.1. Indichiamo con f la funzione di Dirichlet 1(Q[0,1])2 . Siccome




X 
X 
sup f A(S) = 1,
inf f A(S) = 0
S

SF ()

SF ()

quale che sia la partizione di R = [0, 1]2 , la (60) con 0 < < 1 non `e soddisfatta.

Invece:
excontR

Lemma 13.1. Ogni f C 0 (R) `e integrabile in R, e il suo integrale doppio soddisfa


Z
Z b Z d
Z d Z b
f (x, y) dxdy =
dx
f (x, y) dy =
dy
f (x, y) dx.
R

(62)

DIM. Dato arbitrariamente un > 0, sia = > 0 tale che per ogni coppia di punti (x0 , y 0 ), (x00 , y 00 )
di R distanti meno di risulti |f (x0 , y 0 ) f (x00 , y 00 )| < (uniforme continuit`a di f nel compatto R).
Chiamiamo una partizione di R tale che ogni sottorettangolo S F() abbia diametro minore
di . Risulta


X 
X 
sup f inf f A(S) =
max f min f A(S) < A(R)
SF ()

SF ()

e questo mostra lintegrabilit`


a di f .
Poniamo

Z
F (x) =

f (x, y)dy.
c

Su [a, b] la funzione x 7 F (x) `e continua (cfr. il Teorema 7.1), dunque integrabile. Fissiamo
arbitrariamente una partizione di R, il che `e come dire una partizione x0 = a < x1 < < xm = b
di [a, b] ed una partizione y0 = c < y1 < < yn = d di [c, d]. Grazie alladditivit`a degli integrali
di una variabile rispetto agli intervalli di integrazione valgono le identit`a
Z b
m Z xh
n Z yk
X
X
F (x) dx =
F (x) dx e F (x) =
f (x, y) dy,
a

h=1 xh1

k=1

43

yk1

fub1

per cui
Z b Z


f (x, y) dy

dx =

m Z
X

n Z
X

xh

h=1 xh1

XZ
h,k

xh

k=1

yk

f (x, y) dy

dx

yk1

yk

f (x, y) dy

dx :

yk1

xh1

abbiamo potuto portare la sommatoria su k fuori dallintegrale in dx grazie alla linearit`


a di
questultimo. Daltra parte, applicando la positivit`a degli integrali in dy ed in dx otteniamo
facilmente
!


Z xh Z yk
f (x, y) dy dx
inf
f (xh xh1 )(yk yk1 )
]xh1 ,xh []yk1 ,yk [

xh1

yk1

sup

(xh xh1 )(yk yk1 )

]xh1 ,xh []yk1 ,yk [

e quindi anche, sommando su h e k,


!
Z b Z
X
inf
f A(Shk )

h,k

hk


f (x, y) dy

dx

X
h,k

sup f
S

A(Shk ).

hk

Siccome f `e integrabile su R, il suo integrale `e lunico numero reale che soddisfa le stesse
disuguaglianze del secondo membro qui sopra al variare di , per cui vale lidentit`a

Z
Z b Z d
f (x, y) dx dy =
f (x, y) dy dx
R

e quindi la prima delle (62). La seconda si dimostra in modo del tutto analogo.

Le (62) forniscono le formule di riduzione dellintegrale doppio di f .

14

Misurabilit`
a secondo PeanoJordan e domini normali

Il Lemma 13.1 costituisce la diretta estensione a 2 dimensioni del teorema unidimensionale di


integrazione delle funzioni continue sugli intervalli compatti: estensione certo non banale, perche la
formula di riduzione banale non `e, e tuttavia molto restrittiva. Ai fini pratici, infatti, gli intervalli
compatti costituiscono una classe abbastanza ampia di sottoinsiemi limitati della retta, mentre
come sottoinsiemi limitati del piano i rettangoli sono di tipo estremamente particolare. Nasce
quindi la necessit`
a di considerare funzioni definite in sottoinsiemi limitati del piano di tipo pi`
u
generale, salvo poi estenderle a zero fuori di essi per poter studiare lintegrabilit`a delle funzioni cos`
estese in rettangoli sufficientemente grandi.

44

Cominciamo con alcune nozioni che riguardano la funzione caratteristica di un generico limitato
E R2 . Fissato un rettangolo R E, se 1E `e integrabile su R secondo Riemann diciamo che E `e
misurabile secondo PeanoJordan o pi`
u brevemente PJ misurabile (in R2 ), e chiamiamo
Z
1E dxdy
A(E) =
R

la sua misura (bidimensionale), o area, di PeanoJordan. (Si noti che queste nozioni sono
indipendenti dalla scelta del particolare rettangolo R E.)
Richiedere che E sia PJmisurabile equivale dunque a richiedere che, dato comunque > 0,
risulti

X 
sup 1E inf 1E A(S) <
SF ()

A(S)

ovvero
X
SF ()
S E6=

A(S) <

SF ()
S E

per un opportuno R E (e quindi per ogni R0 R) e per unopportuna partizione (e quindi


ovvero ancora
per ogni suo raffinamento ),
X
X
inf
A(S) = sup
A(S).

SF ()
S E6=

SF ()
S E

In particolare, F R2 `e trascurabile secondo PeanoJordan o pi`


u brevemente PJtrascurabile
2
(in R ) se `e PJmisurabile con A(F ) = 0. Ci`o equivale a richiedere che, preso comunque > 0,
risulti

X 
sup 1F <
SF ()

ovvero
X

A(S) <

(63)

SF ()
S F 6=

per un opportuno R F (e quindi per ogni R0 R) e per unopportuna partizione (e quindi


ovvero ancora
per ogni suo raffinamento ),
X
A(S) = 0 :
(64)
inf

SF ()
S F 6=

va infatti esclusa leventualit`


a che per qualche partizione e per qualche S1 F() possa aversi
inf S1 1F = 1, perche ci`
o implicherebbe
Z
0 = A(F ) =
1F dxdy A(S1 ) > 0.
R

r1

Osservazione 14.1. Utilizzando la (63) si vede subito che lunione di un numero finito di insiemi
PJtrascurabili `e anchessa PJtrascurabile.

45

T1

Teorema 14.1. Un sottoinsieme limitato E di R2 `e PJmisurabile se e solo se la sua frontiera E


`e PJtrascurabile.
DIM. Se `e una partizione di un R E risulta


X 
X 
sup 1E A(S).
sup 1E inf 1E A(S) =
S

SF ()

SF ()

(65)

Infatti per ogni S F() si verifica uno ed uno solo dei seguenti tre casi:
S E,

S E = S E = ,

S E 6= = S E 6=

dal momento che S `e aperto. Ora,


sup 1E = inf 1E = 1, sup 1E = 0
S

sup 1E = inf 1E = sup 1E = 0


S

per S E = S E = ,

sup 1E = sup 1E = 1, inf 1E = 0


S

per S E,

per S E 6= = S E 6= .

Dunque `e equivalente richiedere che per ogni > 0 si possano trovare R e tali che risulti < il
primo membro della (65) (PJmisurabilit`a di E) oppure il secondo (PJtrascurabilit`a di E).

r2

Osservazione 14.2. Grazie al precedente teorema ed allOsservazione 14.1 si constata subito che
lunione e lintersezione di un numero finito di insiemi PJmisurabile sono PJmisurabili.

Osservazione 14.3. La frontiera di ([0, 1]Q)2 `e tutto il quadrato [0.1]2 , che non `e PJtrascurabile
perche la sua misura esterna di PeanoJordan `e la sua area e quindi vale 1. Questo significa che,
se si vorr`a estendere al di l`
a della teoria di PeanoJordan la classe dei sottoinsiemi misurabili di
R2 in modo da farci rientrare anche ([0, 1] Q)2 , non si potr`a immaginare di estendere anche la
caratterizzazione fornita dal Teorema 14.1.


exgraf

Lemma 14.1. Se : [a, b] R `e continua, il suo grafico E `e PJtrascurabile.


DIM. Sia R un rettangolo contenente E. Siccome `e integrabile da a a b, ad > 0 si possono
associare x0 = a < x1 < < xm = b con la propriet`a
m 
X
k=1


max min (xk xk1 ) <

[xk1 ,xk ]

[xk1 ,xk ]

.
A(R)

Ma gli addendi della somma qui sopra sono le aree A(Qk ) dei rettangoli


Qk = [xk1 , xk ]
min , max ,
[xk1 ,xk ]

46

[xk1 ,xk ]

P
la cui unione ricopre E e verifica k A(Qk ) < . A questo punto si trova una partizione di R
tale che ogni Qk sia unione di sottorettangoli di F(). Siccome la somma delle aree A(S) degli
S F() contenuti in Qk `e uguale a A(Qk ), risulta


X
X
X 
X 
A(S) =
A(Qk ) < . (66)
max 1E A(S)
sup 1E inf 1E A(S)
SF ()

SF ()

SF ()
Sk Qk

tr

Dunque (cfr. la (63)) E `e PJtrascurabile.



Dimostriamo il
T6.3

Teorema 14.2. Sia data una funzione f continua e limitata su un insieme PJmisurabile E.
Allora il suo prolungamento f di f a zero fuori di E `e integrabile secondo Riemann su un qualunque
rettangolo R E.
DIM. Dimostriamo il teorema sotto lipotesi aggiuntiva che f sia uniformemente continua (come`e
il caso, ad esempio, se E `e chiuso). Ci`
o significa che, fissato un > 0, esiste un = > 0 tale che
per ogni coppia di punti (x0 , y 0 ), (x00 , y 00 ) E distanti meno di risulti |f (x0 , y 0 ) f (x00 , y 00 )| < .
Sia R un rettangolo E. Grazie alla PJtrascurabilit`a di E, esiste una partizione di R tale
che

X 
X
sup 1E =
A(S) < ,
(67)
SF ()

SF ()
S E6=

e si pu`o sempre fare in modo (eventualmente passando ad un opportuno raffinamento) che i diametri
di tutti gli S F() siano minori del che abbiamo associato ad per luniforme continuit`
a di
f . Siccome su tutti gli S che non intersecano E la f o `e uguale alla f o `e identicamente nulla, e
quindi verifica comunque
sup f inf f < ,
S

otteniamo

X 

sup f inf f A(S) =


SF ()

sup f inf f A(S) +

SF ()
S E6=

< 2 max |f |
E

A(S) +

SF ()
S E6=

X
SF ()
S E=




sup f inf f A(S)


S



A(S) < 2 max |f | + A(R) ,

X
SF ()
S E=

per cui f `e integrabile in R.



Nelle ipotesi del precedente teorema si pone
Z
Z
f dxdy =
f dxdy.
E

47

E_0

Siano adesso date due funzioni continue , su un intervallo compatto [a, b] di R con la propriet`
a
in [a, b].
Linsieme
D = {(x, y) R2 | a x b, (x) y (x)}

(68)

(69)

`e un dominio normale rispetto allasse x, linsieme


D] = {(x, y) R2 | a y b , (y) x (y)}

un dominio normale rispetto allasse y. Entrambi questi domini sono chiusi, limitati e PJ
misurabili, dal momento che le loro frontiere sono unioni di grafici di funzioni continue e (addirittura) segmenti verticali o orizzontali. Ebbene:
exnorm

Teorema 14.3. Sia data una f continua sul dominio normale D. Allora la funzione f uguale ad
f in D ed a 0 fuori `e integrabile su R; il suo integrale doppio
ZZ
Z
Z
f (x, y) dxdy oppure
f (x, y) dxdy oppure
f dxdy
D

soddisfa
Z

Z
f (x, y) dx dy =

(x)

Z
dx

f (x, y) dy.

(70)

(x)

DIM. Lintegrabilit`
a di f segue dalla dimostrazione del Teorema (14.2) che abbiamo dato per f
uniformemente continua. La (70) si dimostra quasi punto per punto come la prima della (62)
scrivendo f al posto di f . Le sole differenze di cui va tenuto conto sono che qui la funzione
y 7 f(x, y),

x [a, b],

uguale a f (x, y) per (x) y (x) ed a 0 altrove, `e integrabile da c a d perche `e continua su


tutto lintervallo tranne, eventualmente, i punti (x) e (x)), e che su [a, b] la funzione
d

Z
F (x) =

f(x, y)dy =

(x)

f (x, y) dy.

(x)

`e continua per il Teorema 7.3.



Il precedente teorema vale con D] al posto di D, tranne per la (70) che va sostituita dalla
Z

f (x, y) dx dy =
D]

exarea

(y)

dy
a

f (x, y) dx.
(y)

Osservazione 14.4. Sia dato un dominio normale D come in (68). Dal Teorema 14.3 con f = 1D
segue che D `e PJmisurabile (conseguenza anche del Lemma 14.1!), e che la sua area vale
Z

Z
(x) dx

(x) dx.
a

48

In questa formula rientrano banalmente le aree misurate dalla geometria elementare nel caso dei
rettangoli, inizialmente con i lati paralleli agli assi coordinati, e dei triangoli rettangoli, inizialmente coi cateti paralleli agli assi coordinati, ma poi anche nel caso di arbitrari triangoli e di
parallelogrammi in quanto domini normali rispetto ad entrambi gli assi.
Consideriamo il caso di (x) identicamente nulla. D `e allora il sottografico della funzione continua e non negativa (x), e lintegrale di questultima da a a b ha legittimamente quel significato di
area che gli viene intuitivamente attribuito nelle considerazioni introduttive sullaspetto geometrico
dellintegrabilit`
a in una variabile.
Passiamo allaspetto geometrico della condizione di integrabilit`a fornita dal Teorema 14.3 per
una generica funzione continua e non negativa f (x, y). Le sue somme integrali inferiori sono somme
di volumi (elementari!) A(S)(minS f ) di parallelepipedi contenuti nel sottografico e privi di punti
interni comuni (siccome f 0, in ogni S F() non contenuto in D il minimo della f `e 0), mentre
quelle superiori sono somme A(S) (maxS f) di volumi di parallelepipedi la cui unione contiene il
sottografico di f . Ne segue che una buona definizione di volume del sottografico di f `e: lunico
elemento di separazione tra somme integrali superiori e inferiori, ovvero lintegrale della funzione.
Per avere poi una pi`
u generale teoria della misura tridimensionale di solidi limitati bisogna passare
alla teoria dellintegrale in tre variabili.


15

Integrale delle funzioni a scala, integrale superiore e integrale


inferiore

A questo punto riprendiamo dallinizio lo studio dellintegrazione di Riemann in R2 , procedendo


per`o in maniera pi`
u sistematica.
Una funzione limitata R2 R a supporto compatto, dunque nulla al di fuori di un rettangolo
=]x
R, `e una funzione a scala se assume valori costanti negli interni Shk
h1 , xh []yk1 , yk [ dei
sottorettangoli Shk associati a qualche partizione di R; `e degenere se assume valori non nulli
solo su segmenti limitati verticali o orizzontali. Dunque una generica funzione a scala si scrive sotto
la forma
X
(71)
(x, y) =
hk 1S (x, y) + 0 (x, y)
hk

h,k

con hk R e 0 degenere. In tale definizione pu`o essere sostituito da un suo qualunque


se, ad esempio,
si ottiene aggiungendo a i punti (x0 , yk ), k = 1, . . . , n,
raffinamento :
1
con x0 < x01 < x1 , risulta = 1k sia nei sottorettangoli aperti ]x0 , x01 []yk1 , yk [ che negli
]x01 , x1 []yk1 , yk [. Inoltre R pu`
o essere sostituito da un qualunque rettangolo che lo contenga.
Rientrano banalmente nella definizione i casi di funzioni a scala degeneri, cio`e nulle al di fuori
di un rettangolo degenere.
Sia unaltra funzione a scala, nulla al di fuori di un rettangolo R0 e costante negli interni
dei sottorettangoli associati ad unopportuna partizione 0 di R0 . Per quello che abbiamo visto,
possiamo sempre ricondurci a R0 = R (passando se necessario a un terzo rettangolo contenente
R R0 ) e, una volta fatto questo, a 0 = (passando se necessario al raffinamento comune 0 ).
, diciamo
Dunque anche assume un valore costante in ciascun Shk
X
(x, y) =
hk 1S (x, y) + 0 (x, y)
(72)
hk

h,k

49

con 0 degenere. A questo punto si vede subito che la combinazione lineare a + b con a, b R `e
.
ancora una funzione a scala, che vale ahk + bhk in Shk
Definiamo integrale (elementare) della data in (71) il numero
Z
X
=
hk A(Shk ) .
h,k

In questa definizione la partizione pu`o essere sostituita da un suo qualunque raffinamento


senza che venga alterato il valore del secondo membro: per convincersene basta tornare allesempio
dato un attimo fa ed osservare che
di
1k (x1 x0 )(yk yk1 ) = 1k (x01 x0 )(yk yk1 ) + 1k (x1 x01 )(yk yk1 ) .
Lintegrale elementare gode di tutte le propriet`a che ci si aspetta da un buon integrale. Infatti
si vede subito, servendosi delle espressioni (71) e (72) di e , che `e positivo:
Z
Z
per
dal momento che la condizione si traduce nelle condizioni hk hk e quindi
X
X
hk A(Shk )
hk A(Shk ) .
h,k

Inoltre `e lineare:

h,k

Z
(a + b) = a

Z
per a, b R

+b

dal momento che


X

(ahk + bhk )A(Shk ) = a

h,k

Infine,

hk A(Shk ) + b

h,k

hk A(Shk ) .

h,k

= 0 se `e degenere.

Introduciamo la notazione f Lc col seguente significato: f `e una funzione R2 R limitata


ed a supporto compatto, dunque nulla al di fuori di un rettangolo R. La famiglia Sf+ delle funzioni
semplici tali che f non `e vuota, e la quantit`a
Z

Z


+
f = inf
Sf
`e detta integrale superiore di Riemann della f . Notiamo che una funzione di Sf+ come la (71)
, quindi
dovendo soddisfare f in Shk
supS f per h = 1, . . . , m e k = 1, . . . , n
hk
hk
verifica anche
!
X
X
(73)
hk A(Shk )
sup f A(Shk ).
h,k

h,k

hk

Siccome f (x, y) si scrive


X

f (x, y)1S (x, y) + f (x, y)1E (x, y)


hk

h,k

50

con E = hk Shk (unione di segmenti verticali e orizzontali), il secondo membro della (73) `e
lintegrale elementare della funzione semplice
!


X
sup f 1S (x, y) + sup f 1E (x, y)
(x, y) =
h,k

hk

hk

(e dunque rimane inalterato se `e sostituita da un suo raffinamento o R da un rettangolo che lo


contiene). Ma sta a sua volta in Sf+ , e da qui si arriva a
!

Z
f = inf

sup f
S

h,k

A(Shk )

hk

o pi`
u concisamente
Z
f = inf

X 


sup f

A(S).

SF ()

Si constata subito che sulle funzioni di Lc lintegrale superiore `e positivo


Z
Z
f g per f g
(dal momento che f g = Sf+ Sg+ ), nonche subadditivo
Z

Z
(f + g)

Z
f+

(74)

(dal momento che la somma di un elemento di Sf+ ed uno di Sg+ sta in Sf++g e lintegrale elementare
delle funzioni a scala `e lineare) e positivamente omogeneo
Z

Z
(af ) = a f per a [0, [.

(75)

Il prossimo esempio mostra che lintegrale superiore non ha, sulla totalit`
a delle funzioni di Lc ,
la propriet`a di linearit`
a: pur essendo subadditivo non `e additivo, e pur essendo positivamente
omogeneo non `e omogeneo.
e1

Esempio 15.1. Come nellEsempio 13.1, indichiamo con f la funzione di Dirichlet 1(Q[0,1])2 .
Siccome


X 
X 
sup(f ) A(S) = 0
sup f A(S) = 1,
SF ()

SF ()

quale che sia la partizione di R = [0, 1]2 , e quindi


Z

Z
f+

(f ) = 1 ,

con la presente scelta di f non valgono ne il segno uguale nella disuguaglianza debole della (74)
quando g = f , ne lidentit`
a della (75) quando a = 1.

51

Lintegrale inferiore di Riemann di una funzione f Lc `e la quantit`a


Z
Z
f = (f )
per cui
Z

Z
(f ) = f.

Siccome
Z
0=

Z
(f f )

Z
f+

Z
(f ) =

Z
f

vale sempre la disuguaglianza


Z

Z
f

f.

(76)

Anche lintegrale inferiore `e positivamente omogeneo:


Z
Z
(af ) = a f per a [0, [ .
Inoltre `e superadditivo:
Z

Z
(f + g)

Si verifica subito che

Z
f+

g.


X 
f = sup
inf f A(S).

SF ()

Concludiamo questa sezione occupandoci del caso particolare f = 1E con E sottoinsieme


limitato di R2 . Le quantit`
a

Z
X 
X
A(E) = 1E = inf
sup 1E A(S) = inf
A(S) ,

Z
A(E) =

SF ()

SF ()
S E6=


X 
X
1E = sup
inf 1E A(S) = sup
A(S)

SF ()

SF ()
S E

sono rispettivamente la misura esterna (bidimensionale) di PeanoJordan e la misura


interna (bidimensionale) di PeanoJordan di E. In particolare, E `e PJtrascurabile se
A(E) = 0.

16

Lintegrale doppio di Riemann e le sue propriet`


a

Com`e evidente, ogni funzione a scala soddisfa


Z
Z
Z
= = .
52

separ

Per`o `e altrettanto evidente che lintegrale inferiore della funzione di Dirichlet `e nullo, mentre quello
superiore, come abbiamo visto nellEsempio 13.1, vale 1. Ci`o significa che, se f `e una generica
funzione della classe Lc , la disuguaglianza (64) pu`o effettivamente venire soddisfatta o in senso
stretto o come identit`
a. Supponiamo che si verifichi il secondo caso:
Z
Z
f= f
(77)
ovvero

Z
sup

ovvero ancora
sup


Z





Sf = inf
Sf+

X 
SF ()


inf f
S


X 
sup f A(S)
A(S) = inf

SF ()

(78)

dove le sono partizioni di un rettangolo R al di fuori del quale f si annulla identicamente.


Allora diciamo che f `e integrabile secondo Riemann (in R2 ), scriviamo che f Riem (R2 ), e
chiamiamo integrale (doppio) di Riemann di f il comune valore in (77), che denotiamo con
ZZ
Z
Z
f (x, y) dxdy oppure
f (x, y) dxdy oppure
f dxdy
R2

R2

R2

R
o ancora, volendo essere particolarmente sbrigativi, con f come per le funzioni a scala.
Richiedere che una f : R2 R a supporto compatto appartenga a Riem (R2 ) equivale dunque
a richiedere che, dato > 0, si possano trovare un rettangolo R contenente il supporto di f ed una
partizione di R tali che

X 
sup f inf f A(S) <
(79)
S

SF ()

N0

(cfr. la (60): qui sintende che due partizioni distinte vengono sostituite da un loro comune
raffinamento).
Sia a > 0. Poiche sono positivamente omogenei sia lintegrale inferiore che quello superiore si
ha
Z
Z
Z
Z
f Riem (R2 ) = af Riem (R2 )

con

(af ) =

(af ) =

(af ) = a

f.

Ma allora
Z

Z
Z
Z
(af ) = (af ) = a f = a f

e quindi
Z

Z
Z
Z
Z
(af ) = (af ) = a f = a f = (af ) .

Ne segue che anche af sta in Riem (R2 ), con


Z

Z
(af ) =

Z
(af ) =

Z
(af ) = a

e da qui si ottiene subito lomogeneit`


a dellintegrale di Riemann: la (80) vale per ogni a R.

53

(80)

Sia adesso data unaltra g Riem (R2 ). Siccome su Riem (R2 ) coincidono integrale superiore e
inferiore,
Z
Z
Z
Z
Z
Z
Z
Z
Z
Z
f + g = f + g (f + g) (f + g) f + g = f + g .
Dunque lintegrale di Riemann `e additivo:
2

f, g Riem (R ) = f + g Riem (R )

con

(f + g) =

f+

e quindi, essendo anche omogeneo, `e lineare:


f, g Riem (R2 ) = af + bg Riem (R2 )

Z
con

(af + bg) = a

f +b

per a, b R .

Fissiamo adesso un > 0 e una tale che valga la (79). Facciamo variare le coppie di punti
(x0 , y 0 ), (x00 , y 00 ) interni ad un S F(). Da
|f (x0 , y 0 )| |f (x00 , y 00 )| |f (x0 , y 0 ) f (x00 , y 00 )| sup f inf f
S

ricaviamo
sup |f | inf |f | sup f inf f
S

e grazie alla (79) otteniamo


X 
SF ()


sup |f | inf |f | A(S) < .
S

Da qui concludiamo che |f | Riem (R2 ); grazie alla positivit`a dellintegrale di Riemann,
Z Z


f |f |.


Un procedimento analogo mostra che f, g Riem (R2 ) = f g Riem (R2 ). Infatti
f (x0 , y 0 )g(x0 , y 0 ) f (x00 , y 00 )g(x00 , y 00 )
|f (x0 , y 0 ) f (x00 , y 00 )||g(x0 , y 0 )| + |g(x0 , y 0 ) g(x00 , y 00 )||f (x00 , y 00 )|




sup f inf f sup |g| + sup g inf g sup |f |
S

e quindi


sup(f g) inf (f g) C sup f inf f + sup g inf g .
S

o6.1

Osservazione 16.1. Ripercorrendo la costruzione dellintegrale di Riemann ci si accorge che apparentemente essa viene a dipendere dalla scelta di un particolare riferimento cartesiano in R2 : un
bel guaio se proprio cos` fosse, come si vede pensando al caso particolare delle misure di Peano
Jordan che perderebbero ogni significato geometrico. Ma poi si riflette sul punto di partenza, cio`e
larea dei rettangoli, che `e invariante per composizioni di rotazioni e traslazioni, e ci si convince
che deve valere un risultato del tipo: f Riem (R2 ) f Riem (R2 ) con
Z
Z
f = (f ) .
Questo effettivamente `e vero, come vedremo pi`
u in l`a (Osservazione 18.1).
54


Siano E R2 PJ-misurabile e f : E R limitata. Se il prolungamento f di f a zero fuori di
E sta in Riem (R2 ), diciamo che f sta in Riem (E) e che la quantit`a
Z
Z
f dxdy =
f dxdy
R2

`e il suo integrale di Riemann su E. Stesso discorso e stessa notazione se f `e invece data


in Riem (R2 ), che sappiamo essere chiuso rispetto al prodotto: allora anche f = f 1E , cio`e la f
prima ristretta ad E e poi prolungata a 0 fuori di E, sta in Riem (R2 ). Se in particolare E `e
PJtrascurabile, lintegrale su E di una qualunque funzione f limitata (esiste ed) `e nullo:
Z
0 = (inf f )A(E) =
E

Z
f 1E

f 1E (sup f )A(E) = 0.
E

Ladditivit`
a dellintegrale rispetto alla somma di funzioni si trasferisce alle unioni disgiunte di
domini di integrazione: se E ed F sono PJ-misurabili con E F = , una funzione f : E F R
`e integrabile su E F se e solo se integrabile sia su E che su F , e in tal caso
Z
Z
Z
f dxdy =
f dxdy +
f dxdy;
EF

in particolare, prendendo E aperto e F = E vediamo che


Z
Z
f dxdy =
f dxdy,
E

per cui non ci sar`


a da preoccuparsi di distinguere tra integrali su insiemi misurabili aperti o chiusi.
Con f = 1EF otteniamo per le aree
A(E F ) = A(E) + A(F ),
sempre, sintende, per E F = ; in generale,
A(E F ) = A(E) + A(F ) A(E F ).

17

Alcune estensioni

Leb

Integrali di Riemann in R3 (e in RN )
Un primo, semplice allargamento delle nozioni viste finora consiste nel passaggio dalle funzioni di 2
variabili a quelle di un qualunque numero N di variabili. Gi`a il caso N = 3 illustra significativamente
il procedimento. Al posto dei rettangoli si prendono i parallelepipedi P , con la notazione V (P )
per i volumi (base per altezza per profondit`a). Una partizione di P = [a, b] [c, d] [r, s] `e una
famiglia = {(xh , yk , z` ) | x0 = a < x1 < < xm = b, y0 = c < y1 < < yn = b, z0 = r < z1 <
< zp = s}, e F() `e la famiglia dei sottoparallelepipedi Qhk` = [xh1 , xh ] [yk1 , yk ] [z`1 , z` ].

55

Una funzione limitata R3 R `e una funzione a scala se, per unopportuna scelta di P e , `e nulla
fuori di P e assume valore costanti hk` negli interni dei Qhk` F(). Lespressione
Z
X
=
hk` V (Qhk` )
h,k,`

`e lintegrale elementare di . Una volta constatato che si tratta di una definizione ben posta si
arriva senza difficolt`
a agli integrali superiore e inferiore di Riemann; agli insiemi PJtrascurabili
3
(adesso in R !); allintegrale (triplo) di Riemann denotato con
Z
ZZZ
Z
f dxdydz
f (x, y, z) dxdydz oppure
f (x, y, z) dxdydz oppure
R3

R3

R3

R
o ancora, sbrigativamente, con f ; alla misura (tridimensionale) di PeanoJordan, ovvero ai volumi
dei solidi misurabili secondo PeanoJordan (cfr. lOsservazione ??).
Lo studio degli integrali sui domini normali del piano ammette una prima generalizzazione
immediata allo spazio tridimensionale. Vediamo come. Fissate due funzioni , continue su un
rettangolo R = [a, b] [c, d] del piano con in R vediamo subito (procedendo per R3 come
nella dimostrazione del Teorema 14.3 per R2 ) che una f C 0 (D) `e integrabile su D; inoltre risulta
Z

(x,y)
Z

Z
f (x, y, z) dx dy dz =

dx dy

f (x, y, z) dz =

Z
dx

(x,y)
Z

dy

f (x, y, z) dz

(81)

(x,y)

(x,y)

con a secondo membro la notazione abituale per

(x,y)
Z
Z

f (x, y, z) dz dx dy

(x,y)

(e si noti che diamo per scontata una generalizzazione del Teorema 7.1 per la quale lintegrale
semplice da (x, y) a (x, y) `e una funzione continua, dunque integrabile, di (x, y) R); la seconda
identit`a della (81) segue dalla formula di riduzione dellintegrale doppio. Per dimostrare la (81) si
procede come nella dimostrazione della (70), solo che al posto delladditivit`a dellintegrale semplice
sui sottointervalli associati ad una partizione di [a, b] adesso si sfrutta quella dellintegrale doppio
sui sottorettangoli associati ad una partizione di R.
Da qui si potrebbe poi passare alla generalizzazione della prima delle identit`a (81) che si ottiene
prendendo
D = {(x, y, z) R3 | (x, y) K, (x, y) z (x, y)}
con K sottoinsieme PJmisurabile di R2 :
Z
f (x, y, z) dx dy dz =
D

(x,y)
Z

Z
dx dy

f (x, y, z) dz

(82)

K
(x,y)

(col significato ormai evidente del simbolo a secondo membro).


Naturalmente anche lintegrale doppio a secondo membro della (82) pu`o essere ridotto se K `e
un dominio normale del piano.
56

La prima identit`
a nella (81) e pi`
u in generale la (82) sono le formule di riduzione degli
integrali tripli.
A questo punto si pu`
o passare senza difficolt`a a definire in RN , per un qualunque valore naturale
N , gli integrali secondo Riemann, detti allora N pli ed indicati semplicemente con
Z
f (x) dx ,
RN

(o di nuovo sbrigativamente con f ) e gli insiemi misurabili secondo PeanoJordan: basta prendere
come punto di partenza i prodotti cartesiani [a1 , b1 ] [aN , bN ] e le quantit`a (b1 a1 ) (bN aN )
al posto rispettivamente degli ordinari parallelepipedi e degli ordinari volumi.

Accenni alla teoria di Lebesgue


Ben pi`
u rilevante, e complicato, `e lallargamento delle nozioni stesse di integrale e misura. Restiamo
alle funzioni di due variabili per fissare le idee: esiste una maniera di definire una integrabilit`
a
che si applichi non solo agli elementi di Riem (R2 ), ma anche a funzioni, come ad esempio quella di
Dirichlet, che non rientrano in tale spazio? La risposta `e affermativa, e qui diamo una pallida idea
di come essa pu`
o essere articolata.
P
+
la
famiglia
delle
serie
Data una funzione f : R2 ] , [,
indichiamo
con

k=1 k di
f
P
funzioni semplici con k 0 per k 2 e k=1 k f . Lintegrale superiore di Lebesgue `e la
quantit`a (non necessariamente reale)
)
( Z
Z

X
X

k
k +
.
f = inf
f
k=1

k=1

La nozione che abbiamo introdotto non richiede nessuna restrizione su f : ne che si annulli al
di fuori di un compatto, ne che sia limitata. E se prendiamo in P
particolare le f Lc ? Allora ogni
+
Sf `e la somma della serie + 0 + 0 + , cio`e della serie
k=1 k con 1 = e k = 0 per
R
P R
+
+
k 2, che sta in f e verifica k=1 k = . Ne segue che Sf +
f e
Z

Z
f

f.

(83)

Lintegrale superiore di Lebesgue `e, come quello di Riemann, positivo, positivamente omogeneo
e subadditivo. (Per questultima propriet`a si utilizza lidentit`a

X
X
X
(k + k ) =
k +
k ,
k=1

k=1

k=1

+
qui valida perche le serie in +
f e g , avendo tutti i termini 0 tranne (eventualmente) il primo,
sono incondizionatamente convergenti o divergenti.)
Lintegrale inferiore di Lebesgue `e la quantit`a
Z
Z
f =
(f ).

Anche lintegrale inferiore `e positivo e positivamente omogeneo. Inoltre `e superadditivo: questultima propriet`
a segue dalla subadditivit`a dellintegrale superiore, che implica anche
Z
Z
f
f.
(84)

57

Si ha poi
Z

Z
f

f.

(85)

Se i due membri della (84) sono finiti e uguali si dice che f `e integrabile secondo Lebesgue,
e per il loro comune valore si utilizzano le stesse notazioni che per lintegrale di Riemann. Ci`
o non
crea ambiguit`
a perche, grazie alle (83) e (85) che implicano
Z

Z
f

Z
f

f,

una funzione di Lc integrabile secondo Riemann lo `e anche secondo Lebesgue, e i due integrali
coincidono.
Nel caso particolare che sia integrabile secondo Lebesgue la funzione caratteristica di un E R2
diciamo cheRE `e misurabile secondo Lebesgue (in R2 ) con misura di Lebesgue (finita) data
da (E) = 1E . Ne segue che, quando E `e limitato, se `e misurabile secondo PeanoJordan lo `e
anche secondo Lebesgue.
Per mostrare che non vale il viceversa prendiamo E = ([0, 1] Q)2 , che sappiamo non essere
PJmisurabile. E consiste in una successione di punti {(xk , yk )}. Fissato arbitrariamente > 0,
indichiamo per ogni k con Q,k il quadrato [xk /k, xk + /k] [yk /k, yk + /k]. Siccome 1E
`e maggiorata dalla serie di funzioni semplici
X
1Q,k
k

la somma dei cui integrali vale


X
k

A(Q,k ) =

X 42
k

k2

= K2

P
con K = 4 k 1/k 2 , facendo variare concludiamo che lintegrale superiore di Lebesgue della 1E
`e 0, per cui la funzione `e dotata di integrale di Lebesgue nullo, ovvero E `e misurabile secondo
Lebesgue con misura di Lebesgue nulla, ovvero ancora `e trascurabile secondo Lebesgue (e
ricordiamo che la frontiera di E `e tutto [0, 1]2 , che ha misura di PeanoJordan uguale ad 1).
A questo stesso
u semplicemente, notando che 1E `e essa
P risultato si arriva peraltro, ancora pi`
stessa una serie k 1(xk ,yk ) di funzioni a scala degeneri, dunque con la serie degli integrali uguale a
0, e questo `e un ragionamento che pu`
o essere tranquillamente ripetuto per una qualunque infinit`
a
2
2
numerabile E di punti di R , ad esempio per E = Q . O anche per una retta verticale o orizzontale
unione di uninfinit`
a numerabile di intervalli limitati e poi per una infinit`a numerabile di tali rette.
` il
E qui si pu`o almeno enunciare un risultato cui abbiamo alluso subito dopo il Teorema 14.2. E
Teorema di VitaliLebesgue: Condizione necessaria e sufficiente affinche una funzione f Lc
sia integrabile secondo Riemann `e che linsieme dei suoi punti di discontinuit`a sia trascurabile
secondo Lebesgue.
Infine (ma nella teoria di Lebesgue `e appena linizio. . . ) si vede, procedendo come per lintegrale
di Riemann, che le funzioni integrabili secondo Lebesgue costituiscono uno spazio vettoriale su cui
lintegrale di Lebesgue `e positivo e lineare.

58

18

Cambiamenti di variabili

Nel Calcolo in una variabile un ruolo importantissimo per il calcolo effettivo degli integrali sugli
intervalli `e svolto dalla regola di integrazione per sostituzione, che si enuncia cos`: date una funzione
h di classe C 1 in un intervallo compatto [, ] e una funzione continua f sullimmagine di [, ]
nella h, vale lidentit`
a
Z h()
Z
f () d =
f (h(v))h0 (v) dv.
(86)
h()

Aggiungiamo lipotesi che h0 si mantenga 6= 0. Poiche ci troviamo su un intervallo questo


significa: o h0 > 0 (e quindi h() < h()), oppure h0 < 0 (e quindi h() > h()). Poiche limmagine
di [, ] nella h `e lintervallo [A, B] uguale a [h(), h()] nel primo caso ed a [h(), h()] nel secondo,
la (86) diventa
Z
Z B
f (h(v))h0 (v) dv,
f () d =
A

nel primo caso e


Z

f () d =
A

nel secondo. Riassumiamo in ununica identit`a:


Z B
Z
f () d =
A

f (h(v))h0 (v) dv

f (h(v))|h0 (v)| dv.

(87)

Soffermiamoci un attimo sullipotesi che h0 si mantenga sempre diversa da 0 nellintervallo,


ovvero che h sia un diffeomorfismo = applicazione di classe C 1 e iniettiva. Si tratta di unipotesi
che in dimensione 1 non gioca nessun ruolo rilevante, a parte quello di consentire la presenza del
modulo della derivata, e invece si rivela essenziale nel passaggio a pi`
u dimensioni: evidenzieremo
questo con un controesempio nellOsservazione 18.2.
In dimensione 2 il ruolo della funzione scalare = h(v) `e svolto da una funzione vettoriale
(x, y) = (u, v) = (x(u, v), y(u, v)); al posto di h0 (v), che avevamo supposto 6= 0, si trova il
determinante della matrice jacobiana di , ovvero il numero


xu (u, v) yu (u, v)
(u, v) = det
xv (u, v) yv (u, v)
che si suppone 6= 0, e al posto della quantit`a infinitesima12 |h0 (v)| dv la quantit`a infinitesima13
| | dudv. Illustriamo il significato di questultima fissando il valore d in un punto (u0 , v0 ).
La funzione vettoriale u 7 (x(u, v0 ), y(u, v0 )) `e una curva con vettore tangente in u = u0 dato da
V1 = xu (u0 , v0 )i + yu (u0 , v0 )j; spostandoci da (x(u0 , v0 ), y(u0 , v0 )) a (x(u0 + du, v0 ), y(u0 + du, v0 ))
e sostituendo lincremento (x(u0 + du, v0 ) x(u0 , v0 ), y(u0 + du, v0 ) y(u0 , v0 )) con la sua parte
lineare (xu (u0 , v0 )du, yu (u0 , v0 )du) otteniamo un segmento di lunghezza uguale a kV1 duk.
Analogamente, la funzione vettoriale v 7 (x(u0 , v), y(u0 , v)) `e una curva con vettore tangente
in v = v0 dato da V2 = xv (u0 , v0 )i + yv (u0 , v0 )j; spostandoci da (x(u0 , v0 ), y(u0 , v0 )) a (x(u0 , v0 +
dv), y(u0 , v0 + dv)) e sostituendo lincremento (x(u0 , v0 + dv) x(u0 , v0 ), y(u0 , v0 + dv) y(u0 , v0 ))
con la sua parte lineare (xv (u0 , v0 )dv, yv (u0 , v0 )dv) otteniamo un segmento di lunghezza uguale a
kV2 dvk.
12
13

Qualunque significato si provi a dare a questa espressione.


Qualunque significato si provi a dare a questa espressione.

59

Calcoliamo
kV1 dv V2 dvk = k(xu (u0 , v0 )i + yu (u0 , v0 )j) (xv (u0 , v0 )i + yv (u0 , v0 )j)k |du||dv|
= |xu (u0 , v0 )yv (u0 , v0 ) yu (u0 , v0 )xv (u0 , v0 )||du||dv|.
Dunque | (u0 , v0 )| dudv (con du > 0, dv > 0) coincide con la noma del prodotto vettoriale dei
vettori V1 du e V2 dv, ovvero `e larea del parallelogramma da essi generato, ed approssima, a meno
di infinitesimi di ordine superiore al primo, larea (nel senso di PeanoJordan!) della porzione di
piano compresa tra le curve
u 7 (x(u, v0 ), y(u, v0 ))

per u0 u u0 +du,

u 7 (x(u, v0 ), y(u, v0 +dv))

per u0 u u0 +du,

v 7 (x(u0 , v), y(u0 , v))

per v0 v v0 +dv,

v 7 (x(u0 +du), v), y(u0 +du, v))

per v0 v v0 +dv.

Vediamo come si presenta la versione bidimensionale della (87) in un caso particolare ma


istruttivo.

Trasformazioni affini invertibili di R2


Fissiamo una matrice 2 2 non singolare

=
La trasformazione



.


  
 
u + v
u
u
=
7
:
u + v
v
v

`e un diffeomorfismo di V = R2 ; la sua matrice jacobiana `e la trasposta di , per cui il suo jacobiano


`e uguale alla costante det ; lo jacobiano 1 della trasformazione affine inversa 1 , cio`e il
determinante di 1 , `e uguale a 1/det , e di conseguenza limmagine 1 (S) nel piano (u, v) di
un rettangolo S del piano (x, y) `e un parallelogramma P 0 con area
A(P 0 ) =

A(S)
.
|det |

Dimostriamo che se f `e una funzione limitata, nulla fuori di un rettangolo R e integrabile, allora `e
integrabile anche (f )| |, quindi f perche `e costante, e vale lidentit`a
Z
Z
f (x, y) dxdy = |det |
(f )(u, v) dudv .
(88)
R

1 (R)

Indicando con una partizione di R e con S un rettangolo in F() abbiamo


Z
Z
A(S)
1
= A( (S)) = 11 (S) = 11 (S )
|det |
R
(con la sbrigativa notazione per lintegrale su R2 ), e siccome
f = (f )11 (R) =

(f )11 (S ) + 1E

SF ()

60

af

dove E = SF () 1 (S) `e un insieme (unione di segmenti) PJtrascurabile e `e una funzione


limitata (costante a tratti) che non ha interesse specificare, otteniamo

X
X 
A(S)
inf (f )
inf f A(S) =
|det |
S
|det |
1 (S )
SF ()

SF ()

Z
=

X 

SF ()


Z
X
inf (f ) 11 (S ) + 1E |det |
(f )11 (S ) + 1E |det |

1 (S )

SF ()

Z
=

(f )|det |.

Analogamente si vede che


Z


X 
sup f A(S).
(f )|det |
SF ()

Riassumiamo:
X 
SF ()


inf f
S

Z
A(S)

Z
(f )|det |


X 
(f )|det |
sup f A(S).
SF ()

Dunque f `e integrabile (cfr. la (79)), e vale lidentit`a


Z
Z
f = (f )|det |

(89)

afff

cio`e la (88)14 .
Le considerazioni precedenti, applicate a 1F con F insieme limitato, dunque contenuto in un
rettangolo R, e PJmisurabile, mostrano subito che anche 1 (F ) `e PJmisurabile, con misura di
PeanoJordan uguale a quella di F divisa per |det |.
oin

Osservazione 18.1. Se in particolare `e composizione di rotazioni e traslazioni, per cui `e


ortogonale, otteniamo
Z
Z
f = (f )
cio`e il risultato preannunciato nellOsservazione 16.1: lintegrale di Riemann `e indipendente dal
sistema di riferimento cartesiano rispetto a cui `e stato introdotto.

14

Questa dimostrazione si semplifica enormemente quando f `e in particolare continua in R, e di conseguenza f


lo `e nel dominio normale 1 (R). In tal caso infatti risulta


Z


1
1
inf
f A(S) = |det| inf (f )A( (S)) |det| (f ) dxdy |det| sup (f )A( (S)) = sup f A(S)

1 (S )

e sommando sugli S F () si ottiene la (88).

61

1 (S )

e10

Esempio 18.1. Calcoliamo lintegrale di f (x, y) = (x2 y 2 )2 sul quadrato Q compreso tra le rette
y + x = 2, y x = 2. Siccome x2 y 2 = (x + y)(x y), viene in mente di porre

u=x+y
v =xy
e da qui, invertendo, definire la attraverso il sistema

x = (u + v)/2
y = (u v)/2
cio`e

 
  
 
u
u
1/2 1/2
u
:
7
=
.
v
v
1/2 1/2 v

Dunque Q `e immagine nella di K = [2, 2]2 , e


Z
Z
Z
Z 2
128
1 2 2
u du
v 2 dv =
.
(x2 y 2 )2 dxdy = |det |
u2 v 2 dudv =
2 2
9
2
Q
K

Per introdurre i prossimi sviluppi far`a comodo inquadrare le precedenti considerazioni nel
seguente enunciato (che non dimostriamo), per pesante che esso sia:
T9.1

Teorema 18.1. Siano dati due aperti U e V di R2 , il primo dei quali limitato e PJmisurabile con
chiusura K = U contenuta in V . Sia : V R2 un diffeomorfismo di V , o pi`
u in generale una
funzione di classe C 1 che ristretta ad U sia un diffeomorfismo. Allora anche (U ) `e PJmisurabile,
e per ogni f : (U ) R continua e limitata (dunque integrabile su (U ) grazie al Teorema 14.2)
vale lidentit`
a
Z
Z
f (x, y) dxdy = (f )(u, v)| (u, v)| dudv .
(90)
(U )

aff

Sottolineiamo che al posto degli aperti U e (U ) si possono prendere, senza che cambi nulla, le
loro chiusure, per cui la (90) si scrive anche
Z
Z
Z
f (x, y) dxdy =
f (x, y) dxdy =
(f )(u, v)| (u, v)| dudv .
(U )

(K)

Questo teorema si applica ovviamente nel caso in cui sia una trasformazione affine invertibile,
ed allora la (90) non `e che la (88).
La meticolosit`
a dellenunciato del Teorema 18.1 si pu`o dire che `e fatta apposta per la seguente
importante applicazione.

Coordinate polari nel piano


La trasformazione
(, %) = (% cos , % sin ),

(91)

il cui jacobiano (, %) vale %, `e regolarissima su tutto V = R2 , ma perche sia un diffeomorfismo


la restringiamo al prodotto cartesiano U =]0, 2[]0, R[, sicche (K) `e il disco chiuso DR racchiuso
dalla circonferenza
x2 + y 2 = R 2 .
62

A1

La (90) diventa
Z
Z
Z
f (x, y) dxdy =
f (% cos , % sin )% dd% =
DR

Z
d

f (% cos , % sin )% d%

(92)

per f continua e limitata su C 0 (DR ). In particolare ritroviamo per f (x, y) = 1 larea R2 del disco
DR integrando la lunghezza 2% della circonferenza di raggio %, che `e dunque la derivata dellarea
del disco di raggio %:
Z
R

2% d%.

A(DR ) =
0

Si noti che per a, b > 0 anche la trasformazione


a,b (, %) = (a% cos , b% sin ),
che (coincide con quando a = b = 1 ed) ha determinante ab%, `e regolarissima su tutto V = R2
ed iniettiva su U =]0, 2[]0, R[. Solo che a,b (K) `e la regione racchiusa dallellissi
x2 y 2
+ 2 = R2
a2
b
(e adesso non ha lo stesso significato che nella (91): per x > 0 `e larcotangente non di y/x, bens`
di ay/(bx), eccetera).
141

Esempio 18.2. Il chiuso


D = {(x, y) | 1 x2 + y 2 4, 0 y

3x}

`e un dominio normale rispetto allasse x, ma se la funzione integranda `e


f (x, y) =

1
1 + x2 + y 2

conviene vedere D come immagine nella (91) di K = U = {(, %) | 0 /3, 1 % 2}.


Otteniamo
Z
Z
Z /3 Z 2
%

5
f (x, y) dxdy =
f (% cos , % sin )% dd% =
d
d% = log .
2
1
+
%
6
2
D
K
0
1

o9.1

Osservazione 18.2. Nellintegrazione unidimensionale non avevamo mai visto comparire la richiesta che la sostituzione realizzasse un diffeomorfismo. In dimensione > 1 questa richiesta, formulata
nel Teorema 18.1, `e invece essenziale, come si vede dal seguente esempio per N = 2: il passaggio a
coordinate polari (, %) non realizza un diffeomorfismo del rettangolo U =]0, []0, 1[ se > 2,
e lidentit`a
Z
Z
dxdy =
% dd%
(K)

non `e soddisfatta perch`e (K) `e il disco chiuso di raggio 1 e la sua area `e il valore del primo
membro, mentre quello del secondo `e
Z Z 1

d
% d% = > .
2
0
0
63


o9.1

Osservazione 18.3. In dimensione 1 lopportunit`a di effettuare un cambiamento di variabile, e


leventuale scelta di questultimo, dipendono solo dallespressione della funzione integranda. In
dimensione 2, invece, va tenuto altrettanto conto dellespressione del dominio U di integrazione.
Sia ad esempio f (x, y) = x2 + y 2 . Se D `e il settore di corona circolare compreso tra i raggi 1 e 2
e gli angoli /4 e 3/4 nessun dubbio: coordinate polari. Ma se invece U = {(x, y) | 1 x
1, x2 + 1 y x2 + 2} le coordinate polari diventano un affare complicato, mentre tenendo
conto che D `e un dominio normale rispetto allasse x lintegrazione di f si fa in un attimo servendosi
del Teorema 14.3.

Nello studio degli integrali doppi accade spesso che ad apparire promettente (rispetto tanto
al dominio di integrazione quanto alla funzione integranda) non sia subito una trasformazione di
coordinate (x, y) = (u, v) come nellenunciato del Teorema 18.1 e poi in particolare nellEsempio
18.2, bens` per cominciare una (u, v) = (x, y) iniettiva in un aperto A. Di questo genere `e
la situazione presentatasi con affine nellEsempio 18.1, ma l` non abbiamo incontrato nessuna
difficolt`a: in un attimo abbiamo trovato linversa di . In genere tuttavia il procedimento
di inversione di non `e immediato; poi rimane da calcolare il determinante in U = (A).
Mostriamo come a questultimo fine possa bastare, almeno in linea di principio, la conoscenza del
determinante in A. Applicando allidentit`a
(1 )(u, v) = (u, v)

per (u, v) U

la regola di derivazione delle funzioni composte, e passando ai determinanti delle matrici jacobiane,
otteniamo
1 ((u, v)) (u, v) = 1,
e siccome in A risulta = 1 arriviamo a
(u, v) =

1
.
((u, v))

(93)

ja

A questo punto, dovendosi calcolare il secondo membro della (93), ritorna pur sempre in ballo
la questione dellespressione esplicita della . E per`o se ne pu`o prescindere in certi casi speciali:
tipicamente quelli degli esercizi di un corso, come nel prossimo esempio...
o9.1

Esempio 18.3. Nellaperto B definito dalle disuguaglianze


1
y
1
1 < x2 y 2 < 2, < <
2
x
2

(94)

la trasformazione di coordinate definita da u = x2 y 2 , v = y/x non `e iniettiva: (x, y) =


(x, y). Lo `e invece nellintersezione A di B col semipiano delle x > 0: dato un qualunque punto
(u0 , v0 ) di U = (A) =]1, 2[] 1/2, 1/2[, liperbole x2 y 2 = u0 e la retta y = v0 x si incontrano
in un unico punto (x0 , y0 ) A. Dunque in U `e definita la iniettiva data dallinversa della
ristretta ad A. Soprassediamo momentaneamente alla verifica delle propriet`a della attraverso il
suo calcolo esplicito, ed esprimiamo il suo jacobiano attraverso quello dellinversa: siccome
(x, y) = 2 2
64

y2
x2

inie

la (93) adesso diventa


(u, v) =

1
.
2(1 v 2 )

(95)

Come si vede, non c`e stato bisogno del calcolo esplicito di , che peraltro si fa subito: `e la
trasformazione
r
r
u
u
x=
, y=v
,
2
1v
1 v2
di classe C 1 in V = R] 1, 1[ ed iniettiva in U . Da questa espressione si arriva di nuovo alla (95),
anche se con qualche conto in pi`
u.

Servendosi delle coordinate polari si pu`o formulare un rapido approccio allintegrazione impropria nel piano. Per cominciare, poniamo
CrR = {(x, y) | 0 < r2 x2 + y 2 R2 < }.
Lintegrale
Z
IrR =

(x2 + y 2 )/2 dxdy = 2

CrR

vale

2
(R+2 r+2 )
+2

%+1 d%

per 6= 2,

2(log R log r)

per = 2.

Dunque
lim IrR = per 2,

lim IrR = per 2,

r0

lim IrR =

lim IrR =

r0

2r+2
+2

2R+2
+2

per < 2,
per > 2.

Da qui si ricava facilmente il


T9.2

Teorema 18.2. (i) Sia f definita allesterno del disco x2 + y 2 r2 per qualche r > 0 ed integrabile
in ogni CrR , R > r. Allora lintegrale improprio
Z
f (x, y) dxdy
x2 +y 2 r2

converge assolutamente se esiste una costante K > 0 tale che 0 |f (x, y)| K(x2 + y 2 )/2 per
un < 2, mentre diverge se esiste una costante K > 0 tale che f (x, y) K(x2 + y 2 )/2 per un
2;
(ii) Sia f definita in un disco bucato 0 < x2 + y 2 R2 per qualche R > 0 ed integrabile in ogni
CrR , 0 < r < R. Allora lintegrale improprio
Z
f (x, y) dxdy
x2 +y 2 R2

converge assolutamente se esiste una costante K > 0 tale che 0 |f (x, y)| K(x2 + y 2 )/2 per
un > 2, mentre diverge se esiste una costante K > 0 tale che f (x, y) K(x2 + y 2 )/2 per un
2.
65

deja

Lenunciato del Teorema 18.1 si trasferisce in maniera ovvia alla dimensione 3:


T9.2

Teorema 18.3. Siano dati due aperti U e V di R3 , il primo dei quali limitato con chiusura K = U
contenuta in V . Sia : V R3 un diffeomorfismo di V , o pi`
u in generale una funzione di classe C 1
che ristretta ad U sia un diffeomorfismo, con (U ) PJmisurabile. Allora anche U `e PJmisurabile,
e per ogni f : (U ) R limitata e integrabile vale lidentit`
a
Z
Z
f (x, y, z) dxdydz = (f )(u, v, w)| (u, v, w)| dudvdw
(96)
(U )

aff

ovvero
Z

f (x, y, z) dxdydz =

(f )(u, v, w)| (u, v, w)| dudvdw .

f (x, y, z) dxdydz =

(U )

(K)

Oltre alla (89), che si trasferisce banalmente al caso di una trasformazione affine dello spazio,
unimportante applicazione che rientra nel Teorema 18.4 `e la seguente.

Coordinate sferiche
La trasformazione
(, %, ) = (% cos cos , % sin cos , % sin ),
il cui jacobiano (, %, ) vale %2 cos , `e regolarissima su tutto V = R3 , e diventa un diffeomorfismo quando `e ristretta al prodotto cartesiano ]0, 2[]0, R[] /2, /2[. Prendendo ad esempio
questultimo come U , per cui (K) `e la palla (tridimensionale) chiusa BR , otteniamo
Z
Z
f (x, y, z) dxdydz =
f (% cos cos , % sin cos , % sin )%2 cos dd%d
(97)
K

BR

Z
d

=
0

/2

f (% cos cos , % sin cos , % sin )%2 cos d

d%
0

/2

per f C 0 (BR ) limitata (cfr. la (81)). La (97) fornisce il volume 4R3 /3 della sfera come integrale
dellarea (nel senso della geometria euclidea) 4%2 della superficie sferica di raggio %, area che `e
quindi la derivata del volume della sfera di raggio %:
Z R
V (BR ) =
4%2 d%.
0

Esempio 18.4. Per calcolare


Z
I=
D

p
cos x2 + y 2 + z 2
dxdydz
x2 + y 2 + z 2

con
D = {(x, y, z) | 1 x2 + y 2 + z 2 4, z 0}
passiamo a coordinate sferiche x = % cos cos , y = % sin cos , z = sin , dove 1 % 2, 0
2 e (attenzione!) 0 /2. Otteniamo
Z
cos % 2
I=
% cos d%dd = 2(sin 2 sin 1).
2
[1,2][0,2][0,/2] %
66

(8.3)


Utilizziamo le coordinate sferiche per occuparci dellintegrazione impropria nello spazio a 3
dimensioni. Poniamo
rR = {(x, y, z) | 0 < r2 x2 + y 2 + z 2 R2 < }.
Lintegrale
Z
IrR =

(x2 + y 2 + z 2 )/2 dxdydz = 4

rR

vale

4
(R+3 r+3 )
+3

%+2 d%

per 6= 3,

4(log R log r)

per = 3.

Dunque
lim IrR = per 3,

lim IrR =

lim IrR = per 3,

r0

lim IrR =

r0

4r+3
+3

4R+3
+3

per < 3,
per > 3.

Da qui si ricava il
T9.2

Teorema 18.4. (i) Sia f definita allesterno della palla x2 + y 2 + z 2 r2 per qualche r > 0 ed
integrabile in ogni rR , R > r. Allora lintegrale improprio
Z
f (x, y, z) dxdydz
x2 +y 2 +z 2 r2

converge assolutamente se esiste una costante K > 0 tale che 0 |f (x, y, z)| K(x2 + y 2 + z 2 )/2
per un < 3, mentre diverge se esiste una costante K > 0 tale che f (x, y) K(x2 + y 2 + z 2 )/2
per un 3;
(ii) Sia f definita in una palla bucata 0 < x2 + y 2 + z 2 R2 per qualche R > 0 ed integrabile
in ogni rR , 0 < r < R. Allora lintegrale improprio
Z
f (x, y) dxdydz
x2 +y 2 +z 2 R2

converge assolutamente se esiste una costante K > 0 tale che 0 |f (x, y, z)| K(x2 + y 2 + z 2 )/2
per un > 3, mentre diverge se esiste una costante K > 0 tale che f (x, y, z) K(x2 + y 2 + z 2 )/2
per un 3.

19

Richiami su curve ed integrali curvilinei

Una curva di RN `e una funzione vettoriale = (, . . . , N ) : [a, b] RN almeno continua e


limitata su un intervallo limitato ]a, b[. Il suo integrale da a a b `e il vettore
Z

Z
(t) dt =

Z
1 (t) dt, . . . ,

67


N (t) dt .

nor

Lemma 19.1. Vale la disuguaglianza


Z b
Z b



k(t)k dt.
(t) dt


a

DIM. Applicando la disuguaglianza di CauchySchwartz al prodotto scalare ( | ) in RN otteniamo subito


Z b

Z b
Z b
 Z b

k(t)k kyk dt =
k(t)k dt kyk
((t) | y) dt
(t) dt y =
a

e quindi, con la scelta


b

(t) dt,

y=
a

il risultato cercato.

QuandoN = 2 e N = 3 le pi`
u abituali notazioni per la la generica curva sono rispettivamente
t 7 (x(t), y(t)),

t 7 (x(t), y(t), z(t)).

Esempio 19.1. Se f `e una funzione reale continua su [a, b] le funzioni vettoriali


[a, b] 3 t (t, f (t))
e
[a, b] 3 t (f (t), t)
sono due curve di R2 . Per semplicit`
a conviene parlare di curva y = f (x), x [a, b] nel primo caso
e di curva x = f (y), y [a, b] nel secondo.


68

Si dice che `e: semplice se (t1 ) 6= (t2 ) per a t1 < t2 b tranne, eventualmente, quando
t1 = a e t2 = b; chiusa se (a) = (b); aperta se (a) 6= (b).
Lorientazione di `e quella in cui (t1 ) precede (t2 ) se a t1 < t2 b; il primo estremo
o origine di `e (a), il secondo estremo o termine `e (b). Lopposta di `e la curva
[a, b] 3 t 7 (a + b t).
Il sostegno di `e limmagine ([a, b]). Si tatta di un insieme (sempre chiuso nella topologia
di RN !) da cui in nessun modo si pu`
o risalire alla funzione : basta pensare che esso `e lo stesso per
ogni altra curva p non appena p `e di classe C 0 in un intervallo compatto [c, d] con p([c, d]) = [a, b].
Ci`o corrisponde perfettamente alla distinzione tra una funzione (scalare) e il suo grafico, salvo per
la differenza, non di poco conto, che abitualmente il termine di curva viene utilizzato proprio col
significato di sostegno, non certo di funzione (vettoriale). E anche qui in certi casi far`a comodo,
per procedere un po pi`
u speditamente, riferirsi al sostegno di una famiglia di curve come se fosse
la stessa cosa di una o di alcune particolari curve della famiglia.
Esempio 19.2. In R2 la circonferenza di centro (x0 , y0 ) e raggio r, pensata come curva (semplice
e chiusa), `e la funzione
[0, 2] 3 t (x0 + r cos t, y0 + r sin t).

Esempio 19.3. Dati x e y in RN il segmento (orientato) (x, y) che va da x a y, inteso come
curva (semplice e aperta), `e una qualunque funzione
[a, b] 3 t 7

bt
ta
x+
y
ba
ba

con a e b presi in R, a < b. I segmenti (x, y) e (y, x) sono opposti tra loro.

Due curve : [a, b] RN e : [c, d] RN di classe C 1 sono equivalenti luna allaltra
quando ( ) = ( p)( ), [c, d], con p di classe C 1 , p0 6= 0 in [c, d] e p([c, d]) = [a, b] (per cui p `e
strettamente monotona con p1 C 1 ([a, b])). Se p `e crescente, cio`e se (a) = (c) e (b) = (d),
lorientazione di coincide con quella di , altrimenti una `e lopposta dellaltra.
Esempio 19.4. In R2 la curva di classe C 1
[0, ] 3 t 7 (cos t, sin t)
non `e equivalente alla curva
y=
che non `e di classe
curve di classe C 1

C 1.

p
1 x2 ,

1 x 1,

Invece sono equivalenti tra di loro, ma con orientazioni opposte, le due


[/4, 3/4] 3 t 7 (cos t, sin t)

e
y=

p
1 x2 ,

1
1
x :
2
2

lequivalenza `e realizzata dal cambiamento di parametro p() = cos .



69

Una curva : [a, b] RN di classe C 1 `e regolare se soddisfa k0 k > 0 in ]a, b[. Una ragion
dessere di questa condizione sta nella sua interpretazione geometrica quando a < t0 < b: se e solo
se non `e nulla, la derivata 0 (t0 ), limite per t t0 del rapporto incrementale
(t) (t0 )
t t0
con t0 , t ]a, b[, t 6= t0 , `e lN pla dei parametri direttori di una retta, e pi`
u esattamente della
tangente al sostegno di in (t0 ). Per N generico, N = 2, N = 3 i versori di tale tangente si
scrivono rispettivamente15

0 (t0 )
,
k0 (t0 )k

(x0 (t0 ), y 0 (t0 ))


p
,
x0 (t0 )2 + y 0 (t0 )2

(x0 (t0 ), y 0 (t0 ), z 0 (t0 ))


p
.
x0 (t0 )2 + y 0 (t0 )2 + z 0 (t0 )2

Nel particolare caso bidimensionale di una curva y = f (x) i versori della tangente in (x0 , f (x0 ))
sono
(1, f 0 (x0 ))
p
1 + f 0 (x0 )2
e quindi quelli della normale sono

(f 0 (x0 , 1))
p
.
1 + f 0 (x0 )2

Diversa la questione dal punto di vista cinematico: come velocit`a istantanea allistante t0 del
moto con legge oraria (e quindi con traiettoria uguale al sostegno di ) la derivata 0 (t0 ) pu`
o
benissimo avere tutte le componenti uguali a 0.
Esempio 19.5. La curva (t) = (t3 , t2 ) per 1 t 1 `e di classe C 1 e costituisce la legge oraria
di un moto con velocit`
a (vettoriale) nulla allistante 0. Per`o il suo sostegno, cio`e la traiettoria
del moto, `e anche il sostegno della curva (=grafico della funzione) y = x2/3 , e dunque `e privo di
tangente nellorigine.

Lagganciamento della curva ad una seconda curva : [c, d] RN ha senso (solo) quando
(b) = (c). Esso d`
a luogo alla curva : [a, b+dc] RN definita dalle identit`a: ( ) = ( ) per
a b, ( ) = ( b + c) per b < b + d c. Dunque la ristretta a [a, b] `e la stessa cosa
della , mentre ristretta a [b, b + d c] non `e esattamente la bens` la p con p( ) = b + c.
Lagganciamento consecutivo di tre o pi`
u curve si effettua agganciando, per cominciare, la prima e
la seconda (purche ci`
o sia possibile), poi agganciando la curva cos` ottenuta e la terza delle curve
date (purche ci`
o sia possibile), eccetera. Lagganciamento di un numero finito di segmenti `e una
poligonale.
Un cammino `e una curva detta anche regolare a tratti ottenuta agganciando consecutivamente un numero finito di curve di classe C 1 ; lorientazione di una qualunque di tali curve
determina quella di tutto il cammino se questo `e una curva semplice. Un cammino `e dunque una
funzione di classe C 1 a tratti (oltre che, naturalmente, di classe C 0 ). Ci`o significa che si pu`
o
dare una partizione a = a0 < a1 < < am = b di [a, b] in modo tale che la derivata 0 (t) esista
continua in ogni intervallo ]ah1 , ah [ e sia dotata di limite in RN tanto per t ah1 + 0 che per
t ah 0. Naturalmente rientra nella definizione di cammino una di classe C 1 su tutto [a, b].
15

La scelta del segno + o dipende dallorientazione che si fissa sulla tangente: il segno + `e quello che d`
a alla
tangente lorientazione determinata da quella della curva.

70

Indichiamo con G una funzione continua sul sostegno di un cammino [a, b] RN . Lintegrale
curvilineo (di prima specie) di G su `e definito nel modo seguente:
Z
Z b
G ds =
G((t))k0 (t)k dt.
a

La definizione `e ben posta perche la funzione integranda t 7 G((t))k0 (t)k `e definita, limitata e
continua nellintervallo [a, b] privato al pi`
u di un numero finito di punti ah ; inoltre
Z
m Z ah
X
G ds =
G((t))k0 (t)k dt.
h=1 ah1

Esempio 19.6. Se G `e una funzione reale continua sul grafico di una funzione f C 1 ([a, b]) il suo
integrale di prima specie sulla curva y = f (x) `e dato da
Z b
p
G(x, f (x)) 1 + f 0 (x)2 dx.
a


Dalla formula di integrazione per sostituzione segue facilmente il
Teorema 19.1. Se due curve e di classe C 1 sono equivalenti tra di loro vale lidentit`
a
Z
Z
G ds =
G ds

indipendentemente dallorientazione delle due curve.


DIM. Sia = p con p : [c, d] R di classe C 1 , p0 6= 0 in [c, d] e p([c, d]) = [a, b]. Il primo
membro dellidentit`
a da dimostrare `e uguale a
Z d
Z d
Z d
0
0
G(( ))k ( )k d =
G(( p)( ))k( p) ( )k d =
G(( p)( ))k(0 p)( )k|p0 ( )| d
c

e per la formula dintegrazione per sostituzione lultimo integrale vale


Z b
Z
0
G((t))k (t)k dt = G ds.
a


Adesso fissiamo N funzioni Lj continue in un aperto A di RN ed associamo loro tanto la
funzione vettoriale A RN , o campo vettoriale, L = (L1 , . . . , LN ) che la forma differenziale
= L1 dx1 + + LN dxN ; quando N = 3 il campo vettoriale pu`o essere interpretato come un
campo di forze, e allora lo si denota abitualmente con F = (F1 , F2 , F3 ). Naturalmente ogni
enunciato su L, o in particolare su F, `e equivalente ad un enunciato su .
Dato un cammino = (1 , . . . , N ) : [a, b] RN col sostegno C contenuto in A lintegrale
curvilineo (di seconda specie) di su `e il numero
Z
=

Z bX
N

Lj ((t))0j (t) dt.

a j=1

71

P
0
La definizione `e ben posta perche la funzione integranda t 7 N
e definita, limitata
j=1 Lj ((t))j (t) `
e continua nellintervallo [a, b] privato di un numero finito di punti (quelli in cui non `e definita
qualcuna delle derivate 0j ). Dividendo e moltiplicando lintegrando a secondo membro per la
norma k0 (t)k (definita e non nulla in tutto [a, b] con leccezione di un numero finito di punti) si
vede che tra gli integrali curvilinei delle due specie sussiste il legame
Z
Z
= L ds

dove = (t) indica il versore tangente 0 (t)/k0 (t)k alla curva (con la sua orientazione!) nel
punto (t); quando N = 3 e il campo vettoriale viene interpretato come un campo di forze F il
secondo membro
Z
F ds

ha il significato di lavoro compiuto da F per spostare un punto materiale da (a) a (b).


Esempio 19.7. Se L ed M sono funzioni reali continue in un aperto A di R2 lintegrale di L dx +
M dy su una curva y = f (x), a x b di classe C 1 e con sostegno contenuto in A `e dato da
Z b
Z b
L(x, f (x)) dx +
M (x, f (x))f 0 (x) dx.
a


inv

Teorema 19.2. Se due curve e di classe C 1 con i sostegni contenuti in A sono equivalenti tra
di loro vale lidentit`
a
Z
Z
=

oppure lidentit`
a
Z

Z
=

a seconda che e abbiano orientazioni uguali o opposte.


DIM. Sia = p con p : [c, d] R di classe C 1 , p0 6= 0 in [c, d] e p([c, d]) = [a, b]. Il primo
membro delle identit`
a da dimostrare `e uguale a
Z dX
Z dX
Z dX
N
N
N
0
0
Lj (( ))j ( ) d =
Lj ((p)( ))(p) ( ) d =
Lj ((p)( ))(0 p)( )p0 ( ) d
c

j=1

j=1

j=1

e per la formula dintegrazione per sostituzione lultimo integrale vale


Z bX
Z
N
Lj ((t))0j (t) dt =

a j=1

N
aX

oppure
Z
b

a seconda che

p0

>0o

p0

Lj ((t))0j (t) dt =

j=1

< 0.

72

Esempio 19.8. Applicando ripetutamente il Teorema 19.2 si verifica che lintegrale di seconda
specie
[0, 2]3 t 7 (cos t, sin t) `e uguale alla somma di quelli
p sullopposta
sulla circonferenza

di
2 , 1/ 2
y = 1 x2 , 1/ 2 x 1/ 2(cfr lEsempio
1.4),
sullopposta
di
x
=

y
p

y 1/ 2, su y = 1 x2 , 1/ 2 x 1/ 2 e su x = 1 y 2 , 1/ 2 y 1/ 2.

Se esiste una funzione U C 1 (A) tale che L = U in A si dice che `e una forma differenziale
esatta in A con primitiva data da U ; grazie al teorema di derivazione delle funzioni composte
che qui vale perche U , essendo di classe C 1 , `e differenziabile! si ottiene
Z bX
N

Lj ((t))0j (t) dt =

Z bX
N

a j=1

Uxj ((t))0j (t) dt =

a j=1

d
U ((t)) dt = U ((b)) U ((a)).
dt

Ci`o significa che lintegrale di su non dipende dal sostegno della curva, bens` solo dai suoi
estremi (a) e (b) con lordine in cui sono presi, o, in maniera equivalente, che lintegrale `e nullo
se `e chiusa, ovvero (a) = (b). Per N = 3, con il campo vettoriale interpretato come campo
di forze F, lesistenza di U si esprime dicendo che F `e conservativo, con potenziale dato da U ;
il lavoro compiuto dal campo per spostare un punto materiale lungo la curva dipende solo dagli
estremi di essa e dal verso in cui essi si seguono, con valore 0 se la curva `e chiusa.
Quella appena formulata `e una condizione necessaria, che si potrebbe dimostrare essere anche
sufficiente, per lesistenza di U in tutto A. Unaltra condizione necessaria, ma stavolta non sufficiente, `e la seguente, che si ottiene sotto lipotesi che il campo vettoriale (L1 , . . . , LN ) sia di classe
C 1 . Supponiamo che il campo sia il gradiente della funzione U , per cui questultima `e adesso di
classe C 2 e quindi, grazie al Teorema di Schwarz, verifica (con la notazione Di = /xi )
Di Dk U = Dk Di U
da cui
D i Lk = D k Li
per i, k = 1, . . . , N , propriet`
a questa che si esprime dicendo che la forma differenziale `e chiusa;
nel caso tridimensionale la propriet`
a in questione, riferita al campo di forze F, si riscrive
F1
F2
=
,
y
x

F1
F3
=
,
z
x

F2
F3
=
z
y

e si pu`o riformulare scrivendo


rotF = (0, 0, 0),
ovvero chiamando il campo irrotazionale. Ebbene, come abbiamo preannunciato, si tratta di una
condizione necessaria che per`
o non `e sufficiente per lesistenza di U in tutto A, e questo lo si vede
subito col seguente
Esempio 19.9. Nel suo insieme di definizione A = R2 \ {(0, 0)} il campo magnetico


y
x
,
2
x + y 2 x2 + y 2
generato da una corrente elettrica continua in un filo rettilineo passante per lorigine `e (regolarissimo
e) irrotazionale, ma non conservativo: il suo integrale di seconda specie

Z 
y
x
2
dx + 2
dy
x + y2
x + y2

73

sulla curva chiusa (t) = (cos t, sin t), 0 t 2 non vale 0 bens`
Z 2
(sin2 t + cos2 t) dt = 2.
0


E per`o nel caso C 1 lipotesi di chiusura della forma, o irrotazionalit`a del campo, diventa sufficiente per lesistenza di U in tutto A se si impone qualche restrizione sulla geometria di A: ad
esempio, lipotesi che A sia stellato rispetto ad un suo punto x0 , ovvero che, dato comunque x A,
tutto il segmento [0, 1] 3 t 7 (t) = x0 + t(x x0 ) sia contenuto in A16 . Allora infatti lipotesi
che sia chiusa in A implica che `e esatta in A. Dimostriamo questo risultato per N = 2 con A
stellato rispetto allorigine nel caso di un campo di forze irrotazionale (piano) F = (F1 , F2 ). Sia
Z
Z 1
U (x, y) =
F1 dx + F2 dy =
[F1 (tx, ty)x + F2 (tx, ty)y] dt.

Siccome F1 , F2 C 1 (A), possiamo applicare il teorema di derivazione degli integrali dipendenti da


un parametro, per cui
Z 1
Z 1
U (x, y)

=
[F1 (tx, ty)x+F2 (tx, ty)y] dt =
[(D1 F1 )(tx, ty)tx+F1 (tx, ty)+(D1 F2 )(tx, ty)ty] dt.
x
0 x
0
Dal momento che D1 F2 = D2 F1 per lipotesi di irrotazionalit`a, lultimo integrale qui sopra vale
Z 1
Z 1
[tF1 (tx, ty)]
[(D1 F1 )(tx, ty)tx)+(D2 F1 )(tx, ty)ty+F1 (tx, ty] dt =
dt = [tF1 (tx, ty)]10 = F1 (x, y).
t
0
0
Analogamente si vede che
U (x, y)
= F2 (x, y).
y
In generale, dunque, possiamo dire che in un qualunque aperto A lipotesi di chiusura di una
forma C 1 , o per N = 3 lipotesi di irrotazionalit`a di un campo di forze C 1 , pu`o non essere sufficiente
a garantire lesattezza della forma, o la conservativit`a del campo, in tutto A, ma `e senzaltro
sufficiente in ogni sottoinsieme di A che sia stellato rispetto a un suo punto; per`o pu`o anche
accadere che questultima condizione venga violata e che tuttavia il campo sia conservativo...
Esempio 19.10. Il campo magnetico, pur non essendo conservativo su tutto R2 \ {(0, 0)}, lo `e
in ogni sottoinsieme ottenuto privando R2 non solo del singolo punto {(0, 0)}, ma di unintera
semiretta uscente da tale punto: allora infatti laperto che si ottiene `e stellato rispetto a ogni
punto della semiretta opposta a . Ma questaltro campo


x
y
,
,
x2 + y 2 x2 + y 2
anchesso definito solo in R2 \ {(0, 0)}, vi `e globalmente conservativo, con potenziale log r. Il
fatto `e che esso rientra nella famiglia dei campi vettoriali radiali, cio`e della forma
r
r2n

r = (x, y)

per N = 2, r = (x, y, z)

16

per N = 3, r = krk

Casi particolarissimi: ogni prodotto cartesiano di intervalli `e stellato rispetto ad un qualunque suo punto; il piano
privato della semiretta x > 0 `e stellato rispetto ad un qualunque punto della semiretta x < 0 ma non lo `e rispetto
a nessun altro suo punto; eccetera.

74

(tra i quali `e importantissimo, in dimensione 3 con n = 1, il campo gravitazionale newtoniano),


che sono tutti conservativi in R2 \ {(0, 0)}, con potenziali
rn
n

per n 6= 0,

log r

per n = 0.


20

Lunghezza di una curva

La lunghezza di un segmento (x, y) di estremi x = (x1 , . . . , xN ) e y = (y 1 , . . . , y N ) `e la quantit`


a
v
uN
uX
kx yk = t (xi y i )2 ;
i=1

quella di una poligonale che ottiene agganciando uno dopo laltro un numero finito di segmenti
(xk , yk ) `e la somma delle lunghezze kxk yk k, e noi la indichiamo con `(). Se z `e un punto di
(x, y), cio`e z = x + (y x) per un ]0, 1[, la disuguaglianza triangolare vale col segno uguale:
kx yk = kx zk + kz yk.
Da ci`o segue che la lunghezza di (x, y) non varia se, invece che come un segmento, lo si considera
come la poligonale di vertici consecutivi x, z e y. Pi`
u in generale, dunque, la lunghezza di una
poligonale non varia se ai suoi vertici ne vengono aggiunti degli altri, non essenziali nel senso
appena detto.
Sia adesso data una curva semplice : [a, b] RN . Una poligonale inscritta in viene
costruita fissando una partizione a = t0 < t1 < < tn = b di [a, b] e agganciando consecutivamente
i segmenti ((tk1 ), (tk )), k = 1, ..., n. Diciamo che `e rettificabile se le lunghezze delle
poligonali inscritte in costituiscono un insieme limitato. In tal caso la lunghezza di `e
indicata con `() ed `e definita cos`:
`() = sup `( ).

Lipotesi che sia semplice non `e essenziale se non per fare in modo che la sua lunghezza possa
essere interpretata come lunghezza del suo sostegno.
Teorema 20.1. Se `e rettificabile ogni altra curva tale che = p per unopportuna funzione
reale continua ed invertibile p : [a, b] R `e a sua volta rettificabile ed ha la stessa lunghezza di .
DIM. Un numero finito di punti th distinti tra di loro determina una partizione di [a, b] se e solo
se i punti h = p(th ) sono distinti tra di loro e determinano una partizione di [c, d]. Dunque una
poligonale inscritta a `e una poligonale inscritta a , e viceversa.

Nelle considerazioni che abbiamo svolto finora non abbiamo fatto intervenire nessuna ipotesi di
regolarit`a delle curve in aggiunta a quella (di continuit`a) automaticamente garantita dalla definizione. Ma in un contesto cos` generale pu`o venir meno la rettificabilit`a, e perfino lunidimensionalit`
a.
Uno splendido esempio (troppo elaborato per essere presentato qui) `e la curva di Peano, il cui
sostegno `e lintero quadrato [0, 1]2 . Ma anche curve continue inequivocabilmente unidimensionali
possono non essere rettificabili:
75

Esempio 20.1. La curva piana (t) = (t, t sin(/2t)) per 0 < t 1, (0) = (0, 0) non `e rettificabile.
Sia
Pn infatti K un qualunque numero reale, e sia n = nK un numero naturale cos` grande che
j=2 1/j > K (divergenza della serie armonica). Sia poi la poligonale inscritta associata alla
partizione t0 = 0 < t1 = 1/n < t2 = 1/(n 1) < < tn = 1. Poiche


(j1)
sin j
sin
1
1

1
2
2
k(tj ) (tj1 )k

> , j = 2, ..., n,
= +
j
j1 j
j1
j
la lunghezza `( ) `e maggiore di K.

Passiamo a richiedere che la curva : [a, b] RN sia non pi`
u soltanto continua, bens` anche C 1
a tratti, dunque un cammino. Sia a = a0 < a1 < < am = b una partizione di [a, b] tale che 0 (t)
esista continua in ogni intervallo ]ah1 , ah [ ed ammetta limite in RN tanto quando t ah1 + 0 che
quando t ah 0. La norma k0 (t)k `e definita, limitata e continua in tutto [a, b] con leccezione
al pi`
u dei punti ah , dunque integrabile su [a, b] secondo Riemann.
Teorema 20.2. Ogni cammino : [a, b] RN `e rettificabile, e la sua lunghezza `e data dalla
formula
Z b
`() =
k0 (t)k dt.
(98)

cu4

DIM. Ci si convince facilmente che `e sufficiente dimostrare il presente enunciato per le restrizioni di
ai vari intervalli [ah1 , ah ] in cui essa `e una funzione di classe C 1 . Ma allora tanto vale supporre
direttamente che lo sia su tutto [a, b].
Per ogni partizione a = t0 < t1 < tn1 < tn = b la lunghezza della poligonale di vertici
(tk ) verifica


m Z tk
m

X
X


0 (t) dt
k(tk ) (tk1 )k =
`( ) =

tk1

k=1

k=1

m Z tk
X
k=1

grazie al Lemma 19.1 con

k0 (t)k dt =

tk1

k0 (t)k dt

al posto di . Dunque `e rettificabile, e la sua lunghezza verifica


b

Z
`()

k0 (t)k dt.

Daltra parte, dallidentit`


a
Z
Z

tk
tk


0 (tk ) dt =
k0 (tk )k dt

tk1

tk1
ricaviamo, maggiorando il primo membro con
Z
Z
Z
Z
tk
tk
tk

tk




0
0
0
0
(t) dt +
[ (tk ) (t)] dt
(t) dt +
k0 (tk ) 0 (t)k dt

tk1
tk1
tk1

tk1

76

(99)

cu6

e minorando il secondo membro con


Z
Z tk
k0 (t)k dt

k0 (tk ) 0 (t)k dt,

tk1

tk1

che

tk

Z
Z
Z tk

tk
tk


0
k0 (t)k dt 2
(t) dt
k0 (tk ) 0 (t)k dt.


tk1
tk1
tk1

(100)

cu7

Il primo membro della (100) `e la quantit`a k(tk ) (tk1 )k, e passando alla somma su k si ottiene
la lunghezza della poligonale determinata dalla partizione. Fissiamo > 0 e determiniamo
= > 0 tale che k0 ( ) 0 (t)k < per t, in [a, b] con |t | < (uniforme continuit`a di 0 (t)
su [a, b]). Per i tk tali che tk tk1 < otteniamo
b

Z
`( )

k0 (t)k dt 2(b a)

e insieme alla (99) questo dimostra il teorema.



Il secondo membro della (98) `e lintegrale di prima specie su della funzione identicamente
uguale ad 1.
Esempio 20.2. Il grafico di una funzione reale f C 1 ([a, b]) `e rettificabile, e la sua lunghezza vale
Rbp
1 + [f 0 (x)]2 dx.
a

Limitiamoci a di classe C 1 in [a, b]. La lunghezza
Z
s(t) =

k0 ( )k d

della ristretta ad [a, t], dove t [a, b], `e una funzione detta ascissa curvilinea, che verifica
ds
= k0 (t)k.
dt
Questo spiega la notazione adottata per gli integrali curvilinei di prima specie. La s(t) `e una
funzione iniettiva di classe C 1 su [a, b]: la sua inversa t = t(s), di classe C 1 sullintervallo [0, `()],
fornisce una nuova curva [0, `()] 3 s 7 (t(s)) equivalente alla [a, b] 3 t 7 (t).

21

La formula di GaussGreen

Siano date due funzioni reali continue , : [a, b] R con < su ]a, b[, dove < a < b < .
Indichiamo con K luno o laltro dei due domini normali definiti a partire da f e g, cio`e o
{(x, y) R2 | a x b, (x) y (x)}

77

(101)

7.1

oppure
{(x, y) R2 | a y b, (y) x (y)}.

(102)

7.2

Se K `e il dominio (101) la sua frontiera `e il sostegno del cammino chiuso ottenuta agganciando
consecutivamente: la curva y = (x), a x b; il segmento (che pu`o anche ridursi ad un punto)
x = b, (b) y (b); lopposta della curva y = (x), a x b; lopposto del segmento (che pu`
o
anche ridursi ad un punto) x = b, (a) y (a). Considerazioni del tutto analoghe valgono per
K dato dalla (102).
Aggiungiamo lipotesi che e siano di classe C 1 su [a, b]. Per semplificare la terminologia
diciamo che i domini (101) e (102) sono adesso, rispettivamente, di tipo I e di tipo II. In entrambi
i casi la frontiera K di K `e sostegno di un cammino che orientiamo in senso antiorario e denotiamo
con +K. Per fissare le idee, sia K dato da (101). In ogni punto di K ad eccezione di (a, (a)),
(a, (a)), (b, (b)) e (b, (b)) sono definiti:
il versore tangente positivo a +K, che indichiamo con , uguale a
(1, 0 (x))
p
1 + 0 (x)2
(1, 0 (x))
p
1 + 0 (x)2

nei punti (x, (x)) con a < x < b,

nei punti (x, (x)) con a < x < b,

nonche a (0, 1) nei punti (a, y) con (a) < y < (a) (se ce ne stanno), (0, 1) nei punti (b, y)
con (b) < y < (b) (se ce ne stanno);
il versore normale esterno a K, che indichiamo con e , uguale a
( 0 (x), 1)
p
1 + 0 (x)2

nei punti (x, (x)) con a < x < b,

(0 (x), 1)
p
1 + 0 (x)2

nei punti (x, (x)) con a < x < b,

nonche a (1, 0) nei punti (a, y) con (a) < y < (a) (se ce ne stanno), (1, 0) nei punti (b, y)
con (b) < y < (b) (se ce ne stanno).
Prolunghiamo e a tutto R conservando la loro regolarit`a C 1 e ancora una volta, per fissare
le idee, prendiamo come K il dominio (101). Se A `e un aperto che contiene K, questultimo `e
contenuto nellunione di rettangoli aperti I]c, d[ con
[a, b] [c, d] A,
t7.1

c < (x), (x) < d

x I.

(103)

7.3

Teorema 21.1. Sia K uno dei due aperti (101) o (102) e siano L, M due funzioni continue, nonche
dotate di derivate parziali Ly , Mx anchesse continue, in un aperto A K. Risulta
Z
Z
(Mx Ly ) dxdy =
L dx + M dy.
(104)

7.4

+K

DIM. Sia K il dominio di tipo I dato dalla (101). Per la formula di riduzione degli integrali doppi
ed il teorema fondamentale del calcolo integrale risulta
Z
Z b
Z (x)
Z b
Z
Ly dxdy =
dx
Ly (x, y) dy =
[L(x, (x)) L(x, (x))] dx =
L dx. (105)
K

(x)

+K

78

7.5

Per ogni scelta di I, c, d tali che che sia soddisfatta la (103), si applica il Teorema 7.3 alla
funzione
Z (x)
M (x, y) dy
x 7 (x) =
(x)

nei punti x I e si ottiene lidentit`


a
d
(x) =
dx
0

(x)

(x)

M (x, y) dy =

Mx (x, t) dt + M (x, (x)) 0 (x) M (x, (x))0 (x),

(x)

(x)

che viene dunque ad essere valida in ogni punto x [a, b]. Integrandola su [a, b] otteniamo
Z

(b)

(a)

(b)

Z
M (a, y) dy

M (b, y) dy

Mx (x, y) dy
(x)

(x)

dx

Mx dxdy =
Z

[M (x, (x)) 0 (x) M (x, (x))0 (x)] dx

(a)

Z
=

M dy,
+K

dove la differenza dei due integrali in dy del 3o membro `e (b) (a).


Da qui e da (105) segue la (104).
Lo stesso discorso vale per K dato dalla (102).

La (104) `e la formula di GaussGreen. Unaltra maniera di scriverla si ottiene osservando
che Mx Ly `e la terza componente del rotore del campo vettoriale F(x, y) = (L(x, y), M (x, y), 0),
mentre il secondo membro della (104) `e la somma dei seguenti quattro addendi:
#
Z b"
p
1
0 (x)
L(x, (x)) p
+ M (x, (x)) p
1 + 0 (x)2 dx,
0 (x)2
0 (x)2
1
+

1
+

a
#
Z b"
p
1
0 (x)
L(x, (x)) p
+ M (x, (x)) p
1 + 0 (x)2 dx,
0 (x)2
0 (x)2
1
+

1
+

a
Z (a)
Z (b)
M (a, y)(1) dy e
M (b, y) 1 dy.
(a)

(b)

Ma allora la (106) si pu`


o riscrivere come
Z
Z
(rot F) k dxdy =
K

F ds.
K

Nel secondo membro la scelta dellorientazione sulla frontiera di K, che non pu`o tradursi nel verso
di percorrenza sul cammino di integrazione dellintegrale di prima specie, dal momento che questultimo ne `e indipendente (e infatti abbiamo soppresso il segno +), compare invece nella funzione
integranda, dove il versore tangente `e orientato seguendo il verso antiorario di percorrenza del
cammino.
Diamo una formulazione equivalente della formula di GaussGreen prendendo una funzione
vettoriale continua G = (P, Q) : A R2 con derivate Px , Qy anchesse continue in A. Per L
79

uguale ad Q e M ad P , dunque Mx Ly uguale alla divergenza div G = (Px , Qy ), la (104)


diventa
Z
Z
Q dx + P dy.
(106)
div G dxdy =

7.6

+K

Il secondo membro della (104) `e la somma dei seguenti quattro addendi:


#
Z b"
p
1
0 (x)
+ Q(x, (x)) p
P (x, (x)) p
1 + 0 (x)2 dx,
0 (x)2
0 (x)2
1
+

1
+

a
#
Z b"
p
1
0 (x)
+ Q(x, (x)) p
1 + 0 (x)2 dx,
P (x, (x)) p
1 + 0 (x)2
1 + 0 (x)2
a
Z (a)
Z (b)
P (a, y)(1) dy e
P (b, y) 1 dy.
(a)

(b)

Ma allora la (106) si pu`


o riscrivere come
Z
Z
div G dxdy =
K

G e ds.

(107)

Nel secondo membro la scelta dellorientazione sulla frontiera di K `e realizzata dal versore normale,
che `e precisamente quello esterno e e non il suo opposto. La variante (107) della formula di Green
esprime, sotto le ipotesi che abbiamo dato, il Teorema della divergenza.
Indichiamo con K il cerchio di centro lorigine e raggio 1. Si tratta s` di un dominio normale,
ma non di tipo I ne di tipo II, perche le funzioni
p
p
[1, 1] 3 x 7 1 x2 , [1, 1] 3 y 7 1 y 2
non sono di classe C 1 . Per`
o domini quali

K1 = {(x, y) R2 | x2 + y 2 1, x 1/ 2}
e

K2 = {(x, y) R2 | x2 + y 2 1, x 1/ 2}

sono di tipo II (non di tipo I), mentre

K3 = {(x, y) R2 | x2 + y 2 1, 1/ 2 x 1/ 2}
`e di tipo I (non di tipo II). K `e unione dei Kj , e la sua frontiera, con lorientazione indotta da
quelle delle +Kj , diventa una curva orientata che indichiamo con +K. (Naturalmente avremmo
potuto pi`
u semplicemente dire che +K `e la circonferenza unitaria orientata in senso antiorario,
per`o in tal modo non avremmo suggerito una procedura di portata generale.) Se le funzioni L ed
M sono continue, con Ly e Mx anchesse continue, in un aperto contenente K si pu`o applicare la
formula di GaussGreen su ogni Kj ed ottenere
Z
(Mx Ly ) dxdy =
K

j=1

3 Z
X
j=1

3 Z
X

(Mx Ly ) dxdy

Kj

Z
L dx + M dy =

+Kj

L dx + M dy
+K

80

7.7

R
grazie alla cancellazione reciproca dei contributi negli +Kj L dx + M dy dei segmenti verticali
delle Kj . Lultimo membro si pu`
o adesso scrivere come un integrale sulla curva [0, 2] 3 t 7
(cos t, sin t).
Le considerazioni appena svolte per il cerchio si generalizzano ad ogni dominio K di cui si
possa dare, mediante intersezioni con opportune rette verticali ed orizzontali, una decomposizione
in un numero finito di sottodomini di tipo I o II privi due a due di punti interni in comune; le
frontiere dei sottodomini orientate positivamente inducono automaticamente sulla frontiera di K
una orientazione (positiva per definizione). Diciamo allora che K `e ammissibile, e il Teorema 21.1
ammette il seguente
Corollario 21.1. La formula di GaussGreen vale in ogni dominio ammissibile K per funzioni L
ed M continue, con Ly e Mx anchesse continue, in un aperto contenente K.
Lenunciato precedente si trasforma in un attimo nella sua variante per il Teorema della divergenza.
Esempio 21.1. Se un triangolo ha un lato verticale `e un dominio di tipo I, se ne ha uno orizzontale
`e un dominio di tipo II. Peraltro `e facile decomporre un qualunque triangolo nellunione di due
triangoli con un lato verticale oppure con uno orizzontale in comune. Ne segue che ogni triangolo
`e un dominio ammissibile.

Esempio 21.2. Una corona circolare `e ammissibile, e lorientazione positiva sulla sua frontiera induce il verso di percorrenza antiorario sulla circonferenza maggiore, quello orario sulla circonferenza
minore.

Esempio 21.3. Se ad un dominio normale di tipo I o II si toglie un disco aperto la cui chiusura sia
contenuta allinterno del dominio si ottiene un dominio ammissibile (unione di 8 domini normali di
tipo I oppure II). Da qui si arriva facilmente a generalizzare lEsempio 7.2 della corona circolare,
mostrando che `e ammissibile un disco chiuso privato di un disco aperto con la chiusura contenuta
allinterno del disco di partenza.

Osservazione 21.1. Prendendo una volta L(x, y) = 0, M (x, y) = x e laltra L(x, y) = y,
M (x, y) = 0 otteniamo per larea di un dominio ammissibile K le espressioni
Z
Z
v2 (K) =
x dy =
y dx.
+K

+K


Spesso, nelle applicazioni, quella che viene data esplicitamente `e una curva semplice e chiusa su
cui bisogna calcolare un integrale di seconda specie: se si vuole ricorrere alla formula di GaussGreen
nella formulazione data qui col Teorema 21.1 (tante altre, naturalmente, se ne possono trovare!)
bisogna mostrare innanzitutto che il sostegno di `e la frontiera di un dominio ammissibile K, e
poi che lintegrale su `e uguale a quello su +K.

81

22

Serie di funzioni

P
e
Data una successione di funzioniP
fk definita in un intervallo I, le associamo la serie
n=1 fk , cio`
che
ogni
successione
{g
}
di
funzioni
la successione delle ridotte Fn = nk=1 fk (e si tenga presente
n
P
(g

g
)).
Diciamo
che la serie
`e a sua volta la successione delle ridotte della serie g1 +
k+1
k
k=1
delle fn `e uniformemente convergente in I se `e tale la successione delle Fn . Utilizzando la
(37) scriviamo subito il criterio di Cauchy che fornisce la condizione necessaria e sufficiente per la
convergenza uniforme della serie: dato comunque > 0 esiste = N tale che
n+p

X



fk (x) per x I, n , p N
(108)



k=n+1

ovvero

n+p

X



sup
fk (x) per n , p N.

xI
k=n+1

Il trasporto del Teorema 8.1 dalle successioni alle serie `e immediato.


tser

Teorema 22.1. (i) Se le funzioni fk : I R sono continue in un punto x0 I e la loro serie


converge uniformemente in I, allora anche la somma della serie `e una funzione continua in x0 .
(ii) Se le funzioni fk : I R sono continue in ogni punto di I e la loro serie converge
uniformemente in I, allora la somma della serie (continua in I grazie a (i)) verifica
Z bX

Z b
X
fk (x) dx =
fk (x) dx
a k=1

k=1

per ogni scelta di a, b I.


P
(iii) Se le funzioni fk : I R sono di classe C 1 in I con
k=1 fk (x0 ) convergente per qualche
scelta di x0 I e la serie delle fk0 uniformemente convergente in I, allora la serie delle fk converge
in tutto I ed ha per somma una funzione di classe C 1 , con

k=1

k=1

X dfk
d X
fk (x) =
(x)
dt
dt

per x I.

Nellambito delle serie di funzioni si introduce


una nozione che non ha controparte in quello
P
delle successioni
P di funzioni. Diciamo che k=1 fk converge totalmente in I se esiste una serie
convergente
n=1 Ak di costanti reali non negative tali che
|fk (x)| Ak

per x I,
P
il che P
equivale alla convergenza della serie numerica k supxI |fk (x)| maggiorata termine a termine
dalla
n=1
PAk . La convergenza totale su I implica in ogni punto
P x di I la convergenza della serie
numerica k |fk (x)|, cio`e la convergenza assoluta della serie k fkP
(x). Ma c`e di pi`
u. Grazie alla
condizione di Cauchy soddisfatta dalla serie numerica convergente
A
ed
alle
disuguaglianze
k=1 k
n+p

n+p
n+p
X

X
X


fk (x)
|fk (x)|
Ak per x I



k=n+1

k=n+1

k=n+1

si vede subito che una serie totalmente convergente soddisfa la condizione uniforme di Cauchy (108)
e quindi converge uniformemente su I. Insomma, la convergenza totale implica quella uniforme.
82

causer

P
k
Per`o non vale il viceversa: in I = R la serie numerica
k=1 (1) /k, che converge grazie ad un
criterio di Leibniz, essendo una serie di funzioni costanti, `e uniformemente convergente, ma non
converge assolutamente e quindi neanche totalmente. Ma in un intervallo I una serie di funzioni pu`
o
convergere sia uniformemente che assolutamente senza convergere totalmente. Questo si verifica
ad esempio, di nuovo in I = R, fissando una successione di intervalli compatti Jk 6= due a due
disgiunti e prendendo come fk la funzione caratteristica di Jk moltiplicata per 1/k: la convergenza
assoluta `e ovvia e quella uniforme segue dallidentit`a
sup

n+p
X

xR k=n+1

1
1
1Jk (x) =
,
k
n+1

mentre la convergenza totale viene meno perche


1
1
sup 1Jk (x) = .
k
k
xR

23

Serie di potenze

Tra le serie di funzioni sono particolarmente importanti le serie di potenze

an (x x0 )n

(109)

serpo1

n=0

di coefficienti an R e punto iniziale x0 (col solito abuso di notazione (x x0 )0 = 1 anche


quando x = x0 ). Lo studio della (109) pu`o essere ricondotto, semplicemente sostituendo x con
x + x0 per andare in un verso e con x x0 per tornare indietro, a quello delle serie di potenze

an xn

(110)

n=0

di punto iniziale 0, apparentemente meno generale.


Il primo esempio che viene, o deve venire, in mente `e quello della serie geometrica

xn

n=0

(coefficienti tutti uguali ad 1, punto iniziale lo 0) che converge, ed ha per somma 1/(1 x), se e
solo se |x| < 1.
Naturalmente la (109) converge sempre almeno nel punto iniziale; quando
P la successione dei
coefficienti `e limitata il confronto della serie dei moduli con la serie geometrica (supn |an |)|xx0 |n
mostra subito che la (109) converge assolutamente per |x x0 | < 1.
Se la (109) converge assolutamente in un punto x1 si vede subito col confronto che la convergenza
`e totale per |x x0 | |x1 x0 |. In altri termini:
Lemma 23.1. La convergenza assoluta della (109) in x1 6= x0 `e equivalente alla convergenza totale
in tutto lintervallo chiuso [x0 r, x0 + r] con r = |x1 x0 |.
83

serpo2

Per capire cosa si pu`


o dedurre dalla sola convergenza semplice in un punto ci si serve del
Lemma 23.2. (di Abel) La convergenza semplice della (109) in x1 6= x0 implica la convergenza
assoluta per |x x0 | < |x1 x0 |, cio`e quella totale in ogni intervallo chiuso [x0 %, x0 + %] con
% < |x1 x0 |.
DIM. Per semplificare le notazioni prendiamo x0 = 0. Dalla convergenza della (110) con x1 al posto
di x segue che la successione degli addendi `e (infinitesima, dunque) limitata: |an xn1 | K < per
ogni n. Dunque
n
n

x
n
n x
|an x | = |an x1 | n K
per n N,
x1
x1
P
n
e la convergenza della serie
n=0 |an x | segue dalla convergenza della serie geometrica di ragione
|x/x1 | < 1.

abel

Osservazione 23.1. La convergenza semplice della (109) in x1 6= x0 ha unulteriore, importante


implicazione, che qui non dimostriamo: la convergenza uniforme su tutto il segmento chiuso che
congiunge x0 e x1 .

Associamo ora ad ogni serie (109) linsieme E dei reali positivi o nulli % tali che la (109) converga
assolutamente per |x x0 | %, e quindi totalmente in [x0 %, x0 + %] se % > 0. Tale insieme non
`e vuoto poich`e contiene almeno il suo estremo inferiore % = 0; inoltre `e un intervallo, perche se
contiene un % > 0 contiene anche, banalmente, ogni %0 [0, %[. Il suo estremo superiore r, che pu`
o
essere tanto un numero reale positivo o nullo quanto , `e chiamato raggio di convergenza (della
serie). Dunque:
se r > 0 e |x1 x0 | < r la serie converge assolutamente in x1 ;
se la serie converge in x1 , e quindi converge assolutamente per |x x0 | < |x1 x0 |, devessere
|x1 x0 | r, per cui quando r < la serie non pu`o convergere in nessun punto x1 con |x1 x0 | > r.
Non `e detto che r E, cio`e non `e detto che la (109) converga assolutamente, o anche solo
semplicemente, in tutto lintervallo chiuso |x x0 | r. Quello che si pu`o affermare in generale `e
contenuto nel

tser1

Teorema 23.1. Se r `e il raggio di convergenza della (109) la serie converge assolutamente in ogni
punto dellintervallo aperto ]x0 r, x0 + r[, cio`e totalmente in ogni intervallo chiuso [x0 %, x0 + %]
con % < r (dove ci si limita al caso significativo r > 0), mentre non converge in nessun punto fuori
dellintervallo chiuso [x0 r, x0 + r] (nel caso r < ).
Esempio 23.1. Se la successione {an } dei coefficienti della serie (109) `e limitata il raggio di
convergenza della serie `e 1.

Diciamo che lintervallo di convergenza della serie (109) `e ]x0 r, x0 + r[ se 0 < r < ,
tutto R se r = .
Il Teorema 23.1 ammette il seguente
Corollario 23.1. Se il raggio di convergenza di r della serie di potenze (109) `e > 0 la somma f (x)
della serie `e una funzione continua allinterno del disco di convergenza.
84

DIM. In tutto lintervallo [x0 %, x0 + %] con |x x0 | = % < r la f `e continua grazie al Teorema


22.1 perche la convergenza della (109) `e totale e quindi uniforme.

Come si fa a calcolare il raggio di convergenza? Quando `e possibile, applicando puntualmente
il criterio del rapporto alla serie numerica dei moduli, nel senso del prossimo risultato.
Teorema 23.2. Se esiste L = limn |an+1 |/|an | (nellipotesi che gli an siano definitivamente
6= 0) il raggio di convergenza della (109) `e uguale a 0 se L = , a se L = 0 e ad 1/L se
0 < L < . Stesse conclusioni se esiste il limn |an |1/n = L.
DIM. Limitiamoci al caso del rapporto per x0 = 0, 0 < L < . Se |x| < 1/L il limn |an+1 xn+1 |/|an xn |
`e < 1, e quindi la serie (110) converge assolutamente, mentre se |x| > 1/L il limn |an+1 xn+1 |/|an xn |
`e > 1, e quindi la (110) non converge.

rag

Esempio 23.2. I raggi di convergenza delle serie

X
xn

n!xn ,

n=0

n=0

n!

X
xn
n

n=0

valgono
0, , 1. Soffermiamoci sulla terza serie.
> 1 la serie numeP rispettivamente
P Quando
n

rica
1/n converge, e quindi la convergenza assoluta della n x /n ha luogo nella chiusura
dellintervallo di convergenza, cio`e per |x| 1. Quando invece < 1 si ha convergenza assoluta
solo per |x| < 1; per x = 1 non si ha mai neppure convergenza semplice, mentre, se `e positivo,
si ha convergenza semplice! per x = 1 grazie al criterio di Leibniz, e quindi anche (cfr.
lOsservazione 23.1) convergenza uniforme in [0, 1].

therag

Teorema 23.3. Le serie

nan (x x0 )n1 ,

n=1

e in generale

n(n 1)an (x x0 )n2

n=2

n(n 1) (n k + 1)an (x x0 )nk

n=k

hanno tutte lo stesso raggio di convergenza della serie (109).


DIM. Per semplificare le notazioni prendiamo
P x0 = 0.n1Indichiamo con r il raggio di convergenza
0
della serie (110) e con r quello della serie n=1 nan x
, o, ci`o che `e lo stesso (basta moltiplicare
in un senso, e dividere nellaltro, per x 6= 0), della serie

nan xn .

(111)

n=1

In ogni punto x dove questultima converge assolutamente deve convergere assolutamente anche la
(111), grazie alla disuguaglianza |an ||x|n n|an ||x|n . Dunque r0 r. Adesso supponiamo r > 0 e
85

serpo3

mostriamo che la (111) converge assolutamente per |x| < r, dal che seguir`a r0 = r. Indichiamo con
% un numero reale compreso in senso stretto tra |x| e r. Siccome la serie di partenza converge in %,
e di conseguenza |an |%n 0, il secondo membro della disuguaglianza
n
x
n
n|an ||x| n |an |%n
%
P
`e maggiorato definitivamente dal termine generico della serie convergente ntn con 0 t = |x|/% <
1. Ne segue che la (111) converge assolutamente per |x| < r.
P
n1 `
e uguale ad r. Da
Abbiamo dunque mostrato che il raggio di convergenza della
n=1 nan x
qui segue subito anche il risultato per k qualunque.

Grazie al precedente teorema abbiamo che, indicata con f (x) la somma della serie (109),
questultima ha il coefficiente an di indice n dato dallespressione
an =

f (n) (x0 )
n!

e quindi coincide con la serie di Taylor

X
f (n) (x0 )
n=0

n!

(x x0 )n

(112)

serta1

(113)

serta2

o in particolare, se x0 = 0, di Maclaurin

X
f (n) (0)
n=0

n!

xn

di f (x).
Osservazione 23.2. Quando 0 < r < il Teorema 3.1 non dice nulla a proposito del comportamento della serie sulla frontiera dellintervallo di convergenza, e come abbiamo visto nellEsempio
23.2 la risposta andr`
a trovata caso per caso.


24

Serie di Taylor e Maclaurin

In Analisi I gi`
a si incontrano delle serie di Taylor o in particolare di Maclaurin delle funzioni f di
classe C in un intorno del punto iniziale. Nei vari esempi che allora sono stati studiati soltanto
dal punto di vista della convergenza puntuale non `e difficile in effetti determinare quelli che sono,
come sappiamo adesso, i rispettivi intervalli di convergenza. Ecco un rapido riepilogo.

86

Esempio 24.1. Lo sviluppo di Maclaurin di ex arrestato allordine n `e


ex =

n
X
xk
k=0

k!

+ Rn (x)

con

per x R

xn+1
e
(n + 1)!

Rn (x) =

per un opportuno compreso tra 0 ed x. Dalla disuguaglianza


|x|n+1 |x|
e
(n + 1)!

|Rn (x)|

segue che Rn (x) 0 per n quale che sia x R. Quindi il raggio di convergenza `e , e vale
lo sviluppo in serie di Maclaurin
ex =

X
xk
k=0

k!

per x R.

(114)


Esempio 24.2. Lo sviluppo di Maclaurin di sin x arrestato allordine 2n + 2 `e


sin x =

n
X

(1)k

k=0

x2k+1
+ R2n+2 (x)
(2k + 1)!

con
|R2n+2 (x)|

per x R

|x|2n+3
.
(2n + 3)!

Dunque R2n+2 (x) 0 per n quale che sia x R: il raggio di convergenza `e , e vale lo
sviluppo in serie di Maclaurin
sin x =

(1)k

k=0

x2k+1
(2k + 1)!

per x R.


Esempio 24.3. Lo sviluppo di Maclaurin di cos x arrestato allordine 2n + 1 `e


cos x =

n
X

(1)k

k=0

x2k
+ R2n+1 (x)
(2k)!

con
|R2n+1 (x)|

per x R

|x|2n+2
.
(2n + 2)!

Dunque R2n+1 (x) 0 per n quale che sia x R: il raggio di convergenza `e , e vale lo
sviluppo in serie di Maclaurin

X
x2k
cos x =
(1)k
(2k)!
k=0

87

per x R.

serta3


Esempio 24.4. Integrando da 0 fino ad un qualunque x > 1 lidentit`a
1
tn+1
= 1 t + t2 + (1)n tn + (1)n+1
1+t
1+t
otteniamo

x2 x3
xn+1
+
+ + (1)n
+ Rn+1 (x),
2
3
n+1

log(1 + x) = x
dove

n+1

Rn+1 (x) = (1)

tn+1
dt
1+t

soddisfa
|Rn+1 (x)|

|x|n+2
se 1 < x < 0,
(n + 2)(1 + x)

|Rn+1 (x)|

xn+2
se x 0.
n+2

Ne segue lo sviluppo in serie di Maclaurin


log(1 + x) =

(1)n+1

n=1

xn
n

per 1 < x < 1: il raggio di convergenza `e 1. Per x = 1 il secondo membro converge semplicemente
a log 2, dal momento che
1
|Rn+1 (1)|
n+2
e anzi in [0, 1] la convergenza, senza essere totale, `e per`o uniforme.

Esempio 24.5. Integrando da 0 fino ad un qualunque x lidentit`a
2n+2
1
2
4
n 2n
n+1 t
=
1

t
+
t

+
(1)
t
+
(1)
1 + t2
1 + t2

otteniamo

x3 x5
x2n+1
+
+ + (1)n
+ R2n+1 (x),
3
5
2n + 1
Z x 2n+2
t
R2n+1 (x) = (1)n+1
dt
2
0 1+t

arctan x = x
con

e quindi
Z
|R2n+1 (x)|
0

|x|

t2n+2
dt
1 + t2

|x|

t2n+2 dt =

Ne segue lo sviluppo di Maclaurin dellarcotangente


arctan x =

(1)n

n=0

88

x2n+1
2n + 1

|x|2n+3
.
2n + 3

per |x < 1: il raggio di convergenza `e 1. Per x = 1 il secondo membro converge semplicemente a


arctan 1, dal momento che
1
|R2n+1 (1)|
,
2n + 3
e anzi in [0, 1] la convergenza, senza essere totale, `e per`o uniforme. Abbiamo cos` ottenuto la celebre
identit`a

X (1)n
=
.
4
2n + 1
n=0


Ricordiamo che in un punto x dellintervallo di convergenza la somma della (112) o della(113)
2
pu`o anche non essere il valore f (x) assunto dalla funzione di partenza: la funzione che vale e1/x
per x 6= 0 e 0 per x = 0, di classe C su R, coincide solo nellorigine con la somma della sua serie
di Maclaurin, che `e la funzione identicamente nulla.
Grazie al Teorema 22.1 (iii) di derivazione delle serie di funzioni di una variabile reale siamo
in grado di tornare indietro, dalle serie di potenze reali alle serie di Taylor, nel senso del prossimo
risultato.
Teorema 24.1. Se la serie (109) ha raggio di convergenza r > 0 la somma
f (x) =

an (x x0 )n

(115)

serta4

n=0

`e di classe C nel suo intervallo di convergenza, e la serie di Taylor di punto iniziale x0 della f `e
il secondo membro della (112), ovvero
an =
DIM. La serie

f (n) (x0 )
.
n!

nan (x x0 )n1

(116)

n=1

`e ottenuta derivando termine a termine la (109) rispetto ad x. Dal Teorema 23.3 sappiamo che
r `e anche il raggio di convergenza della (116), quindi che questultima converge totalmente e di
conseguenza uniformemente in [x0 %, x0 + %] per ogni % < r. Ma allora segue dal Teorema 22.1
(iii) che la somma della serie (116) `e la derivata f 0 (x) della somma f (x) della serie (109): questo `e
vero in ogni punto x ]x0 r, x0 + r[, come si vede prendendo % compreso strettamente tra |x x0 |
ed r.
Cos procedendo si dimostrano per ogni k le identit`a
f

(k)

(x) =

n (n k + 1)an (x x0 )nk

per |x x0 | < r.

n=k

In particolare, prendendo x = x0 si ottiene an = f (n) (x0 )/n! e si riscrive la (115) come


f (x) =

X
f (n) (x0 )
n=0

n!

89

(x x0 )n .

serta5

25

Una prima separazione delle variabili

secI1-4

Studiamo lequazione differenziale


y 0 = a(t)y

(117)

I-4.1

con a(t) funzione reale continua in un intervallo aperto I R. La funzione identicamente nulla `e
soluzione di questa equazione. Prendiamo y 6= 0 e operiamo nella (117) una separazione delle
variabili attraverso lutilizzo a prima vista un po disinvolto della notazione di Leibniz
dy/dt = y 0 :
dy
a(t) dt.
y
In effetti per il primo membro di questa identit`a ha perfettamente senso come forma differenziale, e
da tale punto di vista ne vedremo una generalizzazione tra breve. Qui per`o va benissimo riscriverlo
semplicemente sotto forma integrale:
Z
Z
dy
= a(t)dt
y
ovvero
log |y| = A(t) + K

(118)

I-4.2

con K costante e A(t) primitiva di t 7 a(t) in I. La (118) `e una famiglia di equazioni cartesiane
in I] , 0[ e in I]0, [. Risolvendo rispetto a y troviamo per ogni scelta di C(= eK ) non
nulla la soluzione
y(t) = CeA(t) , t I,
sempre diversa da 0. Prendendo C = u0 eA(t0 ) in questa espressione otteniamo la condizione
y(t0 ) = u0 ,

(119)

I-4.4

con t0 fissato in I e u0 in R \ {0}, ricavando cos` per il problema di Cauchy (117),(119) lunica
soluzione
Rt
a( ) d
y(t) = u0 e t0
,
(120)

I-4.3

e in questa espressione rientra anche lunica soluzione dellequazione che in qualche punto t0 assuma
il valore u0 = 0, cio`e la funzione identicamente nulla.
Passiamo allequazione non omogenea
y 0 = a(t)y + f (t)

(121)

con f (t) anchessa continua da I in R. Indichiamo con y1 (t) il secondo membro della (120) per
u0 = 1 e riprendiamo la tecnica della variazione delle costanti. Affinche una funzione y(t), che
scriviamo come prodotto v(t)y1 (t), soddisfi la (121) in I, ovvero la quantit`a
y 0 (t) a(t)y(t) = [D a(t)][v(t)y1 (t)] = v 0 (t)y1 (t)
sia uguale a f (t), `e necessario e sufficiente che v 0 (t) sia uguale a f (t)/y1 (t). Questa richiesta
individua v(t) a meno di una costante additiva reale:
Z

v(t) = K +
t0

f (s)
ds = K +
y1 (s)
90

e
t0

Rs
t0

a( ) d

f (s) ds

I-4.5

(t0 , t I). Abbiamo cos` mostrato che la (121) `e dotata delle infinite soluzioni che si ottengono
facendo variare K nella somma
Z t R
 R
Z t R
Rt
Rt
t
t
a( ) d
a( ) d
a( ) d
ts a( ) d
t
t
t
0
0
0
0
+
e s a( ) d f (s) ds
(122)
= Ke
+
e
f (s) ds e
Ke

I-4.6

t0

t0

dellintegrale generale dellomogenea (117) e di un integrale particolare della non omogenea stessa.
(Ai fini del calcolo nei casi concreti si fa prima ad ottenere una soluzione particolare della
(121) ripercorrendo il procedimento con cui `e stata ottenuta la funzione ausiliaria v(t) che non ad
applicare lespressione (122).)
Ponendo K = u0 nella (122) si ottiene la soluzione del problema di Cauchy (121),(119) (ovviamente unica, perche la differenza di due soluzioni `e la costante nulla, unica soluzione di (117) che
si annulla in un punto t0 ).

26

La separazione della variabili in generale

secI-5

Il metodo che adesso presentiamo consente (almeno in via teorica) la risoluzione esplicita di unequazione differenziale non lineare della forma
y 0 = a(t)b(y)

(123)

I-5.1

dove a(t) `e continua in un intervallo aperto I e b(y) in un intervallo aperto U . Si tratta di


unequazione a variabili separabili perche si riscrive
dy
a(t) dt = 0.
b(y)
Sotto forma integrale:
Z

dy
=
b(y)

Z
a(t) dt

ovvero
B(y) = A(t) + K

(124)

I-5.2

dove K `e una costante, A(t) una primitiva di t 7 a(t) in I e B(y) una di y 7 [b(y)]1 in un
sottointervallo ]c, d[ di U dove b(y) 6= 0. La (124) `e una famiglia di equazioni cartesiane in I]c, d[
che per ogni scelta di un ammissibile valore di K possiamo risolvere rispetto a y (grazie alla
monotonia di B(y), la cui derivata b(y) `e sempre > 0 o sempre < 0 per come `e stato preso ]c, d[),
ottenendo lunica soluzione
y(t) = B 1 (A(t) + K) per t J
(125)

I-5.3

con J sottointervallo aperto di I (dipendente da K); con laggettivo in corsivo intendiamo semplicemente dire che, affinche il secondo membro dellidentit`a abbia senso, A(t) + K deve variare in
B(]c, d[) per ogni t J. Aggiungendo poi alla (123) la condizione di Cauchy (119) con t0 I e
u0 ]c, d[ si trova una e una sola soluzione y(t): quella data dalla (125) con K = B(u0 ) A(t0 ),
valore ammissibile perche A(t) + K, dal momento che vale B(u0 ) per t = t0 , resta nellintervallo
aperto B(]c, d[) al variare di t in un conveniente intervallo aperto 3 t0 .
Fin qui non abbiamo fatto altro che estendere lo stesso approccio gi`a applicato allequazione
lineare omogenea (117), la quale rientra nella (123) per b(y) = y, U = R. Ma tale estensione non
pu`o sempre procedere oltre, come ora passiamo ad illustrare.
91

Cosa succede, innanzitutto, se U contiene punti u1 dove b(y) si annulla, per cui la soluzione
costante y(t) = u1 soddisfa lequazione e quindi, banalmente, il corrispondente problema di Cauchy?
Quando b(y) = y abbiamo potuto mostrare che la funzione costante y(t) = 0 `e lunica soluzione
dellequazione che in un qualche prefissato punto t0 di I vale 0, e ci`o `e come dire che una soluzione
della (117) o coincide identicamente con la costante nulla oppure non la incontra mai. Invece nel
caso generale, diciamo con u1 = 0, non si pu`o escludere che una soluzione non identicamente nulla
vada a coincidere da un certo punto in poi con lo 0, come mostra il prossimo esempio.
Esempio 26.1. Lequazione
y 0 = |y|1/2
`e a variabili separabili con I = U = R. Cerchiamo una soluzione y(t) diversa da 0, diciamo < 0
(per cui prendiamo ]c, d[=] , 0[), in un intervallo aperto J. Siccome 2(y)1/2 `e una primitiva
di |y|1/2 = (y)1/2 in ] , 0[ e t `e una primitiva di 1 in R, imponiamo
1
[y(t)]1/2 = (C t)
2

per t J

ovvero

1
y(t) = (C t)2 per t J
4
con C arbitrariamente fissata. La funzione che ha questa espressione in J =] , C[ e vale
identicamente 0 in [C, [ `e una soluzione dellequazione su tutto I = R che allistante C soddisfa
la stessa condizione di Cauchy della soluzione identicamente nulla.

La causa del fenomeno di non unicit`a appena osservato risiede nella mancanza, per la funzione
di sufficiente regolarit`
a in vicinanza dello zero. Anticipando un risultato che dimostreremo
pi`
u in l`a segnaliamo che lunicit`
a di soluzioni per problemi di tipo (123),(119) `e invece garantita se
b(y), pur annullandosi nel punto u0 (come b(y) = |y|1/2 in u0 = 0), verifica in un suo intorno una
condizione di Lipschitz.
Ricordiamo poi che nel caso della (117) una qualunque soluzione viene automaticamente ad
essere definita in tutto lintervallo I. Questo accade anche per certe equazioni non lineari (123),
come quella dellesempio precedente, ma non per tutte.
|y|1/2 ,

I-e 5.2

Esempio 26.2. Lequazione


y0 = y2
`e a variabili separabili con I = U = R. Cerchiamo una soluzione y(t) diversa da 0, diciamo > 0
(per cui prendiamo ]c, d[=]0, [), in un intervallo aperto J. Siccome y 1 `e una primitiva di y 2
in ]0, [ e t `e una primitiva di 1 in R, imponiamo
y(t)1 = C t

per t J

ovvero
y(t) = (C t)1

per t J

(126)

con C arbitrariamente fissata. Per ogni C abbiamo ottenuto una soluzione che non si estende a
destra di J =] , C[ perche tende all per t C (e se, ad esempio, cerchiamo la totalit`a delle
soluzioni definite per ogni t 1 troviamo tutte e sole le (126) con C > 1).

92

I-5.5

I-o 5.2

Esempio 26.3. Un esempio importante di equazione a variabili separabili `e lequazione logistica


o di Verhulst
y 0 = y y 2
(127)

I-5.6

(, > 0), che costituisce un modello di crescita di una popolazione pi`


u plausibile di quello malthusiano. Con laumentare del numero degli individui tende infatti ad aumentare anche la competizione
tra loro (ad esempio per il cibo o per lo spazio), con un effetto negativo sulla crescita che in prima
istanza possiamo prendere proporzionale, con fattore < 0, alla media statistica y 2 delle loro
interazioni a coppie.
La funzione B(y) = y y 2 si annulla in 0 e in /, e quindi le due funzioni costanti y(t) = 0
e y(t) = / sono soluzioni dellequazione.
Fissata una condizione di Cauchy (119) con u0 diverso sia da 0 che da /, poniamo
Z y
d
B(y) =

2
u0
sicche la (124) con A(t) = t t0 e K = 0 diventa
Z y
d
= t t0 .

2
u0
Siccome lintegrale vale
1
y
log

u0



u0


y

e la quantit`a dentro il modulo `e > 0, otteniamo


y u0
= e(tt0 )
u0 y
e da qui, risolvendo rispetto a y, otteniamo
y(t) =

u0
.
( u0 )e(tt0 ) + u0

(128)

Quando u0 `e negativo, non importa quanto vicino a 0, il denominatore della (128) `e una funzione
decrescente che, siccome tende a per t ed a u0 < 0 per t , deve annullarsi per t
uguale a un tempo finito T1 = T1 (u0 ) > t0 . Ne segue che y(t) 0 per t e y(t) per
t T1 .
Per ogni valore iniziale u0 ]0, /[ (com`e nel caso, con molto pi`
u piccolo di , del modello
biologico) la soluzione `e definita su tutto R. Poiche `e strettamente crescente e tende a 0 e /
rispettivamente per t e per t , il suo grafico ha la forma detta ad S nelle pubblicazioni
di carattere demografico.
Quando u0 > / il denominatore della (128) `e una funzione crescente che, siccome tende a 0
per t e vale > 0 per t = t0 , deve annullarsi per t uguale a un tempo finito T2 = T2 (u0 ) < t0 .
Ne segue che y(t) / per t e y(t) per t T2+ .
Abbiamo dunque visto che per t la soluzione di (127),(119) tende a / quando u > 0
viene comunque preso nellintorno ]0, [ di /: la soluzione costante y(t) = / `e un equilibrio
stabile. Invece nessuna soluzione del problema con u0 6= 0 resta, al crescere di t, in un intorno di
0 come ad esempio ] 1/2, 1/2[: lo 0 `e un equilibrio instabile.


93

I-5.7

27

Equazioni differenziali esatte e fattori integranti

Le equazioni differenziali di cui adesso passiamo ad occuparci sono quelle che si possono porre sotto
la forma
d
F (t, y) = 0
dt
con F (t, y) di classe C 1 in un aperto W del piano e y = y(t), funzione incognita di classe C 1
in qualche intervallo J. Il precedente corsivo ha una specifica ragion dessere che sar`a chiara tra
pochissimo. Per intanto riscriviamo lequazione evidenziando la dipendenza dellincognita da t:
d
F (t, y(t)) = Ft (t, y(t)) + Fy (t, y(t))y 0 (t) = 0
dt

per t J.

(129)

exa

Poiche J `e un intervallo, la (129) `e equivalente alla


F (t, y(t)) = K

per t J

con K costante. In altri termini, y(t) viene ad essere definita implicitamente dallequazione
F (t, y) = K
nel senso che si richiede al suo grafico {(t, y(t)) | t J} di giacere su una curva di livello della
funzione F . Il Teorema di Dini fornisce una condizione sufficiente perche ci`o possa accadere: se
(t0 , u0 ) W `e tale che Fy (t0 , u0 ) 6= 0, allora esiste ununica funzione y(t) di classe C 1 in un intervallo
aperto J 3 t0 il cui grafico coincide con la porzione della curva di livello F (t, y) = F (t0 , u0 ) che
cade in un opportuno intorno aperto V W di (t0 , u0 ) dove Fy si mantiene 6= 0. Questo ci dice
che esiste ununica funzione y = y(t) che soddisfa la (129) ovvero la
y 0 (t) =

Ft (t, y(t))
Fy (t, y(t))

per t J

perche il denominatore della frazione non si annulla sotto la condizione di Cauchy


y(t0 ) = u0 .
Ma a questo punto dobbiamo porci la domanda: Quali sono le equazioni differenziali che rientrano nella classe in esame, quando la funzione F non `e data in partenza? In prima battuta la
risposta `e una banale tautologia: sono le equazioni della forma
p(t, y) + q(t, y)y 0 = 0

(130)

exa1

con p(t, y) e q(t, y) continue in un aperto W del piano, q(t0 , u0 ) 6= 0 per qualche (t0 , u0 ) W ,
purche esista una F (t, y) di classe C 1 in W con Ft (t, y) = p(t, y) e Fy (t, y) = q(t, y), ovvero la
corrispondente forma differenziale p(t, y) dt + q(t, y) dy sia esatta. Per questo motivo si chiama
allora esatta lequazione differenziale (130), che si riscrive
p(t, y) dt + q(t, y) dy = 0.

(131)

E allora dobbiamo passare alla domanda successiva: come facciamo a riconoscere se il primo membro
della (131) `e una forma differenziale esatta? Una condizione sufficiente in un rettangolo R W

94

exa2

`e la seguente: Le derivate parziali py , qt esistano continue e soddisfino la condizione di chiusura


py = qt . In tal caso una primitiva della forma `e
Z

F (t, y) =

q(t0 , ) d +
u0

p(, y) d.
t0

Infatti
Ft (t, y) = p(t, y),
Z

q (, y) d = q(t, y).

py (, y) d = q(t0 , y) +

Fy (t, y) = q(t0 , y) +

t0

t0

Sottolineiamo che non abbiamo richiesto la derivabilit`a di p rispetto a t. Vedremo tra un attimo
(nellOsservazione 27.1) un esempio in cui questo margine pi`
u ampio si riveler`a utile.
Le equazioni della forma (123) rientrano nella classe di quelle esatte con p(t, y) = a(t), q(t, y) =
1/b(y), e a ben vedere proprio cos` ne abbiamo impostato lo studio. Solo che la particolare espressione a variabili separabili consente di ottenere subito la funzione che qui stiamo indicando con
F (t, y), e che per la (123) non `e altro che A(t) + B(y) con A(t) e B(y) primitive rispettivamente di
a(t) in I e di [b(y)]1 in ]c, d[, la cui esistenza `e diretta conseguenza del Teorema Fondamentale del
Calcolo. Inoltre lesistenza di soluzioni y(t) della (123) non ha bisogno di essere dimostrata attraverso il Teorema di Dini, visto che segue semplicemente dallinvertibilit`a della funzione monotona
B(y) della (sola) variabile y ]c, d[. Di pi`
u: applicando B 1 si pu`o dare (almeno teoricamente)
unesplicita espressione delle soluzioni che invece nel caso generale il Teorema di Dini non pu`
o
garantire.
Com`e ovvio siamo in grado di applicare il precedente ragionamento per risolvere la (129) anche
se in W non `e esatta la forma p dt+q dy, ma lo `e invece la forma p dt+q dy per unopportuna (t, y)
di classe C 1 e mai nulla, detta fattore integrante. Come trovare (t, y)? Sempre supponendo
che py , qt esistano continue imponiamo la condizione di chiusura (p)y = (q)t , cio`e
py + py = qt + qt .

(132)

Una tale , per di pi`


u indipendente dalla y, esiste (ed `e teoricamente calcolabile) come soluzione
dellequazione
p y qt
d
=

(133)
dt
q
se la frazione nel secondo membro (con denominatore 6= 0) dipende solo dalla t. Analogamente,
esiste una soluzione della (132) indipendente dalla t e dunque tale che
qt py
d
=

dy
p
se la frazione nel secondo membro (con denominatore 6= 0) dipende solo dalla y.
Esempio 27.1. Per risolvere la (132) con
p(t, y) = 2ty + t2 y +
osserviamo che

y3
,
3

q(t, y) = t2 + y 2

py (t, y) qt (t, y)
2t + t2 + y 2 2t
=
= 1.
q(t, y)
t2 + y 2

95

exa4

exa5

La (133) diventa 0 = , che ammette la soluzione (t) = et . Lequazione di partenza `e dunque


equivalente alla


y3
t
2
e 2ty + t y +
dt + et (t2 + y 2 ) dy = 0.
3
Il primo membro `e in tutto R una forma differenziale esatta di cui si calcolano subito le primitive,
ottenendo lespressione implicita


y2
t
2
ye t +
=C
3
per le soluzioni y(t) dellequazione differenziale.

exai

Osservazione 27.1. Lequazione lineare non omogenea (121), a differenza di quella omogenea,
non `e a variabili separabili. Per`
o si riconduce a unequazione esatta, come si vede introducendo
un fattore integrante. Siano infatti p(t, y) = a(t)y f (t) (si noti che non abbiamo bisogno di
derivabilit`a rispetto a t) e q(t, y) = 1. Siccome (py (t, y) qt (t, y))/q(t, y) = a(t), una soluzione
Rt

(t) = e

t0

a( ) d

dellequazione 0 = a(t) `e un fattore integrante e la forma differenziale (t)[a(t)yf (t)] dt+(t) dy


`e dotata di una primitiva F (t, y) che scriviamo come somma di una funzione della sola t, diciamo
h(t), e di (t)y. Ma allora la Ft (t, y) = p(t, y) equivale a
h0 (t) + 0 (t)y = (t)[a(t)y f (t)]
e siccome 0 (t) = a(t)(t) ne ricaviamo h0 (t) = (t)f (t). Lintegrale generale della (4.5) lo
otteniamo risolvendo la
Z t
( )f ( ) d + (t)y(t) = K
F (t, y(t)) =
t0

e da qui ritroviamo la (121).



Allo studio dellequazione lineare non omogenea (121) si riconduce quello dellequazione
y 0 + p(t)y + q(t)y = 0,

(134)

ber

con p(t) e q(t) continue in un intervallo aperto I. Fissiamo un diverso sia da 0 che da 1. La
(7.1) non `e lineare, ma richiedere che essa sia soddisfatta in un intervallo aperto J I da una y(t)
positiva (o anche negativa, se ad esempio N) equivale a richiedere che
y 0 y + p(t)y 1 + q(t) = 0
ovvero che [y(t)]1 coincida con una soluzione z(t) dellequazione lineare
z 0 + (1 )p(t)z = (1 )q(t),
t J.
96

(135)

ber1

La (134) `e detta equazione di Bernoulli. Lequation de mon Fr`ere, la chiama in una lettera
Johann Bernoulli, ma `e lui che la risolve, con la semplice trasformazione che abbiamo appena visto,
dopo mesi di infruttuosi tentativi da parte del fratello Jacob.
Attenzione per`
o a non voler trasferire automaticamente alla (134) ogni risultato noto per unequazione lineare quale la (135). Una qualunque soluzione z(t) di questultima `e infatti definita in
tutto I, ma non `e affatto detto che ci`o valga per la y(t) = z(t)1/(1) : si pensi allesempio, gi`
a
0
2
studiato con la separazione delle variabili, di y = y (dunque p(t) = 0, q(t) = 1, I = R) e alle
soluzioni y(t) = (C t)1 definite solo in J =] , C[ o solo in J =]C, [. Possiamo per`
o dire
che, dati comunque t0 I e u0 > 0 (o anche u0 < 0, se ad esempio N), esiste ununica funzione
definita e positiva in un opportuno intervallo aperto J I, J 3 t0 , che soddisfa la (134) e vale u0
in t0 : la funzione y(t) = z(t)1/(1) , t J, dove z(t) `e lunica soluzione della (135) che vale u1
0
in t0 .
` di Bernoulli lequazione
Esempio 27.2. E
y0

y
y 3 sin t = 0.
t

(136)

exa6

(137)

exa7

Con la sostituzione z = y 2 ci si riconduce allequazione lineare


2
z 0 + z = 2 sin t.
t
Lintegrale generale dellomogenea associata
2
z0 + z = 0
t
`e Ct2 , per cui un integrale particolare della (137) `e un prodotto v(t)t2 con v 0 (t) = 2t2 sin t.
Integrando troviamo una funzione
v(t) = 2t2 cos t 4t sin t 4 cos t,
che moltiplicata per t2 e sommata allintegrale generale dellomogenea d`a lintegrale generale della
(137)
sin t
cos t C
z(t) = 2 cos t 4
4 2 + 2
t
t
t
da cui arriviamo alla famiglia di soluzioni della (136)

y(t) =

sin t
cos t C
2 cos t 4
4 2 + 2
t
t
t

1/2

definita ciascuna, a costante C fissata, in ogni sottointervallo di ] , 0[ o ]0, [ dove la quantit`


a
tra parentesi `e > 0.

Osservazione 27.2. Lequazione logistica (127), che abbiamo gi`a risolto mediante la separazione
delle variabili, `e anche unequazione di Bernoulli. Ponendo y(t) = z(t)1 la trasformiamo nella
z 0 + z = ,

97

il cui integrale generale `e della forma


z(t) = Ke(tt0 ) +

per t0 fissato in R. Imponiamo la condizione di Cauchy y(t0 ) = u0 , che trasformiamo nella z(t0 ) =
u1
0 supponendo u0 6= 0. Otteniamo K = ( u0 )/u0 , e di conseguenza
z(t) =

( u0 )e(tt0 ) + u0
.
u0

Se poi aggiungiamo lipotesi u0 6= 0 ritroviamo la soluzione (128) della (127), definita in un


intervallo aperto J contenente il punto t0 dove essa assume il valore u0 :
y(t) =

u0
.
( u0 )e(tt0 ) + u0


Sistemi 2 2 e diagrammi di fase

28

In questa sezione ci occuperemo dei sistemi a coefficienti reali


 0
x1 = ax1 + bx2
x02 = cx1 + dx2

(138)

2eq

x0 = Ax

(139)

complx


a b
.
A=
c d

(140)

defA

ovvero
con x = col (x1 , x2 ) e


Le soluzioni sono curve t 7 x(t) = col (x1 (t), x2 (t)), e chiaramente costituiscono uno spazio vettoriale. Vedremo che esse sono definite per ogni t R; i loro sostegni (o orbite, o traiettorie) si
ottengono, eliminando il parametro t tranne ovviamente nel caso delle soluzioni costanti x(t) = u
con Au = 0, dette equilibri , come grafici, qui chiamati diagrammi di fase, nel piano (x1 , x2 ),
qui chiamato piano delle fasi del sistema (139).
Uno strumento fondamentale del nostro studio sar`a lesame delle soluzioni dellequazione
caratteristica
det (I A) = 2 (tr A) + det A = 0
(dove tr A denota la traccia a + d di A), dette autovalori della matrice A. Se `e un autovalore e
u `e un autovettore associato a , cio`e un vettore 6= 0 tale che Au = u, una soluzione del sistema
diversa dallequilibrio 0 `e data dalla funzione t 7 et u:
(et u)0 = et u = et Au = A(et u).
Gli autovalori 1 e 2 di A verificano
1 + 2 = tr A,
98

1 2 = det A,

e da queste due identit`


a si possono dedurre a colpo docchio, senza bisogno di risolvere lequazione
caratteristica, alcune informazioni sugli autovalori. Se ad esempio A `e singolare, cio`e det A = 0,
uno degli autovalori `e nullo e laltro `e la traccia di A; se det A > 0 gli autovalori possono essere sia
complessi coniugati che reali, e hanno entrambi parti reali negative se per di pi`
u tr A < 0; se invece
det A < 0 essi (non possono essere complessi coniugati e quindi) sono reali con segni opposti.
Notiamo che nel sistema (138), ovvero nellequazione vettoriale del primo ordine (139), rientra
lequazione scalare del secondo ordine
y 00 + hy 0 + ky = 0.

(141)

III-4.2

Infatti la funzione scalare y(t) soddisfa lequazione (141) se e solo se la funzione vettoriale

 

x1 (t)
y(t)
= 0
x2 (t)
y (t)
soddisfa il sistema

x01 = x2
x02 = kx1 hx2

Viceversa, derivando o luna o laltra equazione di tale sistema e poi procedendo per sostituzione
si vede che sia y(t) = x1 (t) e sia y(t) = x2 (t) soddisfano lequazione scalare
y 00 (tr A)y 0 + det A = 0,
la cui equazione caratteristica `e, non sorprendentemente, la stessa del sistema.
Il sistema `e detto stabile se tutte le sue soluzioni soluzioni sono limitate per t , instabile
in caso contrario, e asintoticamente stabile se tutte le sue soluzioni convergono a 0 per t .
Aggiungendo al sistema (139) la condizione iniziale
 
C1
x(0) = C =
(142)
C2

condi

e quindi anche, in particolare, aggiungendo allequazione (141) le condizioni iniziali


y 0 (0) = C2

y(0) = C1 ,

si ottiene un problema di Cauchy.


Nello studio della (139) si rivela preziosa la seguente osservazione: se P `e una matrice 2 2
invertibile, e quindi A `e simile alla matrice B = P 1 AP , una funzione x(t) soddisfa il sistema (139)
con condizione iniziale (142) la funzione y(t) = P 1 x(t), la cui derivata `e y0 (t) = P 1 x0 (t),
soddisfa il sistema
y0 = P 1 Ax = BP 1 x = By
(143)
con condizione iniziale


K1
y(0) = K =
= P 1 C.
K2

comply

(144)

Ebbene: a seconda degli autovalori di A si riesce sempre a costruire una matrice di passaggio P
in modo tale che risulti estremamente semplice dimostrare lesistenza di ununica soluzione per
ogni problema (143),(144), fornendone anzi lesplicita espressione e quindi anche visualizzandone
il diagramma di fase nel piano (y1 , y2 ). A quel punto basta operare la trasformazione affine P

99

cond

per passare allesistenza di ununica soluzione per ogni problema (139),(142), alla sua esplicita
espressione17 , nonche alla visualizzazione del suo diagramma di fase nel piano (x1 , x2 ).
1o Supponiamo per cominciare che A abbia due autovalori reali e distinti 1 e 2 , con rispettivi
autovettori u1 e u2 . Questo ci d`
a subito due soluzioni e1 t u1 e e2 t u2 , che si vede subito essere
linearmente indipendenti: ma come controllare se generano lo spazio di tutte le soluzioni, ovvero
se questultimo ha dimensione 2? Per rispondere, notiamo che A `e simile alla matrice diagonale


1 0
B=
0 2
con matrice di passaggio P = [u1
A[u1

u2 ]: infatti

u2 ] = [Au1

Au2 ] = [1 u1

2 u2 ] = [u1

u2 ]B.

Col presente significato di B il sistema (143) `e costituito da due equazioni indipendenti


 0
y1 = 1 y1
y20 = 2 y2
ciascuna univocamente risolubile per ogni dato valore imposto alla soluzione nellorigine; la totalit`
a
delle sue soluzioni si ottiene dallespressione


 t


0
K1 e1 t
e 1
= K1
+ K2 2 t
(145)
0
e
K2 e2 t
al variare dei valori K1 e K2 assunti per t = 0 rispettivamente da y1 (t) e y2 (t). Quando K1 > 0 e
K2 > 0 la traiettoria di una curva piana y1 = K1 e1 t , y2 = K2 e2 t , t R `e il grafico di una funzione
t/
y2 = Cy1 2 1 , y1 > 0 con C > 0, e dunque si disegna subito distinguendo i tre casi 0 < 2 /1 < 1,
2 /1 > 1, 2 /1 < 0: nei primi due si dice che lorigine `e un nodo stabile o instabile a seconda
che il segno degli autovalori sia negativo o positivo, nel terzo che `e un punto di sella. Lestensione
ai casi degli altri segni di K1 e K2 si fa per simmetrie.
A questo punto resta solo da operare una deformazione affine di matrice [u1 u2 ] per concludere
che le soluzioni dellequazione di partenza si ottengono dalla formula


1 t
1
2 K1 e
= K1 e1 t u1 + K2 e2 t u2 ,
[u u ]
K2 e2 t
sicche costituiscono uno spazio vettoriale reale di dimensione 2, e ottenere la rappresentazione
grafica delle loro traiettorie nel piano delle fasi (x1 , x2 ).
Esempio 28.1. La matrice dei coefficienti del sistema
 0
x1 = 5x1 + 3x2
x02 = 6x1 4x2
ha determinante < 0 e quindi autovalori reali di segni opposti: lorigine `e un punto di sella.
Calcoliamo: un autovalore `e uguale a 2 con un autovettore dato da col (1, 1), laltro a 1 con un
autovettore dato da col (1, 2). Un integrale generale di questo sistema `e dato da


 

1 1 K1 e2t
K1 e2t K2 et
=
.
1 2
K2 et
K1 e2t + 2K2 et
17

Quindi anche allesplicita espressione di ogni soluzione y(t) del sistema (139), dal momento che (142) `e banalmente
soddisfatta con C definito come y(0).

100

III-e4.3


2o Siano i con , R, 6= 0 gli autovalori di una A M2 (R) con rispettivi autovettori
v iw (dove v, w sono vettori colonne di R2 ). Di nuovo otteniamo due funzioni e(i)t (v iw) che
soddisfano la (139)18 , e si vede anche, in un attimo, che sono linearmente indipendenti: ma si tratta
di funzioni a valori in C2 , non in R2 come interessa a noi. Allora procediamo con unopportuna
similitudine: quella tra A e la matrice



B=

con matrice di passaggio P = [v

w]. Infatti da

Av + iAw = A(v + iw) = ( + i)(v + iw) = v w + i(v + w)


ricaviamo, separando le parti reale e immaginaria,
Av = v w,

Aw = v + w

ovvero
A[v

w] = [Av

Aw] = [v w

v + w] = [v

w]B.

Col presente significato di B il sistema (143) `e


 0
y1 = y1 + y2
y20 = y1 + y2
18

(146)

Partiamo dallidentit`
a di Eulero
e(+i)t = et (cos t + i sin t).

Derivando otteniamo
D(et cos t) = et ( cos t sin t),

D(et sin t) = et ( sin t + cos t)

ovvero
D[et (cos t + i sin t)] = ( + i)et (cos t + i sin t)
da cui
De(+i)t = ( + i)e(+i)t :
in altri termini, come per reale, cos` anche per complesso risulta
Det = et ,
o anche, moltiplicando per un qualunque vettore u di C2 ,
D(et u) = et u.
Naturalmente poi
D(Ket ) = Ket
al variare di K non solo nei reali, ma anche nei complessi, per cui lequazione omogenea z 0 = z con C ammette
le infinite soluzioni complesse Ket con K C; altre non ce ne sono, perche una qualunque soluzione si scrive
z(t) = v(t)et con v(t) differenziabile in un intervallo I, e quindi
0 = z 0 (t) z(t) = [v(t)et ]0 v(t)et = v(t)[(et )0 e ] + v 0 (t)et = v 0 (t)et ,
da cui v 0 (t) = 0. Ne segue che, fissato K C, Ket `e lunica soluzione del problema di Cauchy
z 0 = z,

y(0) = K.

101

comply

e quindi equivale a unequazione scalare nellincognita complessa z(t) = y1 (t) + iy2 (t):
y10 + iy20 = y1 + y2 + i(y1 + y2 ) z 0 = ( i)z.
Ogni soluzione di questa equazione `e univocamente espressa, una volta fissato il valore complesso
K1 + iK2 imposto a z(t) per t = 0, da
z = y1 + iy2 = (K1 + iK2 )e(i)t = (K1 + iK2 )et (cos t i sin t)
= et [K1 cos t + K2 sin t + i(K1 sin t + K2 cos t)];
da qui si ricava che ogni soluzione col (y1 (t), y2 (t) del sistema (146) `e univocamente espressa da
 t

 t



e sin t
e cos t
K1 cos t + K2 sin t
t
+ K2 t
= K1
e
e cos t
et sin t
K1 sin t + K2 cos t
una volta fissati i valori K1 e K2 rispettivamente imposti a y1 (t) e y2 (t) per t = 0 . Se = 0 lorigine
`e un centro: le traiettorie delle curve piane y1 = K1 cos t + K2 sin t, y2 = K1 sin t + K2 cos t,
t R, sono le circonferenze y12 + y22 = K12 + K22 . Altrimenti lorigine `e un fuoco stabile o instabile
a seconda che < 0 o > 0: le traiettorie delle curve piane y1 = et (K1 cos t + K2 sin t),
y2 = et (K1 sin t + K2 cos t), t R, sono spirali che escono dallorigine e crescono verso
linfinito per t decrescente nel primo caso e invece per t crescente nel secondo.
A questo punto, con una deformazione affine di matrice [v w] si ottiene la totalit`a della
soluzioni (a valori in R2 ) del sistema (139) facendo variare K1 , K2 R nellespressione



 t K1 cos t + K2 sin t
v w e
= K1 et (v cos t w sin t) + K2 et (v sin t + w cos t),
K1 sin t + K2 cos t
per cui esse costituiscono uno spazio vettoriale reale di dimensione 2, e si arriva anche alla rappresentazione grafica delle loro traiettorie nel piano delle fasi (x1 , x2 ).
Esempio 28.2. La matrice dei coefficienti del sistema
 0
x1 = 3x1 + 5x2
x02 = 5x1 + 3x2
ha un autovalore uguale a 3 5i con un autovettore dato da col (0, 1) + i col (1, 0) (e quindi, automaticamente, laltro autovalore `e uguale a 3 + 5i con un autovettore dato da col (0, 1) i col (1, 0)).
Un integrale generale `e dunque








0 1 3t K1 cos 5t K2 sin 5t
sin 5t
cos 5t
e
= K1 e3t
+ K2 e3t
.
sin 5t
1 0
K1 sin 5t + K2 cos 5t
cos 5t

3o Supponiamo che i due autovalori di A abbiano lo stesso valore reale , con autovettore u. Si trova
una soluzione et u di (139): e poi? Innanzitutto A, se non `e gi`a diagonale, non `e diagonalizzabile.
Per`o `e comunque comunque triangolarizzabile, cio`e simile ad una matrice triangolare (superiore
o inferiore). Sia infatti v un versore ek non proporzionale ad u. Supponendo k = 2 per fissare le
idee, possiamo scrivere il vettore Av (seconda colonna di A) come combinazione lineare di u e v

102

perche questi vettori, essendo linearmente indipendenti, costituiscono una base di R2 . Dunque Av
`e uguale a pu + qv, per cui
A[u

v] = [Au

Av] = [u

pu + qv] = [u

v]B

con



p
B=
.
0 q
Devessere q = perche B, essendo simile ad A, ha lo stesso autovalore di molteplicit`a 2; daltra
parte, p = 0 se e solo se v `e un altro autovettore della matrice, la quale `e allora diagona(lizzabi)le
perche due suoi autovettori sono linearmente indipendenti. Dunque vale la similitudine




p
AP = P B con P = u v e B =
, p 6= 0.
0
Il sistema y0 = By, ovvero
y10 = y1 + py2
(147)
y20 = y2
si risolve subito: inserendo nella prima equazione lunica soluzione della seconda che assume
nellorigine un dato valore K2 , cio`e y2 (t) = K2 et , si ottiene lequazione


y10 = y1 + pK2 et
la cui unica soluzione che assume nellorigine un dato valore K1 `e y1 (t) = et (K1 + K2 pt). Ne segue
che la totalit`
a delle soluzioni del sistema (147) si ottiene facendo variare K1 , K2 R nellespressione


 t 
 t 
e
e pt
t K1 + K2 pt
e
= K1
+ K2
.
K2
0
et
Per ottenere i diagrammi di fase ricaviamo innanzitutto t dalla y2 = K2 et : t =
y2 /K2 > 0. Dalla y1 = (K1 + K2 pt)et ricaviamo poi


y2
y2
K2 p
y1 = K1 +
log

K2 K2

y2
log K
per
2

sia per y2 > 0, purche K2 > 0, e sia per y2 < 0, purche K2 < 0: lorigine `e un nodo improprio
stabile o instabile a seconda che < 0 o > 0.
Ancora una volta concludiamo operando una deformazione affine, stavolta di matrice [u v]:
le soluzioni dellequazione di partenza si ottengono dalla formula



 t K1 + K2 pt
u v e
= K1 et u + K2 et (tpu + v)
K2
sicche costituiscono uno spazio vettoriale reale di dimensione 2, e otteniamo subito la rappresentazione grafica delle loro traiettorie nel piano delle fasi (x1 , x2 ).
Esempio 28.3. La matrice dei coefficienti del sistema
 0
x1 = x1 x2
x02 = x1 + 3x2
ha un autovalore doppio = 2, con autovettore u = col (1, 1). Prendiamo come v il versore
col (0, 1). Siccome Av = u + 2v, la totalit`a delle soluzioni del sistema si scrive come



 

1 0 2t K1 + K2 t
(K1 K2 t)e2t
e
=
.
1 1
K2
[K1 + K2 (t + 1)]e2t


103

comply

29
esistgr

Esistenza in grande e unicit`


a per il problema di Cauchy

Teorema 29.1. Sia f (t, y) una funzione reale continua in una striscia chiusa [A, B] R, dove
< A < B < , e dotata di derivata rispetto ad y continua con
|fy (t, y)| < .

sup

(148)

derlim

(t,y)[A,B]R

Allora, dati comunque t0 [A, B] e y0 R, esiste ununica funzione y = y(t) che soddisfa in [A, B]
lequazione differenziale
y 0 (t) = f (t, y(t))
(149)

pbcaueq

insieme alla condizione di Cauchy y(t0 ) = y0 , ovvero, pi`


u concisamente, il problema di Cauchy
y 0 = f (t, y),

y(t0 ) = y0 .

(150)

pbcaueq

(151)

equint

DIM. Per dimostrare il teorema ci serviamo di due cruciali considerazioni.


La prima `e che il problema (158) equivale allequazione integrale
Z t
y(t) = y0 +
f (s, y(s)) ds
t0

nel seguente senso: una funzione y = y(t) `e di classe C 0 e soddisfa la (151) per t [A, B] se
e solo se `e di classe C 1 e verifica la (157) per t [A, B] insieme alla y(t0 ) = y0 .
Per dimostrare limplicazione se basta tener conto che il secondo membro della (151) vale
y0 per t = t0 e inoltre (Teorema fondamentale del Calcolo) `e derivabile in tutto [A, B] con
derivata uguale a f (t, y(t)), dunque continua = in [A, B] la y(t) `e di classe C 1 e soddisfa la
(157) insieme a y(t0 ) = y0 .
Limplicazione solo se si dimostra scrivendo la (157) con s al posto di t e integrando poi
entrambi i membri da t0 a t.
La seconda considerazione `e questa: grazie alla (148) esiste una costante L tale che
|f (t, y) f (t, z)| L|y z|

per t [A, B], y, z R.

(152)

Dal Teorema del valor medio segue infatti che nel primo membro della (152) la quantit`
a
dentro al modulo `e uguale a fy (t, )(y z) per qualche opportuno valore di compreso tra y
e z, e quindi la (152) `e soddisfatta con L = sup(x,y)[A,B]R |fy (x, y)|.
Mostriamo lunicit`
a. Siano date due soluzioni y(t) e y(t), per cui sono soddisfatte in [A, B]
tanto la (151) che la
Z t
y(t) = y0 +
f (s, y(s)) ds.
t0

[0, (2L)1 ]

Fissato il pi`
u grande valore di a
tale che t1 = t0 + a B, sottraiamo membro a
membro le due equazioni integrali e passiamo alla maggiorazione dei moduli utilizzando la (152):
per [t0 , t1 ] risulta
Z
Z

|y( ) y( )|
|f (s, y(s)) f (s, y(s))| ds L
|y(s) y(s)| ds La ,
2
t0
t0
104

lipcau

dove denota il massimo di |y(t) y(t)| in [t0 , t1 ], e quindi, prendendo come un punto in cui tale
massimo viene assunto, otteniamo

,
2
da cui = 0. Ci`
o mostra che y(t) = y(t) per t0 t t1 . Se t1 < B fissiamo il pi`
u grande valore di
a [0, (2L)1 ] tale che t2 = t1 + a B e poniamo y1 = y(t1 ) = y(t1 ). Adesso y(t) e y(t) verificano
rispettivamente
Z
t

f (s, y(s)) ds,

y(t) = y1 +
t1

f (s, y(s)) ds

y(t) = y1 +
t1

e possiamo ripetere il ragionamento precedente, arrivando a dimostrare che y(t) = y(t) per t0 t
t2 . In un numero finito di passi concludiamo che y(t) = y(t) per t0 t B; in maniera analoga si
vede che y(t) = y(t) per A t t0 .
Passiamo allesistenza. Definiamo per ricorrenza
Z t
y1 (t) = y0 +
f (s, y0 ) ds,
t0
t

Z
y2 (t) = y0 +

f (s, y1 (s)) ds,


t0

f (s, y2 (s)) ds

y3 (t) = y0 +
t0

e via via
Z

yn+1 (t) = y0 +

f (s, yn (s)) ds

per n N.

(153)

nterm

(154)

ricorr

t0

Accettiamo il seguente risultato, che dimostreremo tra un attimo:


Lemma 29.1. La serie
y0 + (y2 (t) y1 (t)) + (y3 (t) y2 (t)) + . . .
converge totalmente in [A, B].
Grazie alla convergenza totale della serie (154) in [A, B], la successione (delle sue ridotte) {yn (t)}
converge uniformemente in [A, B] a una funzione continua y(t). Ma allora anche la successione
{f (t, yn (t))}, che converge puntualmente a f (t, y(t)) per la continuit`a di f e verifica
|f (t, yn (t)) f (t, y(t))| L|yn (t) y(t)|

per n N,

`e a sua volta uniformemente convergente. Ne segue che nel secondo membro della (153) si pu`
o
passare al limite sotto il segno dintegrale, e quindi che la y(t) soddisfa la (151) in [A, B].

Per concludere:
DIM. DEL LEMMA Sia M il massimo di |f (, y0 | su [A, B]. Facciamo dapprima variare t in [t0 , B]:
otteniamo innanzitutto
Z
t

|y1 (t) y0 |

|f (s, y0 )| ds M (t t0 ),
t0

105

poi, grazie alla (152),


Z

|y2 (t)y1 (t)|

|f (s, y1 (s))f (s, y0 )| ds L


t0

(st0 ) = LM
t0

t
2

t0

t0

t0

|y2 (s)y1 (s)| ds L M

|f (s, y2 (s))f (s, y1 (s))| ds L

|y3 (t)y2 (t)|

|y1 (s)y0 | ds LM

t0

(t t0 )2
,
2

(s t0 )2
(t t0 )3
= L2 M
,
2
3!

da cui in generale
|yn+1 (t) yn (t)| Ln M

(B A)n+1
.
(n + 1)!

(155)

magtot

Siccome il secondo membro della (155) `e laddendo generico di una serie numerica convergente,
abbiamo ottenuto la convergenza totale della serie (154) in [t0 , B]. Allo stesso modo si ottiene la
convergenza totale della serie (154) in [A, t0 ].

olip

Osservazione 29.1. Come abbiamo evidenziato allinizio della precedente dimostrazione, la (148)
non `e servita ad altro che ad ottenere la propriet`a (152), questultima s` assolutamente essenziale in
tutto il successivo svolgimento. In altri termini: la tesi del Teorema 29.1 continua a valere inalterata
se lipotesi che f sia dotata di fy continua con la propriet`
a (148) viene indebolita richiedendo che
per unopportuna costante L sia soddisfatta la (152). A questo punto viene naturale chiedere:
perche non abbiamo gi`
a in partenza enunciato il teorema con lipotesi pi`
u debole? E la risposta
`e: perche sempre, quando si vuole appurare se una funzione verifica una condizione di Lipschitz
in una data variabile, la prima cosa da fare `e verificare se la funzione `e dotata, rispetto a quella
variabile, di derivata limitata, per cui si possa applicare il Teorema del valor medio! Poi, certo,
tale verifica pu`
o avere esito negativo, e allora si dovr`a ricorrere a opportune tecniche ad hoc, come
vedremo per esempio nel caso della dimostrazione del Teorema 31.1.

Ecco unutile variante del Teorema 29.1:

esistgr

Teorema 29.2. Sia f (t, y) una funzione reale continua in una striscia aperta S =]a, b[R, dove
a < b , e dotata in S di derivata rispetto ad y continua, con
|fy (t, y)| <

sup

(156)

derlim

(t,y)[A,B]R

per ogni coppia di punti A, B ]a, b[ con A < B. Allora, dati comunque t0 ]a, b[ e y0 R, esiste
ununica funzione y = y(t) che soddisfa in ]a, b[ lequazione differenziale
y 0 (t) = f (t, y(t))

(157)

pbcaueq

(158)

pbcaueq

insieme alla condizione di Cauchy y(t0 ) = y0 , ovvero il problema di Cauchy


y 0 = f (t, y),

106

y(t0 ) = y0 .

DIM. Fissiamo una successione crescente di intervalli [An , Bn ] ]a, b[ tutti contenenti t0 , con An a
e Bn b. Per ogni n possiamo applicare il Teorema 29.1 e ottenere lesistenza di una soluzione y (n)
in [An , Bn ] del problema (158). Per lunicit`a, su [An , Bn ] ogni y (n+k) coincide con y (n) , e quindi la
funzione y(t) posta uguale a y (n) (t) se t [An , Bn ] (`e univocamente determinata e) soddisfa, oltre
alla condizione di Cauchy per t = t0 , lequazione (157) per ogni t ]a, b[.

Sottolineiamo un aspetto molto importante dei Teoremi 29.1 e 29.2: abbiamo ottenuto una
soluzione y(t) che soddisfa lequazione (157) in tutto il primo lato della striscia su cui `e definita
la f (t, y) ([A, B] per il Teorema 29.1 e ]a, b[ per il Teorema 29.2), ovvero una soluzione in grande.
Ci`o `e stato possibile grazie alla limitatezza della fy nel prodotto cartesiano di [A, B] per tutto R
richiesta in (148) e (163): richiesta molto forte, che per`o permette di coprire casi significativi come
mostreremo nella prossima sezione.

30

Estensioni e applicazioni

Casi particolari di applicazione del Teorema 29.2 si costruiscono facilmente: ad esempio y 0 = cos t2 y,
2 2
(t, y) S =]a, b[R, dove < a < b < , oppure y 0 = t3 et y , (t, y) S =] , [R...
Per tutta una classe di esempi vanno menzionate le equazioni lineari (che peraltro, si sanno anche
risolvere esplicitamente) y 0 + a(t)y = g(t) con a(t), g(t) continue in ]a, b[, a < b .
Per casi pi`
u significativi passiamo allequazione differenziale (vettoriale)
y0 = f (t, y)
cio`e al sistema

(159)

IV-(2.1)

(160)

IV-(2.3)

(161)

IV-(2.4)

(162)

IV-(2.5)

y1 = f1 (t, y1 , . . . , yN )
..
.

0
yN = fN (t, y1 , . . . , yN )

con condizione iniziale o di Cauchy


y(t0 ) = y0 ,
anchessa unidentit`
a vettoriale, e precisamente
y1 (t0 ) = y01 ,

...,

yN (t0 ) = y0N .

Nella (159) rientra lequazione differenziale scalare di ordine N


y (N ) = g(t, y, y 0 , . . . , y (N 1) )
perche la si pu`
o scrivere anche, ponendo y1 = y, come
0
y1 = y2

2 = y3
..
.

= yN
yN

0 1
yN = g(t, y1 , . . . , yN )
107

Le condizioni di Cauchy (scalari)


y(t0 ) = y0 ,

y (N 1) (t0 ) = yN 1

...,

associate alla (162) si trasformano facilmente nelle (161), e quindi nella (160).
Passando dal caso scalare a quello vettoriale si estendono facilmente Teoremi 29.1 e 29.2;
questultimo, in particolare, diventa
Teorema 30.1. Sia f (t, y) una funzione a valori in RN continua in un aperto S =]a, b[RN , dove
a < b , e dotata in S di matrice jacobiana [f (t, y)/y] rispetto ad y continua, con
|det [f (t, y)/y]| <

sup

(163)

(t,y)[A,B]RN

per ogni coppia di punti A, B ]a, b[ con A < B. Allora, dati comunque t0 ]a, b[ e y0 R, esiste
ununica funzione y = y(t) che soddisfa in ]a, b[ lequazione differenziale
y0 (t) = f (t, y(t))
insieme alla condizione di Cauchy y(t0 ) = y0 , ovvero il problema di Cauchy
y0 = f (t, y),

y(t0 ) = y0 .

Significative applicazioni del teorema si hanno nel caso lineare: vettoriale


0
1
N

y1 = a1 (t)y1 + + a1 (t)yN + g1 (t)


..
.

0
yN = a1N (t)y1 + + aN
N yN (t) + gn (t)
con le aij (t), gj (t) continue in ]a, b[, a < b , e scalare di ordine N
y (N ) + aN 1 (t)y (N 1) + + a0 (t)y = g(t)
con le aj (t), g(t) continue in ]a, b[, a < b .

31

Esistenza in piccolo

Passiamo ad occuparci dellesistenza di soluzioni per il problema di Cauchy quando lipotesi, utilizzata nei Teoremi 29.1 e 29.2, di limitatezza della fy nelle strisce chiuse [A, B] R viene sostituita
da una condizione pi`
u debole.
esistpic

Teorema 31.1. Sia f (t, y) una funzione reale continua e dotata di derivata continua rispetto ad y
in un aperto U di R2 . Allora, dato comunque (t0 , y0 ) U , esiste un intervallo ], [3 t0 su cui `e
definita ununica soluzione y = y(t) del problema di Cauchy (158).

108

derlim

DIM. Sia R = [A, B] [C, D] U un rettangolo contenente (t0 , y0 ) al proprio interno, e sia
L = max(t,y)R |fy (t, y)|, per cui
|f (t, y) f (t, z)| L|y z|
La funzione

per x [A, B], y, z [C, D].

(164)

lipcau

f (t, y) per A t B, C y D
F (t, y) = f (t, D) per A t B, y > D

f (t, C) per A t B, y < C

`e continua in [A, B]R; non `e dotata di derivata rispetto ad y nei punti di [A, B]{C} e [A, B]{D},
per`o soddisfa, grazie alla (164), la
|F (t, y) F (t, z)| L|y z|

per x [A, B], y, z R.

Tanto basta, tenendo conto dellOsservazione 29.1, ad applicare il Teorema 29.1 con f sostituita da
F : in [A, B] esiste ununica soluzione y = y(t) dellequazione
y 0 (t) = F (t, y(t))

(165)

con condizione condizione di Cauchy y(t0 ) = y0 . In generale il grafico di [A, B] 3 t 7 y(t)


non `e contenuto in R. Per`
o, siccome (t0 , y0 ) `e interno ad [A, B] [C, D], esiste un intervallo
J [A, B] contenente t0 al proprio interno tale che per t J si abbia C y(t) D, quindi
F (t, y(t)) = f (t, y(t)), e infine
y 0 (t) = f (t, y(t))
grazie alla (165).

A questo punto si impongono alcune considerazioni.
Innanzitutto, il Teorema 29.2 rientra nel Teorema 31.1: le ipotesi di questultimo sono pi`
u
generali, e la sua tesi `e conseguentemente pi`
u debole.
Inoltre, la genericit`
a insita nella (scarsa) determinazione dellintervallo ], [ di esistenza della
soluzione y(t) non pu`
o essere eliminata19 . Nella dimostrazione si comincia infatti fissando, in modo
arbitario, uno degli infiniti rettangoli R = [A, B] [C, D] U contenenti (t0 , y0 ) al proprio interno.
` chiaro dunque che lintervallo J menzionato nella dimostrazione `e solo transitorio, nel senso che
E
pu`o significativamente variare a seconda del rettangolo ammissibile che viene fissato. Quello che
va tenuto ben presente `e, parlando per sommi capi, che lintervallo finale ], [ pu`o risultare ben
pi`
u piccolo della famiglia dei valori di t per i quali `e definita f (t, y): quella ottenuta nel teorema `e
una soluzione, appunto, in piccolo. Vediamo questo su un esempio.
I-e 5.1

Esempio 31.1. Riprendiamo lEsempio 31.1:


y0 = y2.
Per ogni C abbiamo ottenuto la soluzione
y(t) = (C t)1
19

Ma attraverso ulteriori sviluppi della teoria si arriva a fornire una determinazione otttimale dellintervallo, che
prende il nome di intervallo massimale di esistenza della soluzione.

109

pbcaueq-

ovvero, imponendo la condizione di Cauchy y(0) = y0 = 1/C,


y(t) =

y0
,
1 y0 t

(166)

dove o t < 1/y0 se y0 > 0, o t > 1/y0 se y0 < 0: nel primo caso y(t) `e positiva nella semiretta
aperta e tende all per t (1/y0 ) , nel secondo caso `e negativa nella semiretta aperta e tende a
per t (1/y0 )+ .
Come si colloca questo esempio rispetto ai teoremi di esistenza e unicit`a visti finora? Il secondo
membro di (166) `e una funzione continua e derivabile in R2 , e questultimo `e naturalmente una
striscia ]a, b[R con a = e b = , ma non possiamo applicare il Teorema 29.2: la derivata
2y di y 2 non si mantiene limitata in nessuna striscia [A, B] R (e, data comunque L > 1, basta
prendere y > L e = 0 per violare (152)). Invece sono soddisfatte le ipotesi del Teorema 31.1 con
U = R2 : lintervallo ], [ della tesi non coincide con la totalit`a (tutto R!) dei valori di t per i quali
ha senso f (t, y) = y 2 , bens` solo con ] , 1/y0 [ o ]1/y0 , [ a seconda che y0 > 0 o y0 < 0.
E se y0 = 0, caso finora non considerato? Banale: per il risultato dunicit`a la funzione
identicamente nulla `e la sola che soddisfa lequazione e la condizione di Cauchy.


110

pbcaueq

You might also like