An Vett 1112

ANALISI VETTORIALE
Giovanni Maria Troianiello

29 gennaio 2012
Indice
1 Formula di Taylor 3
2 Massimi e minimi locali 6
3 Approfondimenti sullintegrale di Riemann 11
4 Integrali impropri e serie 13
5 Criterio del confronto, convergenza assoluta, convergenza condizionata 16
6 Integrali di Riemann dipendenti da parametri 19
7 Successioni uniformemente convergenti 23
8 Integrali impropri dipendenti da parametri 25
9 Il Teorema di Dini per funzioni scalari 28
10 Il Teorema di Dini per sistemi 32
11 Massimi e minimi vincolati 35
12 Un primo rapido approccio agli integrali doppi 39
13 Misurabilità secondo PeanoJordan e domini normali 41
14 Integrale delle funzioni a scala, integrale superiore e integrale inferiore 46
1
15 Lintegrale doppio di Riemann e le sue proprietà 49
16 Alcune estensioni 52
17 Cambiamenti di variabili 55
18 Richiami su curve ed integrali curvilinei 63
19 Lunghezza di una curva 68
20 La formula di GaussGreen 71
21 Serie di funzioni 75
22 Serie di potenze 76
23 Serie di Taylor e Maclaurin 79
24 Una prima separazione delle variabili 82
25 La separazione della variabili in generale 84
26 Sistemi 2 2 e diagrammi di fase 87
27 Esistenza in grande e unicità per il problema di Cauchy 92
28 Estensioni e applicazioni 96
29 Esistenza in piccolo 97
2
1 Formula di Taylor
Dato il generico vettore
1
u = (u
1
, . . . , u
N
) R
N
, indichiamo con u loperatore
N
i=1
u
i
D
i
=
N
i=1
u
i
x
i
che ad ogni funzione reale f di classe C
n
, n 1, in un aperto A di R
N
associa la
funzione
(u )f = u f =
N
i=1
u
i
D
i
f =
N
i=1
u
i
f
x
i
.
Per n 2 il quadrato (u )
2
= (
N
i=1
u
i
D
i
)
2
è denito attraverso lidentità
(u )
2
f = (u )[(u )f]
ovvero
i=1
u
i
D
i
2
f =
i=1
u
i
D
i
i=1
u
i
D
i
. (1)
Operando sui simboli D
i
come se fossero dei numeri, che commutano cogli u
i
perchè questi ultimi
sono ssati, cioè non dipendono dalle variabili rispetto a cui si deriva, vediamo che la quantità (1)
è uguale alla forma quadratica
N
i,j=1
u
i
u
j
D
i
D
j
f =
N
i,j=1
u
i
u
j
f
x
i
x
j
= u Hu = u
t
Hu
con H matrice hessiana di f:
H(x) =
_
_
f
x
1
x
1
(x) . . . f
x
1
x
N
(x)
. . .
f
x
N
x
1
(x) . . . f
x
N
x
N
(x)
_
_
.
La potenza (u )
k
con 2 k n è poi denita per ricorrenza attraverso lidentità
(u )
k
f = (u )[(u )
k1
f].
Per indicare il valore di (u )
k
f in un punto x
0
di A usiamo la notazione (u )
k
f(x
0
) invece
della [(u )
k
f](x
0
), pi` u corretta ma poco maneggevole.
La notazione (u)
k
si rivela molto conveniente quando si devono eseguire derivazioni successive
della funzione composta
t
[u]
(t) = f(x
0
+tu). (2)
.
Teorema 1.1. Se f è una funzione di C
n
(A) e A contiene tutto il segmento che congiunge i punti
x
0
, x
0
+u la funzione (2) è di classe C
n
nel segmento [0, 1] e verica
(k)
[u]
(t) = (u )
k
f(x
0
+tu) (3)
per ogni k = 1, . . . , n.
DIM. Quando k = 1 la (3) segue subito dalla regola di derivazione delle funzioni composte. Per k > 1
arbitrario si procede induttivamente, tenendo conto che a sinistra compare d/dt[d
k1
[u]
(t)/dt
k1
]
e a destra (u )[(u )
k1
f(x
0
+tu)].
1
Inteso, quando il contesto lo richiede, come la colonna delle sue componenti, ovvero come matrice N 1.
3
Teorema 1.2. Se A contiene tutto il segmento che congiunge i punti x
0
, x
0
+ u e f C
1
(A),
esiste un numero ]0, 1[ tale che
f(x
0
+u) = f(x
0
) + (u )f(x
0
+ u). (4)
Se poi f C
2
(A) esiste un numero ]0, 1[ tale che
f(x
0
+u) = f(x
0
)+(u)f(x
0
)+
1
2
(u)
2
f(x
0
+u) = f(x
0
)+(u)f(x
0
)+
1
2
uH(x
0
+u)u. (5)
In generale: se f C
n
(A) esiste un numero ]0, 1[ tale che
f(x
0
+u) = f(x
0
) + (u )f(x
0
) + +
1
(n 1)!
(u )
n1
f(x
0
) +
1
n!
(u )
n
f(x
0
+ u). (6)
DIM. Siccome
[u]
(1) = f(x
0
+u) e
[u]
(0) = f(x
0
), la (4) segue dallidentità
[u]
(1) =
[u]
(0) +
[u]
()
(Teorema del valor medio) e dal Teorema 1.1. Abbiamo poi
[u]
(1) =
[u]
(0) +
[u]
(0) +
1
2
[u]
()
per n = 2 e
[u]
(1) =
[u]
(0) +
[u]
(0) + +
1
(n 1)!
(n1)
[u]
(0) +
1
n!
(n)
[u]
()
per n qualunque (formula di Taylor), sicche ancora una volta basta applicare il Teorema 1.1.
Per le funzioni di N variabili la (4) esprime il teorema del valor medio, mentre le (5) e
(6) sono gli sviluppi di Taylor (rispettivamente di ordine 2 e di ordine n) con il resto di
Lagrange.
Si faccia attenzione: la richiesta che il segmento di estremi x
0
e x
0
+u sia tutto contenuto in A
è essenziale per la validità delle (4), (5) e (6). A questo riguardo introduciamo la seguente nozione.
Un sottoinsieme U di R
N
è convesso se contiene ogni segmento di cui contiene gli estremi. Ad
esempio, ogni sfera è convessa. Con questa terminologia si ottiene dal Teorema 1.1 il
Corollario 1.1. Siano A convesso e f C
1
(A) con
f(x) K < per x A. (7)
Allora f verica la condizione di Lipschitz
f(x) f(y) Kx y per x, y A.
In particolare, f ha tutte le derivate nulle in A se e solo se è una costante.
DIM. Disuguaglianza di CauchySchwarz nella (4) per x = x
0
+u e y = x
0
:
f(x) f(y) = (x y) f(y + (x y)) x yf(y + (x y)) x yK.
4
In eetti anche se, come abbiamo detto, il teorema non vale in un generico aperto, lipotesi di
convessità si potrebbe indebolire un po per il primo enunciato e ancora di pi` u per il secondo.
Noi ci interessiamo soprattutto al caso N = 2, sicche la (2) è la funzione
[u]
(t) = f(x
0
+tu
1
, y
0
+tu
2
) (8)
senzaltro ben denita per 1 < t < 1 e u = (u
1
, u
2
) tale che u < r R se R > 0 è cos` piccolo
che tutto il disco di centro (x
0
, y
0
) e raggio R sia contenuto in A. Per k = 1 la (3) si riscrive
[u]
(t) = u
1
f
x
(x
0
+tu
1
, y
0
+tu
2
) +u
2
f
y
(x
0
+tu
1
, y
0
+tu
2
) = u f(x
0
+tu
1
, y
0
+tu
2
)
e per k = 2
[u]
(t) = u
2
1
f
xx
(x
0
+tu
1
, y
0
+tu
2
) + 2u
1
u
2
f
xy
(x
0
+tu
1
, y
0
+tu
2
) +u
2
2
f
yy
(x
0
+tu
1
, y
0
+tu
2
)
= u H(x
0
+tu
1
, y
0
+tu
2
)u; (9)
la (4) e la (5) si riscrivono rispettivamente
f(x
0
+u
1
, y
0
+u
2
) f(x
0
, y
0
) = u
1
f
x
(x
0
+ u
1
, y
0
+ u
2
) +u
2
f
y
(x
0
+ u
1
, y
0
+ u
2
)
= u f(x
0
+ u
1
, y
0
+ u
2
)
e
f(x
0
+u
1
, y
0
+u
2
) f(x
0
, y
0
) = u
1
f
x
(x
0
, y
0
) +u
2
f
y
(x
0
, y
0
)
+
1
2
u
2
1
f
xx
(x
0
+ u
1
, y
0
+ u
2
) + 2u
1
u
2
f
xy
(x
0
+ u
1
, y
0
+ u
2
) +u
2
2
f
yy
(x
0
+ u
1
, y
0
+ u
2
)
= u f(x
0
, y
0
) +
1
2
u H(x
0
+ u
1
, y
0
+ u
2
)u. (10)
Lultimo termine scritto qua sopra è uguale a
1
2
u H(x
0
, y
0
)u +
1
2
u [H(x
0
+ u
1
, y
0
+ u
2
) H(x
0
, y
0
)]u (11)
con la norma
2
H(x
0
+ u
1
, y
0
+ u
2
) H(x
0
, y
0
)
innitesima per r 0 uniformemente in grazie alla continuità delle derivate seconde di f.
3
2
La norma B di una matrice B = [b
ij
] è
ij
b
2
ij
, e la norma del vettore prodotto di B per un vettore v verica
la disuguaglianza di CauchySchwarz Bv Bv.
3
Consideriamo ad esempio f
xx
. Dato comunque > 0, esiste un r = r
]0, R[ tale che |f

xx
(x, y) f
xx
(x
0
, y
0
)| <
per ogni (x, y) tale che (x x
0
)
2
+ (y y
0
)
2
< r
2
, quindi in particolare per x = x
0
+u
1
e y = y
0
+u
2
se || < 1 e
u
2
1
+ u
2
2
< r
2
.
5
2 Massimi e minimi locali
Sia f una funzione C
1
(A), dove A R
2
è aperto. Diciamo che in un punto (x
0
, y
0
) A la f
assume un estremo locale, e pi` u precisamente un minimo locale o un massimo locale, se esiste
un intorno aperto U A di (x
0
, y
0
) tale che per ogni (x, y) U risulti, rispettivamente, f(x, y)
f(x
0
, y
0
) oppure f(x, y) f(x
0
, y
0
) (e aggiungiamo laggettivo proprio se le disuguaglianze sono
soddisfatte in senso stretto nei punti (x, y) = (x
0
, y
0
)). Ciò equivale a richiedere che per r > 0
sucientemente piccolo tutte le funzioni (8) con 1 < t < 1 e u = (u
1
, u
2
) tale che u < r
assumano rispettivamente un minimo o un massimo locale nel punto t = 0.
Le precedenti nozioni trasferiscono immediatamente alla dimensione 2 quelle analoghe viste in
dimensione 1. Ma per le funzioni di pi` u di una variabile può presentarsi unulteriore eventualità:
quella che un punto ne di minimo ne di massimo (in nessun suo intorno) sia però un punto di
sella, cioè di minimo in una direzione e di massimo in unaltra, ovvero ancora che esistano due
diversi vettori u tali che in corrispondenza ad uno di essi la
[u]
(t) assuma in t = 0 un minimo
locale proprio e in corrispondenza allaltro un massimo locale proprio.
Esempio 2.1. Lorigine degli assi è un punto di sella per la funzione f(x, y) = (x
2
y
2
)/2: la
restrizione f(x, 0) = x
2
/2 allasse x (vettore u = (1, 0)) ha minimo (assoluto) per x = 0, mentre
la restrizione f(0, y) = y
2
/2 allasse y (vettore u = (0, 1)) ha massimo (assoluto) per y = 0. (Il
graco di f(x, y) è il celeberrimo paraboloide a sella, detto anche iperbolico.)
La condizione necessaria di estremalità del primo ordine per f(x, y) segue subito da quella già
nota per le funzioni di una variabile.
Teorema 2.1. Anche un punto (x
0
, y
0
) A sia di minimo o massimo locale per una funzione
f C
1
(A) è necessario che f(x
0
, y
0
) = 0.
DIM. In t = 0 ogni funzione ] 1, 1[ t
[u]
(t) = f(x
0
+tu
1
, y
0
+tu
2
) con u = (u
1
, u
2
) di norma
< r è dotata di estremo, e quindi ha derivata nulla:
[u]
(0) = f
x
(x
0
, y
0
)u
1
+f
y
(x
0
, y
0
)u
2
= 0.
Dallarbitrarietà della scelta di (u
1
, u
2
) segue che f(x
0
, y
0
) = (f
x
(x
0
, y
0
), f
y
(x
0
, y
0
)) = (0, 0).
Ogni punto di A in cui f è dotata di gradiente nullo è un punto critico o stazionario o anche
un estremale di f, e come per le funzioni di una variabile non è detto che si tratti di un minimo
o di un massimo locale: si pensi a 0 per f(x) = x
3
, ovvero a (0, 0) per f(x, y) = x
3
...
Per poter passare alle condizioni del secondo ordine introduciamo la seguente terminologia. Se
B è una matrice simmetrica N N, la forma quadratica R
N
u u Bu si dice:
semidenita positiva o semidenita negativa a seconda che per ogni u R
N
risulti
u Bu 0 o u Bu 0;
denita positiva o denita negativa a seconda che per ogni u R
N
\{0} risulti u Bu > 0
o u Bu < 0.
6
E n qui si direbbe che stiamo semplicemente estendendo al caso di una qualunque dimensione
N delle banali nozioni unidimensionali sulla funzione R u Bu
2
legate al segno dello scalare B.
Ma non è cos`: quando N = 1 la funzione può solo essere soltanto 0 o 0, mentre già per N = 2
incontriamo semplici forme quadratiche che non sono semidenite, bens` vericano u Bu > 0 o
u Bu < 0 a seconda della scelta di u.
Esempio 2.2. Per
B =
1 0
0 1
risulta u Bu = u
2
1
u
2
2
, e questa quantità è positiva o negativa a seconda che si prenda u = (u
1
, 0)
con u
1
= 0 o u = (0, u
2
) con u
2
= 0.
Le precedenti nozioni sulle forme quadratiche si riformulano senza dicoltà in termini di au-
tovalori delle matrici B. Grazie alla simmetria di B sappiamo infatti dallAlgebra Lineare che
la matrice = diag (
1
, . . . ,
N
) dei suoi autovalori è reale ed uguale a C
t
BC, con C matrice
ortogonale: C
t
= C
1
. Dato comunque v R
N
abbiamo
v v = v
t
v = v
t
C
t
BCv = (Cv)
t
BCv = (Cv) BCv = u Bu
per u = Cv, e siccome il primo membro verica
mv
2
v v =
N
i=1
i
v
2
i
Mv
2
,
dove M e m sono rispettivamente il pi` u grande ed il pi` u piccolo autovalore di B, otteniamo
mu
2
u Bu Mu
2
per u R
N
grazie allisometria u = v; la prima (la seconda) disuguaglianza debole diventa lidentità quan-
do u è un autovettore associato allautovalore m (M). Dunque richiedere che B sia semidenita
positiva (semidenita negativa) equivale a richiedere che m 0 (M 0), per cui B non è semide-
nita se e solo se m < 0 < B; richiedere che B sia denita positiva (denita negativa) equivale a
richiedere che m > 0 (M < 0).
Teorema 2.2. Anche un punto (x
0
, y
0
) A sia di minimo oppure di massimo locale per una
funzione f C
2
(A) è necessario non solo che (x
0
, y
0
) sia un punto critico, ma anche che la forma
quadratica u H(x
0
, y
0
)u sia rispettivamente semidenita positiva oppure negativa, ovvero che tutti
gli autovalori di H(x
0
, y
0
) siano 0 oppure 0.
DIM. Supponiamo che (x
0
, y
0
) sia di minimo per f. Allora ogni funzione t
[u]
(t), essendo dotata
di minimo in t = 0, verica non solo
[u]
(0) = 0 ma anche
[u]
(0) 0, e quindi
u H(x
0
, y
0
)u = u
2
1
f
xx
(x
0
, y
0
) + 2u
1
u
2
f
xy
(x
0
, y
0
) +u
2
2
f
yy
(x
0
, y
0
) =
[u]
(0) 0.
Analogo discorso se (x
0
, y
0
) è di massimo.
7
Osservazione 2.1. Nelle dimostrazioni di entrambi i teoremi precedenti abbiamo sfruttato lim-
plicazione:
la f(x, y) ha un minimo locale in (x
0
, y
0
) =tutte le
[u]
(t) hanno un minimo locale in (x
0
, y
0
).
Ebbene, vale la pena di notare che questa implicazione non si inverte. Siano ad esempio A = R
2
,
f(x, y) = (y x
2
)(y 2x
2
). In (0, 0) il gradiente di f è nullo e lhessiana vale
0 0
0 2
,
per cui è semidenita positiva. Ma (0, 0) non è di minimo per f, perche ogni intorno dellorigine
contiene punti in cui f è positiva ed altri in cui è negativa. Invece in t = 0 tutte le
[u]
(t) = f(tu
1
, t
2
) = t
2
(u
2
tu
2
1
)(u
2
2tu
2
1
)
hanno minimo locale (proprio) uguale a 0: infatti t
2
(u
2
tu
2
1
)(u
2
2tu
2
1
) con |t| > 0 abbastanza
piccolo ha il segno di di u
2
2
> 0 se u
2
= 0, mentre per vale 2t
4
u
4
1
> 0 per t = 0, u
1
= 0, u
2
= 0.
Col Teorema 2.2 abbiamo ottenuto una condizione solo necessaria perche un punto critico sia di
estremo locale. NellOsservazione 2.1 abbiamo già visto un controesempio, e altri ne menzioneremo
nellOsservazione 2.2. Passiamo alla condizione suciente.
Teorema 2.3. Un punto critico (x
0
, y
0
) A per una funzione f C
2
(A) tale che la forma
quadratica u H(x
0
, y
0
)u sia denita positiva oppure negativa, ovvero che tutti gli autovalori di
H(x
0
, y
0
) siano > 0 oppure < 0, è rispettivamente di minimo o massimo locale proprio.
DIM. Applichiamo la formula di Taylor di ordine 2 con f(x
0
, y
0
) = (0, 0) (il punto è critico): dato
comunque u = (u
1
, u
2
) R
2
con u < r esiste un ]0, 1[ tale che
f(x
0
+u
1
, y
0
+u
2
) f(x
0
, y
0
) =
1
2
u H(x
0
+ u
1
, y
0
+ u
2
)u
=
1
2
u H(x
0
, y
0
)u +
1
2
u [H(x
0
+ u
1
, y
0
+ u
2
) H(x
0
, y
0
)]u
con la norma
H(x
0
+ u
1
, y
0
+ u
2
) H(x
0
, y
0
)
innitesima per r 0 uniformemente in (cfr. (10) e (11)).
Supponiamo che la forma quadratica u u H(x
0
, y
0
)u sia denita positiva, ovvero che il
minimo autovalore m di H(x
0
, y
0
) sia > 0. Fissiamo un r = r
m/2
> 0 tale che
H(x
0
+ u
1
, y
0
+ u
2
) H(x
0
, y
0
) <
m
2
e quindi
u [H(x
0
+ u
1
, y
0
+ u
2
) H(x
0
, y
0
)]u H(x
0
+ u
1
, y
0
+ u
2
) H(x
0
, y
0
)u
2
<
m
2
u
2
per u < r. Siccome
u H(x
0
, y
0
)u mu
2
8
come abbiamo visto con le considerazioni che precedono il Teorema 2.2
4
, otteniamo
f(x
0
+u
1
, y
0
+u
2
) f(x
0
, y
0
)
m
2
u
2
m
4
u
2
u
2
=
m
4
u
2
,
da cui f(x, y) > f(x
0
, y
0
) per 0 < (x x
0
)
2
+ (y y
0
)
2
< r
2
. Ne segue che la f è dotata in
(x
0
, y
0
) di minimo (per di pi` u proprio).
Il ragionamento per il massimo è del tutto analogo.
Osservazione 2.2. A dierenza di quanto accade in dimensione 1, in dimensione 2 un punto critico

può essere associato ad una forma quadratica che non è semidenita, e in tal caso (condizione
suciente!) il punto è di sella. Infatti la corrispondente funzione
[u]
(t) verica
[u]
(0) > 0
o
[u]
(0) < 0 a seconda che il vettore u sia stato scelto in modo tale che u H(x
0
, y
0
)u > 0
o u H(x
0
, y
0
)u < 0, e questo, insieme alla condizione di stazionarietà, implica che t = 0 è
rispettivamente di minimo o di massimo (locale) per
[u]
(t).
`
E il caso considerato nellEsempio 2.1:
in (0, 0) la funzione f(x, y) = (x
2
y
2
)/2 ha gradiente nullo e hessiana uguale alla B dellEsempio
2.2. Ma un punto può essere di sella anche se l` la forma quadratica è semidenita: insomma, nel
caso della forma semidenita può succedere quasi tutto, o addirittura tutto. Infatti se si aggiunge
la richiesta che lhessiana non sia nulla rimane escluso solo che il punto possa essere di massimo
o di minimo, a seconda che la forma sia semidenita positiva o negativa: si pensi alle funzioni
(x
4
y
2
). Se poi lhessiana è nulla ovvero la forma, valendo identicamente zero, è semidenita
positiva e negativa , non si esclude proprio niente: si pensi alle funzioni (x
4
y
4
) e x
3
nonche
alla (y x
2
)(y 2x
2
) dellOsservazione 2.1...
Osservazione 2.3. Per lo studio della forma quadratica associata allhessiana è utile, ntantoche
siamo in dimensione 2, ricorrere semplicemente alla formula risolutiva per le equazioni di secondo
grado. Infatti lo studio del segno del polinomio omogeneo di secondo grado in due variabili
u u H(x
0
, y
0
)u = f
xx
u
2
1
+ 2f
xy
u
1
u
2
+f
yy
u
2
2
si riconduce a quello di un polinomio di secondo grado in una variabile, per la precisione f
xx
2
+
2f
xy
+f
yy
se f
xx
= 0 (con = u
1
/u
2
per u
2
= 0) o f
yy
2
+2f
xy
+f
xx
se f
yy
= 0 (con = u
2
/u
1
per u
1
= 0). In ogni caso si tratta di studiare il segno del discriminante = f
2
xy
f
xx
f
yy
: a seconda
che in (x
0
, y
0
) il risulti negativo, nullo o positivo il polinomio non ha nessuna soluzione reale, ne ha
una o ne ha due, e di conseguenza la forma quadratica è denita (positiva o negativa a seconda che
f
xx
> 0, e quindi f
yy
> 0, oppure f
xx
< 0, e quindi f
yy
< 0, per cui (x
0
, y
0
) è rispettivamente punto
di minimo oppure di massimo locale proprio), semidenita, o non semidenita (per cui (x
0
, y
0
) è
un punto di sella).
4
Alla stessa disuguaglianza possiamo arrivare, senza parlare di autovalori, nel modo seguente. Indichiamo con m
il minimo sulla circonferenza u =
u
2
1
+ u
2
2
= 1 della funzione continua di 2 variabili u u H(x
0
, y
0
)u, sempre
positiva fuori da 0, per cui m > 0 grazie al Teorema di Weierstrass. Preso allora u = 0, per cui u/u ha norma 1,
otteniamo
u H(x
0
, y
0
)u
u
2
=
u
u
H(x
0
, y
0
)
u
u
m.
9
Tutto il contenuto di questa sezione, ad eccezione della precedente osservazione, si estende senza
dicoltà da 2 a pi` u variabili.
Esempio 2.3. Siano A = R
2
, f(x, y) = x
2
+ y
3
xy. I punti critici di f sono le soluzioni del
sistema
f
x
(x, y) = 2x y = 0, f
y
(x, y) = 3y
2
x = 0,
ovvero (0, 0) e (1/12, 1/6). Studiamo il discriminante
(x, y) = f
2
xy
(x, y) f
xx
(x, y)f
yy
(x, y) = (1)
2
2 6y.
Siccome (0, 0) = 1 e (1/12, 1/6) = 1 con f
xx
(1/12, 1/6) = 2, lorigine è un punto di sella e
(1/12, 1/6) è un punto di minimo locale (ma non assoluto: nel piano la f è illimitata sia inferiormente
che superiormente!) Si noti che lhessiana di f nel punto generico (x, y) vale
H(x, y) =
2 1
1 6y
,
per cui
H(0, 0) =
2 1
1 0
, H(1/12, 1/6) =
2 1
1 1
e quindi u H(0, 0)u = 2u

2
1
2u
1
u
2
non è semidenita (basta prendere u
1
= 0 e u
2
una volta uguale
a u
1
/2 e unaltra a 2u
1
), mentre u H(1/12, 1/6)u = 2u
2
1
2u
1
u
2
+u
2
2
= u
2
1
+(u
1
u
2
)
2
è denita
positiva.
Esempio 2.4. Siano A =]0, 2[

2
, f(x, y) = x
2
+ 2y
2
4xy + 2x. Imponendo il sistema
f
x
(x, y) = 2x 4y + 2 = 0, f
y
(x, y) = 4y 4x = 0
si trova un unico punto critico (1, 1), che appartiene ad A. Il discriminante
(x, y) = f
2
xy
(x, y) f
xx
(x, y)f
yy
(x, y) = (4)
2
2 4
vale identicamente 8, e quindi (1, 1) è un punto di sella.
Esempio 2.5. In R
3
lorigine è punto di minimo assoluto per f(x, y, z) = x
2
+ 3y
2
+ 2z
4
ed
è di sella per per f(x, y, z) = x
2
3y
2
+ 2z
4
.
10
3 Approfondimenti sullintegrale di Riemann
Nello studio dellintegrabilità secondo Riemann e di tanti altri argomenti! un ruolo fonda-
mentale è svolto dalla nozione di uniforme continuità in un insieme I. Si tratta della proprietà
di cui diciamo che gode una funzione f : I R se ad ogni > 0 si può associare un =
> 0
tale che |f(x
) f(x
)| < per ogni coppia di punti x
, x
I con |x
| < .
Ogni f lipschitziana in I, cioè tale che esista una costante K > 0 per la quale |f(x
) f(x
)|
K|x
| al variare di x
, x
in I, è uniformemente continua: basta prendere = /K.

Se I è un intervallo sia chiuso che limitato una f C
1
(I) vi è uniformemente continua. Infatti
la sua derivata f
è dotata in I di massimo e di minimo assoluti per il Teorema di Weierstrass, e

di conseguenza è soddisfatta la condizione di Lipschitz: |f(x
) f(x
)| (max
I
|f
|)|x
| per
x
, x
I grazie al Teorema di Lagrange.

Notiamo tuttavia che una comunissima funzione come

x non è C
1
, e non è lipschitziana, in
I = [0, 1]. Vi è, comunque, uniformemente continua? S`, semplicemente perche vi è continua, ma
questo lo vedremo solo nelle considerazioni nali di questa sezione.
Arontiamo alla luce delluniforme continuità il criterio di integrabilità di una funzione f denita
e limitata nellintervallo chiuso e limitato I = [a, b]. Anche esista lintegrale (di Riemann) di f è
necessario e suciente che ad ogni > 0 si possa associare una partizione {x
0
= a < x
1
< x
2
<
< x
m
= b} di [a, b] tale che
m
h=1
sup
]x
h1
,x
h
[
f inf
]x
h1
,x
h
[
f
(x
h
x
h1
) < . (12)
Ma quando f è continua negli [x
h1
, x
h
] esistono
sup
]x
h1
,x
h
[
f = max
[x
h1
,x
h
]
f = f(x
h
), inf
]x
h1
,x
h
[
f = min
[x
h1
,x
h
]
f = f(x
h
)
per opportuni x
h
, x
h
[x
h1
, x
h
], sicche la condizione (12) diventa
m
h=1
f(x
h
) f(x
h
)
(x
h
x
h1
) < .
Questultima disuguaglianza è immediata quando in pi` u si sa che f è uniformemente continua in
[a, b]: richiedendo che x
h
x
h1
< per h = 1, . . . , m, con > 0 tale che |f(x
) f(x
)| < /(ba)
per ogni coppia di punti x
, x
I con |x
| < , si ottiene
m
h=1
f(x
h
) f(x
h
)
(x
h
x
h1
) <

b a
m
h=1
(x
h
x
h1
) = .
E perche valga luniforme continuità una condizione suciente, come abbiamo visto, è che f sia
lipschitziana, o pi` u sbrigativamente che stia in C
1
([a, b]). Però con questo approccio già non si
ottiene, ad esempio, lintegrabilità di

x, 0 x 1.
`
E dunque chiaro che vale la pena di passare
ad un criterio di integrabilità un po pi` u maneggevole. Eccolo:
Teorema 3.1. Una funzione limitata f : [a, b] R è integrabile se è di classe C
1
al di fuori di un
numero nito di punti
0
, . . . ,
n
.
11
DIM. Ci si convince facilmente ricorrendo se necessario ad una opportuna suddivisione dellinter-
vallo in sottointervalli che non è restrittivo limitarsi al caso che f sia di classe C
1
in tutto [a, b]
privato solo di un estremo, diciamo di
0
= b per ssare le idee.
Dato arbitrariamente > 0 scegliamo innanzitutto un B ]a, b[ tale che
2 sup
[a,b]
|f|(b B) <

2
. (13)
Applicando poi luniforme continuità di f in [a, B] otteniamo lesistenza di un > 0 tale che
|f(x
) f(x
)| <

2(b a)
per tutti i punti x
, x
di tale intervallo che vericano |x
| < .
Sia {x
0
= a < < x
m1
= B < x
m
= b} una partizione di [a, b] con x
h
x
h1
< per
h = 1, . . . , m1. Allora, servendoci fra laltro delle maggiorazioni
sup
]x
m1
,x
m
[
f inf
]x
m1
,x
m
[
f
sup
]x
m1
,x
m
[
f
inf
]x
m1
,x
m
[
f
2 sup
[a,b]
|f|,
otteniamo
m
h=1
sup
]x
h1
,x
h
[
f inf
]x
h1
,x
h
[
f
(x
h
x
h1
)
=
m1
h=1
f(x
h
) f(x
h
)
(x
h
x
h1
) +
sup
]x
m1
,x
m
[
f inf
]x
m1
,x
m
[
f
(x
m
x
m1
)

2(b a)
m1
h=1
(x
h
x
h1
) + 2
sup
[a,b]
|f|
(b B) <

2(b a)
(b a) +

2
= .
Ne segue che la (12) è soddisfatta, e quindi che f è integrabile.
Questo teorema si applica subito per esempio a

x, che è C
1
in ]0, 1] e C
0
in [0, 1], quindi
limitata, ma anche a funzioni che in alcuni o tutti gli
k
presentino un numero nito di veri e propri
salti (discontinuità).
Torniamo adesso dal punto di vista pi` u generale sulla nozione di uniforme continuità in un
insieme I.
`
E facile convincersi che essa implica la continuità in ogni punto di I: anzi, a prima
vista verrebbe fatto di dire che si tratti proprio della stessa cosa. E invece no, perche non vale il
viceversa, come mostrano i seguenti esempi.
Esempio 3.1. Sia I =]0, 1] (intervallo limitato, ma non chiuso). La funzione f(x) = sin(1/x) è
di classe C
0
(I), ovvero continua in ogni punto di I, ma non uniformemente in I: la quantità
f(1/(2n + /2)) f(1/(2n)) = sin(2n + /2) sin(2n) è sempre = 1, dunque > non
appena < 1, nonostante che per ogni scelta di > 0 si possano sempre trovare inniti n tali che
0 < 1/(2n) 1/(2n + /2) < .
12
Esempio 3.2. Sia I = [0, [ (intervallo chiuso, ma non limitato). La funzione f(x) = x
2
è di
classe C
0
(I), ovvero continua in ogni punto di I, ma non uniformemente in I: per ogni scelta di
> 0 e di x
0
1/ la quantità f(x
0
+/2) f(x
) = (2x
0
+/2)/2 è > x
0
1, dunque > non
appena < 1, e questo nonostante tutti i punti x
0
, x
0
+ /2 con x
0
1/ distino meno di .
Si noti che in ciascuno dei due esempi la f è di classe C

1
, anzi C
, nellintervallo I in cui
è stata denita, ma con derivata f
illimitata comè ovvio, altrimenti il teorema di Lagran-

ge implicherebbe la lipschitzianità (con costante di Lipschitz K = sup
I
|f
|) e quindi luniforme
continuità.
Ebbene: limportantissimo Teorema di HeineCantor aerma che quando I è un sottoin-
sieme sia chiuso che limitato di R, anzi pi` u in generale di un qualunque R
N
(con la distanza tra
due punti al posto del modulo della dierenza di due numeri), ogni f : I R continua in I,
come ad esempio

x in I = [0, 1], vi è uniformemente continua. Questo ci consente di riformulare,
nella portata pi` u generale che è in eetti la sua, la condizione di integrabilità fornita dal Teorema
3.1. Nella dimostrazione abbiamo infatti sfruttato in modo essenziale luniforme continuità di f in
[a, B], e per ottenerla ci siamo serviti dellipotesi che l` f sia di classe C
1
. Alla luce del Teorema
di HeineCantor possiamo adesso dire che basta molto meno, e cioè che il Teorema 3.1 vale con la
classe C
1
dellipotesi sostituita dalla classe C
0
:
Teorema 3.2. Una funzione limitata f : [a, b] R è integrabile se è continua al di fuori di un
numero nito di punti
0
, . . . ,
n
.
Nel seguito, pur senza aver dimostrato il Teorema di HeineCantor, faremo il pi` u delle volte
riferimento (magari tacito) al Teorema 3.2 invece che all3.1.
4 Integrali impropri e serie
Per < a < b indichiamo con f una funzione [a, b[R integrabile secondo Riemann da a
ad B per ogni B ]a, b[.
Se aggiungiamo le ipotesi che (i) b sia nito e (ii) f sia limitata, la funzione è dotata di integrale
di Riemann da a a b, con
b
a
f(x) dx = lim
Bb
B
a
f(x) dx. (14)
Dato arbitrariamente > 0, infatti, sia B ]a, b[ come nella (13) e sia {x
0
= a < < x
m1
= B}
una partizione di [a, B] per la quale, grazie allipotesi di integrabilità su [a, B], risulti
m1
h=1
sup
]x
h1
,x
h
[
f inf
]x
h1
,x
h
[
f
(x
h
x
h1
) <

2
.
Allora {x
0
= a < < x
m1
= B < x
m
= b} è una partizione di [a, b] per la quale risulta
m
h=1
sup
]x
h1
,x
h
[
f inf
]x
h1
,x
h
[
f
(x
h
x
h1
) <
13
(cfr. la dimostrazione del Teorema 3.1), da cui lintegrabilità secondo Riemann di f su [a, b]. Che
poi valga la (14) è conseguenza immediata di
b
a
f(x) dx
B
a
f(x) dx
b
B
f(t) dt
sup
[a,b]
|f|(b B) < /2.
Lasciamo cadere almeno una tra la (i) e la (ii). Il primo membro della (14) non ha pi` u senso
come integrale di Riemann: lo chiamiamo integrale improprio di f da a a b. Il limite nel secondo
membro (con lintesa che b
si legga come se b = ) non è detto che esista, ne, se esiste, che

sia nito. Se esiste diciamo che il suo valore è quello dellintegrale improprio a primo membro, che
chiamiamo convergente o divergente a seconda che sia nito o no.
In maniera analoga a quanto abbiamo appena visto si aronta poi il caso di una funzione f
denita su un ]a, b], dove a < b < , e integrabile secondo Riemann su ogni sottointervallo
[A, b], a < A < b, col valore dellintegrale improprio dato da
b
a
f(x) dx = lim
Aa
+
b
A
f(x) dx (15)
nel caso che il limite esista (e con lintesa che a
+
si legga come se a = ).
Se inne f è una funzione denita su un ]a, b[ con a < b e integrabile secondo
Riemann su ogni sottointervallo [A, B] con a < A < B < b, il suo integrale improprio da a a b vale
b
a
f(x) dx = lim
Aa
+
,Bb
B
A
f(x) dx (16)
nel caso che entrambi i limiti indipendenti! esistano senza essere uguali uno a + e laltro
a .
Esempio 4.1. (i) Sia f(x) = x
, 0 < K x < . La funzione
B
K
x
dx
vale (B
1
K
1
)/(1 ) se = 1 e log B log K se = 1. Ne segue che x
è dotata di
integrale improprio da 1 a convergente (e uguale a K
1
/(1)) o divergente (a +) a seconda
che > 1 o 1.
(ii) Sia f(x) = x
, 0 < x K < . La funzione
K
A
x
dx
vale (K
1
A
1
)/(1 ) se = 1 e log K log A se = 1. Ne segue che x
è dotata di
integrale improprio da 0 a 1 convergente (e uguale a K
1
/(1 )) o divergente (a +) a seconda
che < 1 o 1. Da qui deduciamo poi che per < a < b < gli integrali impropri di
1/(x a)
e di 1/(b x)
da a a b convergono o divergono a seconda che < 1 o 1. Infatti si

vede, sostituendo y = x a nel primo e y = b x nel secondo, che entrambi sono uguali a
ba
0
dy
y
.
(iii) Lintegrale improprio
e
|x|
dx = 2

0
e
x
dx
converge: il suo valore è 2[e
x
]
0
= 2.
14
Una serie reale
n=K
a
n
(dove K è qualche naturale) si può scrivere come integrale improprio
della funzione che vale a
n
per n x < n + 1[, n = K, K + 1, . . . , ovvero
[K, [ x
n=K
a
n
1
[n,n+1[
(x)
(che su ogni intervallo limitato soddisfa lipotesi del Teorema 3.1 e di conseguenza è integrabile). Ciò
rende interessante, nel contesto dellintegrazione impropria, approfondire alcune questioni relative
alle serie.
Ricordiamo il criterio del confronto per le serie a termini non negativi : se due successioni
reali {a
n
} e {b
n
} vericano denitivamente
0 a
n
b
n
la convergenza della
b
n
implica quella della
a
n
, mentre la divergenza della
a
n
implica quella
della
b
n
.
Quando i termini di una serie soddisfano, da un certo punto in poi, le disuguaglianze strette
a
n
> 0, unutile applicazione del criterio del confronto è il criterio del rapporto: condizione
suciente anche
a
n
converga è che esista un numero ]0, 1[ tale che
a
n+1
/a
n
per n K (17)
dove K è un opportuno naturale. Infatti dalle disuguaglianze
a
K+1
a
K
, a
K+2
a
K+1
, . . . , a
n+K
a
n1+K
si ricava che
a
n+K
a
n+K1
a
K+1
n1
a
K
n
e quindi che la serie
n
a
n+K
è maggiorata termine a termine dalla serie convergente
n
a
K
n
(prodotto di una costante per la serie geometrica di ragione ). Se il rapporto a
n+1
/a
n
tende a
un limite L < 1, la (17) vale con un qualunque ssato in ]L, 1[ a patto di prendere K = K()
sucientemente grande.
Esempio 4.2. (i) Siccome
1
(n + 1)!
n! =
1
n + 1
0 per n
la serie
n
1/n! converge (e si dimostra che la sua somma è e).
(ii) La serie
n
n!/n
n
converge perche
(n + 1)!
(n + 1)
n+1
n
n
n!
=
n
n + 1
n
=
1
1
n + 1
1
e
< 1.
Se a
n+1
/a
n
tende a un limite L > 1 la serie diverge, perche per un opportuno N i suoi
addendi vericano a
n+1
/a
n
1 per n , e quindi a
+p
a
per p N: viene meno la condizione

a
n
0 che sappiamo essere necessaria per la convergenza.
Se a
n+1
/a
n
1 può accadere sia che la serie converga, come la
con > 1, e sia che

diverga, come la
con 1.
15
E se i termini a
n
della serie non sono di segno costante? Si può passare allo studio della serie
|a
n
| dei moduli e controllare se converge. In tal caso, essa soddisfa la condizione di Cauchy. Ma
allora soddisfa la condizione di Cauchy anche la
a
n
: infatti il primo membro della disuguaglianza
|a
n+1
+a
n+1
+ +a
n+1
| |a
n+1
| + |a
n+1
| + + |a
n+1
|
è minore di > 0 se lo è il secondo membro. Ne segue allora anche la convergenza, che chiamiamo
assoluta, della serie di partenza
a
n
.
5 Criterio del confronto, convergenza assoluta, convergenza con-
dizionata
Torniamo agli integrali impropri. Nella maggior parte dei casi di speciche funzioni bisogna aspet-
tarsi che il calcolo esplicito dei limiti che compaiono nelle formulazioni generali a secondo membro
della (14) o della (15) o della (16) si riveli semplicemente impossibile.
`
E dunque utile poter disporre
di un criterio di convergenza/divergenza di integrali impropri, che riguarda funzioni non negative
e costituisce la generalizzazione del criterio del confronto per serie a termini non negativi.
Teorema 5.1 (del confronto). Siano f, g : [a, b[R, dove < a < b , funzioni entrambe
integrabili secondo Riemann da a a B per ogni B [a, b[, con
0 f(x) g(x) per a x < b. (18)
Allora lintegrale improprio da a a b di f converge se converge quello di g, mentre quello di g diverge
se diverge quello di f.
DIM. Dalla (18) segue che
B
a
f(x) dx
B
a
g(x) dx.
Entrambi gli integrali sono funzioni crescenti della B dal momento che i loro integrandi sono 0,
e di conseguenza ammettono limite per B b
. La conclusione segue subito.
Il passaggio ai casi f, g :]a, b] R con a < b < , e f, g :]a, b[R con a < b
si fa in un attimo.
Il prossimo esempio estende, a partire dallEsempio 4.1, la classe delle funzioni su cui appoggiarsi
per lutilizzo pratico del criterio del confronto.
Esempio 5.1. (i) Lintegrale improprio su R di 1/(1 + |x|
) converge o diverge a seconda che

> 1 o 1. Per convincersene basta limitarsi alla semiretta x 1 (per 1 x 1 non ci sono
problemi e per x 1 si utilizza la simmetria del modulo): siccome
1
2x

1
1 +x

1
x
per x 1
basta tener conto dellEsempio 4.1 (i).
(ii) Per 1 e |x| 1 vale la maggiorazione e
|x|
e
|x|
, e quindi la convergenza del
lintegrale improprio di e
|x|
da a segue dallEsempio 4.1 (iii).
16
In eetti il primo approccio allutilizzo del criterio del confronto conviene tentarlo, quando si ha
a che fare con funzioni f, g entrambe (strettamente) positive, ricorrendo allo studio del limite del
rapporto tra le due. Poniamoci ad esempio nel caso di f, g : [a, b[R, < a < b , funzioni
entrambe > 0 in [a, b[ e integrabili secondo Riemann da a a B per ogni B [a, b[. Supponiamo che
esista L = lim
xb
f(x)/g(x) (necessariamente 0) . Allora:
se lintegrale improprio di g da a a b converge e L è < sicche esiste un B tale che
f(x) (L + 1)g(x) per x B , converge anche lintegrale improprio di f;
se lintegrale improprio di g da a a b diverge e L è > 0 sicche, ssato ]0, L[, esiste un
B tale che f(x) g(x) per x B , diverge anche lintegrale improprio di f.
Proseguiamo con lanalogia al (e in eetti con la generalizzazione del) caso delle serie. Su
[a, B] [a, b[ lintegrabilità secondo Riemann di f implica quella del modulo |f|, della parte positiva
f
+
e della parte negativa f
; se da a a b converge lintegrale improprio di |f| diciamo che quello

di f converge assolutamente, e grazie al Teorema del confronto vale il
Teorema 5.2. Per < a < b lintegrale improprio di una f : [a, b[R, integrabile secondo
Riemann da a a B per ogni B [a, b[, se è assolutamente convergente è anche convergente.
DIM. Siccome
0 f
+
, f
|f|
la convergenza dellintegrale improprio di |f| implica quella degli integrali impropri di f
+
e di f
,
dunque quella di f = f
+
f
Il precedente enunciato non si inverte: può ben accadere che un integrale improprio converga
ma non assolutamente, ovvero che converga condizionatamente.
Esempio 5.2. Lintegrale improprio (detto di Dirichlet)
D =

0
sin x
x
dx
converge condizionatamente. Per vedere questo basta limitarsi allintervallo di integrazione [1, [,
visto che lintegrando, posto uguale a un qualunque numero reale per x = 0, è integrabile secondo
Riemann da 0 a 1.
Per 1 < K < si ottiene, integrando per parti,
K
1
sin x
x
dx =
cos x
x
K
1
K
1
cos x
x
2
dx.
Siccome lintegrando nel secondo membro è maggiorato in valore assoluto dalla funzione x
2
che è
dotata di integrale improprio convergente da 1 a , il limite per K esiste nito. Dunque D
è un integrale improprio convergente. Non assolutamente convergente, però:
(2k+1)
2k
| sin x|
x
dx =
(2k+1)
2k
sin x
x
dx
1
(2k + 1)
(2k+1)
2k
sin xdx =
1
(2k + 1)
cos x
(2k+1)
2k
=
2
(2k + 1)
17
e quindi
D
k=1
(2k+1)
2k
| sin x|
x
dx
k=1
1
(k + 1)
= .
In maniera analoga si verica che anche gli integrale impropri
J
1
=

0
sin x
x
dx, J
2
=

1
cos x
x
dx
convergono, ma non assolutamente.
A questo punto si verica anche che converge, ma non assolutamente, lintegrale improprio
F =

1
sin x
2
dx :
la sostituzione y = x
2
dà infatti
F =
1
2

1
sin y
y
dy =
1
2
J.
Il criterio del confronto per la convergenza/divergenza degli integrali impropri si può trasportare
ad una serie
n
a
n
(a termini 0) quando esiste una funzione f continua e decrescente in una
semiretta [K, [ (K N) che verica f(n) = a
n
e quindi a
n+1
f(x) a
n
. In tal caso infatti
risulta
a
n+1

n+1
n
f(x) dx a
n
da cui
n=K
a
n+1

K
f(x) dx
n=K
a
n
,
e si arriva al criterio integrale di convergenza o divergenza per le serie: se lintegrale improprio di
f converge, converge
n
a
n+1
e quindi anche
n
a
n
; se lintegrale improprio di f diverge,
n
a
n
diverge.
Questo criterio può rivelarsi uno strumento prezioso quando gli altri criteri sono di applicazione
un po troppo complicata. Si pensi già alla serie armonica generalizzata
: dallEsempio 4.1
segue subito la convergenza o la divergenza a seconda che 1 o > 1. Ancora pi` u illuminante
è il caso della
(nlog n)
1
: il confronto con le serie armoniche generalizzate non fornisce nessuna
informazione che permetta di concludere, mentre basta osservare che la funzione (xlog x)
1
, essendo
la derivata di log(log x), ha integrale improprio divergente, per ottenere la divergenza della serie.
Lanalogia tra integrali impropri e serie deve peraltro essere maneggiata con cautela. Se, ad
esempio, una serie
a
n
converge, sia pure solo semplicemente, il suo termine generale a
n
è innite-
simo per n , mentre se lintegrale improprio di una funzione f su un intervallo superiormente
illimitato converge non è aatto detto che f(x) 0 per x : si pensi a f(x) = sin x
2
, 1 x <
(Esempio 5.2), o ancora meglio alla funzione
f(x) =
n=1
n1
[n,n+1/n
3
]
(x),
addirittura illimitata su ogni semiretta [K, [ eppure dotata di integrale improprio assolutamente
convergente uguale a
n=1
1/n
2
. Dunque non si può pensare di estendere dalle serie agli integrali
18
impropri una qualche versione puntuale! del criterio di convergenza di Cauchy (e infatti
per dimostrare col Teorema 5.2 che la convergenza assoluta implica la convergenza siamo ricorsi al
Teorema del confronto 5.1, mentre per le serie si utilizza tranquillamente Cauchy).
6 Integrali di Riemann dipendenti da parametri
Nel corso di Calcolo 1 si incontrano delle particolari, e importantissime, funzioni denite mediante
integrali: quelle della forma [c, d] x
x
c
f(t) dt. Passiamo adesso allambito delle funzioni di
pi` u variabili, servendoci in maniera rilevante delluniforme continuità di una funzione continua in
un chiuso e limitato C garantita dal Teorema di HeineCantor
5
.
Cominciamo col
Teorema 6.1. Sia f una funzione continua in I [c, d] con I intervallo chiuso e limitato, <
c < d < . Allora
F(x) =
d
c
f(x, t) dt
è continua in I. Se poi si suppone che per ogni t [c, d] esista la derivata f
x
(x, t) di I x f(x, t)
e che f
x
C
0
(I [c, d]), allora anche F è dotata di derivata continua
F
(x) =
d
c
f
x
(x, t) dt (19)
in I.
DIM. Siano x
0
, x I. Grazie alluniforme continuità della funzione f nel rettangolo chiuso e
limitato I [c, d] possiamo associare ad ogni > 0 un =
> 0 tale che

|f(x, t) f(x
0
, t)| per t [c, d]
e quindi, maggiorando in modulo lincremento
F(x) F(x
0
) =
d
c
[f(x, t) f(x
0
, t)] dt,
ottenere
|F(x) F(x
0
)|
d
c
|f(x, t) f(x
0
, t)| dt (d c)
purche x I verichi |x x
0
| . Ciò mostra la continuità in x
0
.
Passiamo alla derivabilità in x
0
, sfruttando stavolta luniforme continuità in I [c, d] della
funzione f
x
. Sia dunque dato arbitrariamente > 0, e sia =
> 0 tale che

|f
x
(x, t) f
x
(x
0
, t)| per t [c, d] (20)
5
Anche in pi` u variabili luniforme continuità in C segue, senza passare per HeineCantor, da propriet` a pi` u forti
della continuità, come la lipschitzianità. Ma questultima, senza qualche ulteriore ipotesi su C, come ad esempio la
convessit` a che consente di applicare su ogni segmento contenuto in C il Teorema del valor medio in una variabile,
non è pi` u a sua volta conseguenza automatica della regolarit` a C
1
: cfr. le consderazioni che precedono e seguono il
Corollario 1.1.
19
se x I con |x x
0
| . Sia 0 < |h| tale che x
0
+h I. Applichiamo il teorema di Lagrange:
ad ogni t [c, d] corrisponde un ]0, 1[, che dipende anche da h, tale che
f(x
0
+h, t) f(x
0
, t)
h
= f
x
(x
0
+ h, t)
(e, sebbene non si sappia nulla della dipendenza di da t, la funzione t f
x
(x
0
+ h, t), essendo
uguale a (f(x
0
+ h, t) f(x
0
, t))/h, è continua, e dunque integrabile secondo Riemann, in [c, d]).
Dunque, maggiorando in modulo la dierenza
F(x
0
+h) F(x
0
)
h

d
c
f
x
(x
0
, t) dt =
d
c
f(x
0
+h, t) f(x
0
, t)
h
f
x
(x
0
, t)
dt
=
d
c
[f
x
(x
0
+ h, t) f
x
(x
0
, t)] dt
otteniamo
F(x
0
+h) F(x
0
)
h

b
a
f
x
(x
0
, t) dt
d
c
|f
x
(x
0
+ h, t) f
x
(x
0
, t)| dt < (d c).
A questo punto la (19) per x = x
0
segue dallarbitrarietà di . Applicando poi a f
x
(x, t) il precedente
risultato di continuità si ottiene anche la continuità di F
in I.
Naturalmente nel Teorema 6.1 gli estremi di integrazione possono essere scambiati tra di loro:
questo signica semplicemente passare da F e F
a G = F e G
= F
.
Adesso facciamo variare gli estremi di integrazione.
Teorema 6.2. Sia f continua in I [c, d]. In C = I [c, d] [c, d] la funzione
(x, y, z) =
z
y
f(x, t) dt
è continua e dotata di derivate parziali continue
y
(x, y, z) = f(x, y),
z
(x, y, z) = f(x, z). (21)
Se poi si aggiunge lipotesi che per ogni t [c, d] esista la derivata f
x
(x, t) di I x f(x, t) e che
f
x
C
0
(I [c, d]), allora per ogni (y, z) [c, d] [c, d] la I x (x, y, z) è dotata anche della
derivata
x
(x, y, z) =
z
y
f
x
(x, t) dt, (22)
a sua volta continua in C.
DIM. Per (x
0
, y
0
, z
0
), (x, y, z) C scriviamo (x, y, z) (x
0
, y
0
, z
0
) come somma
z
0
y
0
[f(x, t) f(x
0
, t)] dt +
y
0
y
f(x, t) dt +
z
z
0
f(x, t) dt. (23)
Il secondo e terzo addendo sono rispettivamente maggiorati in modulo dai prodotti di |y y
0
| e di
|z z
0
| per il massimo di |f| su I [c, d]. Sia un qualunque reale positivo. Grazie al Teorema
6.1 sappiamo che il primo addendo della (23) è maggiorato in valore assoluto da purche |x x
0
|
20
sia maggiorato da un opportuno =
> 0. Poichè nulla impedisce di prendere , la quantità

|(x, y, z) (x
0
, y
0
, z
0
)| è maggiorata dal prodotto di una costante per non appena (x, y, z) K
verica |x x
0
| , |y y
0
| , |z z
0
| , e questo dimostra che in ogni punto (x
0
, y
0
, z
0
) K
la è continua.
Le (21) sono conseguenze immediate del teorema fondamentale del calcolo integrale applicato,
per ogni ssato x, alla funzione t f(x, t).
Per ottenere la (22) in un punto (x
0
, y
0
, z
0
) di K basta applicare il risultato di derivazione del
Teorema 6.1 alla funzione
x
z
0
y
0
f(x, t) dt;
applicando poi il precedente risultato di continuità con sostituita da
x
si ottiene la continuità
di questultima in (x
0
, y
0
, z
0
).
Osservazione 6.1. Nelle due precedenti dimostrazioni è stata utilizzata lipotesi che I sia, oltre
che chiuso, anche limitato. Però esse si ripetono tali e quali con le intersezioni [x
0
r, x
0
+r] I,
r > 0, al posto di I, per cui i Teoremi 6.1 e 6.2 continuano a valere con lintervallo I chiuso ma
non limitato.
Dal teorema precedente possiamo nalmente dedurre il

Teorema 6.3. Sia f C
0
(I [c, d]) con I intervallo chiuso, < c < d < , e siano ,
C
0
(I) tali che c (x), (x) d. La funzione
G(x) =
(x)
(x)
f(x, t) dt
è continua su I; se poi si aggiungono le ipotesi che per ogni t [c, d] esista la derivata f
x
(x, t) di
I x f(x, t) continua in I [c, d] e che , appartengano a C
1
(I), allora G è dotata di derivata
continua
G
(x) =
(x)
(x)
f
x
(x, t) dt +f(x, (x))
(x) f(x, (x))
(x)
in I.
DIM. Continuità della funzione composta G(x) = (x, (x), (x)); derivabilità della funzione
composta (dal momento che è C
1
), e dunque
G
(x) =
x
(x, (x), (x)) +
y
(x, (x), (x))
(x) +
z
(x, (x), (x))
(x),
poi le (21) e la (22).
Il Teorema 6.3 ha unapplicazione importante nel metodo di Duhamel per la risoluzione di

equazioni dierenziali lineari non omogenee a coecienti costanti. Cominciamo dal I ordine. Per
a R e f C
0
(]c, d[) si verica in un attimo che la funzione
y(t) =
t
t
0
e
a(ts)
f(s) ds (24)
21
soddisfa lequazione lineare y
+ ay = f(t) (insieme alla condizione di Cauchy y(t

0
) = 1): non cè
bisogno di ricorrere al Teorema 6.3, visto che il secondo membro si riscrive
e
at
t
t
0
e
as
f(s) ds
con lintegrando che non dipende dal parametro t, e di conseguenza si deriva elementarmente.
Tuttavia la (24) è istruttiva, perche fornisce al I ordine la formula di Duhamel
y(t) =
t
t
0
Y (t s)f(s) ds (25)
con Y (t) che qui denota la soluzione e
at
dellequazione omogenea Y
+ aY = 0 che soddisfa la
condizione di Cauchy Y (0) = 1.
Passiamo al II ordine.
Teorema 6.4. Siano a, b R, f C
0
(]c, d[). La funzione (25) con Y (t) soluzione del problema di
Cauchy
Y
+aY
+bY = 0, Y (0) = 0, Y
(0) = 1
è una soluzione dellequazione non omogenea
y
+ay
+by = f(t), (26)

e pi` u esattamente lunica ad annullarsi in t
0
insieme alla sua derivata prima.
DIM. Adesso bisogna applicare, per due volte, la regola di derivazione degli integrali dipendenti da
un parametro. Si ottiene prima
y
(t) = Y (0)f(t) +
t
t
0
Y
(t s)f(s) ds =
t
t
0
Y
(t s)f(s) ds,
poi
y
(t) = Y
(0)f(t) +
t
t
0
Y
(t s)f(s) ds = f(t) +
t
t
0
Y
(t s)f(s) ds
e inne
y
(t) +ay
(t) +by(t) = f(t) +
t
t
0
[Y
(t s) +aY
(t s) +bY (t s)]f(s) ds = f(t)

cioè la tesi. (Abbiamo utilizzato lequazione omogenea soddisfatta da Y nei punti t s.)
Esempio 6.1. Sia b R. Lintegrale generale dellequazione

y
+by = f(t)
vale
c
1
sin t
b +c
2
cos t
b +
t
t
0
sin (t s)
b
f(s) ds
22
per b > 0, e invece
c
1
e
t
b
+c
2
e
t
b
+
t
t
0
e
(ts)
b
e
(ts)
b
2
b
f(s) ds
per b < 0.
Prendiamo in particolare b = 1, f(t) = 1/ cos t per /2 < t < /2. La funzione (25) con
t
0
= 0 è allora
t
0
sin(t s)
cos s
ds =
t
0
sin t cos s cos t sin s
cos s
ds = t sin t cos t
t
0
sin s
cos s
ds
= t sin t + cos t log(cos t).
Il metodo di Duhamel che abbiamo nora illustrato per le equazioni del I e del II ordine
si trasporta immediatamente a un qualunque ordine N: per a
0
, . . . , a
N1
R e f C
0
(]c, d[)
lequazione
y
(N)
+a
N1
y
(N1)
+ +a
1
y
+a
0
y = f(t)
è soddisfatta dalla funzione y(t) che ha lespressione (25) con Y (t) soluzione adesso dellomogenea
Y
(N)
+a
N1
Y
(N1)
+ +a
1
Y
+a
0
Y = 0
che soddisfa le condizioni di Cauchy Y (0) = Y
(0) = = Y
(N2)
(0) = 0, Y
(N1)
(0) = 1. La
verica troppo lunga! si fa con N derivazioni successive attraverso il Teorema 6.3. Qui ci
limitiamo ad osservare che nel caso particolarissimo a
0
= = a
N1
= 0 la funzione Y (t) richiesta
è la t
n1
/(n 1)!, per cui
y(t) =
1
(n 1)!
t
t
0
(t s)
n1
f(s) ds
è la soluzione di y
(N)
= f(t) che si annulla in t
0
insieme a tutte le sue derivate no all(n1)esima.
7 Successioni uniformemente convergenti

Nella prossima sezione ci serviremo delle denizioni e dei risultati seguenti.
Sia data una successione di funzioni F
n
denite su un intervallo I. Preso un x I, ha senso
chiedersi se la successione numerica {F
n
(x)} è convergente; ovvero se esiste un numero reale,
che allora sarà lecito indicare con F(x), tale che lim
n
F
n
(x) = F(x); ovvero ancora se, dato
comunque > 0, esiste un
,x
N tale che
|F
n
(x) F(x)| per n
,x
.
Prescindendo dalla conoscenza delleventuale limite F(x), la condizione necessaria e suciente per
la convergenza di {F
n
(x)} è fornita dal criterio di Cauchy: dato comunque > 0, esiste un
,x
N
tale che
|F
n
(x) F
n+p
(x)| per n
,x
, p N.
23
Se poi ci interessiamo alla eventuale convergenza di ogni successione numerica {F
n
(x)} al variare
di x I detta convergenza puntuale delle F
n
in I , le precedenti formule rimangono
inalterate: laspetto cruciale è che ci si accontenta di poter appurare per ogni e per ogni x
lesistenza di quellindice denotato appunto
,x
.
Adesso introduciamo una nozione pi` u stringente, richiedendo lesistenza di tale indice ancora in
dipendenza da , ma non pi` u da x. Diciamo dunque che le F
n
convergono uniformemente
6
in
I a una funzione F se, dato comunque > 0, esiste un
N tale che
|F
n
(x) F(x)| per x I, n
(27)
ovvero
sup
xI
|F
n
(x) F(x)| per n
. (28)
La convergenza uniforme implica banalmente quella puntuale, ma non viceversa. Un semplicissimo
esempio di successione che converge puntualmente ma non uniformemente è fornito dalle F
n
(x) = x
n
in I = [0, 1[: il limite puntuale è F(x) = 0, ma per < 1 la (28) è violata dal momento che
sup
x[0,1[
|x
n
| = 1.
Prendendo nella (27) /2 al posto di e poi aggiungendo F
p
(x) F
n+p
(x) dentro al modulo
si ottiene la condizione necessaria per la convergenza uniforme: dato comunque > 0, esiste un
N tale che
|F
n
(x) F
n+p
(x)| per x I, n
, p N. (29)
La condizione è anche suciente per la convergenza uniforme, e viene detta criterio uniforme
di Cauchy: da essa segue essa infatti la convergenza puntuale ad una F(x), e passando al limite
per p si ottiene la (27).
7
Il prossimo teorema fornisce condizioni sucienti per scambiare tra di loro il segno di limite per
n con quello di limite per x x
0
, con quello di integrale e con quello di derivata.
Teorema 7.1. (i) Se le funzioni F
n
: I R sono continue in un punto x
0
I e convergono
uniformemente in I, allora anche F = lim
n
F
n
è una funzione continua in x
0
.
(ii) Se le funzioni F
n
: I R sono continue in ogni punto di I e convergono uniformemente in
I, allora F = lim
n
F
n
(continua in I grazie a (i)) verica
b
a
F(x) dx = lim
n
b
a
F
n
(x) dx per a, b I. (30)
(iii) Se le funzioni F
n
: I R sono di classe C
1
in I, con {F
n
(x
0
)} convergente per qualche
scelta di x
0
I e le F
n
uniformemente convergenti in I, allora F = lim
n
F
n
è di classe C
1
in I con
F
(x) = lim
n
F
n
(x) per x I. (31)
DIM. (i) Fissiamo arbitrariamente un > 0 e associamogli N in modo che valga la (27). Grazie
allipotesi di continuità di ogni F
n
in x
0
esiste un =
,
> 0 tale che
|F
(x) F
(x
0
)| < per x I, |x x
0
| < .
Allora (tecnica dei tre )
|F(x) F(x
0
)| |F(x) F
(x)| + |F
(x) F
(x
0
)| + |F
(x
0
) F(x
0
)| < 3,
6
Per lanit` a concettuale con la continuit` a uniforme di una funzione in un intervallo cfr. la Sezione 3.
7
Se avessimo optato per la richiesta delle disuguaglianze forti < invece di quelle deboli, assolutamente equivalenti
per larbitrariet` a di > 0, ci saremmo procurati qualche inutile complicazione, sia pur di poco conto.
24
da cui la continuità di F in x
0
.
(ii) Innanzitutto sottolineiamo che F è continua in ogni punto di I grazie al punto (i), e di
conseguenza è integrabile al pari di tutte le F
n
su ogni intervallo chiuso e limitato di I. Fissiamo
poi un arbitrario > 0 e associamogli N in modo che valga la (27). Allora
b
a
F(x) dx
b
a
F
n
(x) dx
b
a
|F(x) F
n
(x)| dx
< |b a| per n .
Ciò prova la (30).
(iii) Per ogni x I il Teorema fondamentale del Calcolo dà
F
n
(x) = F
n
(x
0
) +
x
x
0
F
n
(t) dt.
Ponendo = lim
n
F
n
(x
0
) e G = lim
n
F
vediamo che, in virt` u del punto (ii), il secondo membro

tende a
+
x
x
0
G(t) dt. (32)
Ma allora F(x) = lim
n
F
n
(x) esiste e assume il valore (32) per ogni x, da cui = F(x
0
) e, derivando,
G(x) = F
(x).
Osservazione 7.1. Nel punto (i) del teorema lipotesi di uniforme convergenza delle F
n
è essenziale,
come si vede con semplicissimi esempio: per dirne uno, quello già visto delle funzioni continue
F
n
(x) = x
n
, ma stavolta per x I = [0, 1], che convergono puntualmente alla funzione discontinua
che vale 0 per x [0, 1[ e ad 1 per x = 1. Invece sia la (30) e sia la (31) valgono sotto ipotesi molto
pi` u deboli delluniforme convergenza rispettivamente delle F
n
e delle F
n
.
8 Integrali impropri dipendenti da parametri

Estendiamo il Teorema 6.1 agli integrali impropri.
Teorema 8.1. Sia f una funzione continua in I]c, d[ con I intervallo chiuso, c < d .
Supponiamo che
|f(x, t)| g(t) per (x, t) I]c, d[ (33)
con g funzione reale 0 dotata di integrale improprio (assolutamente) convergente su ]c, d[. Allora
la funzione
I x F(x) =
d
c
f(x, t) dt
è continua. Se poi si aggiungono le ipotesi che per ogni t ]c, d[ esista la derivata f
x
(x, t) di
I x f(x, t), che f
x
C
0
(I]c, d[) e che valga una disuguaglianza
|f
x
(x, t)| g(t) per (x, t) I]c, d[, (34)
allora la funzione F sta in C
1
(I) con
F
(x) =
d
c
f
x
(x, t) dt.
25
DIM. Innanzitutto, la (33) garantisce, grazie al Teorema del confronto, che per ogni ssato x I
la funzione t f(x, t) ha integrale improprio assolutamente convergente da c a d. Dunque F(x) è
ben denita. Studiamo la sua regolarità al variare di x in I.
Siano {c
n
}, {d
n
} ]c, d[ tali che c
n
c e d
n
d.
Dal Teorema 6.1 (e alla luce dellOsservazione 6.1 se I è illimitato) sappiamo che per ogni n la
funzione
I x F
n
(x) =
d
n
c
n
f(x, t) dt (35)
è continua. Daltra parte, dalla convergenza dellintegrale improprio di g segue che, dato comunque
> 0, esiste un =
N tale che
c
n
c
g(t) dt +
d
d
n
g(t) dt per n . (36)
Dunque la (33), oltre a garantire che per ogni x I la funzione t f(x, t) è dotata di in-
tegrale improprio assolutamente convergente, ovvero che F(x) è ben denita, fornisce anche la
disuguaglianza
c
n
c
|f(x, t)| dt +
d
d
n
|f(x, t)| dt per x I, n .
Ma allora
|F(x) F
n
(x)|
c
n
c
f(x, t) dt
d
d
n
f(x, t) dt
per x I, n .
Ne segue che in I la successione delle funzioni continue F
n
(x) converge uniformemente in I ad F(x),
e quindi (Teorema 7.1 (i)) che questultima è continua.
In maniera analoga, sotto lipotesi di derivabilità di x f(x, t) si ricava innanzitutto, grazie al
Teorema 6.1 (e allOsservazione 6.1 se I è illimitato) , che per ogni n la funzione (35) è derivabile
in I con
F
n
(x) =
d
n
c
n
f
x
(x, t) dt.
Dalla (34) segue poi che per ogni x I la funzione t f
x
(x, t) è dotata di integrale improprio
assolutamente convergente, ovvero che la funzione
I x G(x) =
d
c
f
x
(x, t) dt
è ben denita; inoltre G C
0
(I) grazie alla prima parte del teorema.
Sia > 0 arbitrariamente ssato, e sia di nuovo =
N tale che valga la (36). Allora risulta
c
n
c
|f
x
(x, t)| dt +
d
d
n
|f
x
(x, t)| dt per x I, n
per cui
|G(x) F
n
(x)|
c
n
c
f
x
(x, t) dt
d
d
n
f
x
(x, t) dt
per x I, n .
Ne segue che la successione delle funzioni continue F
n
(x) converge uniformemente a G(x), e quindi
(Teorema 7.1 (iii)) F(x) = lim
n
F
n
(x) è derivabile con F
(x) = G(x).
26
Naturalmente non è aatto restrittivo richiedere che le disuguaglianze (33) e (34) valgano con
la stessa funzione g(t): se si parte da due diverse funzioni nei secondi membri basta prendere la
loro somma per ricondursi alle ipotesi del teorema.
Esempio 8.1. Fissiamo x in I = [a, [, a > 0. Su ]c, d[=]0, [ sia la funzione t f(x, t) =
t
1
e
tx
sin t che la sua derivata t f
x
(x, t) = e
tx
sin t sono maggiorate in modulo dalla funzione
continua g(t) = e
ta
, che ha integrale improprio assolutamente convergente. Dunque la
F(x) =

0
e
tx
sin t
t
dt
è continua e anzi derivabile per x a, con
F
(x) =

0
e
tx
sin t dt.
Esempio 8.2. La funzione f(x, t) = xe

xt
soddisfa tutte le ipotesi del Teorema 6.1 con I = R e
[c, d] qualunque. Si può dedurre da questo che il suo integrale di Riemann su [c, d] è una funzione
continua, anzi derivabile della x; pi` u direttamente, basta tener conto che xe
xt
= (e
xt
)
e
applicare il Teorema Fondamentale del Calcolo. Invece
F(x) =

0
xe
xt
dt = e
xt
0
è denita su [0, [, ma non è continua in 0:
F(0) = 0, F(x) = 1 per x > 0
(e in qualunque intervallo [0, b] si ha convergenza puntuale ma non uniforme delle funzioni continue
F
n
(x) =
n
0
xe
xt
dt = e
xt
n
0
= 1 e
nx
a F(x): cfr il Teorema 7.1 (i)). Infatti non si applica il Teorema 8.1: non esiste una funzione
]0, [ t g(t) dotata di integrale improprio convergente e tale che valga la (33), dal momento
che per 1/t b il max
0xb
xe
xt
si ottiene per x = 1/t e vale (et)
1
.
Per gli integrali impropri semplicemente convergenti non vale il teorema di derivazione sotto il
segno di integrale, come mostra il seguente
Esempio 8.3. Per x > 0 la funzione
F(x) =

0
sin tx
t
dt
assume costantemente il valore dellintegrale improprio semplicemente convergente
0
[(sin u)/u] du,
come si vede operando il cambiamento u = tx della variabile dintegrazione. Dunque F
(x) = 0,
mentre lintegrale improprio della derivata della funzione x (sin tx)/t, cioè di cos tx, non solo
non vale identicamente 0, ma non è neppure convergente.
27
9 Il Teorema di Dini per funzioni scalari
Nel piano euclideo lequazione di una retta
F(x, y) = ax +by +c = 0
con a, b, c numeri reali ed a
2
+b
2
> 0 è risolubile rispetto a y in funzione della x (con y = ax/bc/b)
se F
y
= b = 0, cioè se la retta non è verticale, e rispetto a x in funzione della y (con x = by/ac/a)
se F
x
= a = 0, cioè se la retta non è orizzontale. Per farla breve, qui tutto linsieme dei punti del
piano che vericano lequazione è sempre il graco di una funzione della x o della y a seconda che
F
y
= 0 o F
x
= 0 (senza che un caso escluda necessariamente laltro).
Se per` o F è una generica funzione R con aperto di R
2
non è aatto detto che linsieme
dei punti (x, y) che soddisfano lequazione F(x, y) = 0 sia sempre il graco di una funzione
y = f(x) o di una funzione x = g(y) e nemmeno che sia una curva, ne, perno, che sia = .
Per rendersene conto già basterebbe osservare che un qualunque sottoinsieme S del piano coincide
con linsieme delle soluzioni dellequazione F(x, y) = 1
S
(x, y) 1 = 0. Ma questa è una F che in
generale non ha la minima regolarità. Ebbene, prendiamo delle F regolarissime.
Esempio 9.1. Sia F(x, y) = x
2
y
2
. Linsieme Z delle soluzioni dellequazione F(x, y) = 0 è
costituito dallunione delle due bisettrici y = x. Ogni suo punto diverso dallorigine ha un intorno
la cui intersezione con Z è un tratto di retta, dunque un graco. Invece lintersezione con Z di un
qualunque intorno dellorigine non è mai un graco e notiamo che F
x
(0, 0) = F
y
(0, 0) = 0.
Esempio 9.2. Per ogni r R sia
F(x, y) = x
2
+y
2
r.
Linsieme Z delle soluzioni dellequazione F(x, y) = 0 è vuoto se r < 0 e coincide col solo punto
(0, 0) se r = 0: dunque non è un graco in nessuno dei due casi. Sia r > 0. Neanche allora è vero che
tutto Z, essendo la circonferenza di centro lorigine e raggio
r, sia un graco. Però Z è localmente

graco di una funzione o della x oppure della y (senza che un caso escluda necessariamente laltro).
Vediamo i dettagli.
In un opportuno intorno aperto A di un punto (x
0
, y
0
) Z tale che F
y
(x
0
, y
0
) = 2y
0
= 0,
per cui la retta tangente alla circonferenza nel punto non è verticale, i punti di Z sono quelli
del graco di y =
r x
2
o di y =
r x
2
a seconda che y
0
> 0 (e allora A è lintero
semipiano delle y > 0) o y
0
< 0 (e allora A è lintero semipiano delle y < 0). Se però y
0
= 0,
e quindi x
0
=
r o x
0
=
r, non esiste nessun intorno del punto, per quanto piccolo, la cui
intersezione con Z sia graco di una funzione della x.
In un opportuno intorno aperto A di di un punto (x
0
, y
0
) Z tale che F
x
(x
0
, y
0
) = 2x
0
= 0,
per cui la retta tangente alla circonferenza nel punto non è orizzontale, i punti di Z sono
quelli del graco di x =
r y
2
o di x =
r y
2
a seconda che x
0
> 0 (e allora A è
lintero semipiano delle x > 0) o x
0
< 0 (e allora A è lintero semipiano delle x < 0). Invece
non esiste nessun intorno, per quanto piccolo, del punto (0,
r) o del punto (0,
r) la cui
intersezione con Z sia graco di una funzione della y.
28
Il precedente esempio illustra signicativamente il caso di una classe abbastanza generale di
equazioni F(x, y) = 0, tranne per un aspetto (non di poco conto). Come vedremo col prossimo
risultato, infatti, sotto opportune ipotesi esiste un intorno di una soluzione (x
0
, y
0
) dellequazione
in cui questultima denisce implicitamente una delle due variabili come funzione dellaltra, nel
senso che le soluzioni dellequazione che cadono nellintorno sono tutti e soli punti del graco di
tale funzione; di questultima però sar` a impossibile, in genere, dare unespressione esplicita come
invece si è facilmente fatto nellesempio.
Teorema 9.1 (di Dini). Sia F di classe C
1
in un aperto di R
2
. Supponiamo che per un
(x
0
, y
0
) risulti F(x
0
, y
0
) = 0 e F
y
(x
0
, y
0
) = 0. Allora esistono , > 0 tali che in A =
]x
0
, x
0
+ []y
0
, y
0
+ [ (la F
y
si mantiene = 0 e) lequazione F(x, y) = 0 denisce
implicitamente una funzione y = f(x) continua, ed anzi di classe C
1
; la derivata di f si ottiene
derivando rispetto ad x lidentità F(x, f(x)) = 0, da cui F
x
(x, f(x))+F
y
(x, f(x))f
(x) = 0 e quindi
f
(x) =
F
x
(x, f(x))
F
y
(x, f(x))
per |x x
0
| < . (37)
DIM. Per ssare le idee supponiamo F
y
(x
0
, y
0
) > 0. Grazie alla continuità della F
y
in possiamo
applicarle il Teorema della permanenza del segno e trovare due numeri reali positivi a e con
la seguente proprietà: per |x x
0
| a e |y y
0
| risulta F
y
(x, y) > 0, e di conseguenza ogni
funzione y F(x, y) ad x ssato è crescente. Poiche F(x
0
, y
0
) = 0, questo implica F(x
0
, y
0
) < 0
e F(x
0
, y
0
+ ) > 0. Applichiamo di nuovo il Teorema della permanenza del segno, questa volta
alle due funzioni x F(x, u
0
) e x F(x, y
0
+ ): se =
a è un numero reale positivo

sucientemente piccolo (per intendersi, tanto pi` u piccolo quanto pi` u piccolo è ) abbiamo sia
F(x, y
0
) < 0 che F(x, y
0
+ ) > 0 per x nellintervallo chiuso [x
0
, x
0
+ ]. Fissiamo la x
nellintervallo aperto
8
]x
0
, x
0
+[ ed applichiamo il Teorema di esistenza degli zeri alla funzione
continua e strettamente monotona y F(x, y): otteniamo
F(x, f(x)) = 0
per un unico valore f(x) strettamente compreso tra y
0
e y
0
+ , cioè tale che
|f(x) y
0
| < . (38)
Naturalmente f(x
0
) = y
0
.
Passiamo alla dimostrazione della (41). Come è detto nellenunciato, essa segue subito dalli-
dentit` a F(x, f(x)) = 0 in ]x
0
, x
0
+ [ grazie alla regola di derivazione delle funzioni composte,
a patto però di sapere preliminarmente che f è derivabile, cosa questa che non abbiamo anco-
ra fatto vedere. Cominciamo col mostrare la continuità di f in ]x
0
, x
0
+ [. Per x ssato
in ]x
0
, x
0
+ [ si ha anche x + h ]x
0
, x
0
+ [, e quindi (x + h, f(x + h)) A, se |h|
è sucientemente piccolo, diciamo |h| < k. Il teorema del valor medio applicato alla funzione
t (t) = F(x +th, f(x) +t(f(x +h) f(x))) assicura lesistenza di un ]0, 1[ tale che
F(x +h, f(x +h)) F(x, f(x)) = (1) (0) =
()
= F
x
(x+h, f(x) +(f(x+h) f(x)))h+F
y
(x+h, f(x) +(f(x+h) f(x)))(f(x+h) f(x)).
8
Naturalmente qui anche lintervallo chiuso andrebbe bene. Per` o quando poi si passer` a dalla variabile scalare x
ad una vettoriale far` a comodo limitare questultima ad un aperto, in modo di poterle associare senza dicolt` a la
nozione di regolarit` a C
1
che nei chiusi diventa delicata se le variabili sono pi` u di una.
29
Il primo membro di questa identità è nullo, e dividendo per F
y
(x+h, f(x) +(f(x+h) f(x)))
m = min
A
F
y
> 0, otteniamo
f(x +h) f(x) =
F
x
(x + h, f(x) + (f(x +h) f(x)))
F
y
(x + h, f(x) + (f(x +h) f(x)))
h. (39)
Il secondo membro si maggiora in modulo con M|h|/m dove M = max
A
|F
x
|, e questo mostra la
continuità di f nel punto x. Grazie ad essa la frazione nel secondo membro è il rapporto di due
funzioni continue di h ] k, k[. Dividiamo entrambi i membri della (39) per h = 0: otteniamo
f(x +h) f(x)
h
=
F
x
(x + h, f(x) + (f(x +h) f(x)))
F
y
(x + h, f(x) + (f(x +h) f(x)))
e quindi la derivabilità di f facendo tendere h a 0.
Osservazione 9.1. Se nel teorema si sostituisce lipotesi F

y
(x
0
, y
0
) = 0 con la F
x
(x
0
, y
0
) = 0, allora
vale la tesi che enunciamo sbrigativamente cos`: lequazione F(x, y) = 0 denisce implicitamente,
in un opportuno intorno di (x
0
, y
0
), una funzione x = g(y) di classe C
1
, la cui derivata si ottiene
derivando rispetto ad y lidentit` a F(g(y), y) = 0.
Osservazione 9.2. Come abbiamo già fatto presente, in generale non possiamo sperare di riuscire
ad esplicitare la f(x) ottenuta grazie al Teorema di Dini. E questo fa s` che tanto meno possiamo
servirci della (41) per il calcolo di f
(x), tranne per x = x

0
. Se F è solo C
1
ci fermiamo l`. Ma se
F è pi` u regolare possiamo procedere oltre: deriviamo entrambi i membri della (41) e otteniamo
f
(x) =
F
2
y
F
xx
2F
x
F
y
F
xy
+F
2
x
F
yy
F
3
y
.
Tutte le funzioni del secondo membro sono calcolate in (x, f(x)), per cui è dato il loro valore per
x
0
= 0: adesso disponiamo dei valori non solo di f(x
0
) e di f
(x
0
), ma anche di f
(x
0
). Cos`
procedendo (beninteso nei limiti dellumanamente, e anche numericamente, possibile) possiamo
pensare di arrivare a dare alla f un buono sviluppo di Taylor di punto iniziale x
0
.
Osservazione 9.3. Abbiamo visto che se F appartiene a C

1
(), dove è un aperto di R
2
, e per
un (x
0
, y
0
) A verica F(x
0
, y
0
) = 0, F
y
(x
0
, y
0
) = 0, allora esiste un intorno di (x
0
, y
0
) in cui
linsieme di livello F = 0 coincide col graco di una funzione y = f(x) di classe C
1
, cioè con una
curva dotata in (x
0
, y
0
) di retta tangente di equazione
y y
0
= f
(x
0
)(x x
0
)
ovvero
y y
0
=
F
x
(x
0
, y
0
)
F
y
(x
0
, y
0
)
(x x
0
)
e quindi
F
x
(x
0
, y
0
)(x x
0
) +F
y
(x
0
, y
0
)(y y
0
) = 0. (40)
30
Per ottenere lequazione (40) della retta tangente in (x
0
, y
0
) alla curva F = 0 abbiamo utilizzato
il Teorema di Dini sotto lipotesi F
y
(x
0
, y
0
) = 0. Però saremmo arrivati allo stesso risultato sotto
lipotesi F
x
(x
0
, y
0
) = 0. Dunque possiamo concludere che ogni punto (x
0
, y
0
) di in cui F si
annulla e il gradiente
9
(F
x
, F
y
) = F non è il vettore nullo ha un intorno nel quale lequazione
F = 0 denisce una curva regolare con retta tangente (al sostegno) in (x
0
, y
0
) data dallequazione
(40) o, ciò che è lo stesso, con retta normale di direzione F(x
0
, y
0
).
Il Teorema di Dini per le funzioni scalari di 2 variabili si estende con ovvie modiche alle funzioni
di un qualunque numero di variabili. Per le funzioni di 3 variabili, ad esempio, abbiamo il
Teorema 9.2. Sia F di classe C
1
in un aperto di R
3
. Supponiamo che per un (x
0
, y
0
, z
0
)
risulti F(x
0
, y
0
, z
0
) = 0 e F
z
(x
0
, y
0
, z
0
) = 0. Allora esiste un aperto A = A
0
]z
0
, z
0
+ [
, con A
0
aperto di R
2
, in cui (la F
z
si mantiene = 0 e) lequazione F(x, y, z) = 0 denisce
implicitamente una funzione z = f(x, y) di classe C
1
; le derivate di f si ottengono derivando
rispetto ad x e y lidentità F(x, y, f(x, y)) = 0, da cui F
x
(x, y, f(x, y))+F
z
(x, y, f(x, y))f
x
(x, y) = 0,
F
y
(x, y, f(x, y)) +F
z
(x, y, f(x, y))f
y
(x, y) = 0, e quindi
f
x
(x, y) =
F
x
((x, y, f(x, y))
F
z
(x, y, f(x, y))
, f
y
(x, y) =
F
y
((x, y, f(x, y))
F
z
(x, y, f(x, y))
per (x, y) A
0
. (41)
Naturalmente questo teorema continua a valere con la variabile z sostituita dalla x o dalla y
nellipotesi che sia diversa da 0 la corrispondente derivata di F nel punto, eccetera.
Osservazione 9.4. Occupiamoci dellequazione F(x, y, z) = 0. Se F appartiene a C
1
() con
aperto di R
3
e in un punto (x
0
, y
0
, z
0
) di si ha F(x
0
, y
0
, z
0
) = 0, F
z
(x
0
, y
0
, z
0
) = 0, il Teorema
9.2 con N = 2 aerma che esiste un intorno di (x
0
, y
0
, z
0
) in cui linsieme di livello F = 0 coincide
col graco di una funzione z = f(x, y) di classe C
1
, cioè con una supercie dotata in (x
0
, y
0
, z
0
) di
piano tangente di equazione
z z
0
= f
x
(x
0
, y
0
)(x x
0
) +f
y
(x
0
, y
0
)(y y
0
)
ovvero
z z
0
=
F
x
(x
0
, y
0
, z
0
)
F
z
(x
0
, y
0
, z
0
)
(x x
0
)
F
y
(x
0
, y
0
, z
0
)
F
z
(x
0
, y
0
, z
0
)
(y y
0
)
e quindi
F
x
(x
0
, y
0
, z
0
)(x x
0
) +F
y
(x
0
, y
0
, z
0
)(y y
0
) +F
z
(x
0
, y
0
, z
0
)(z z
0
) = 0. (42)
Per ottenere lequazione (42) del piano tangente in (x
0
, y
0
, z
0
) alla supercie F = 0 abbiamo
utilizzato il Teorema di Dini sotto lipotesi F
z
(x
0
, y
0
, z
0
) = 0. Però saremmo arrivati allo stesso
risultato sotto lipotesi F
x
(x
0
, y
0
, z
0
) = 0 o lipotesi F
y
(x
0
, y
0
, z
0
) = 0. Possiamo dunque aermare
che ogni punto (x
0
, y
0
, z
0
) di in cui F si annulla e F non è il vettore nullo ha un intorno nel
quale lequazione F = 0 denisce una supercie con piano tangente (al sostegno) in (x
0
, y
0
, z
0
) dato
dallequazione (42) o, ciò che è lo stesso, con retta normale di direzione F(x
0
, y
0
, z
0
).
9
Ricordiamo che il gradiente di una funzione u di classe C
1
in un aperto del piano ha, in ogni punto in cui non si
annulla, la direzione e il verso di massima crescita di u. Infatti la derivata in (x
0
, y
0
) di u lungo una direzione (, ),
2
+
2
= 1, cioè
(t) = du(x
0
+t, y
0
+t)/dt calcolata in t = 0, vale, grazie alla disuguaglianza di CauchySchwarz,
(0) = u
x
(x
0
, y
0
) + u
y
(x
0
, y
0
)
u
x
(x
0
, y
0
)
2
+ u
y
(x
0
, y
0
)
2
col segno = se e solo se (, ) = u(x
0
, y
0
)/u(x
0
, y
0
).
31
10 Il Teorema di Dini per sistemi
Il Teorema di Dini si estende ai sistemi di P equazioni in P + Q variabili. Qui ci occupiamo di
P = 2 e Q = 1, cominciando dal semplice caso lineare
F(x, y, z) = ax +by +cz +d = 0

G(x, y, z) = a
x +b
y +c
z +d
= 0
(43)
delle equazioni di due piani. Se i due piani sono paralleli, ovvero la matrice jacobiana
(F, G)
(x, y, z)
=
F
x
F
y
F
z
G
x
G
y
G
z
a b c
a
ha rango 1, la loro intersezione o è vuota o coincide con entrambi. Supponiamo che il rango sia 2,
diciamo con
det
(F, G)
(y, z)
= det
F
y
F
z
G
y
G
z
= det
b c
b
= 0 (44)
per ssare le idee. Le soluzioni di (43) sono allora tutti e soli i punti di una retta, e possiamo
risolvere il sistema (44) rispetto a y e z (come funzioni di x, ovviamente). Procedendo con lalgebra
lineare otteniamo y = f(x) e z = g(x) da
f(x)
g(x)
(F, G)
(y, z)
ax +d
a
x +d
.
Ma possiamo anche ricorrere alle elementari tecniche di sostituzioni successive. Dalla prima delle
equazioni (43), supponendo (non è restrittivo) c = 0 ricaviamo z = (ax by d)/c; sostituendo
nella seconda equazione otteniamo
a
x +b
y +
c
(ax by d)
c
+d
= 0
da cui

b
bc
y +
ac
x +d
d
c
= 0.
Grazie allipotesi (44) il coeciente di y in questa equazione è diverso da 0, per cui possiamo
scrivere la y come funzione di x e poi, sostituendola nella precedente espressione della z, ottenere
anche questultima come funzione di x. A questo punto non abbiamo bisogno di esplicitare i calcoli
rimanenti. Quello che interessa è vedere come le sostituzioni successive permettano di abbordare
lo studio di un pi` u generale sistema di 2 equazioni scalari in 3 variabili
F(x, y, z) = 0
G(x, y, z) = 0
(45)
indicando con (x
0
, y
0
, z
0
) una sua soluzione. Abbiamo bisogno di ipotesi che consentano di operare
i seguenti passaggi:
mostrare, servendosi del Teorema 9.2, che in un opportuno intorno (tridimensionale) di
(x
0
, y
0
, z
0
) la prima delle (45) denisce implicitamente una funzione z = (x, y) di classe
C
1
, con (x
0
, y
0
) = z
0
;
32
mostrare, servendosi del Teorema 9.1, che in un opportuno intorno (bidimensionale) di (x
0
, y
0
)
lequazione (x, y) = G(x, y, (x, y)) = 0 denisce implicitamente una funzione y = f(x) di
classe C
1
, con f(x
0
) = y
0
.
Arrivati qui ci basta porre g(x) = (x, f(x)) per vericare che in un opportuno intorno (tridimen-
sionale) di (x
0
, y
0
, z
0
) il sistema (45) denisce implicitamente due funzioni scalari
y = f(x), z = g(x)
di classe C
1
; derivando rispetto ad x le identit` a
F(x, f(x), g(x)) = 0, G(x, f(x), g(x)) = 0
si ottiene il sistema di 2 equazioni
F
x
(x, f(x), g(x)) +F
y
(x, f(x), g(x))f
(x) +F
z
(x, f(x), g(x))g
(x) = 0
G
x
(x, f(x), g(x)) +G
y
(x, f(x), g(x))f
(x) +G
z
(x, f(x), g(x))g
(x) = 0
da cui si ricavano le derivate di f e g:
(F, G)
(y, z)
F
x
G
x
(46)
con largomento delle funzioni uguale a x nel primo membro ed a (x, f(x), g(x)) nel secondo.
Lipotesi che consente di eettuare i passaggi richiesti è la trasposizione al caso generale della
(44):
det
(F, G)
(y, z)
(x
0
, y
0
, z
0
) = det
F
y
(x
0
, y
0
, z
0
) F
z
(x
0
, y
0
, z
0
)
G
y
(x
0
, y
0
, z
0
) G
z
(x
0
, y
0
, z
0
)
= 0. (47)
Infatti la (47) implica innanzitutto che in (x
0
, y
0
, z
0
) una almeno delle derivate F
y
, F
z
sia diversa
da 0, e non è restrittivo supporre che si tratti della F
z
. Dunque il Teorema 9.2 può essere applicato
e fornisce lesistenza della , che inoltre sappiamo derivare, in particolare rispetto ad y:
y
=
F
y
F
z
.
Calcoliamo
y
= G
y
+G
z
y
= G
y
G
z
F
y
F
z
=
1
F
z
det
(F, G)
(y, z)
.
Grazie di nuovo alla (47), otteniamo
y
(x
0
, y
0
) = 0 e possiamo applicare il Teorema 9.1 per ottenere
lesistenza della f. Dunque:
Teorema 10.1. Siano F, G di classe C
1
in un aperto di R
3
0
, y
0
, z
0
)
risulti F(x
0
, y
0
, z
0
) = G(x
0
, y
0
, z
0
) = 0 e che valga la (47). Allora esiste un intorno aperto
tridimensionale A di (x
0
, y
0
, z
0
) in cui (il determinante di (F, G)/(y, z) si mantiene = 0 e)
il sistema (45) denisce implicitamente due funzioni y = f(x), z = g(x) di classe C
1
, con f
e g
date dalla (46).

Con un po pi` u di sforzo, ma con la stessa tecnica di base, il precedente teorema si generalizza
cos`:
33
Teorema 10.2. Siano F, G di classe C
1
in un aperto di R
4
0
, y
0
, u
0
, v
0
)
risulti F(x
0
, y
0
, u
0
, v
0
) = G(x
0
, y
0
, u
0
, v
0
) = 0 e inoltre
det
(F, G)
(u, v)
(x
0
, y
0
, u
0
, v
0
) = det
F
u
(x
0
, y
0
, u
0
, v
0
) F
v
(x
0
, y
0
, u
0
, v
0
)
G
u
(x
0
, y
0
, u
0
, v
0
) G
v
(x
0
, y
0
, u
0
, v
0
)
= 0.
Allora esiste un intorno aperto quadridimensionale A di (x
0
, y
0
, u
0
, v
0
) in cui (il determinante
di (F, G)/(u, v) si mantiene = 0 e) il sistema
F(x, y, u, v) = 0
G(x, y, u, v) = 0
(48)
denisce implicitamente due funzioni u = f(x, y), v = g(x, y) di classe C
1
, con f e g dati da
f
x
f
y
g
x
g
y
F
u
F
v
G
u
G
v
F
x
F
y
G
x
G
y
con largomento delle funzioni uguale a (x, y) nel primo membro ed a (x, y, f(x, y), g(x, y)) nel
secondo.
Per illustrare unimportantissima conseguenza del Teorema 10.2 ricordiamo innanzitutto che su
un aperto B di R
N
un dieomorsmo (= applicazione iniettiva B R
N
di classe C
1
con inversa di
classe C
1
) deve avere matrice jacobiana invertibile su tutto B. Possiamo formulare la congettura
che, viceversa, ogni applicazione B R
N
di classe C
1
con matrice jacobiana invertibile su tutto B
sia un dieomorsmo di B? In questi termini ovviamente no: già per N = 1 si danno facilmente
dei controesempi quando B non è un intervallo. Però è vero che, se B è un intervallo di R, una
funzione reale di classe C
1
con derivata sempre diversa da 0, quindi sempre positiva o sempre
negativa, è dotata in tutto B di funzione inversa di classe C
1
. Ebbene, questo risultato globale non
si estende alle dimensioni N > 1, a prescindere dalla regolarità (ad esempio la convessità) che si
può pensare di imporre a B: basta pensare alla funzione (r, ) (r cos , r sin ), che ha in ogni
punto (r, ) B =]0, [R matrice jacobiana di determinante r > 0 e quindi invertibile, ma per
ogni ssato r è periodica in e dunque non iniettiva su tutto il suo dominio B.
Il risultato generale che vale in dimensione N maggiore di 1 è di natura locale, e per N = 2 segue
dal Teorema 10.2, di cui riprendiamo le notazioni. Infatti invertire unapplicazione : B R
2
,
di componenti x = (u, v) e y = (u, v), signica ottenere una coppia di funzioni u = (x, y),
v = (x, y) denite implicitamente dal sistema (48) con A = R
2
B e F(x, y, u, v) = x (u, v),
G(x, y, u, v) = y (u, v). Ma noi abbiamo visto che vicino ad un punto (x
0
, y
0
, u
0
, v
0
) con
x
0
= (u
0
, v
0
) e y
0
= (u
0
, v
0
) questo è possibile se nel punto lo jacobiano di , cioè il determinante
della matrice jacobiana (F, G)/(u, v), è diverso da 0. Abbiamo cos` dimostrato per N = 2 un
risultato, che enunciamo senza dimostrarlo in tale generalità, per N qualunque:
Teorema 10.3. Siano dati un aperto B di R
N
ed una funzione : B R
N
di classe C
1
con
jacobiano diverso da 0 in un punto di B. Allora B contiene un intorno aperto del punto su cui la
restrizione di è un dieomorsmo.
Vale la pena di insistere: se il determinante jacobiano di è diverso da 0 in tutto B possiamo
concludere che vicino ad ogni punto di U la restrizione di è un dieomorsmo, non che è un
dieomorsmo di tutto B!
Il Teorema 10.3 per N = 2 consente di mostrare che, intorno ad ogni suo punto, il sostegno di
una supercie regolare coincide col graco di una funzione C
1
di due variabili. Per dimostrarlo,
34
prendiamo unapplicazione B (u, v) ((u, v), (u, v), (u, v)), B aperto di R
2
, di classe C
1
con (
u
,
u
,
u
) (
v
,
v
,
v
) = (0, 0, 0) in B. Sia (u
0
, v
0
) un punto di B dove, ad esempio,
v

v
u
= 0, e sia (x
0
, y
0
) = ((u
0
, v
0
), (u
0
, v
0
)). Allora B contiene un intorno aperto di
(x
0
, y
0
) su cui lapplicazione x = (u, v), y = (u, v) è dotata di inversa u = (x, y), v = (x, y) di
classe C
1
. Ne segue che il sostegno della supercie (u, v) ((u, v), (u, v), (u, v)) coincide col
graco della funzione (x, y) ((x, y), (x, y)).
A questo punto è opportuno fare un sommario riepilogo delle nostre conoscenze sulle curve in
R
2
e le superci in R
3
.
Sia C R
2
. Allora è equivalente richiedere che, vicino ad un suo punto, C sia il graco di
una funzione C
1
di una variabile o il sostegno di una curva regolare o linsieme di livello di una
funzione C
1
di 2 variabili con gradiente = (0, 0) nel punto.
Sia S R
3
. Allora è equivalente richiedere che, vicino ad un suo punto, S sia il graco di
una funzione C
1
di 2 variabili o il sostegno di una supercie regolare o linsieme di livello di una
funzione C
1
di 3 variabili con gradiente = (0, 0, 0) nel punto.
11 Massimi e minimi vincolati
Quando A è un aperto di R
2
la ricerca dei punti iin cui una f C
1
(A) può assumere valori estremi
cioè massimi o minimi locali va ristretta innanzitutto ai punti stazionari, in cui il gradiente
f è nullo.
10
E se si è interessati agli estremi di f non in tutto A, bens` in un suo sottoinsieme chiuso E
(ad esempio sotto lulteriore ipotesi che E sia limitato, per cui ogni funzione in C
0
(E) è senzaltro
dotata di massimo e minimo assoluti grazie al teorema di Weierstrass)? Il procedimento appena
visto in A rimane valido nellinterno (se non è vuoto) di E, ma diventa inapplicabile sulla sua
frontiera. L` bisogna, quando è possibile, ricorrere alle altre tecniche che costituiscono largomento
di questa sezione.
Indichiamo dunque con S una curva contenuta in A (quale potrebbe ad esempio essere una
porzione della frontiera dellinsieme E di cui si è precedentemente parlato). Con lutilizzo del
termine tra virgolette intendiamo dire che i punti (x, y) S costituiscono:
(i) o limmagine di un intervallo I in una rappresentazione parametrica t ((t), (t)) di classe
C
1
con
(t)
2
+
(t)
2
> 0,
(ii) o il graco di una funzione y = (x) oppure x = (y) di classe C
1
in un intervallo I,
(iii) o un sottoinsieme S dellinsieme di livello F(x, y) = 0 di una F C
1
(A) con F = 0 in S.
Nei casi (i) e (ii) la ricerca degli estremanti di una f C
1
(A) sul vincolo S si restringe alla
ricerca dei punti stazionari di funzioni di una variabile. Come è facile vedere, infatti, richiedere
che un punto (x, y) S sia, per ssare le idee, un massimo locale di f|
S
, cioè che tutti i punti di
S (non di A!) distanti da (x, y) meno di un opportuno > 0 soddisno f(x, y) f(x, y), signica
richiedere:
10
Ricordiamo che se f C
2
(A) la ricerca va ulteriormente ristretta, escludendo quei punti stazionari in cui la
matrice hessiana

f
xx
f
xy
f
xy
f
yy
non è semidenita, ovvero siccome siamo in R

2
ha determinante < 0; un punto stazionario in cui invece
lhessiana ha determinante > 0 è di minimo locale o di massimo locale a seconda che in esso la f
xx
sia > 0 o < 0.
35
o (caso (i)) che t I con ((t), (t)) = (x, y) sia un massimo locale di g(t) = f((t), (t)), e
quindi
g
(t) = f
x
(x, y)
(t) +f
y
(x, y)
(t) = 0
se t è interno ad I;
o (primo sottocaso di (ii)) che x I con (x) = y sia un massimo locale di g(x) = f(x, (x)),
e quindi
g
(x) = f
x
(x, y) +f
y
(x, y)
(x) = 0 (49)
se x è interno ad I;
o (secondo sottocaso di (ii)) che y I con (y) = x sia un massimo locale di g(y) = f((y), y),
e quindi
g
(y) = f
x
(x, y)
(y) +f
y
(x, y) = 0 (50)
se y è interno ad I.
Esempio 11.1. In A = R
2
la regolarissima funzione f(x, y) = x + y
2
è priva di punti stazionari
perche f
x
non si annulla mai. Dunque non esistono punti di estremo relativo di f in A. Per` o la
restrizione f|
E
di f ad un qualunque sottoinsieme chiuso e limitato E del piano è dotata di massimo
e minimo assoluti. Prendiamo
E = {(x, y) R
2
| y x y, x
2
+y
2
1}.
Per quello che abbiamo appena visto, gli estremi di f|
E
non possono cadere allinterno di E.
Scriviamo la frontiera di E come unione dei tre insiemi
S
1
= {(x, y) E | x
2
+y
2
= 1}, S
2
= {(x, y) E | y = x}, S
3
= {(x, y) E | y = x}.
S
1
è immagine dellintervallo [/4, 3/4] nella rappresentazione parametrica (cos , sin ).
Per trovare gli estremi di f(cos , sin ) = cos +sin
2
nellintervallo cerchiamo innanzitutto
i suoi punti stazionari in ]/4, 3/4[: devessere d(cos + sin
2
)/d = sin + 2 sin cos = 0,
cioè cos = 1/2, e tra i valori di per i quali questo vale cè /3 ]/4, 3/4[. Calcoliamo:
cos /3 + sin
2
/3 = 1/2 + 3/4 = 5/4. Negli estremi: cos(/4) + sin
2
(/4) = (
2 + 1)/2,
cos /4 + sin
2
/4 = (
2 + 1)/2. Dunque il minimo e il massimo della restrizione di f al chiuso e

limitato S
1
sono rispettivamente il pi` u piccolo e il pi` u grande dei tre valori ottenuti, cioè (
2+1)/2
e (
2 + 1)/2.
Possiamo anche vedere S
1
come graco di y =
1 x
2
per x [1/
2, 1/
2]. Allinterno
di questo intervallo cerchiamo i punti stazionari di f(x,
1 x
2
) = x + 1 x
2
: si deve annullare
d(x +1 x
2
)/dx = 1 2x, dal che x = 1/2, e l` abbiamo f(1/2,
1 1/4) = 1/2 +1 1/4 = 5/4.

Poi: 1/
2 + 1 1/2 = 1/
2 + 1/2 = (
2 + 1)/2 allestremo sinistro, 1/
2 + 1 1/2 =
1/
2 + 1/2 = (
2 + 1)/2 allestremo destro.

S
2
è il graco di y = x per x [1/
2, 0]; allinterno di questo intervallo non cadono punti

stazionari di f(x, x) = x + x
2
, perchè d(x + x
2
)/dx = 1 + 2x si annulla per x = 1/2.
Allestremo sinistro la restrizione di f assume il valore minimo (
2 + 1)/2 e allestremo destro il

massimo 0.
S
3
è il graco di y = x per x [0, 1/
2]; allinterno di questo intervallo non cadono punti

stazionari di f(x, x) = x +x
2
, perchè d(x +x
2
)/dx = 1 + 2x si annulla per x = 1/2. Allestremo
sinistro la restrizione di f assume il valore minimo 0 e allestremo destro il massimo (
2 + 1)/2.
Conclusione: il minimo e il massimo di f in E sono rispettivamente (
2 +1)/2 e (
2 +1)/2.
36
Passiamo a (iii). Siccome le derivate F

x
e F
y
non si annullano mai contemporaneamente in S,
per il Teorema di Dini ogni punto (x
0
, y
0
) di S ha un intorno U (in generale di dimensioni non
note) la cui intersezione con S è graco di una funzione (in generale non nota) x = (y) o y = (x).
Siamo formalmente nella situazione (ii), nel senso che in S U vanno cercati i punti (x, y) in cui
vale la (49) o la (50): però, oltre alle coordinate x e y che stiamo per lappunto cercando, nella
prima è ignota anche la funzione
e nella seconda la
! Per aggirare questo ostacolo ricorriamo

allespressione delle derivate delle funzioni implicite:
(x) =
F
x
(x, y)
F
y
(x, y)
,
(x) =
F
y
(x, y)
F
x
(x, y)
.
Le (49) e (50) diventano cos` rispettivamente
f
x
(x, y) f
y
(x, y)
F
x
(x, y)
F
y
(x, y)
= 0, f
x
(x, y)
F
y
(x, y)
F
x
(x, y)
f
y
(x, y) = 0
a seconda che nel punto (ignoto!) risulti F
y
(x, y) = 0 o F
x
(x, y) = 0, e quindi comunque
f
x
(x, y)F
y
(x, y) f
y
(x, y)F
x
(x, y) = 0.
Questa è unequazione algebrica nelle sole incognite x e y che ci interessano, e richiede che il determi-
nante jacobiano di f e F in (x, y) si annulli, dunque abbia tanto le righe che le colonne linearmente
dipendenti. Imponiamo la dipendenza lineare delle colonne, che sono f(x, y) e F(x, y). Siccome
abbiamo supposto che il secondo di questi vettori non è nullo, deve esistere un moltiplicatore di
Lagrange R, che non interessa calcolare, tale che
f(x, y) + F(x, y) = (0, 0).
Riassumiamo:
Teorema 11.1. Siano A un aperto di R
2
e f, F C
1
(A). Se in un sottoinsieme S dellinsieme di
livello F = 0 il gradiente di F non è mai nullo, gli eventuali punti di minimo e di massimo locali
per la restrizione f|
S
di f ad S vanno cercati tra le soluzioni (x, y) S del sistema
_
_
_
F(x, y) = 0
f
x
(x, y) + F
x
(x, y) = 0
f
y
(x, y) + F
y
(x, y) = 0
per unopportuna costante .
Esempio 11.2. Cerchiamo il minimo e massimo assoluti di f(x, y) = xy nellinsieme E dei punti
(x, y) R
2
con x
2
xy + y
2
1, che è chiuso e limitato dal momento che è costituito dai punti
che cadono su un ellisse o al suo interno. Siccome in tutto A = R
2
lunico punto stazionario di f è
lorigine, e si vede subito che si tratta di un punto di sella, resta solo da applicare i moltiplicatori
sulla frontiera S di E, che è tutto linsieme di livello F(x, y) = x
2
xy +y
2
1 = 0. Imponiamo
y + 2x y = 0, x + 2y x = 0, x
2
xy +y
2
= 1.
Sommando le prime due equazioni otteniamo (1 + )(x +y) = 0, e quindi:
o = 1, per cui x = y e la terza equazione dà i due punti (1, 1), (1, 1) dove f vale 1;
oppure x = y e la terza equazione dà i due punti (1/
3, 1/
3), (1/
3, 1/
3) dove f vale
1/3.
Da qui segue che il massimo è 1, il minimo è 1/3.
37
Passiamo senza dicoltà a 3 dimensioni:

3
e f, F C
1
(A). Se in un sottoinsieme S dellinsieme di
livello F = 0 il gradiente di F non è mai nullo, gli eventuali punti di minimo e di massimo locali
per la restrizione f|
S
di f ad S vanno cercati tra le soluzioni (x, y, z) S del sistema
_
_
F(x, y, z) = 0
f
x
(x, y, z) + F
x
(x, y, z) = 0
f
y
(x, y, z) + F
y
(x, y, z) = 0
f
z
(x, y, z) + F
z
(x, y, z) = 0
(51)
per unopportuna costante .
Esempio 11.3. Siano f(x, y, z) = xyz, F(x, y, z) = xy +yz +zx 1 e
S = {(x, y, z) R
3
| x 0, y 0, z 0, F(x, y, z) = 0}.
La restrizione di f ad S è sempre 0 ed in certi punti di S (ad esempio quelli con z = 0 e
xy = 1) vale 0. Dunque questo è il suo minimo assoluto. Daltra parte, nei punti di S con z > 0
si ha 0 x 1/z, 0 y 1/z e quindi 0 xyz 1/z. Ne segue che f(x, y, z) 0 quando
(x, y, z) S, x
2
+ y
2
+ z
2
(come si vede cominciando dalle semirette contenute in S con
punto iniziale nellorigine). Dunque, benche il Teorema di Weierstrass non si applichi allinsieme
illimitato S, la f|
S
è dotata anche di massimo assoluto. Cerchiamolo coi moltiplicatori. Il sistema
(51) è adesso
_
_
xy +yz +zx = 1
yz + (y +z) = 0
xz + (x +z) = 0
xy + (x +y) = 0.
Dalle ultime 3 equazioni ricaviamo
_
_
_
xyz + x(y +z) = 0
xyz + y(x +z) = 0
xyz + z(x +y) = 0
.
Dunque x(y +z) = y(x +z) = z(x +y), ovvero xy = yz = xz, ovvero ancora x = y = z =
1/
3, e inne max f|
S
= f(1/
3, 1/
3, 1/
3) = 1/(3
3). (Questo esempio è preso da E.Giusti,

Esercizi e complementi di Analisi Matematica, Volume secondo, Bollati Boringhieri 1992, dove se
ne traggono interessanti e profonde conseguenze geometriche.)
Passando a vincoli sotto forma di sistema si ha il seguente risultato:

3
e f, F, G C
1
(A). Se in un sottoinsieme S dellinter-
sezione degli insiemi di livello F = 0 e G = 0 la matrice jacobiana di F e G ha sempre rango
massimo 2, gli eventuali punti di massimo e minimo locali per la restrizione f|
S
di f ad S vanno
cercati tra le soluzioni (x, y, z) S del sistema
_
_
F(x, y, z) = 0
f
x
(x, y, z) + F
x
(x, y, z) +G
x
(x, y, z) = 0
f
y
(x, y, z) + F
y
(x, y, z) +G
y
(x, y, z) = 0
f
z
(x, y, z) + F
z
(x, y, z) +G
z
(x, y, z) = 0
per opportune costanti , .
38
12 Un primo rapido approccio agli integrali doppi
In questa sezione e nelle prossime cinque, quando parleremo di un rettangolo S sottintenderemo:
compatto, salvo esplicita indicazione in altro senso; con S
indicheremo linsieme dei punti interni,

ovvero linterno, di S, e con A(S) la sua area (base per altezza) .
Sia R il rettangolo [a, b] [c, d]. Una partizione di R è una famiglia = {(x
h
, y
k
) | x
0
=
a < x
1
< < x
m
= b, y
0
= c < y
1
< < y
n
= b} (dove m ed n dipendono da ). In
maniera equivalente si può individuare anche assegnando la famiglia F() dei sottorettangoli
S
hk
= [x
h1
, x
h
] [y
k1
, y
k
] associati a . Unaltra partizione

di R è un ranamento della
se la contiene.
Si tratta di nozioni che quasi banalmente trasferiscono alla dimensione 2 quelle utilizzate nel caso
unidimensionale per lo studio dellintegrale di Riemann in una variabile, e noi qui ce ne serviamo
appunto per i primi passi nellintegrazione di Riemann in due variabili. Fissiamo dunque una
funzione limitata f denita sul rettangolo. Con la notazione A(S) per larea (base per altezza) di
un qualunque rettangolo S, deniamo le somme integrali superiore e inferiore di f associate
ad una partizione di R come, rispettivamente, i numeri
h,k
sup
S
hk
f
A(S
hk
)
o pi` u concisamente
SF()
sup
S
A(S)
e
h,k
inf
S
hk
f
A(S
hk
)
SF()
inf
S
A(S).
(Qui, come nel seguito,
h,k
sta per
h=1,...,m, k=1,...,n
.)
Si dimostrerà (con la (67)) che
SF()
sup
S
A(S)
TF(
inf
T
A(T)
per ogni scelta delle partizioni e
. Se per ogni > 0 si possono trovare e
in modo tale che
SF()
sup
S
A(S)
TF(
inf
T
A(T) < (52)

e di conseguenza
inf
SF()
sup
S
A(S) = sup
SF()
inf
S
A(S) (53)
39
diciamo che f è integrabile (secondo Riemann) in R e chiamiamo integrale (doppio di
Riemann) di f in R il valore (53), denotato con
R
f(x, y) dxdy oppure
R
f(x, y) dxdy oppure
R
f dxdy.
Ecco un classico esempio di funzione limitata non integrabile secondo Riemann.
Esempio 12.1. Indichiamo con f la funzione di Dirichlet 1
(Q[0,1])
2. Siccome
SF()
sup
S
A(S) = 1,
SF()
inf
S
A(S) = 0
quale che sia la partizione di R = [0, 1]
2
, la (52) con 0 < < 1 non è soddisfatta.
Invece:
Lemma 12.1. Ogni f C
0
(R) è integrabile in R, e il suo integrale doppio soddisfa
R
f(x, y) dxdy =
b
a
dx
d
c
f(x, y) dy =
d
c
dy
b
a
f(x, y) dx. (54)
DIM. Dato arbitrariamente un > 0, sia =
> 0 tale che per ogni coppia di punti (x
, y
), (x
, y
)
di R distanti meno di risulti |f(x
, y
) f(x
, y
)| < (uniforme continuità di f nel compatto R).

Chiamiamo una partizione di R tale che ogni sottorettangolo S F() abbia diametro minore
di . Risulta
SF()
sup
S
f inf
S
A(S) =
SF()
max
S
f min
S
f
A(S) < A(R)

e questo mostra lintegrabilità di f.
Poniamo
F(x) =
d
c
f(x, y)dy.
Su [a, b] la funzione x F(x) è continua (cfr. il Teorema 6.1), dunque integrabile. Fissiamo
arbitrariamente una partizione di R, il che è come dire una partizione x
0
= a < x
1
< < x
m
= b
di [a, b] ed una partizione y
0
= c < y
1
< < y
n
= d di [c, d]. Grazie alladditività degli integrali
di una variabile rispetto agli intervalli di integrazione valgono le identità
b
a
F(x) dx =
m
h=1
x
h
x
h1
F(x) dx e F(x) =
n
k=1
y
k
y
k1
f(x, y) dy,
per cui
b
a
d
c
f(x, y) dy
dx =
m
h=1
x
h
x
h1
k=1
y
k
y
k1
f(x, y) dy
dx
=
h,k
x
h
x
h1
y
k
y
k1
f(x, y) dy
dx :
40
abbiamo potuto portare la sommatoria su k fuori dallintegrale in dx grazie alla linearità di
questultimo. Daltra parte, applicando la positività degli integrali in dy ed in dx otteniamo
facilmente
inf
]x
h1
,x
h
[]y
k1
,y
k
[
f
(x
h
x
h1
)(y
k
y
k1
)
x
h
x
h1
y
k
y
k1
f(x, y) dy
dx
sup
]x
h1
,x
h
[]y
k1
,y
k
[
f
(x
h
x
h1
)(y
k
y
k1
)
e quindi anche, sommando su h e k,
h,k
inf
S
hk
f
A(S
hk
)
b
a
d
c
f(x, y) dy
dx
h,k
sup
S
hk
f
A(S
hk
).
Siccome f è integrabile su R, il suo integrale è lunico numero reale che soddisfa le stesse
disuguaglianze del secondo membro qui sopra al variare di , per cui vale lidentità
R
f(x, y) dxdy =
b
a
d
c
f(x, y) dy
dx
e quindi la prima delle (54). La seconda si dimostra in modo del tutto analogo.
Le (54) forniscono le formule di riduzione dellintegrale doppio di f.

13 Misurabilità secondo PeanoJordan e domini normali
Il Lemma 12.1 costituisce la diretta estensione a 2 dimensioni del teorema unidimensionale di
integrazione delle funzioni continue sugli intervalli compatti: estensione certo non banale, perche la
formula di riduzione banale non è, e tuttavia molto restrittiva. Ai ni pratici, infatti, gli intervalli
compatti costituiscono una classe abbastanza ampia di sottoinsiemi limitati della retta, mentre
come sottoinsiemi limitati del piano i rettangoli sono di tipo estremamente particolare. Nasce
quindi la necessità di considerare funzioni denite in sottoinsiemi limitati del piano di tipo pi` u
generale, salvo poi estenderle a zero fuori di essi per poter studiare lintegrabilità delle funzioni cos`
estese in rettangoli sucientemente grandi.
Cominciamo con alcune nozioni che riguardano la funzione caratteristica di un generico limitato
E R
2
. Fissato un rettangolo R E, se 1
E
è integrabile su R secondo Riemann diciamo che E è
misurabile secondo PeanoJordan o pi` u brevemente PJ misurabile (in R
2
), e chiamiamo
A(E) =
R
1
E
dxdy
la sua misura (bidimensionale), o area, di PeanoJordan. (Si noti che queste nozioni sono
indipendenti dalla scelta del particolare rettangolo R E.)
41
Richiedere che E sia PJmisurabile equivale dunque a richiedere che, dato > 0, si possano
trovare un R E ed una sua partizione tali che
SF()
sup
S
1
E
inf
S
1
E
A(S) < ,
ovvero
SF()
S
E=
A(S)
SF()
S
E
A(S) <
ovvero ancora
inf
SF()
S
E=
A(S) = sup
SF()
S
E
A(S).
In particolare, F R
2
è trascurabile secondo PeanoJordan o pi` u brevemente PJtrascurabile
(in R
2
) se è PJmisurabile con A(F) = 0, ovvero se, > 0, si possano trovare un R F ed una
sua partizione tali che
SF()
sup
S
1
F
<
ovvero
SF()
S
F=
A(S) < (55)
ovvero ancora
inf
SF()
S
F=
A(S) = 0 : (56)
va infatti esclusa leventualità che per qualche partizione e per qualche S
1
F() possa aversi
inf
S
1
1
F
= 1, perche cio implicherebbe
0 = A(F) =
R
1
F
dxdy A(S
1
) > 0.
Osservazione 13.1. Utilizzando la (55) si vede subito che lunione di un numero nito di insiemi
PJtrascurabili è anchessa PJtrascurabile.
Teorema 13.1. Un sottoinsieme limitato E di R

2
è PJmisurabile se e solo se la sua frontiera è
PJtrascurabile.
DIM. Se è una partizione di un R E risulta
SF()
sup
S
1
E
inf
S
1
E
A(S) =
SF()
sup
S
1
E
A(S). (57)
Infatti per ogni S F() si verica uno ed uno solo dei seguenti tre casi:
S
E, S
E = S
E = , S
E = =S
E =
42
dal momento che S
è aperto. Ora,
sup
S
1
E
= inf
S
1
E
= 1, sup
S
1
E
= 0 per S
E,
sup
S
1
E
= inf
S
1
E
= sup
S
1
E
= 0 per S
E = S
E = ,
sup
S
1
E
= sup
S
1
E
= 1, inf
S
1
E
= 0 per S
E = =S
E = .
Dunque è equivalente richiedere che per ogni > 0 si possano trovare R e tali che risulti < il
primo membro della (57) (PJmisurabilità di E) oppure il secondo (PJtrascurabilità di E).
Osservazione 13.2. Grazie al precedente teorema ed allOsservazione 13.1 si constata subito che
lunione e lintersezione di un numero nito di insiemi PJmisurabile sono PJmisurabili.
Osservazione 13.3. La frontiera di ([0, 1]Q)

2
è tutto il quadrato [0.1]
2
, che non è PJtrascurabile
perche la sua misura esterna di PeanoJordan è la sua area e quindi vale 1. Questo signica che,
se si vorrà estendere al di là della teoria di PeanoJordan la classe dei sottoinsiemi misurabili di
R
2
in modo da farci rientrare anche ([0, 1] Q)
2
, non si potrà immaginare di estendere anche la
caratterizzazione fornita dal Teorema 13.1.
Lemma 13.1. Se : [a, b] R è continua, il suo graco E è trascurabile.

DIM. Sia R un rettangolo contenente E. Siccome è integrabile da a a b, ad > 0 si possono
associare x
0
= a < x
1
< < x
m
= b con la proprietà
m
k=1
max
[x
k1
,x
k
]
min
[x
k1
,x
k
]
(x
k
x
k1
) <

A(R)
.
Ma gli addendi della somma qui sopra sono le aree A(Q
k
) dei rettangoli
Q
k
= [x
k1
, x
k
]
min
[x
k1
,x
k
]
, max
[x
k1
,x
k
]
,
la cui unione ricopre E e verica
k
A(Q
k
) < . A questo punto si trova una partizione di R
tale che ogni Q
k
sia unione di sottorettangoli di F(). Siccome la somma delle aree A(S) degli
S F() contenuti in Q
k
è uguale a A(Q
k
), risulta
SF()
sup
S
1
E
inf
S
1
E
A(S)
SF()
max
S
1
E
A(S)
SF()
S
k
Q
k
A(S) =
k
A(Q
k
) < . (58)
Dunque (cfr. la (55)) E è PJtrascurabile.
43
Siano adesso date due funzioni continue , su un intervallo compatto [a, b] di R con la proprietà
in [a, b].
Linsieme
D = {(x, y) R
2
| a x b, (x) y (x)} (59)
è un dominio normale rispetto allasse x, linsieme
D
= {(x, y) R
2
| a y b , (y) x (y)} (60)
un dominio normale rispetto allasse y.
Ebbene:
Teorema 13.2. Sia data una f continua sul dominio normale D. Allora la funzione

f uguale ad
f in D ed a 0 fuori è integrabile su R; il suo integrale doppio, che indichiamo con
D
f(x, y) dxdy oppure
D
f(x, y) dxdy oppure
D
f dxdy,
soddisfa
D
f(x, y) dxdy =
b
a
dx
(x)
(x)
f(x, y) dy. (61)
DIM. Innanzitutto, ssato un > 0, determiniamo un =
> 0 tale che per ogni coppia di punti

(x
, y
), (x
, y
) D distanti meno di risulti |f(x
, y
) f(x
, y
)| < (uniforme continuità di

f nel compatto D). Poi procediamo come nella dimostrazione del Lemma 13.1 e costruiamo dei
rettangoli Q
k
R che contengano nella loro unione i graci di e e verichino
k
A(Q
k
) < .
Sia E il complementare in R di
k
Q
k
. Costruiamo una partizione di R che soddis i seguenti
requisiti:
ogni sottorettangolo S F() abbia diametro minore di ,
ogni Q
k
sia unione di sottorettangoli di .
Dunque
A(Q
k
) =
SF()
SQ
k
A(S)
e quindi
SF()
S
k
Q
k
A(S) =
k
A(Q
k
) < A(R)
mentre

f verica |

f(x
, y
)

f(x
, y
)| < al variare di (x
, y
), (x
, y
) allinterno di qualunque
rettangolo S E, dal momento che E è unione di rettangoli D in cui

f = f e di altri in cui
f = 0. Ne segue che
SF()
sup
S
f inf
S
A(S) =
SF()
S
k
Q
k
max
S
f min
S
A(S) +
SF()
SE
max
S
f min
S
A(S)
44
< 2 max
D
|f|
k
A(Q
k
) +
SF()
SE
A(S) <
2 max
D
|f| +A(R)
(in ogni S F(), S

k
Q
k
la

f è dotata sia di massimo che di minimo anche se è discontinua),
per cui

f è integrabile in R.
La (61) si dimostra quasi punto per punto come la prima della (54) scrivendo

f al posto di f.
Le sole dierenze di cui va tenuto conto sono che qui la funzione
y

f(x, y), x [a, b],
uguale a f(x, y) per (x) y (x) ed a 0 altrove, è integrabile da c a d perche è continua su
tutto lintervallo tranne, eventualmente, i punti (x) e (x)), e che su [a, b] la funzione
F(x) =
d
c
f(x, y)dy =
(x)
(x)
f(x, y) dy.
è continua per il Teorema 6.3.
Il precedente teorema contiene i Lemmi 12.1 ((x) = a, (x) = b) e 13.1 ((x) = (x)). Esso
inoltre vale con D
al posto di D, tranne per la (61) che va sostituita dalla
f(x, y) dxdy =
b
a
dy
(y)
(y)
f(x, y) dx.
Osservazione 13.4. Sia dato un dominio normale D come in (59). Dal Teorema 13.2 con f = 1
D
segue che D è PJmisurabile (conseguenza anche del Lemma (13.1)!), e che la sua area vale
b
a
(x) dx
b
a
(x) dx.
Ancora pi` u in particolare, consideriamo il caso di (x) identicamente nulla. D è allora il sottograco
della funzione continua e non negativa (x), e lintegrale di questultima da a a b ha legittimamente
quel signicato di area che gli viene intuitivamente attribuito nelle considerazioni introduttive
sullaspetto geometrico dellintegrabilità in una variabile.
Passiamo allaspetto geometrico della condizione di integrabilità fornita dal Teorema 13.2 per
una generica funzione continua e non negativa f(x, y). Le sue somme integrali inferiori sono somme
di volumi (elementari!) A(S)(min
S
f) di parallelepipedi contenuti nel sottograco e privi di punti
interni comuni (siccome f 0, in ogni S F() non contenuto in D il minimo della

f è 0), mentre
quelle superiori sono somme A(S) (max
S

f) di volumi di parallelepipedi la cui unione contiene il
sottograco di f. Ne segue che una buona denizione di volume del sottograco di f è: lunico
elemento di separazione tra somme integrali superiori e inferiori, ovvero lintegrale della funzione.
Per avere poi una pi` u generale teoria della misura tridimensionale di solidi limitati si fa riferimento
alla teoria dellintegrale in tre variabili.
Il Teorema 13.2 ammette la seguente generalizzazione, che non dimostriamo:

45
Teorema 13.3. Anche una funzione f denita e limitata in un rettangolo sia integrabile secondo
Riemann è suciente che linsieme dei suoi punti di discontinuità sia trascurabile secondo Peano
Jordan.
(Il precedente risultato si migliora a sua volta in una condizione necessaria e suciente, che
però non può nemmeno essere formulata con le sole nozioni della teoria di Riemann: ne daremo un
accenno nella Sezione 16.)
14 Integrale delle funzioni a scala, integrale superiore e integrale
inferiore
A questo punto riprendiamo dallinizio lo studio dellintegrazione di Riemann in R
2
, procedendo
però in maniera pi` u sistematica.
Una funzione limitata R
2
R a supporto compatto, dunque nulla al di fuori di un rettangolo
R, è una funzione a scala se assume valori costanti negli interni S
hk
=]x
h1
, x
h
[]y
k1
, y
k
[ dei
sottorettangoli S
hk
associati a qualche partizione di R; è degenere se assume valori non nulli
solo su segmenti limitati verticali o orizzontali. Dunque una generica funzione a scala si scrive sotto
la forma
(x, y) =
h,k
hk
1
S
hk
(x, y) +
0
(x, y) (62)
con
hk
R e
0
degenere. In tale denizione può essere sostituito da un suo qualunque
ranamento

: se, ad esempio,

si ottiene aggiungendo a i punti (x
1
, y
k
), k = 1, . . . , n,
con x
0
< x
1
< x
1
, risulta =
1k
sia nei sottorettangoli aperti ]x
0
, x
1
[]y
k1
, y
k
[ che negli
]x
1
, x
1
[]y
k1
, y
k
[. Inoltre R può essere sostituito da un qualunque rettangolo che lo contenga.
Rientrano banalmente nella denizione i casi di funzioni a scala degeneri, cioè nulle al di fuori
di un rettangolo degenere.
Sia unaltra funzione a scala, nulla al di fuori di un rettangolo R
e costante negli interni

dei sottorettangoli associati ad unopportuna partizione
di R
. Per quello che abbiamo visto,

possiamo sempre ricondurci a R
= R (passando se necessario a un terzo rettangolo contenente

RR
) e, una volta fatto questo, a
= (passando se necessario al ranamento comune
).
Dunque anche assume un valore costante in ciascun S
hk
, diciamo
(x, y) =
h,k
hk
1
S
hk
(x, y) +
0
(x, y) (63)
con
0
degenere. A questo punto si vede subito che la combinazione lineare a+b con a, b R è
ancora una funzione a scala, che vale a
hk
+b
hk
in S
hk
.
Deniamo integrale (elementare) della data in (62) il numero
h,k
hk
A(S
hk
) .
In questa denizione la partizione può essere sostituita da un suo qualunque ranamento

senza che venga alterato il valore del secondo membro: per convincersene basta tornare allesempio
di

dato un attimo fa ed osservare che
1k
(x
1
x
0
)(y
k
y
k1
) =
1k
(x
1
x
0
)(y
k
y
k1
) +
1k
(x
1
x
1
)(y
k
y
k1
) .
46
Lintegrale elementare gode di tutte le proprietà che ci si aspetta da un buon integrale. Infatti
si vede subito, servendosi delle espressioni (62) e (63) di e , che è positivo:
per
dal momento che la condizione si traduce nelle condizioni
hk

hk
e quindi
h,k
hk
A(S
hk
)
h,k
hk
A(S
hk
) .
Inoltre è lineare:

(a +b) = a
+b
per a, b R
dal momento che
h,k
(a
hk
+b
hk
)A(S
hk
) = a
h,k
hk
A(S
hk
) +b
h,k
hk
A(S
hk
) .
Inne,
= 0 se è degenere.
Introduciamo la notazione f L
c
col seguente signicato: f è una funzione R
2
R limitata
ed a supporto compatto, dunque nulla al di fuori di un rettangolo R. La famiglia S
+
f
delle funzioni
semplici tali che f non è vuota, e la quantità
f = inf
S
+
f
è detta integrale superiore di Riemann della f. Notiamo che una funzione di S

+
f
come la (62)
dovendo soddisfare f in S
hk
, quindi
hk
sup
S
hk
f per h = 1, . . . , m e k = 1, . . . , n
verica anche
h,k
hk
A(S
hk
)
h,k
sup
S
hk
f
A(S
hk
). (64)
Siccome f(x, y) si scrive
h,k
f(x, y)1
S
hk
(x, y) +f(x, y)1
E
(x, y)
con E =
hk
S
hk
(unione di segmenti verticali e orizzontali), il secondo membro della (64) è
lintegrale elementare della funzione semplice
(x, y) =
h,k
sup
S
hk
f
1
S
hk
(x, y) +
sup
E
f
1
E
(x, y)
(e dunque rimane inalterato se è sostituita da un suo ranamento o R da un rettangolo che lo
contiene). Ma sta a sua volta in S
+
f
, e da qui si arriva a
f = inf
h,k
sup
S
hk
f
A(S
hk
)
47
f = inf
SF()
sup
S
A(S).
Si constata subito che sulle funzioni di L
c
lintegrale superiore è positivo
g per f g
(dal momento che f g =S
+
f
S
+
g
), nonche subadditivo
(f +g)
f +
g (65)
(dal momento che la somma di un elemento di S
+
f
ed uno di S
+
g
sta in S
+
f+g
e lintegrale elementare
delle funzioni a scala è lineare) e positivamente omogeneo
(af) = a
f per a [0, [. (66)

Il prossimo esempio mostra che lintegrale superiore non ha, sulla totalità delle funzioni di L
c
,
la proprietà di linearità: pur essendo subadditivo non è additivo, e pur essendo positivamente
omogeneo non è omogeneo.
Esempio 14.1. Come nellEsempio 12.1, indichiamo con f la funzione di Dirichlet 1
(Q[0,1])
2.
Siccome
SF()
sup
S
A(S) = 1,
SF()
sup
S
(f)
A(S) = 0
quale che sia la partizione di R = [0, 1]
2
, e quindi
f +
(f) = 1 ,
con la presente scelta di f non valgono ne il segno uguale nella disuguaglianza debole della (65)
quando g = f, ne lidentità della (66) quando a = 1.
Lintegrale inferiore di Riemann di una funzione f L

c
è la quantità
f =
(f)
per cui
(f) =
f.
Siccome
0 =
(f f)
f +
(f) =
f
48
vale sempre la disuguaglianza
f. (67)
Anche lintegrale inferiore è positivamente omogeneo:
(af) = a
f per a [0, [ .
Inoltre è superadditivo:
(f +g)
f +
g .
Si verica subito che

f = sup
SF()
inf
S
A(S).
Concludiamo questa sezione occupandoci del caso particolare f = 1
E
con E sottoinsieme
limitato di R
2
. Le quantità
A(E) =
1
E
= inf
SF()
sup
S
1
E
A(S) = inf
SF()
S
E=
A(S) ,
A(E) =
1
E
= sup
SF()
inf
S
1
E
A(S) = sup
SF()
S
E
A(S)
sono rispettivamente la misura esterna (bidimensionale) di PeanoJordan e la misura
interna (bidimensionale) di PeanoJordan di E. In particolare, E è PJtrascurabile se
A(E) = 0.
15 Lintegrale doppio di Riemann e le sue proprietà
Comè evidente, ogni funzione a scala soddisfa
.
Però è altrettanto evidente che lintegrale inferiore della funzione di Dirichlet è nullo, mentre quello
superiore, come abbiamo visto nellEsempio 12.1, vale 1. Ciò signica che, se f è una generica
funzione della classe L
c
, la disuguaglianza (56) può eettivamente venire soddisfatta o in senso
stretto o come identità. Supponiamo che si verichi il secondo caso:
f =
f (68)
ovvero
sup
= inf
S
+
f
49
ovvero ancora
sup
SF()
inf
S
A(S) = inf
SF()
sup
S
A(S) (69)
dove le sono partizioni di un rettangolo R al di fuori del quale f si annulla identicamente.
Allora diciamo che f è integrabile secondo Riemann (in R
2
), scriviamo che f Riem(R
2
), e
chiamiamo integrale (doppio) di Riemann di f il comune valore in (68), che denotiamo con
R
2
f(x, y) dxdy oppure
R
2
f(x, y) dxdy oppure
R
2
f dxdy
o ancora, volendo essere particolarmente sbrigativi, con
f come per le funzioni a scala.

Richiedere che una f : R
2
R a supporto compatto appartenga a Riem(R
2
) equivale dunque
a richiedere che, dato > 0, si possano trovare un rettangolo R contenente il supporto di f ed una
partizione di R tali che
SF()
sup
S
f inf
S
A(S) < (70)

(cfr. la (52): qui sintende che due partizioni distinte vengono sostituite da un loro comune
ranamento).
Sia a > 0. Poiche sono positivamente omogenei sia lintegrale inferiore che quello superiore si
ha
f Riem(R
2
) =af Riem(R
2
) con
(af) =
(af) =
(af) = a
f . (71)
Ma allora
(af) =
(af) = a
f = a
f
e quindi
(af) =
(af) = a
f = a
f =
(af) .
Ne segue che anche af sta in Riem(R
2
), con
(af) =
(af) =
(af) = a
f
e da qui si ottiene subito lomogeneità dellintegrale di Riemann: la (71) vale per ogni a R.
Sia adesso data unaltra g Riem(R
2
). Siccome su Riem(R
2
) coincidono integrale superiore e
inferiore,
f +
g =
f +
(f +g)
(f +g)
f +
g =
f +
g .
Dunque lintegrale di Riemann è additivo:
f, g Riem(R
2
) =f +g Riem(R
2
) con
(f +g) =
f +
g
e quindi, essendo anche omogeneo, è lineare:
f, g Riem(R
2
) =af +bg Riem(R
2
) con
(af +bg) = a
f +b
g per a, b R.
50
Fissiamo adesso un > 0 e una tale che valga la (70). Facciamo variare le coppie di punti
(x
, y
), (x
, y
) interni ad un S F(). Da
|f(x
, y
)| |f(x
, y
)| |f(x
, y
) f(x
, y
)| sup
S
f inf
S
f
ricaviamo
sup
S
|f| inf
S
|f| sup
S
f inf
S
f
e grazie alla (70) otteniamo
SF()
sup
S
|f| inf
S
|f|
A(S) < .
Da qui concludiamo che |f| Riem(R
2
); grazie alla positività dellintegrale di Riemann,
|f|.
Un procedimento analogo mostra che f, g Riem(R
2
) =fg Riem(R
2
). Infatti
f(x
, y
)g(x
, y
) f(x
, y
)g(x
, y
)
|f(x
, y
) f(x
, y
)||g(x
, y
)| + |g(x
, y
) g(x
, y
)||f(x
, y
)|
sup
S
f inf
S
sup
S
|g| +
sup
S
g inf
S
sup
S
|f|
e quindi
sup
S
(fg) inf
S
(fg) C
sup
S
f inf
S
f + sup
S
g inf
S
.
Osservazione 15.1. Ripercorrendo la costruzione dellintegrale di Riemann ci si accorge che appa-
rentemente essa viene a dipendere dalla scelta di un particolare riferimento cartesiano in R
2
: un bel
guaio se proprio cos` fosse, come si vede pensando al caso particolare delle misure di PeanoJordan
che perderebbero ogni signicato geometrico. Ma poi si riette sul punto di partenza, cioè larea
dei rettangoli, che è invariante per composizioni di rotazioni e traslazioni, e ci si convince che
deve valere un risultato del tipo: f Riem(R
2
) f Riem(R
2
) con
f =
(f ) .
Questo eettivamente è vero, come vedremo pi` u in là (Osservazione 17.1).
Siano E R
2
PJ-misurabile e f : E R limitata. Se il prolungamento

f di f a zero fuori di
E sta in Riem(R
2
), diciamo che f sta in Riem(E) e che la quantità
E
f dxdy =
R
2
f dxdy
è il suo integrale di Riemann su E. Stesso discorso e stessa notazione se f è invece data
in Riem(R
2
), che sappiamo essere chiuso rispetto al prodotto: allora anche

f = f1
E
, cioè la f
51
prima ristretta ad E e poi prolungata a 0 fuori di E, sta in Riem(R
2
). Se in particolare E è
PJtrascurabile, lintegrale su E di una qualunque funzione f limitata (esiste ed) è nullo:
0 = (inf
E
f)A(E) =
f1
E

f1
E
(sup
E
f)A(E) = 0.
Ladditività dellintegrale rispetto alla somma di funzioni si trasferisce alle unioni disgiunte di
domini di integrazione: se E ed F sono PJ-misurabili con E F = , una funzione f : E F R
è integrabile su E F se e solo se integrabile sia su E che su F, e in tal caso
EF
f dxdy =
E
f dxdy +
F
f dxdy;
in particolare, prendendo E aperto e F = E vediamo che
E
f dxdy =
E
f dxdy,
per cui non ci sarà da preoccuparsi di distinguere tra integrali su insiemi misurabili aperti o chiusi.
Con f = 1
EF
otteniamo per le aree
A(E F) = A(E) +A(F),
sempre, sintende, per E F = ; in generale,
A(E F) = A(E) +A(F) A(E F).
16 Alcune estensioni
Integrali di Riemann in R
3
(e in R
N
)
Un primo, semplice allargamento delle nozioni viste nora consiste nel passaggio dalle funzioni di 2
variabili a quelle di un qualunque numero N di variabili. Già il caso N = 3 illustra signicativamente
il procedimento. Al posto dei rettangoli si prendono i parallelepipedi P, con la notazione V (P)
per i volumi (base per altezza per profondità). Una partizione di P = [a, b] [c, d] [r, s] è una
famiglia = {(x
h
, y
k
, z
) | x
0
= a < x
1
< < x
m
= b, y
0
= c < y
1
< < y
n
= b, z
0
= r < z
1
<
< z
p
= s}, e F() è la famiglia dei sottoparallelepipedi Q
hk
= [x
h1
, x
h
] [y
k1
, y
k
] [z
1
, z
].
Una funzione limitata R
3
R è una funzione a scala se, per unopportuna scelta di P e , è nulla
fuori di P e assume valore costanti
hk
negli interni dei Q
hk
F(). Lespressione
h,k,
hk
V (Q
hk
)
è lintegrale elementare di . Una volta constatato che si tratta di una denizione ben posta si
arriva senza dicoltà agli integrali superiore e inferiore di Riemann; agli insiemi PJtrascurabili
(adesso in R
3
!); allintegrale (triplo) di Riemann denotato con
R
3
f(x, y, z) dxdydz oppure
R
3
f(x, y, z) dxdydz oppure
R
3
f dxdydz
52
o ancora, sbrigativamente, con
f; alla misura (tridimensionale) di PeanoJordan, ovvero ai volumi

dei solidi misurabili secondo PeanoJordan (cfr. lOsservazione ??).
Lo studio degli integrali sui domini normali del piano ammette una prima generalizzazione
immediata allo spazio tridimensionale. Vediamo come. Fissate due funzioni , continue su un
rettangolo R = [a, b] [c, d] del piano con in R vediamo subito (procedendo per R
3
come
nella dimostrazione del Teorema 13.2 per R
2
) che una f C
0
(D) è integrabile su D; inoltre risulta
D
f(x, y, z) dxdy dz =
R
dxdy
(x,y)
(x,y)
f(x, y, z) dz =
b
a
dx
d
c
dy
(x,y)
(x,y)
f(x, y, z) dz (72)
con a secondo membro la notazione abituale per
R
_
_
_
(x,y)
(x,y)
f(x, y, z) dz
_
_
_
dxdy
(e si noti che diamo per scontata una generalizzazione del Teorema 6.1 per la quale lintegrale
semplice da (x, y) a (x, y) è una funzione continua, dunque integrabile, di (x, y) R); la seconda
identità della (72) segue dalla formula di riduzione dellintegrale doppio. Per dimostrare la (72) si
procede come nella dimostrazione della (61), solo che al posto delladditività dellintegrale semplice
sui sottointervalli associati ad una partizione di [a, b] adesso si sfrutta quella dellintegrale doppio
sui sottorettangoli associati ad una partizione di R.
Da qui si potrebbe poi passare alla generalizzazione della prima delle identità (72) che si ottiene
prendendo
D = {(x, y, z) R
3
| (x, y) K, (x, y) z (x, y)}
con K sottoinsieme PJmisurabile di R
2
:
D
f(x, y, z) dxdy dz =
K
dxdy
(x,y)
(x,y)
f(x, y, z) dz (73)
(col signicato ormai evidente del simbolo a secondo membro).
Naturalmente anche lintegrale doppio a secondo membro della (73) può essere ridotto se K è
un dominio normale del piano.
La prima identità nella (72) e pi` u in generale la (73) sono le formule di riduzione degli
integrali tripli.
A questo punto si può passare senza dicoltà a denire in R
N
, per un qualunque valore naturale
N, gli integrali secondo Riemann, detti allora Npli ed indicati semplicemente con
R
N
f(x) dx,
(o di nuovo sbrigativamente con
f) e gli insiemi misurabili secondo PeanoJordan: basta prendere

come punto di partenza i prodotti cartesiani [a
1
, b
1
] [a
N
, b
N
] e le quantità (b
1
a
1
) (b
N
a
N
)
al posto rispettivamente degli ordinari parallelepipedi e degli ordinari volumi.
53
Accenni alla teoria di Lebesgue
Ben pi` u rilevante, e complicato, è lallargamento delle nozioni stesse di integrale e misura. Restiamo
alle funzioni di due variabili per ssare le idee: esiste una maniera di denire una integrabilità
che si applichi non solo agli elementi di Riem(R
2
), ma anche a funzioni, come ad esempio quella di
Dirichlet, che non rientrano in tale spazio? La risposta è aermativa, e qui diamo una pallida idea
di come essa può essere articolata.
Data una funzione f : R
2
] , [, indichiamo con
+
f
la famiglia delle serie
k=1

k
di
funzioni semplici con
k
0 per k 2 e
k=1

k
f. Lintegrale superiore di Lebesgue è la
quantità (non necessariamente reale)

f = inf
k=1
k=1
k

+
f
.
La nozione che abbiamo introdotto non richiede nessuna restrizione su f: ne che si annulli al
di fuori di un compatto, ne che sia limitata. E se prendiamo in particolare le f L
c
? Allora ogni
S
+
f
è la somma della serie + 0 + 0 + , cioè della serie
k=1

k
con
1
= e
k
= 0 per
k 2, che sta in
+
f
e verica
k=1

k
=
. Ne segue che S
+
f

+
f
e
f. (74)
Lintegrale superiore di Lebesgue è, come quello di Riemann, positivo, positivamente omogeneo
e subadditivo. (Per questultima proprietà si utilizza lidentità
k=1
(
k
+
k
) =
k=1
k
+
k=1
k
,
qui valida perche le serie in
+
f
e
+
g
, avendo tutti i termini 0 tranne (eventualmente) il primo,
sono incondizionatamente convergenti o divergenti.)
Lintegrale inferiore di Lebesgue è la quantità
f =

(f).
Anche lintegrale inferiore è positivo e positivamente omogeneo. Inoltre è superadditivo: questul-
tima proprietà segue dalla subadditività dellintegrale superiore, che implica anche

f. (75)
Si ha poi
f . (76)
Se i due membri della (75) sono niti e uguali si dice che f è integrabile secondo Lebesgue,
e per il loro comune valore si utilizzano le stesse notazioni che per lintegrale di Riemann. Ciò non
crea ambiguità perche, grazie alle (74) e (76) che implicano
f,
54
una funzione di L
c
integrabile secondo Riemann lo è anche secondo Lebesgue, e i due integrali
coincidono.
Nel caso particolare che sia integrabile secondo Lebesgue la funzione caratteristica di un E R
2
diciamo che E è misurabile secondo Lebesgue (in R
2
) con misura di Lebesgue (nita) data
da (E) =
1
E
. Ne segue che, quando E è limitato, se è misurabile secondo PeanoJordan lo è
anche secondo Lebesgue.
Per mostrare che non vale il viceversa prendiamo E = ([0, 1] Q)
2
, che sappiamo non essere
PJmisurabile. Siccome E consiste in una successione {E
k
} di punti, e di conseguenza 1
E
è essa
stessa somma di una serie
j=1
1
E
k
di funzioni a scala degeneri, risulta

1
E
=
j=1
1
E
k
= 0 =
1
E
.
Quindi la funzione 1
E
è dotata di integrale di Lebesgue nullo, ovvero E è misurabile secondo
Lebesgue con misura di Lebesgue nulla, ovvero ancora è trascurabile secondo Lebesgue. E
ricordiamo che la frontiera di E è tutto [0, 1]
2
, che ha misura di PeanoJordan uguale ad 1. Ma si può
subito andare molto avanti. Il ragionamento svolto per mostrare che (E) = 0 se E = ([0, 1] Q)
2
può essere tranquillamente ripetuto per una qualunque innità numerabile E di punti di R
2
, ad
esempio per E = Q
2
. O anche per una retta verticale o orizzontale unione di uninnità numerabile
di intervalli limitati e poi per una innità numerabile di tali rette. E qui si può almeno enunciare
un risultato cui abbiamo alluso subito dopo il Teorema 13.3.
`
E il Teorema di VitaliLebesgue:
Condizione necessaria e suciente anche una funzione f L
c
sia integrabile secondo Riemann è
che linsieme dei suoi punti di discontinuità sia trascurabile secondo Lebesgue.
Inne (ma nella teoria di Lebesgue è appena linizio. . . ) si vede, procedendo come per lintegrale
di Riemann, che le funzioni integrabili secondo Lebesgue costituiscono uno spazio vettoriale su cui
lintegrale di Lebesgue è positivo e lineare.
17 Cambiamenti di variabili
Nel Calcolo in una variabile un ruolo importantissimo per il calcolo eettivo degli integrali sugli
intervalli è svolto dalla regola di integrazione per sostituzione, che si enuncia cos`: date una funzione
h di classe C
1
in un intervallo compatto [, ] e una funzione continua f sullimmagine di [, ]
nella h, vale lidentità
h()
h()
f() d =
f(h(v))h
(v) dv. (77)

Aggiungiamo lipotesi che h
si mantenga = 0. Poiche ci troviamo su un intervallo questo

signica: o h
> 0 (e quindi h() < h()), oppure h
< 0 (e quindi h() > h()). Poiche limmagine

di [, ] nella h è lintervallo [A, B] uguale a [h(), h()] nel primo caso ed a [h(), h()] nel secondo,
la (77) diventa
B
A
f() d =
f(h(v))h
(v) dv,
nel primo caso e
B
A
f() d =
f(h(v))h
(v) dv
55
nel secondo. Riassumiamo in ununica identità:
B
A
f() d =
f(h(v))|h
(v)| dv. (78)

Soermiamoci un attimo sullipotesi che h
si mantenga sempre diversa da 0 nellintervallo,

ovvero che h sia un dieomorsmo = applicazione di classe C
1
e iniettiva. Si tratta di unipotesi
che in dimensione 1 non gioca nessun ruolo rilevante, a parte quello di consentire la presenza del
modulo della derivata, e invece si rivela essenziale nel passaggio a pi` u dimensioni: evidenzieremo
questo con un controesempio nellOsservazione 17.2.
Vediamo come si presenta la versione bidimensionale della (78) in un caso particolare ma
istruttivo.
Trasformazioni ani invertibili di R
2
Fissiamo una matrice 2 2 non singolare
=
a b
c d
La trasformazione
:
u
v
u
v
p
q
au +bv +p
cu +dv +q
è un dieomorsmo di V = R
2
; il suo jacobiano
è uguale alla costante det e lo jacobiano
1 della sua inversa è uguale a 1/det . Dimostriamo che se f è una funzione limitata, nulla
fuori di un rettangolo R e integrabile, allora è integrabile anche (f )|
|, quindi f perche
è costante, e vale lidentità
R
f(x, y) dxdy = |det |
1
(R)
(f )(u, v) dudv . (79)
A tal ne ricordiamo innanzitutto che una trasformazione denita dal prodotto a sinistra per una
matrice 22 porta un parallelogramma P in un altro parallelogramma P
, con larea A(P
) uguale
al prodotto dellarea A(P) per il determinante della matrice = jacobiano della trasformazione, preso
in valore assoluto. Nel caso della trasformazione
1
applicata ad un rettangolo S di una partizione
di R abbiamo dunque
A(S)
|det |
= A(
1
(S)) =
1
(S)
=
1
(S
)
(con la sbrigativa notazione
per lintegrale su R
2
), e siccome
f = (f )1
1
(R)
=
SF()
(f )1
1
(S
)
+ 1
E
dove E =
SF()
1
(S) è un insieme (unione di segmenti) PJtrascurabile e è una funzione
limitata (costante a tratti) che non ha interesse specicare, otteniamo
SF()
inf
S
A(S) =
SF()
inf
1
(S
)
(f )
A(S)
|det |
|det |
56
=
_
_

SF()
inf
1
(S
)
(f )
1
(S
)
+ 1
E
_
_
|det |
_
_

SF()
(f )1
1
(S
)
+ 1
E
_
_
|det |
=
(f )|det |.
Analogamente si vede che
(f )|det |
SF()
sup
S
A(S).
Riassumiamo:
SF()
inf
S
A(S)
(f )|det |
(f )|det |
SF()
sup
S
A(S).
Dunque f è integrabile (cfr. la (70)), e vale lidentità
f =
(f )|det | (80)
cioè la (79).
Le considerazioni precedenti, applicate a 1
F
con F insieme limitato, dunque contenuto in un
rettangolo R, e PJmisurabile, mostrano subito che anche
1
(F) è PJmisurabile, con misura di
PeanoJordan uguale a quella di F divisa per |det |.
Osservazione 17.1. Se in particolare è composizione di rotazioni e traslazioni, per cui è
ortogonale, otteniamo
f =
(f )
cioè il risultato preannunciato nellOsservazione 15.1: lintegrale di Riemann è indipendente dal
sistema di riferimento cartesiano rispetto a cui è stato introdotto.
Esempio 17.1. Calcoliamo lintegrale di f(x, y) = (x

2
y
2
)
2
sul quadrato Q compreso tra le rette
y +x = 2, y x = 2. Siccome x
2
y
2
= (x +y)(x y), viene in mente di porre
u = x +y
v = x y
e da qui, invertendo, denire la attraverso il sistema
x = (u +v)/2
y = (u v)/2
cioè
:
u
v
u
v
1/2 1/2
1/2 1/2

u
v
.
Dunque Q è immagine nella di K = [2, 2]
2
, e
Q
(x
2
y
2
)
2
dxdy = |det |
K
u
2
v
2
dudv =
1
2
2
2
u
2
du
2
2
v
2
dv =
128
9
.
57
Per introdurre i prossimi sviluppi farà comodo inquadrare le precedenti considerazioni nel
seguente enunciato (che non dimostriamo), per pesante che esso sia:
Teorema 17.1. Siano dati due aperti U e V di R
2
, il primo dei quali limitato e PJmisurabile con
chiusura K = U contenuta in V . Sia : V R
2
un dieomorsmo di V , o pi` u in generale una
funzione di classe C
1
che ristretta ad U sia un dieomorsmo. Allora anche (U) è PJmisurabile,
e per ogni f : (U) R continua e limitata (dunque integrabile su (U) grazie al Teorema 13.3)
vale lidentità

(U)
f(x, y) dxdy =
U
(f )(u, v)|
(u, v)| dudv . (81)

Sottolineiamo che al posto degli aperti U e (U) si possono prendere, senza che cambi nulla, le
loro chiusure, per cui la (81) si scrive anche
(U)
f(x, y) dxdy =
(K)
f(x, y) dxdy =
K
(f )(u, v)|
(u, v)| dudv .

Questo teorema si applica ovviamente nel caso in cui sia una trasformazione ane invertibile,
ed allora la (81) non è che la (79).
La meticolosità dellenunciato del Teorema 17.1 si può dire che è fatta apposta per la seguente
importante applicazione.
Coordinate polari nel piano
La trasformazione
(, ) = ( cos , sin ), (82)
il cui jacobiano
(, ) vale , è regolarissima su tutto V = R

2
, ma perche sia un dieomorsmo
la restringiamo al prodotto cartesiano U =]0, 2[]0, R[, sicche (K) è il disco chiuso D
R
racchiuso
dalla circonferenza
x
2
+y
2
= R
2
.
La (81) diventa
D
R
f(x, y) dxdy =
K
f( cos , sin ) dd =
2
0
d
R
0
f( cos , sin ) d (83)
per f continua e limitata su C
0
(D
R
). In particolare ritroviamo per f(x, y) = 1 larea R
2
del disco
D
R
integrando la lunghezza 2 della circonferenza di raggio , che è dunque la derivata dellarea
del disco di raggio :
A(D
R
) =
R
0
2 d.
Si noti che per a, b > 0 anche la trasformazione
a,b
(, ) = (a cos , b sin ),
che (coincide con quando a = b = 1 ed) ha determinante ab, è regolarissima su tutto V = R
2
ed iniettiva su U =]0, 2[]0, R[. Solo che
a,b
(K) è la regione racchiusa dallellissi
x
2
a
2
+
y
2
b
2
= R
2
(e adesso non ha lo stesso signicato che nella (82): per x > 0 è larcotangente non di y/x, bens`
di ay/(bx), eccetera).
58
Esempio 17.2. Il chiuso
D = {(x, y) | 1 x
2
+y
2
4, 0 y
3x}
è un dominio normale rispetto allasse x, ma se la funzione integranda è
f(x, y) =
1
1 +x
2
+y
2
conviene vedere D come immagine nella (82) di K = U = {(, ) | 0 /3, 1 2}.
Otteniamo
D
f(x, y) dxdy =
K
f( cos , sin ) dd =
/3
0
d
2
1
1 +
2
d =

6
log
5
2
.
Osservazione 17.2. Nellintegrazione unidimensionale non avevamo mai visto comparire la richie-
sta che la sostituzione realizzasse un dieomorsmo. In dimensione > 1 questa richiesta, formulata
nel Teorema 17.1, è invece essenziale, come si vede dal seguente esempio per N = 2: il passaggio a
coordinate polari (, ) non realizza un dieomorsmo del rettangolo U =]0, []0, 1[ se > 2,
e lidentità

(K)
dxdy =
K
dd
non è soddisfatta perchè (K) è il disco chiuso di raggio 1 e la sua area è il valore del primo
membro, mentre quello del secondo è

0
d
1
0
d =

2
> .
Osservazione 17.3. In dimensione 1 lopportunità di eettuare un cambiamento di variabile, e

leventuale scelta di questultimo, dipendono solo dallespressione della funzione integranda. In
dimensione 2, invece, va tenuto altrettanto conto dellespressione del dominio U di integrazione.
Sia ad esempio f(x, y) = x
2
+ y
2
. Se D è il settore di corona circolare compreso tra i raggi 1 e 2
e gli angoli /4 e 3/4 nessun dubbio: coordinate polari. Ma se invece U = {(x, y) | 1 x
1, x
2
+ 1 y x
2
+ 2} le coordinate polari diventano un aare complicato, mentre tenendo
conto che D è un dominio normale rispetto allasse x lintegrazione di f si fa in un attimo servendosi
del Teorema 13.2.
Nello studio degli integrali doppi accade spesso che ad apparire promettente (rispetto tanto
al dominio di integrazione quanto alla funzione integranda) non sia subito una trasformazione di
coordinate (x, y) = (u, v) come nellenunciato del Teorema 17.1 e poi in particolare nellEsempio
17.2, bens` per cominciare una (u, v) = (x, y) iniettiva in un aperto A. Di questo genere è
la situazione presentatasi con ane nellEsempio 17.1, ma l` non abbiamo incontrato nessuna
dicoltà: in un attimo abbiamo trovato linversa di . In genere tuttavia il procedimento
di inversione di non è immediato; poi rimane da calcolare il determinante
in U = (A).
59
Mostriamo come a questultimo ne possa bastare, almeno in linea di principio, la conoscenza del
determinante
in A. Applicando allidentità
(
1
)(u, v) = (u, v) per (u, v) U
la regola di derivazione delle funzioni composte, e passando ai determinanti delle matrici jacobiane,
otteniamo
1((u, v))
(u, v) = 1,
e siccome in A risulta
1 arriviamo a
(u, v) =
1
((u, v))
. (84)
A questo punto, dovendosi calcolare il secondo membro della (84), ritorna pur sempre in ballo
la questione dellespressione esplicita della . E però se ne può prescindere in certi casi speciali:
tipicamente quelli degli esercizi di un corso, come nel prossimo esempio...
Esempio 17.3. Nellaperto B denito dalle disuguaglianze
1 < x
2
y
2
< 2,
1
2
<
y
x
<
1
2
(85)
la trasformazione di coordinate denita da u = x
2
y
2
, v = y/x non è iniettiva: (x, y) =
(x, y). Lo è invece nellintersezione A di B col semipiano delle x > 0: dato un qualunque punto
(u
0
, v
0
) di U = (A) =]1, 2[] 1/2, 1/2[, liperbole x
2
y
2
= u
0
e la retta y = v
0
x si incontrano
in un unico punto (x
0
, y
0
) A. Dunque in U è denita la iniettiva data dallinversa della
ristretta ad A. Soprassediamo momentaneamente alla verica delle proprietà della attraverso il
suo calcolo esplicito, ed esprimiamo il suo jacobiano attraverso quello dellinversa: siccome
(x, y) = 2 2
y
2
x
2
la (84) adesso diventa
(u, v) =
1
2(1 v
2
)
. (86)
Come si vede, non cè stato bisogno del calcolo esplicito di , che peraltro si fa subito: è la
trasformazione
x =
u
1 v
2
, y = v
u
1 v
2
,
di classe C
1
in V = R] 1, 1[ ed iniettiva in U. Da questa espressione si arriva di nuovo alla (86),
anche se con qualche conto in pi` u.
Servendosi delle coordinate polari si può formulare un rapido approccio allintegrazione impro-
pria nel piano. Per cominciare, poniamo
C
rR
= {(x, y) | 0 < r
2
x
2
+y
2
R
2
< }.
Lintegrale
I
rR
=
C
rR
(x
2
+y
2
)
/2
dxdy = 2
R
r
+1
d
60
vale
2
+ 2
(R
+2
r
+2
) per = 2, 2(log R log r) per = 2.
Dunque
lim
R
I
rR
= per 2, lim
R
I
rR
=
2r
+2
+ 2
per < 2,
lim
r0
I
rR
= per 2, lim
r0
I
rR
=
2R
+2
+ 2
per > 2.
Da qui si ricava facilmente il
Teorema 17.2. (i) Sia f denita allesterno del disco x
2
+y
2
r
2
per qualche r > 0 ed integrabile
in ogni C
rR
, R > r. Allora lintegrale improprio
x
2
+y
2
r
2
f(x, y) dxdy
converge assolutamente se esiste una costante K > 0 tale che 0 |f(x, y)| K(x
2
+ y
2
)
/2
per
un < 2, mentre diverge se esiste una costante K > 0 tale che f(x, y) K(x
2
+ y
2
)
/2
per un
2;
(ii) Sia f denita in un disco bucato 0 < x
2
+y
2
R
2
per qualche R > 0 ed integrabile in ogni
C
rR
, 0 < r < R. Allora lintegrale improprio
x
2
+y
2
R
2
f(x, y) dxdy
converge assolutamente se esiste una costante K > 0 tale che 0 |f(x, y)| K(x
2
+ y
2
)
/2
per
un > 2, mentre diverge se esiste una costante K > 0 tale che f(x, y) K(x
2
+ y
2
)
/2
per un
2.
Lenunciato del Teorema 17.1 si trasferisce in maniera ovvia alla dimensione 3:
Teorema 17.3. Siano dati due aperti U e V di R
3
, il primo dei quali limitato con chiusura K = U
contenuta in V . Sia : V R
3
un dieomorsmo di V , o pi` u in generale una funzione di
classe C
1
che ristretta ad U sia un dieomorsmo, con (U) PJmisurabile. Allora anche U è
PJmisurabile, e per ogni f : (U) R limitata e integrabile vale lidentit` a
(U)
f(x, y, z) dxdydz =
U
(f )(u, v, w)|
(u, v, w)| dudvdw (87)

ovvero
(U)
f(x, y, z) dxdydz =
(K)
f(x, y, z) dxdydz =
K
(f )(u, v, w)|
(u, v, w)| dudvdw.

Oltre alla (80), che si trasferisce banalmente al caso di una trasformazione ane dello spazio,
unimportante applicazione che rientra nel Teorema 17.4 è la seguente.
61
Coordinate sferiche
La trasformazione
(, , ) = ( cos cos , sin cos , sin ),
il cui jacobiano
(, , ) vale
2
cos , è regolarissima su tutto V = R
3
, e diventa un dieomor-
smo quando è ristretta al prodotto cartesiano ]0, 2[]0, R[] /2, /2[. Prendendo ad esempio
questultimo come U, per cui (K) è la palla (tridimensionale) chiusa B
R
, otteniamo
B
R
f(x, y, z) dxdydz =
K
f( cos cos , sin cos , sin )
2
cos ddd (88)
=
2
0
d
R
0
d
/2
/2
f( cos cos , sin cos , sin )
2
cos d
per f C
0
(B
R
) limitata (cfr. la (72)). La (88) fornisce il volume 4R
3
/3 della sfera come integrale
dellarea (nel senso della geometria euclidea) 4
2
della supercie sferica di raggio , area che è
quindi la derivata del volume della sfera di raggio :
V (B
R
) =
R
0
4
2
d.
Esempio 17.4. Per calcolare
I =
D
cos
x
2
+y
2
+z
2
x
2
+y
2
+z
2
dxdydz
con
D = {(x, y, z) | 1 x
2
+y
2
+z
2
4, z 0}
passiamo a coordinate sferiche x = cos cos , y = sin cos , z = sin , dove 1 2, 0
2 e (attenzione!) 0 /2. Otteniamo
I =
[1,2][0,2][0,/2]
cos
2

2
cos ddd = 2(sin 2 sin 1).
Utilizziamo le coordinate sferiche per occuparci dellintegrazione impropria nello spazio a 3

dimensioni. Poniamo
rR
= {(x, y, z) | 0 < r
2
x
2
+y
2
+z
2
R
2
< }.
Lintegrale
I
rR
=
rR
(x
2
+y
2
+z
2
)
/2
dxdydz = 4
R
r
+2
d
vale
4
+ 3
(R
+3
r
+3
) per = 3, 4(log R log r) per = 3.
Dunque
lim
R
I
rR
= per 3, lim
R
I
rR
=
4r
+3
+ 3
per < 3,
lim
r0
I
rR
= per 3, lim
r0
I
rR
=
4R
+3
+ 3
per > 3.
Da qui si ricava il
62
Teorema 17.4. (i) Sia f denita allesterno della palla x
2
+ y
2
+ z
2
r
2
per qualche r > 0 ed
integrabile in ogni
rR
, R > r. Allora lintegrale improprio
x
2
+y
2
+z
2
r
2
f(x, y, z) dxdydz
converge assolutamente se esiste una costante K > 0 tale che 0 |f(x, y, z)| K(x
2
+y
2
+z
2
)
/2
per un < 3, mentre diverge se esiste una costante K > 0 tale che f(x, y) K(x
2
+y
2
+z
2
)
/2
per un 3;
(ii) Sia f denita in una palla bucata 0 < x
2
+ y
2
+ z
2
R
2
per qualche R > 0 ed integrabile
in ogni
rR
, 0 < r < R. Allora lintegrale improprio
x
2
+y
2
+z
2
R
2
f(x, y) dxdydz
converge assolutamente se esiste una costante K > 0 tale che 0 |f(x, y, z)| K(x
2
+y
2
+z
2
)
/2
per un > 3, mentre diverge se esiste una costante K > 0 tale che f(x, y, z) K(x
2
+y
2
+z
2
)
/2
per un 3.
18 Richiami su curve ed integrali curvilinei
Una curva di R
N
è una funzione vettoriale = (
,
. . . ,
N
) : [a, b] R
N
almeno continua e
limitata su un intervallo limitato ]a, b[. Il suo integrale da a a b è il vettore
b
a
(t) dt =
b
a
1
(t) dt, . . . ,
b
a
N
(t) dt
.
Lemma 18.1. Vale la disuguaglianza
b
a
(t) dt
b
a
(t) dt.
DIM. Applicando la disuguaglianza di CauchyScwarz al prodotto scalare ( | ) in R
N
otteniamo
subito
b
a
(t) dt
b
a
((t) | y) dt
b
a
(t) y dt =
b
a
(t) dt
y
e quindi, con la scelta
y =
b
a
(t) dt,
il risultato cercato.
QuandoN = 2 e N = 3 le pi` u abituali notazioni per la la generica curva sono rispettivamente

t (x(t), y(t)), t (x(t), y(t), z(t)).
63
Esempio 18.1. Se f è una funzione reale continua su [a, b] le funzioni vettoriali
[a, b] t (t, f(t))
e
[a, b] t (f(t), t)
sono due curve di R
2
. Per semplicità conviene parlare di curva y = f(x), x [a, b] nel primo caso
e di curva x = f(y), y [a, b] nel secondo.
Si dice che è: semplice se (t

1
) = (t
2
) per a t
1
< t
2
b tranne, eventualmente, quando
t
1
= a e t
2
= b; chiusa se (a) = (b); aperta se (a) = (b).
Lorientazione di è quella in cui (t
1
) precede (t
2
) se a t
1
< t
2
b; il primo estremo
o origine di è (a), il secondo estremo o termine è (b). Lopposta di è la curva
[a, b] t (a +b t).
Il sostegno di è limmagine ([a, b]). Si tatta di un insieme (sempre chiuso nella topologia
di R
N
!) da cui in nessun modo si può risalire alla funzione : basta pensare che esso è lo stesso per
ogni altra curva p non appena p è di classe C
0
in un intervallo compatto [c, d] con p([c, d]) = [a, b].
Ciò corrisponde perfettamente alla distinzione tra una funzione (scalare) e il suo graco, salvo per
la dierenza, non di poco conto, che abitualmente il termine di curva viene utilizzato proprio col
signicato di sostegno, non certo di funzione (vettoriale). E anche qui in certi casi farà comodo,
per procedere un po pi` u speditamente, riferirsi al sostegno di una famiglia di curve come se fosse
la stessa cosa di una o di alcune particolari curve della famiglia.
Esempio 18.2. In R
2
la circonferenza di centro (x
0
, y
0
) e raggio r, pensata come curva (semplice
e chiusa), è la funzione
[0, 2] t (x
0
+r cos t, y
0
+r sin t).
Esempio 18.3. Dati x e y in R

N
il segmento (orientato) (x, y) che va da x a y, inteso come
curva (semplice e aperta), è una qualunque funzione
[a, b] t
b t
b a
x +
t a
b a
y
con a e b presi in R, a < b. I segmenti (x, y) e (y, x) sono opposti tra loro.
Due curve : [a, b] R

N
e : [c, d] R
N
di classe C
1
sono equivalenti luna allaltra quando
= p con p : [c, d] R di classe C
1
, p
= 0 in [c, d] e p([c, d]) = [a, b] (per cui p è strettamente

monotona con p
1
C
1
([a, b])). Se p è crescente, cioè se (a) = (c) e (b) = (d), lorientazione
di coincide con quella di , altrimenti una è lopposta dellaltra.
Esempio 18.4. In R
2
la curva di classe C
1
[0, ] t (cos t, sin t)
64
non è equivalente alla curva
y =
1 x
2
, 1 x 1,
che non è di classe C
1
. Invece sono equivalenti tra di loro, ma con orientazioni opposte, le due
curve di classe C
1
[/4, 3/4] t (cos t, sin t)
e
y =
1 x
2
,
1
2
x
1
2
:
lequivalenza è realizzata dal cambiamento di parametro p() = cos .
Una curva : [a, b] R

N
di classe C
1
è regolare se soddisfa
> 0 in tutto [a, b]. La ragion

dessere di questa condizione sta nella sua interpretazione geometrica quando a < t
0
< b: se e solo
se non è nulla, la derivata
(t
0
), limite per t t
0
del rapporto incrementale
(t) (t
0
)
t t
0
con t
0
, t ]a, b[, t = t
0
, è lNpla dei parametri direttori di una retta, e pi` u esattamente della
tangente al sostegno di in (t
0
). Per N generico, N = 2, N = 3 i versori di tale tangente si
scrivono rispettivamente
11
(t
0
)
(t
0
)
,
(x
(t
0
), y
(t
0
))
(t
0
)
2
+y
(t
0
)
2
,
(x
(t
0
), y
(t
0
), z
(t
0
))
(t
0
)
2
+y
(t
0
)
2
+z
(t
0
)
2
.
Nel particolare caso bidimensionale di una curva y = f(x) i versori della tangente in (x
0
, f(x
0
))
sono
(1, f
(x
0
))
1 +f
(x
0
)
2
e quindi quelli della normale sono
(f
(x
0
, 1))
1 +f
(x
0
)
2
.
Diversa la questione dal punto di vista cinematico: come velocità istantanea allistante t
0
del
moto con legge oraria (e quindi con traiettoria uguale al sostegno di ) la derivata
(t
0
) pu` o
benissimo avere tutte le componenti uguali a 0.
Esempio 18.5. La curva (t) = (t
3
, t
2
) per 1 t 1 è di classe C
1
e costituisce la legge oraria
di un moto con velocità (vettoriale) nulla allistante 0. Però il suo sostegno, cioè la traiettoria
del moto, è anche il sostegno della curva (=graco della funzione) y = x
2/3
, e dunque è privo di
tangente nellorigine.
11
La scelta del segno + o dipende dallorientazione che si ssa sulla tangente.
65
Lagganciamento della curva ad una seconda curva : [c, d] R
N
ha senso (solo) quando
(b) = (c). Esso dà luogo alla curva : [a, b+dc] R
N
denita dalle identità: () = () per
a b, () = ( b +c) per b < b +d c. Dunque la ristretta a [a, b] è la stessa cosa
della , mentre ristretta a [b, b +d c] non è esattamente la bens` la p con p() = b +c.
Lagganciamento consecutivo di tre o pi` u curve si eettua agganciando, per cominciare, la prima e
la seconda (purche ciò sia possibile), poi agganciando la curva cos` ottenuta e la terza delle curve
date (purche ciò sia possibile), eccetera. Lagganciamento di un numero nito di segmenti è una
poligonale.
Un cammino è una curva ottenuta agganciando consecutivamente un numero nito di curve
di classe C
1
; lorientazione di una qualunque di tali curve determina quella di tutto il cammino se
questo è una curva semplice. Un cammino è dunque una funzione di classe C
1
a tratti (oltre che,
naturalmente, di classe C
0
). Ciò signica che si può dare una partizione a = a
0
< a
1
< < a
m
= b
di [a, b] in modo tale che la derivata
(t) esista continua in ogni intervallo ]a

h1
, a
h
[ e sia dotata
di limite in R
N
tanto per t a
h1
+ 0 che per t a
h
0. Naturalmente rientra nella denizione
di cammino una di classe C
1
su tutto [a, b].
Indichiamo con G una funzione continua sul sostegno di un cammino [a, b] R
N
. Lintegrale
curvilineo (di prima specie) di G su è denito nel modo seguente:
Gds =
b
a
G((t))
(t) dt.
La denizione è ben posta perche la funzione integranda t G((t))
(t) è denita, limitata e

continua nellintervallo [a, b] privato al pi` u di un numero nito di punti a
h
; inoltre
Gds =
m
h=1
a
h
a
h1
G((t))
(t) dt.
Esempio 18.6. Se G è una funzione reale continua sul graco di una funzione f C
1
([a, b]) il suo
integrale di prima specie sulla curva y = f(x) è dato da
b
a
G(x, f(x))
1 +f
(x)
2
dx.
Dalla formula di integrazione per sostituzione segue facilmente il

Teorema 18.1. Se due curve e di classe C
1
sono equivalenti tra di loro vale lidentità
Gds =
Gds
indipendentemente dallorientazione delle due curve.
DIM. Sia = p con p : [c, d] R di classe C
1
, p
= 0 in [c, d] e p([c, d]) = [a, b]. Il primo

membro dellidentità da dimostrare è uguale a
d
c
G((t))
(t) dt =
d
c
G(( p)(t))( p)
(t) dt =
d
c
G(( p)(t))(
p)(t)|p
(t)| dt
66
e per la formula dintegrazione per sostituzione lultimo integrale vale
b
a
G((t))
(t) dt =
Gds.
Adesso ssiamo N funzioni L

j
continue in un aperto A di R
N
ed associamo loro tanto la
funzione vettoriale A R
N
, o campo vettoriale, L = (L
1
, . . . , L
N
) che la forma dierenziale
= L
1
dx
1
+ + L
N
dx
N
. Ogni enunciato su L è equivalente ad un enunciato su . Per` o la
notazione dierenziale è la pi` u comoda quando si ha a che fare con gli integrali che adesso passiamo
ad introdurre.
Dato un cammino = (
1
, . . . ,
N
) : [a, b] R
N
col sostegno C contenuto in A lintegrale
curvilineo (di seconda specie) di su è il numero
b
a
N
j=1
L
j
((t))
j
(t) dt.
La denizione è ben posta perche la funzione integranda t
N
j=1
L
j
((t))
j
(t) è denita, limitata
e continua nellintervallo [a, b] privato di un numero nito di punti (quelli in cui non è denita
qualcuna delle derivate
j
).
Esempio 18.7. Se L ed M sono funzioni reali continue in un aperto A di R
2
lintegrale di Ldx +
M dy su una curva y = f(x), a x b di classe C
1
e con sostegno contenuto in A è dato da
b
a
L(x, f(x)) dx +
b
a
M(x, f(x))f
(x) dx.
Teorema 18.2. Se due curve e di classe C

1
con i sostegni contenuti in A sono equivalenti tra
di loro vale lidentità

oppure lidentit` a
a seconda che e abbiano orientazioni uguali o opposte.

DIM. Sia = p con p : [c, d] R di classe C
1
, p
= 0 in [c, d] e p([c, d]) = [a, b]. Il primo

membro delle identità da dimostrare è uguale a
d
c
N
j=1
L
j
((t))
j
(t) dt =
d
c
N
j=1
L
j
(( p)(t))( p)
(t) =
d
c
N
j=1
L
j
(( p)(t))(
p)(t)p
(t) dt
e per la formula dintegrazione per sostituzione lultimo integrale vale
b
a
N
j=1
L
j
((t))
j
(t) dt =
67
oppure
a
b
N
j=1
L
j
((t))
j
(t) dt =
a seconda che p
> 0 o p
< 0.
Esempio 18.8. Applicando ripetutamente il Teorema 18.2 si verica che lintegrale di seconda
specie sulla circonferenza [0, 2] t (cos t, sin t) è uguale alla somma di quelli sullopposta di
y =
1 x
2
, 1/
2 x 1/
2 (cfr lEsempio 1.4), sullopposta di x =
1 y
2
, 1/
2
y 1/
2, su y =
1 x
2
, 1/
2 x 1/
2 e su x =
1 y
2
, 1/
2 y 1/
2.
19 Lunghezza di una curva

La lunghezza di un segmento (x, y) di estremi x = (x
1
, . . . , x
N
) e y = (y
1
, . . . , y
N
) è la quantità
x y =
i=1
(x
i
y
i
)
2
;
quella di una poligonale che ottiene agganciando uno dopo laltro un numero nito di segmenti
(x
k
, y
k
) è la somma delle lunghezze x
k
y
k
, e noi la indichiamo con (). Se z è un punto di
(x, y), cioè z = x +(y x) per un ]0, 1[, la disuguaglianza triangolare vale col segno uguale:
x y = x z +z y.
Da ciò segue che la lunghezza di (x, y) non varia se, invece che come un segmento, lo si considera
come la poligonale di vertici consecutivi x, z e y. Pi` u in generale, dunque, la lunghezza di una
poligonale non varia se ai suoi vertici ne vengono aggiunti degli altri, non essenziali nel senso
appena detto.
Sia adesso data una curva semplice : [a, b] R
N
. Una poligonale
inscritta in viene
costruita ssando una partizione a = t
0
< t
1
< < t
n
= b di [a, b] e agganciando consecutivamente
i segmenti ((t
k1
), (t
k
)), k = 1, ..., n. Diciamo che è retticabile se le lunghezze delle
poligonali
inscritte in costituiscono un insieme limitato. In tal caso la lunghezza di è

indicata con () ed è denita cos`:
() = sup
).
Lipotesi che sia semplice non è essenziale se non per fare in modo che la sua lunghezza possa
essere interpretata come lunghezza del suo sostegno.
Teorema 19.1. Se è retticabile ogni altra curva tale che = p per unopportuna funzione
reale continua ed invertibile p : [a, b] R è a sua volta retticabile ed ha la stessa lunghezza di .
68
DIM. Un numero nito di punti t
h
distinti tra di loro determina una partizione di [a, b] se e solo
se i punti
h
= p(t
h
) sono distinti tra di loro e determinano una partizione di [c, d]. Dunque una
poligonale inscritta a è una poligonale inscritta a , e viceversa.
Nelle considerazioni che abbiamo svolto nora non abbiamo fatto intervenire nessuna ipotesi di
regolarità delle curve in aggiunta a quella (di continuità) automaticamente garantita dalla denizio-
ne. Ma in un contesto cos` generale può venir meno la retticabilità, e perno lunidimensionalità.
Uno splendido esempio (troppo elaborato per essere presentato qui) è la curva di Peano, il cui
sostegno è lintero quadrato [0, 1]
2
. Ma anche curve continue inequivocabilmente unidimensionali
possono non essere retticabili:
Esempio 19.1. La curva piana (t) = (t, t sin(/2t)) per 0 < t 1, (0) = (0, 0) non è retticabile.
Sia infatti K un qualunque numero reale, e sia n = n
K
un numero naturale cos` grande che
n
j=2
1/j > K (divergenza della serie armonica). Sia poi
la poligonale inscritta associata alla

partizione t
0
= 0 < t
1
= 1/n < t
2
= 1/(n 1) < < t
n
= 1. Poiche
(t
j
) (t
j1
)
sin
j
2
j

sin
(j1)
2
j 1
=
1
j
+
1
j 1
>
1
j
, j = 2, ..., n,
la lunghezza (
) è maggiore di K.
Passiamo a richiedere che la curva : [a, b] R

N
sia non pi` u soltanto continua, bens` anche C
1
a tratti, dunque un cammino. Sia a = a
0
< a
1
< < a
m
= b una partizione di [a, b] tale che
(t)
esista continua in ogni intervallo ]a
h1
, a
h
[ ed ammetta limite in R
N
tanto quando t a
h1
+0 che
quando t a
h
0. La norma
(t) è denita, limitata e continua in tutto [a, b] con leccezione

al pi` u dei punti a
h
, dunque integrabile su [a, b] secondo Riemann.
Teorema 19.2. Ogni cammino : [a, b] R
N
è retticabile, e la sua lunghezza è data dalla
formula
() =
b
a
(t) dt. (89)

DIM. Ci si convince facilmente che è suciente dimostrare il presente enunciato per le restrizioni di
ai vari intervalli [a
h1
, a
h
] in cui essa è una funzione di classe C
1
. Ma allora tanto vale supporre
direttamente che lo sia su tutto [a, b].
Per ogni partizione a = t
0
< t
1
< t
n1
< t
n
= b la lunghezza della poligonale
di vertici
(t
k
) verica
(
) =
m
k=1
(t
k
) (t
k1
) =
m
k=1
t
k
t
k1
(t) dt
k=1
t
k
t
k
1
(t) dt =
b
a
(t) dt
grazie al Lemma 18.1 con
al posto di . Dunque è retticabile, e la sua lunghezza verica

()
b
a
(t) dt. (90)

69
Daltra parte, dallidentità
t
k
t
k1
(t
k
) dt
t
k
t
k1
(t
k
) dt
ricaviamo, maggiorando il primo membro con
t
k
t
k1
(t) dt
t
k
t
k1
[
(t
k
)
(t)] dt
t
k
t
k1
(t) dt
t
k
t
k1
(t
k
)
(t) dt
e minorando il secondo membro con
t
k
t
k1
(t) dt
t
k
t
k1
(t
k
)
(t) dt,
che

t
k
t
k1
(t) dt
t
k
t
k1
(t) dt 2
t
k
t
k1
(t
k
)
(t) dt. (91)

Il primo membro della (91) è la quantità (t
k
) (t
k1
), e passando alla somma su k si ottiene
la lunghezza della poligonale
determinata dalla partizione. Fissiamo > 0 e determiniamo

=
> 0 tale che
()
(t) < per t, in [a, b] con |t | < (uniforme continuità di
(t)
su [a, b]). Per i t
k
tali che t
k
t
k1
< otteniamo
(
b
a
(t) dt 2(b a)
e insieme alla (90) questo dimostra il teorema.
Il secondo membro della (89) è lintegrale di prima specie su della funzione identicamente
uguale ad 1.
Esempio 19.2. Il graco di una funzione reale f C
1
([a, b]) è retticabile, e la sua lunghezza vale
b
a
1 + [f
(x)]
2
dx.
Limitiamoci a di classe C
1
in [a, b]. La lunghezza
s(t) =
t
a
() d
della ristretta ad [a, t], dove t [a, b], è una funzione detta ascissa curvilinea, che verica
ds
dt
=
(t).
Questo spiega la notazione adottata per gli integrali curvilinei di prima specie. La s(t) è una
funzione iniettiva di classe C
1
su [a, b]: la sua inversa t = t(s), di classe C
1
sullintervallo [0, ()],
fornisce una nuova curva [0, ()] s (t(s)) equivalente alla [a, b] t (t).
70
20 La formula di GaussGreen
Siano date due funzioni reali continue , : [a, b] R con < su ]a, b[, dove < a < b < .
Indichiamo con K luno o laltro dei due domini normali deniti a partire da f e g, cioè o
{(x, y) R
2
| a x b, (x) y (x)} (92)
oppure
{(x, y) R
2
| a y b, (y) x (y)}. (93)
Se K è il dominio (92) la sua frontiera è il sostegno del cammino chiuso ottenuta agganciando
consecutivamente: la curva y = (x), a x b; il segmento (che può anche ridursi ad un punto)
x = b, (b) y (b); lopposta della curva y = (x), a x b; lopposto del segmento (che può
anche ridursi ad un punto) x = b, (a) y (a). Considerazioni del tutto analoghe valgono per
K dato dalla (93).
Aggiungiamo lipotesi che e siano di classe C
1
su [a, b]. Per semplicare la terminologia
diciamo che i domini (92) e (93) sono adesso, rispettivamente, di tipo I e di tipo II. In entrambi i
casi la frontiera K di K è sostegno di un cammino che orientiamo in senso antiorario e denotiamo
con +K. Per ssare le idee, sia K dato da (92). In ogni punto di K ad eccezione di (a, (a)),
(a, (a)), (b, (b)) e (b, (b)) sono deniti:
il versore tangente positivo a +K, che indichiamo con , uguale a
(1,
(x))
1 +
(x)
2
nei punti (x, (x)) con a < x < b,
(1,
(x))
1 +
(x)
2
nonche a (0, 1) nei punti (a, y) con (a) < y < (a) (se ce ne stanno), (0, 1) nei punti (b, y)
con (b) < y < (b) (se ce ne stanno);
il versore normale esterno a K, che indichiamo con
e
, uguale a
(
(x), 1)
1 +
(x)
2
(
(x), 1)
1 +
(x)
2
nonche a (1, 0) nei punti (a, y) con (a) < y < (a) (se ce ne stanno), (1, 0) nei punti (b, y)
con (b) < y < (b) (se ce ne stanno).
Prolunghiamo e a tutto R conservando la loro regolarità C
1
e ancora una volta, per ssare
le idee, prendiamo come K il dominio (92). Se A è un aperto che contiene K, questultimo è
contenuto nellunione di rettangoli aperti I]c, d[ con
[a, b] [c, d] A, c < (x), (x) < d x I. (94)
Teorema 20.1. Sia K uno dei due aperti (92) o (93) e siano L, M due funzioni continue, nonche
dotate di derivate parziali L
y
, M
x
anchesse continue, in un aperto A K. Risulta
K
(M
x
L
y
) dxdy =
+K
Ldx +M dy. (95)
71
DIM. Sia K il dominio di tipo I dato dalla (92). Per la formula di riduzione degli integrali doppi
ed il teorema fondamentale del calcolo integrale risulta
K
L
y
dxdy =
b
a
dx
(x)
(x)
L
y
(x, y) dy =
b
a
[L(x, (x)) L(x, (x))] dx =
+K
Ldx. (96)
Per ogni scelta di I, c, d tali che che sia soddisfatta la (94), si applica il Teorema 6.3 alla funzione
x (x) =
(x)
(x)
M(x, y) dy
nei punti x I e si ottiene lidentità
(x) =
d
dx
(x)
(x)
M(x, y) dy =
(x)
(x)
M
x
(x, t) dt +M(x, (x))
(x) M(x, (x))
(x),
che viene dunque ad essere valida in ogni punto x [a, b]. Integrandola su [a, b] otteniamo
T
M
x
dxdy =
b
a
dx
(x)
(x)
M
x
(x, y) dy
=
(b)
(b)
M(b, y) dy
(a)
(a)
M(a, y) dy
b
a
[M(x, (x))
(x) M(x, (x))
(x)] dx
=
+K
M dy,
dove la dierenza dei due integrali in dy del 3
o
membro è (b) (a).
Da qui e da (96) segue la (95).
Lo stesso discorso vale per K dato dalla (93).
La (95) è la formula di GaussGreen. Unaltra maniera di scriverla si ottiene osservando

che M
x
L
y
è la terza componente del rotore del campo vettoriale F(x, y) = (L(x, y), M(x, y), 0),
mentre il secondo membro della (95) è la somma dei seguenti quattro addendi:
b
a
L(x, (x))
1
1 +
(x)
2
+M(x, (x))

(x)
1 +
(x)
2
1 +
(x)
2
dx,
b
a
L(x, (x))
1
1 +
(x)
2
+M(x, (x))

(x)
1 +
(x)
2
1 +
(x)
2
dx,
(a)
(a)
M(a, y)(1) dy e
(b)
(b)
M(b, y) 1 dy.
Ma allora la (97) si può riscrivere come
K
(rot F) kdxdy =
K
F ds.
72
Nel secondo membro la scelta dellorientazione sulla frontiera di K, che non può tradursi nel verso
di percorrenza sul cammino di integrazione dellintegrale di prima specie, dal momento che que-
stultimo ne è indipendente (e infatti abbiamo soppresso il segno +), compare invece nella funzione
integranda, dove il versore tangente è orientato seguendo il verso antiorario di percorrenza del
cammino.
Diamo una formulazione equivalente della formula di GaussGreen prendendo una funzione
vettoriale continua G = (P, Q) : A R
2
con derivate P
x
, Q
y
anchesse continue in A. Per L
uguale ad Q e M ad P, dunque M
x
L
y
uguale alla divergenza div G = (P
x
, Q
y
), la (95)
diventa

K
div Gdxdy =
+K
Qdx +P dy. (97)
Il secondo membro della (95) è la somma dei seguenti quattro addendi:
b
a
P(x, (x))

(x)
1 +
(x)
2
+Q(x, (x))
1
1 +
(x)
2
1 +
(x)
2
dx,
b
a
P(x, (x))

(x)
1 +
(x)
2
+Q(x, (x))
1
1 +
(x)
2
1 +
(x)
2
dx,
(a)
(a)
P(a, y)(1) dy e
(b)
(b)
P(b, y) 1 dy.
Ma allora la (97) si può riscrivere come
K
div Gdxdy =
K
G
e
ds. (98)
Nel secondo membro la scelta dellorientazione sulla frontiera di K è realizzata dal versore normale,
che è precisamente quello esterno
e
e non il suo opposto. La variante (98) della formula di Green
esprime, sotto le ipotesi che abbiamo dato, il Teorema della divergenza.
Indichiamo con K il cerchio di centro lorigine e raggio 1. Si tratta s` di un dominio normale,
ma non di tipo I ne di tipo II, perche le funzioni
[1, 1] x
1 x
2
, [1, 1] y
1 y
2
non sono di classe C
1
. Però domini quali
K
1
= {(x, y) R
2
| x
2
+y
2
1, x 1/
2}
e
K
2
= {(x, y) R
2
| x
2
+y
2
1, x 1/
2}
sono di tipo II (non di tipo I), mentre
K
3
= {(x, y) R
2
| x
2
+y
2
1, 1/
2 x 1/
2}
è di tipo I (non di tipo II). K è unione dei K
j
, e la sua frontiera, con lorientazione indotta da
quelle delle +K
j
, diventa una curva orientata che indichiamo con +K. (Naturalmente avremmo
potuto pi` u semplicemente dire che +K è la circonferenza unitaria orientata in senso antiorario,
però in tal modo non avremmo suggerito una procedura di portata generale.) Se le funzioni L ed
73
M sono continue, con L
y
e M
x
anchesse continue, in un aperto contenente K si può applicare la
formula di GaussGreen su ogni K
j
ed ottenere
K
(M
x
L
y
) dxdy =
3
j=1
K
j
(M
x
L
y
) dxdy
=
3
j=1
+K
j
Ldx +M dy =
+K
Ldx +M dy
grazie alla cancellazione reciproca dei contributi negli
+K
j
Ldx + M dy dei segmenti verticali
delle K
j
. Lultimo membro si può adesso scrivere come un integrale sulla curva [0, 2] t
(cos t, sin t).
Le considerazioni appena svolte per il cerchio si generalizzano ad ogni dominio K di cui si
possa dare, mediante intersezioni con opportune rette verticali ed orizzontali, una decomposizione
in un numero nito di sottodomini di tipo I o II privi due a due di punti interni in comune; le
frontiere dei sottodomini orientate positivamente inducono automaticamente sulla frontiera di K
una orientazione (positiva per denizione). Diciamo allora che K è ammissibile, e il Teorema 20.1
ammette il seguente
Corollario 20.1. La formula di GaussGreen vale in ogni dominio ammissibile K per funzioni L
ed M continue, con L
y
e M
x
anchesse continue, in un aperto contenente K.
Lenunciato precedente si trasforma in un attimo nella sua variante per il Teorema della diver-
genza.
Esempio 20.1. Se un triangolo ha un lato verticale è un dominio di tipo I, se ne ha uno orizzontale
è un dominio di tipo II. Peraltro è facile decomporre un qualunque triangolo nellunione di due
triangoli con un lato verticale oppure con uno orizzontale in comune. Ne segue che ogni triangolo
è un dominio ammissibile.
Esempio 20.2. Una corona circolare è ammissibile, e lorientazione positiva sulla sua frontiera in-
duce il verso di percorrenza antiorario sulla circonferenza maggiore, quello orario sulla circonferenza
minore.
Esempio 20.3. Se ad un dominio normale di tipo I o II si toglie un disco aperto la cui chiusura sia
contenuta allinterno del dominio si ottiene un dominio ammissibile (unione di 8 domini normali di
tipo I oppure II). Da qui si arriva facilmente a generalizzare lEsempio 7.2 della corona circolare,
mostrando che è ammissibile un disco chiuso privato di un disco aperto con la chiusura contenuta
allinterno del disco di partenza.
Osservazione 20.1. Prendendo una volta L(x, y) = 0, M(x, y) = x e laltra L(x, y) = y,

M(x, y) = 0 otteniamo per larea di un dominio ammissibile K le espressioni
v
2
(K) =
+K
xdy =
+K
y dx.
74
Spesso, nelle applicazioni, quella che viene data esplicitamente è una curva semplice e chiusa su
cui bisogna calcolare un integrale di seconda specie: se si vuole ricorrere alla formula di GaussGreen
nella formulazione data qui col Teorema 20.1 (tante altre, naturalmente, se ne possono trovare!)
bisogna mostrare innanzitutto che il sostegno di è la frontiera di un dominio ammissibile K, e
poi che lintegrale su è uguale a quello su +K.
21 Serie di funzioni
Data una successione di funzioni f
k
denita in un intervallo I, le associamo la serie
n=1
f
k
, cioè
la successione delle ridotte F
n
=
n
k=1
f
k
(e si tenga presente che ogni successione {g
n
} di funzioni
è a sua volta la successione delle ridotte della serie g
1
+
k=1
(g
k+1
g
k
)). Diciamo che la serie
delle f
n
è uniformemente convergente in I se è tale la successione delle F
n
. Utilizzando la
(29) scriviamo subito il criterio di Cauchy che fornisce la condizione necessaria e suciente per la
convergenza uniforme della serie: dato comunque > 0 esiste =
N tale che
n+p
k=n+1
f
k
(x)
per x I, n
, p N (99)
ovvero
sup
xI
n+p
k=n+1
f
k
(x)
per n
, p N.
Il trasporto del Teorema 7.1 dalle successioni alle serie è immediato.
Teorema 21.1. (i) Se le funzioni f
k
: I R sono continue in un punto x
0
I e la loro serie
converge uniformemente in I, allora anche la somma della serie è una funzione continua in x
0
.
(ii) Se le funzioni f
k
: I R sono continue in ogni punto di I e la loro serie converge
uniformemente in I, allora la somma della serie (continua in I grazie a (i)) verica
b
a
k=1
f
k
(x) dx =
k=1
b
a
f
k
(x) dx
per ogni scelta di a, b I.
(iii) Se le funzioni f
k
: I R sono di classe C
1
in I con
k=1
f
k
(x
0
) convergente per qualche
scelta di x
0
I e la serie delle f
k
uniformemente convergente in I, allora la serie delle f
k
converge
in tutto I ed ha per somma una funzione di classe C
1
, con
d
dt
k=1
f
k
(x) =
k=1
df
k
dt
(x) per x I.
Nellambito delle serie di funzioni si introduce una nozione che non ha controparte in quello
delle successioni di funzioni. Diciamo che
k=1
f
k
converge totalmente in I se esiste una serie
convergente
n=1
A
k
di costanti reali non negative tali che
|f
k
(x)| A
k
per x I,
75
il che equivale alla convergenza della serie numerica
k
sup
xI
|f
k
(x)| maggiorata termine a termine
dalla
n=1
A
k
. La convergenza totale su I implica in ogni punto x di I la convergenza della serie
numerica
k
|f
k
(x)|, cioè la convergenza assoluta della serie
k
f
k
(x). Ma cè di pi` u. Grazie alla
condizione di Cauchy soddisfatta dalla serie numerica convergente
k=1
A
k
ed alle disuguaglianze
n+p
k=n+1
f
k
(x)
n+p
k=n+1
|f
k
(x)|
n+p
k=n+1
A
k
per x I
si vede subito che una serie totalmente convergente soddisfa la condizione uniforme di Cauchy (99)
e quindi converge uniformemente su I. Insomma, la convergenza totale implica quella uniforme.
Però non vale il viceversa: in I = R la serie numerica
k=1
(1)
k
/k, che converge grazie ad un
criterio di Leibniz, essendo una serie di funzioni costanti, è uniformemente convergente, ma non
converge assolutamente e quindi neanche totalmente. Ma in un intervallo I una serie di funzioni può
convergere sia uniformemente che assolutamente senza convergere totalmente. Questo si verica
ad esempio, di nuovo in I = R, ssando una successione di intervalli compatti J
k
= due a due
disgiunti e prendendo come f
k
la funzione caratteristica di J
k
moltiplicata per 1/k: la convergenza
assoluta è ovvia e quella uniforme segue dallidentità
sup
xR
n+p
k=n+1
1
k
1
J
k
(x) =
1
n + 1
,
mentre la convergenza totale viene meno perche
sup
xR
1
k
1
J
k
(x) =
1
k
.
22 Serie di potenze
Tra le serie di funzioni sono particolarmente importanti le serie di potenze
n=0
a
n
(x x
0
)
n
(100)
di coecienti a
n
R e punto iniziale x
0
(col solito abuso di notazione (x x
0
)
0
= 1 anche
quando x = x
0
). Lo studio della (100) può essere ricondotto, semplicemente sostituendo x con
x +x
0
per andare in un verso e con x x
0
per tornare indietro, a quello delle serie di potenze
n=0
a
n
x
n
(101)
di punto iniziale 0, apparentemente meno generale.
Il primo esempio che viene, o deve venire, in mente è quello della serie geometrica
n=0
x
n
76
(coecienti tutti uguali ad 1, punto iniziale lo 0) che converge, ed ha per somma 1/(1 x), se e
solo se |x| < 1.
Naturalmente la (100) converge sempre almeno nel punto iniziale; quando la successione dei
coecienti è limitata il confronto della serie dei moduli con la serie geometrica
(sup
n
|a
n
|)|xx
0
|
n
mostra subito che la (100) converge assolutamente per |x x
0
| < 1.
Se la (100) converge assolutamente in un punto x
1
si vede subito col confronto che la convergenza
è totale per |x x
0
| |x
1
x
0
|. In altri termini:
Lemma 22.1. La convergenza assoluta della (100) in x
1
= x
0
è equivalente alla convergenza totale
in tutto lintervallo chiuso [x
0
r, x
0
+r] con r = |x
1
x
0
|.
Per capire cosa si può dedurre dalla sola convergenza semplice in un punto ci si serve del
Lemma 22.2. (di Abel) La convergenza semplice della (100) in x
1
= x
0
implica la convergenza
assoluta per |x x
0
| < |x
1
x
0
|, cioè quella totale in ogni intervallo chiuso [x
0
, x
0
+ ] con
< |x
1
x
0
|.
DIM. Per semplicare le notazioni prendiamo x
0
= 0. Dalla convergenza della (101) con x
1
al posto
di x segue che la successione degli addendi è (innitesima, dunque) limitata: |a
n
x
n
1
| K < per
ogni n. Dunque
|a
n
x
n
| = |a
n
x
n
1
|
x
n
x
n
1
x
x
1
n
per n N,
e la convergenza della serie
n=0
|a
n
x
n
| segue dalla convergenza della serie geometrica di ragione
|x/x
1
| < 1.
Osservazione 22.1. La convergenza semplice della (100) in x

1
= x
0
ha unulteriore, importante
implicazione, che qui non dimostriamo: la convergenza uniforme su tutto il segmento chiuso che
congiunge x
0
e x
1
.
Associamo ora ad ogni serie (100) linsieme E dei reali positivi o nulli tali che la (100) converga
assolutamente per |x x
0
| , e quindi totalmente in [x
0
, x
0
+ ] se > 0. Tale insieme non
è vuoto poichè contiene almeno il suo estremo inferiore = 0; inoltre è un intervallo, perche se
contiene un > 0 contiene anche, banalmente, ogni
[0, [. Il suo estremo superiore r, che pu` o

essere tanto un numero reale positivo o nullo quanto , è chiamato raggio di convergenza (della
serie). Quando r < la serie non può convergere in nessun punto x
1
con |x
1
x
0
| > r (perche
se questo accadesse ogni < |x
1
x
0
| starebbe in E grazie al Lemma di Abel, e ne seguirebbe la
contraddizione |x
1
x
0
| r), mentre non è detto che r E, cioè non è detto che la (100) converga
assolutamente, o anche solo semplicemente, in tutto lintervallo chiuso |x x
0
| r. Quello che si
può aermare in generale è contenuto nel
Teorema 22.1. Se r è il raggio di convergenza della (100) la serie converge assolutamente in ogni
punto dellintervallo aperto ]x
0
r, x
0
+r[, cioè totalmente in ogni intervallo chiuso [x
0
, x
0
+]
con < r (dove ci si limita al caso signicativo r > 0), mentre non converge in nessun punto fuori
dellintervallo chiuso [x
0
r, x
0
+r] (nel caso r < ).
Esempio 22.1. Se la successione {a
n
} dei coecienti della serie (100) è limitata il raggio di
convergenza della serie è 1.
77
Diciamo che lintervallo di convergenza della serie (100) è ]x

0
r, x
0
+ r[ se 0 < r < ,
tutto R se r = .
Il Teorema 22.1 ammette il seguente
Corollario 22.1. Se il raggio di convergenza di r della serie di potenze (100) è > 0 la somma f(x)
della serie è una funzione continua allinterno del disco di convergenza.
DIM. In tutto lintervallo [x
0
, x
0
+ ] con |x x
0
| = < r la f è continua grazie al Teorema
21.1 perche la convergenza della (100) è totale e quindi uniforme.
Come si fa a calcolare il raggio di convergenza? Quando è possibile, applicando puntualmente

il criterio del rapporto alla serie numerica dei moduli, nel senso del prossimo risultato.
Teorema 22.2. Se esiste L = lim
n
|a
n+1
|/|a
n
| (nellipotesi che gli a
n
siano denitivamente
= 0) il raggio di convergenza della (100) è uguale a 0 se L = , a se L = 0 e ad 1/L se
0 < L < .
DIM. Limitiamoci al caso x
0
= 0, 0 < L < . Se |x| < 1/L il lim
n
|a
n+1
x
n+1
|/|a
n
x
n
| è < 1,
e quindi la serie (101) converge assolutamente, mentre se |x| > 1/L il lim
n
|a
n+1
x
n+1
|/|a
n
x
n
| è
> 1, e quindi la (101) non converge.
Esempio 22.2. I raggi di convergenza delle serie
n=0
n!x
n
,
n=0
x
n
n!
,
n=0
x
n
n
valgono rispettivamente 0, , 1. Soermiamoci sulla terza serie. Quando > 1 la serie nume-
rica
1/n
converge, e quindi la convergenza assoluta della
n
x
n
/n
ha luogo nella chiusura

dellintervallo di convergenza, cioè per |x| 1. Quando invece < 1 si ha convergenza assoluta
solo per |x| < 1; per x = 1 non si ha mai neppure convergenza semplice, mentre, se è positivo,
si ha convergenza semplice! per x = 1 grazie al criterio di Leibniz, e quindi anche (cfr.
lOsservazione 22.1) convergenza uniforme in [0, 1].
Teorema 22.3. Le serie
n=1
na
n
(x x
0
)
n1
,
n=2
n(n 1)a
n
(x x
0
)
n2
e in generale
n=k
n(n 1) (n k + 1)a
n
(x x
0
)
nk
hanno tutte lo stesso raggio di convergenza della serie (100).
78
DIM. Per semplicare le notazioni prendiamo x
0
= 0. Indichiamo con r il raggio di convergenza
della serie (101) e con r
quello della serie
n=1
na
n
x
n1
, o, ciò che è lo stesso (basta moltiplicare
in un senso, e dividere nellaltro, per x = 0), della serie
n=1
na
n
x
n
. (102)
In ogni punto x dove questultima converge assolutamente deve convergere assolutamente anche la
(102), grazie alla disuguaglianza |a
n
||x|
n
n|a
n
||x|
n
. Dunque r
r. Adesso supponiamo r > 0 e

mostriamo che la (102) converge assolutamente per |x| < r, dal che seguirà r
= r. Indichiamo con
un numero reale compreso in senso stretto tra |x| e r. Siccome la serie di partenza converge in ,
e di conseguenza |a
n
|
n
0, il secondo membro della disuguaglianza
n|a
n
||x|
n
n
n
|a
n
|
n
è maggiorato denitivamente dal termine generico della serie convergente
nt
n
con 0 t = |x|/ <
1. Ne segue che la (102) converge assolutamente per |x| < r.
Abbiamo dunque mostrato che il raggio di convergenza della
n=1
na
n
x
n1
è uguale ad r. Da
qui segue subito anche il risultato per k qualunque.
Quando 0 < r < il Teorema 3.1 non dice nulla a proposito del comportamento della serie
sulla frontiera dellintervallo di convergenza, e come abbiamo visto nellEsempio 22.2 la risposta
andrà trovata caso per caso.
23 Serie di Taylor e Maclaurin
In Analisi I già si incontrano delle serie di potenze reali: le serie di Taylor
n=0
f
(n)
(x
0
)
n!
(x x
0
)
n
(103)
o in particolare di Maclaurin
n=0
f
(n)
(0)
n!
x
n
(104)
delle funzioni f di classe C
in un intorno del punto iniziale. Nei vari esempi che sono stati studiati
soltanto dal punto di vista della convergenza puntuale non è dicile in eetti determinare quelli
che sono, come sappiamo adesso, i rispettivi intervalli di convergenza. Ecco un rapido riepilogo.
Esempio 23.1. Lo sviluppo di Maclaurin di e
x
arrestato allordine n è
e
x
=
n
k=0
x
k
k!
+R
n
(x) per x R
con
R
n
(x) =
x
n+1
(n + 1)!
e
79
per un opportuno compreso tra 0 ed x. Dalla disuguaglianza
|R
n
(x)|
|x|
n+1
(n + 1)!
e
|x|
segue che R
n
(x) 0 per n quale che sia x R. Quindi il raggio di convergenza è , e vale
lo sviluppo in serie di Maclaurin
e
x
=
k=0
x
k
k!
per x R. (105)
Esempio 23.2. Lo sviluppo di Maclaurin di sin x arrestato allordine 2n + 2 è

sin x =
n
k=0
(1)
k
x
2k+1
(2k + 1)!
+R
2n+2
(x) per x R
con
|R
2n+2
(x)|
|x|
2n+3
(2n + 3)!
.
Dunque R
2n+2
(x) 0 per n quale che sia x R: il raggio di convergenza è , e vale lo
sviluppo in serie di Maclaurin
sin x =
k=0
(1)
k
x
2k+1
(2k + 1)!
per x R.
Esempio 23.3. Lo sviluppo di Maclaurin di cos x arrestato allordine 2n + 1 è

cos x =
n
k=0
(1)
k
x
2k
(2k)!
+R
2n+1
(x) per x R
con
|R
2n+1
(x)|
|x|
2n+2
(2n + 2)!
.
Dunque R
2n+1
(x) 0 per n quale che sia x R: il raggio di convergenza è , e vale lo
sviluppo in serie di Maclaurin
cos x =
k=0
(1)
k
x
2k
(2k)!
per x R.
Esempio 23.4. Integrando da 0 no ad un qualunque x > 1 lidentità

1
1 +t
= 1 t +t
2
+ (1)
n
t
n
+ (1)
n+1
t
n+1
1 +t
80
otteniamo
log(1 +x) = x
x
2
2
+
x
3
3
+ + (1)
n
x
n+1
n + 1
+R
n+1
(x),
dove
R
n+1
(x) = (1)
n+1
x
0
t
n+1
1 +t
dt
soddisfa
|R
n+1
(x)|
|x|
n+2
(n + 2)(1 +x)
se 1 < x < 0, |R
n+1
(x)|
x
n+2
(n + 2)
se x 0.
Ne segue lo sviluppo in serie di Maclaurin
log(1 +x) =
n=1
(1)
n+1
x
n
n
per 1 < x < 1: il raggio di convergenza è 1. Ma il secondo membro converge semplicemente per
x = 1 e quindi uniformemente in [0, 1], come abbiamo menzionato nellEsempio 22.2: ne segue che
la sua somma è continua in [0, 1] e quindi, siccome vale log(1 +x) per x < 1, deve soddisfare
log 2 =
n=1
(1)
n+1
n
.
Esempio 23.5. Integrando da 0 no ad un qualunque x lidentit` a

1
1 +t
2
= 1 t
2
+t
4
+ (1)
n
t
2n
+ (1)
n+1
t
2n+2
1 +t
2
otteniamo
arctan x = x
x
3
3
+
x
5
5
+ + (1)
n
x
2n+1
2n + 1
+R
2n+1
(x),
con
R
2n+1
(x) = (1)
n+1
x
0
t
2n+2
1 +t
2
dt
e quindi
|R
2n+1
(x)|
|x|
0
t
2n+2
1 +t
2
dt
|x|
0
t
2n+2
dt =
|x|
2n+3
2n + 3
.
Ne segue lo sviluppo di Maclaurin dellarcotangente
arctan x =
n=0
(1)
n
x
2n+1
2n + 1
per |x < 1: il raggio di convergenza è 1. Di pi` u: come abbiamo menzionato nellEsempio 22.2, il
secondo membro converge semplicemente per x = 1 e quindi uniformemente in [0, 1], per cui la sua
somma, essendo continua in [0, 1], verica la celebre identità
4
=
n=0
(1)
n
2n + 1
.
81
Ricordiamo che in un punto x dellintervallo di convergenza la somma della (103) o della(104)

può anche non essere il valore f(x) assunto dalla funzione di partenza: la funzione che vale e
1/x
2
per x = 0 e 0 per x = 0, di classe C
su R, coincide solo nellorigine con la somma della sua serie

di Maclaurin, che è la funzione identicamente nulla.
Grazie al Teorema 21.1 (iii) di derivazione delle serie di funzioni di una variabile reale siamo
in grado di tornare indietro, dalle serie di potenze reali alle serie di Taylor, nel senso del prossimo
risultato.
Teorema 23.1. Se la serie (100) ha raggio di convergenza r > 0 la somma
f(x) =
n=0
a
n
(x x
0
)
n
(106)
è di classe C
nel suo intervallo di convergenza, e la serie di Taylor di punto iniziale x

0
della f è
il secondo membro della (103), ovvero
a
n
=
f
(n)
(x
0
)
n!
.
DIM. La serie
n=1
na
n
(x x
0
)
n1
(107)
è ottenuta derivando termine a termine la (100) rispetto ad x. Dal Teorema 22.3 sappiamo che
r è anche il raggio di convergenza della (107), quindi che questultima converge totalmente e di
conseguenza uniformemente in [x
0
, x
0
+ ] per ogni < r. Ma allora segue dal Teorema 21.1
(iii) che la somma della serie (107) è la derivata f
(x) della somma f(x) della serie (100): questo è

vero in ogni punto x ]x
0
r, x
0
+r[, come si vede prendendo compreso strettamente tra |xx
0
|
ed r.
Cos procedendo si dimostrano per ogni k le identit` a
f
(k)
(x) =
n=k
n (n k + 1)a
n
(x x
0
)
nk
per |x x
0
| < r.
In particolare, prendendo x = x
0
si ottiene a
n
= f
(n)
(x
0
)/n! e si riscrive la (106) come
f(x) =
n=0
f
(n)
(x
0
)
n!
(x x
0
)
n
.
24 Una prima separazione delle variabili
Studiamo lequazione dierenziale
y
= a(t)y (108)
82
con a(t) funzione reale continua in un intervallo aperto I R. La funzione identicamente nulla è
soluzione di questa equazione. Prendiamo y = 0 e operiamo nella (108) una separazione delle
variabili attraverso lutilizzo a prima vista un po disinvolto della notazione di Leibniz
dy/dt = y
:
dy
y
a(t) dt.
In eetti per il primo membro di questa identità ha perfettamente senso come forma dierenziale, e
da tale punto di vista ne vedremo una generalizzazione tra breve. Qui però va benissimo riscriverlo
semplicemente sotto forma integrale:
dy
y
=
a(t)dt
ovvero
log |y| = A(t) +K (109)
con K costante e A(t) primitiva di t a(t) in I. La (109) è una famiglia di equazioni cartesiane
in I] , 0[ e in I]0, [. Risolvendo rispetto a y troviamo per ogni scelta di C(= e
K
) non
nulla la soluzione
y(t) = Ce
A(t)
, t I,
sempre diversa da 0. Prendendo C = u
0
e
A(t
0
)
in questa espressione otteniamo la condizione
y(t
0
) = u
0
, (110)
con t
0
ssato in I e u
0
in R \ {0}, ricavando cos` per il problema di Cauchy (108),(110) lunica
soluzione
y(t) = u
0
e
t
t
0
a() d
, (111)
e in questa espressione rientra anche lunica soluzione dellequazione che in qualche punto t
0
assuma
il valore u
0
= 0, cioè la funzione identicamente nulla.
Passiamo allequazione non omogenea
y
= a(t)y +f(t) (112)

con f(t) anchessa continua da I in R. Indichiamo con y
1
(t) il secondo membro della (111) per
u
0
= 1 e riprendiamo la tecnica della variazione delle costanti. Anche una funzione y(t), che
scriviamo come prodotto v(t)y
1
(t), soddis la (112) in I, ovvero la quantità
y
(t) a(t)y(t) = [D a(t)][v(t)y

1
(t)] = v
(t)y
1
(t)
sia uguale a f(t), è necessario e suciente che v
(t) sia uguale a f(t)/y

1
(t). Questa richiesta
individua v(t) a meno di una costante additiva reale:
v(t) = K +
t
t
0
f(s)
y
1
(s)
ds = K +
t
t
0
e
s
t
0
a() d
f(s) ds
(t
0
, t I). Abbiamo cos` mostrato che la (112) è dotata delle innite soluzioni che si ottengono
facendo variare K nella somma
Ke
t
t
0
a() d
+
t
t
0
e
s
t
0
a() d
f(s) ds
t
t
0
a() d
= Ke
t
t
0
a() d
+
t
t
0
e
t
s
a() d
f(s) ds (113)
83
dellintegrale generale dellomogenea (108) e di un integrale particolare della non omogenea stessa.
(Ai ni del calcolo nei casi concreti si fa prima ad ottenere una soluzione particolare della
(112) ripercorrendo il procedimento con cui è stata ottenuta la funzione ausiliaria v(t) che non ad
applicare lespressione (113).)
Ponendo K = u
0
nella (113) si ottiene la soluzione del problema di Cauchy (112),(110) (ovvia-
mente unica, perche la dierenza di due soluzioni è la costante nulla, unica soluzione di (108) che
si annulla in un punto t
0
).
25 La separazione della variabili in generale
Il metodo che adesso presentiamo consente (almeno in via teorica) la risoluzione esplicita di une-
quazione dierenziale non lineare della forma
y
= a(t)b(y) (114)
dove a(t) è continua in un intervallo aperto I e b(y) in un intervallo aperto U. Si tratta di
unequazione a variabili separabili perche si riscrive
dy
b(y)
a(t) dt = 0.
Sotto forma integrale:
dy
b(y)
=
a(t) dt
ovvero
B(y) = A(t) +K (115)
dove K è una costante, A(t) una primitiva di t a(t) in I e B(y) una di y [b(y)]
1
in un
sottointervallo ]c, d[ di U dove b(y) = 0. La (115) è una famiglia di equazioni cartesiane in I]c, d[
che per ogni scelta di un ammissibile valore di K possiamo risolvere rispetto a y (grazie alla
monotonia di B(y), la cui derivata b(y) è sempre > 0 o sempre < 0 per come è stato preso ]c, d[),
ottenendo lunica soluzione
y(t) = B
1
(A(t) +K) per t J (116)
con J sottointervallo aperto di I (dipendente da K); con laggettivo in corsivo intendiamo sempli-
cemente dire che, anche il secondo membro dellidentità abbia senso, A(t) + K deve variare in
B(]c, d[) per ogni t J. Aggiungendo poi alla (114) la condizione di Cauchy (110) con t
0
I e
u
0
]c, d[ si trova una e una sola soluzione y(t): quella data dalla (116) con K = B(u
0
) A(t
0
),
valore ammissibile perche A(t) + K, dal momento che vale B(u
0
) per t = t
0
, resta nellintervallo
aperto B(]c, d[) al variare di t in un conveniente intervallo aperto t
0
.
Fin qui non abbiamo fatto altro che estendere lo stesso approccio già applicato allequazione
lineare omogenea (108), la quale rientra nella (114) per b(y) = y, U = R. Ma tale estensione non
può sempre procedere oltre, come ora passiamo ad illustrare.
Cosa succede, innanzitutto, se U contiene punti u
1
dove b(y) si annulla, per cui la soluzione
costante y(t) = u
1
soddisfa lequazione e quindi, banalmente, il corrispondente problema di Cauchy?
Quando b(y) = y abbiamo potuto mostrare che la funzione costante y(t) = 0 è lunica soluzione
dellequazione che in un qualche pressato punto t
0
di I vale 0, e ciò è come dire che una soluzione
della (108) o coincide identicamente con la costante nulla oppure non la incontra mai. Invece nel
caso generale, diciamo con u
1
= 0, non si può escludere che una soluzione non identicamente nulla
vada a coincidere da un certo punto in poi con lo 0, come mostra il prossimo esempio.
84
Esempio 25.1. Lequazione
y
= |y|
1/2
è a variabili separabili con I = U = R. Cerchiamo una soluzione y(t) diversa da 0, diciamo < 0
(per cui prendiamo ]c, d[=] , 0[), in un intervallo aperto J. Siccome 2(y)
1/2
è una primitiva
di |y|
1/2
= (y)
1/2
in ] , 0[ e t è una primitiva di 1 in R, imponiamo
[y(t)]
1/2
=
1
2
(C t) per t J
ovvero
y(t) =
1
4
(C t)
2
per t J
con C arbitrariamente ssata. La funzione che ha questa espressione in J =] , C[ e vale
identicamente 0 in [C, [ è una soluzione dellequazione su tutto I = R che allistante C soddisfa
la stessa condizione di Cauchy della soluzione identicamente nulla.
La causa del fenomeno di non unicità appena osservato risiede nella mancanza, per la funzione
|y|
1/2
, di suciente regolarità in vicinanza dello zero. Anticipando un risultato che dimostreremo
pi` u in là segnaliamo che lunicità di soluzioni per problemi di tipo (114),(110) è invece garantita se
b(y), pur annullandosi nel punto u
0
(come b(y) = |y|
1/2
in u
0
= 0), verica in un suo intorno una
condizione di Lipschitz.
Ricordiamo poi che nel caso della (108) una qualunque soluzione viene automaticamente ad
essere denita in tutto lintervallo I. Questo accade anche per certe equazioni non lineari (114),
come quella dellesempio precedente, ma non per tutte.
Esempio 25.2. Lequazione
y
= y
2
è a variabili separabili con I = U = R. Cerchiamo una soluzione y(t) diversa da 0, diciamo > 0
(per cui prendiamo ]c, d[=]0, [), in un intervallo aperto J. Siccome y
1
è una primitiva di y
2
in ]0, [ e t è una primitiva di 1 in R, imponiamo
y(t)
1
= C t per t J
ovvero
y(t) = (C t)
1
per t J (117)
con C arbitrariamente ssata. Per ogni C abbiamo ottenuto una soluzione che non si estende a
destra di J =] , C[ perche tende allper t C
(e se, ad esempio, cerchiamo la totalità delle

soluzioni denite per ogni t 1 troviamo tutte e sole le (117) con C > 1).
Esempio 25.3. Un esempio importante di equazione a variabili separabili è lequazione logistica

o di Verhulst
y
= y y
2
(118)
(, > 0), che costituisce un modello di crescita di una popolazione pi` u plausibile di quello malthu-
siano. Con laumentare del numero degli individui tende infatti ad aumentare anche la competizione
tra loro (ad esempio per il cibo o per lo spazio), con un eetto negativo sulla crescita che in prima
85
istanza possiamo prendere proporzionale, con fattore < 0, alla media statistica y
2
delle loro
interazioni a coppie.
La funzione B(y) = y y
2
si annulla in 0 e in /, e quindi le due funzioni costanti y(t) = 0
e y(t) = / sono soluzioni dellequazione.
Fissata una condizione di Cauchy (110) con u
0
diverso sia da 0 che da /, poniamo
B(y) =
y
u
0
d

2
sicche la (115) con A(t) = t t
0
e K = 0 diventa
y
u
0
d

2
= t t
0
.
Siccome lintegrale vale
1
log
y
u
0
u
0
y
e la quantità dentro il modulo è > 0, otteniamo

y
u
0
u
0
y
= e
(tt
0
)
e da qui, risolvendo rispetto a y, otteniamo
y(t) =
u
0
( u
0
)e
(tt
0
)
+ u
0
. (119)
Quando u
0
è negativo, non importa quanto vicino a 0, il denominatore della (119) è una funzione
decrescente che, siccome tende a per t ed a u
0
< 0 per t , deve annullarsi per
t uguale a un tempo nito T
1
= T
1
(u
0
). Ne segue che y(t) 0 per t e y(t) per
t T
1
.
Per ogni valore iniziale u
0
]0, /[ (comè nel caso, con molto pi` u piccolo di , del modello
biologico) la soluzione è denita su tutto R. Poiche è strettamente crescente e tende a 0 e /
rispettivamente per t e per t , il suo graco ha la forma detta ad S nelle pubblicazioni
di carattere demograco.
Quando u
0
> / il denominatore della (119) è una funzione crescente che, siccome tende a 0
per t ed a u
0
> 0 per t , deve annullarsi per t uguale a un tempo nito T
2
= T
2
(u
0
).
Ne segue che y(t) / per t e y(t) per t T
+
2
.
Abbiamo dunque visto che per t la soluzione di (118),(110) tende a / quando u > 0
viene comunque preso nellintorno ]0, [ di /: la soluzione costante y(t) = / è un equilibrio
stabile. Invece nessuna soluzione del problema con u
0
= 0 resta, al crescere di t, in un intorno di
0 come ad esempio ] 1/2, 1/2[: lo 0 è un equilibrio instabile.
86
26 Sistemi 2 2 e diagrammi di fase
In questa sezione ci occuperemo dei sistemi a coecienti reali
1
= ax
1
+bx
2
x
2
= cx
1
+dx
2
(120)
ovvero
x
= Ax (121)
con x =col (x
1
, x
2
) e
A =
a b
c d
. (122)
Le soluzioni sono curve t x(t) =col (x
1
(t), x
2
(t)), e chiaramente costituiscono uno spazio vet-
toriale. Vedremo che esse sono denite per ogni t R; i loro sostegni (o orbite, o traiettorie) si
ottengono, eliminando il parametro t tranne ovviamente nel caso delle soluzioni costanti x(t) = u
con Au = 0, dette equilibri , come graci, qui chiamati diagrammi di fase, nel piano (x
1
, x
2
),
qui chiamato piano delle fasi del sistema (121).
Uno strumento fondamentale del nostro studio sarà lesame delle soluzioni dellequazione
caratteristica
det (I A) =
2
(tr A) + det A = 0
(dove tr A denota la traccia a +d di A), dette autovalori della matrice A. Se è un autovalore e
u è un autovettore associato a , cioè un vettore = 0 tale che Au = u, una soluzione del sistema
diversa dallequilibrio 0 è data dalla funzione t e
t
u:
(e
t
u)
= e
t
u = e
t
Au = A(e
t
u).
Gli autovalori
1
e
2
di A vericano
1
+
2
= tr A,
1
2
= det A,
e da queste due identità si possono dedurre a colpo docchio, senza bisogno di risolvere lequazione
caratteristica, alcune informazioni sugli autovalori. Se ad esempio A è singolare, cioè det A = 0,
uno degli autovalori è nullo e laltro è la traccia di A; se det A > 0 gli autovalori possono essere sia
complessi coniugati che reali, e hanno entrambi parti reali negative se per di pi` u tr A < 0; se invece
det A < 0 essi (non possono essere complessi coniugati e quindi) sono reali con segni opposti.
Notiamo che nel sistema (120), ovvero nellequazione vettoriale del primo ordine (121), rientra
lequazione scalare del secondo ordine
y
+hy
+ky = 0. (123)
Infatti la funzione scalare y(t) soddisfa lequazione (123) se e solo se la funzione vettoriale
x
1
(t)
x
2
(t)
y(t)
y
(t)
soddisfa il sistema

x
1
= x
2
x
2
= kx
1
hx
2
87
Viceversa, derivando o luna o laltra equazione di tale sistema e poi procedendo per sostituzione
si vede che sia y(t) = x
1
(t) e sia y(t) = x
2
(t) soddisfano lequazione scalare
y
(tr A)y
+ det A = 0,
la cui equazione caratteristica è, non sorprendentemente, la stessa del sistema.
Il sistema è detto stabile se tutte le sue soluzioni soluzioni sono limitate per t , instabile
in caso contrario, e asintoticamente stabile se tutte le sue soluzioni convergono a 0 per t .
Aggiungendo al sistema (121) la condizione iniziale
x(0) = C =
C
1
C
2
(124)
e quindi anche, in particolare, aggiungendo allequazione (123) le condizioni iniziali
y(0) = C
1
, y
(0) = C
2
si ottiene un problema di Cauchy.
Nello studio della (121) si rivela preziosa la seguente osservazione: se P è una matrice 2 2
invertibile, e quindi A è simile alla matrice B = P
1
AP, una funzione x(t) soddisfa il sistema (121)
con condizione iniziale (124) la funzione y(t) = P
1
x(t), la cui derivata è y
(t) = P
1
x
(t),
soddisfa il sistema
y
= P
1
Ax = BP
1
x = By (125)
con condizione iniziale
y(0) = K =
K
1
K
2
= P
1
C. (126)
Ebbene: a seconda degli autovalori di A si riesce sempre a costruire una matrice di passaggio P
in modo tale che risulti estremamente semplice dimostrare lesistenza di ununica soluzione per
ogni problema (125),(126), fornendone anzi lesplicita espressione e quindi anche visualizzandone
il diagramma di fase nel piano (y
1
, y
2
). A quel punto basta operare la trasformazione ane P
per passare allesistenza di ununica soluzione per ogni problema (121),(124), alla sua esplicita
espressione
12
, nonche alla visualizzazione del suo diagramma di fase nel piano (x
1
, x
2
).
1
o
Supponiamo per cominciare che A abbia due autovalori reali e distinti
1
e
2
, con rispettivi
autovettori u
1
e u
2
. Questo ci dà subito due soluzioni e
1
t
u
1
e e
2
t
u
2
, che si vede subito essere
linearmente indipendenti: ma come controllare se generano lo spazio di tutte le soluzioni, ovvero
se questultimo ha dimensione 2? Per rispondere, notiamo che A è simile alla matrice diagonale
B =
1
0
0
2
con matrice di passaggio P = [u

1
u
2
]: infatti
A[u
1
u
2
] = [Au
1
Au
2
] = [
1
u
1
2
u
2
] = [u
1
u
2
]B.
Col presente signicato di B il sistema (125) è costituito da due equazioni indipendenti
1
=
1
y
1
y
2
=
2
y
2
12
Quindi anche allesplicita espressione di ogni soluzione y(t) del sistema (121), dal momento che (124) è banalmente
soddisfatta con C denito come y(0).
88
ciascuna univocamente risolubile per ogni dato valore imposto alla soluzione nellorigine; la totalità
delle sue soluzioni si ottiene dallespressione
K
1
e
1
t
K
2
e
2
t
= K
1
1
t
0
+K
2
0
e
2
t
(127)
al variare dei valori K
1
e K
2
assunti per t = 0 rispettivamente da y
1
(t) e y
2
(t). Quando K
1
> 0 e
K
2
> 0 la traiettoria di una curva piana y
1
= K
1
e
1
t
, y
2
= K
2
e
2
t
, t R è il graco di una funzione
y
2
= Cy
2
t/
1
1
, y
1
> 0 con C > 0, e dunque si disegna subito distinguendo i tre casi 0 <
2
/
1
< 1,
2
/
1
> 1,
2
/
1
< 0: nei primi due si dice che lorigine è un nodo stabile o instabile a seconda
che il segno degli autovalori sia negativo o positivo, nel terzo che è un punto di sella. Lestensione
ai casi degli altri segni di K
1
e K
2
si fa per simmetrie.
A questo punto resta solo da operare una deformazione ane di matrice [u
1
u
2
] per concludere
che le soluzioni dellequazione di partenza si ottengono dalla formula
[u
1
u
2
]
K
1
e
1
t
K
2
e
2
t
= K
1
e
1
t
u
1
+K
2
e
2
t
u
2
,
sicche costituiscono uno spazio vettoriale reale di dimensione 2, e ottenere la rappresentazione
graca delle loro traiettorie nel piano delle fasi (x
1
, x
2
).
Esempio 26.1. La matrice dei coecienti del sistema
1
= 5x
1
+ 3x
2
x
2
= 6x
1
4x
2
ha determinante < 0 e quindi autovalori reali di segni opposti: lorigine è un punto di sella.
Calcoliamo: un autovalore è uguale a 2 con un autovettore dato da col (1, 1), laltro a 1 con un
autovettore dato da col (1, 2). Un integrale generale di questo sistema è dato da
1 1
1 2

K
1
e
2t
K
2
e
t
K
1
e
2t
K
2
e
t
K
1
e
2t
+ 2K
2
e
t
2
o
Siano i con , R, = 0 gli autovalori di una A M
2
(R) con rispettivi autovettori
viw (dove v, w sono vettori colonne di R
2
). Di nuovo otteniamo due funzioni e
(i)t
(viw) che
soddisfano la (121)
13
, e si vede anche, in un attimo, che sono linearmente indipendenti: ma si tratta
13
Partiamo dallidentità di Eulero
e
(+i)t
= e
t
(cos t + i sin t).
Derivando otteniamo
D(e
t
cos t) = e
t
(cos t sin t), D(e
t
sin t) = e
t
(sin t + cos t)
ovvero
D[e
t
(cos t + i sin t)] = ( + i)e
t
(cos t + i sin t)
da cui
De
(+i)t
= ( + i)e
(+i)t
:
in altri termini, come per reale, cos` anche per complesso risulta
De
t
= e
t
,
89
di funzioni a valori in C
2
, non in R
2
come interessa a noi. Allora procediamo con unopportuna
similitudine: quella tra A e la matrice
B =
con matrice di passaggio P = [v w]. Infatti da

Av +iAw = A(v +iw) = ( +i)(v +iw) = v w +i(v + w)
ricaviamo, separando le parti reale e immaginaria,
Av = v w, Aw = v + w
ovvero
A[v w] = [Av Aw] = [v w v + w] = [v w]B.
Col presente signicato di B il sistema (125) è
1
= y
1
+ y
2
y
2
= y
1
+ y
2
(128)
e quindi equivale a unequazione scalare nellincognita complessa z(t) = y
1
(t) +iy
2
(t):
y
1
+iy
2
= y
1
+ y
2
+i(y
1
+ y
2
) z
= ( i)z.
Ogni soluzione di questa equazione è univocamente espressa, una volta ssato il valore complesso
K
1
+iK
2
imposto a z(t) per t = 0, da
z = y
1
+iy
2
= (K
1
+iK
2
)e
(i)t
= (K
1
+iK
2
)e
t
(cos t i sin t)
= e
t
[K
1
cos t +K
2
sin t +i(K
1
sin t +K
2
cos t)];
da qui si ricava che ogni soluzione col (y
1
(t), y
2
(t) del sistema (128) è univocamente espressa da
e
t
K
1
cos t +K
2
sin t
K
1
sin t +K
2
cos t
= K
1
e
t
cos t
e
t
sin t
+K
2
e
t
sin t
e
t
cos t
una volta ssati i valori K

1
e K
2
rispettivamente imposti a y
1
(t) e y
2
(t) per t = 0 . Se = 0 lorigine
è un centro: le traiettorie delle curve piane y
1
= K
1
cos t +K
2
sin t, y
2
= K
1
sin t +K
2
cos t,
o anche, moltiplicando per un qualunque vettore u di C
2
,
D(e
t
u) = e
t
u.
Naturalmente poi
D(Ke
t
) = Ke
t
al variare di K non solo nei reali, ma anche nei complessi, per cui lequazione z
= z con C ammette le innite

soluzioni complesse Ke
t
con K C; altre non ce ne sono, perche una qualunque soluzione si scrive z(t) = v(t)e
t
con v(t) dierenziabile in un intervallo I, e quindi
0 = z
(t) + az(t) = [v(t)e

at
]
+ av(t)e
at
= v(t)[(e
at
)
+ ae
at
] + v
(t)e
at
= v
(t)e
at
,
da cui v
(t) = 0. Ne segue che, ssato K C, Ke

t
è lunica soluzione del problema di Cauchy
z
= z, y(0) = K.
90
t R, sono le circonferenze y
2
1
+y
2
2
= K
2
1
+K
2
2
. Altrimenti lorigine è un fuoco stabile o instabile
a seconda che < 0 o > 0: le traiettorie delle curve piane y
1
= e
t
(K
1
cos t + K
2
sin t),
y
2
= e
t
(K
1
sin t + K
2
cos t), t R, sono spirali che escono dallorigine e crescono verso
linnito per t decrescente nel primo caso e invece per t crescente nel secondo.
A questo punto, con una deformazione ane di matrice [v w] si ottiene la totalità della
soluzioni (a valori in R
2
) del sistema (121) facendo variare K
1
, K
2
R nellespressione
v w
e
t
K
1
cos t +K
2
sin t
K
1
sin t +K
2
cos t
= K
1
e
t
(v cos t wsin t) +K
2
e
t
(v sin t +wcos t),
per cui esse costituiscono uno spazio vettoriale reale di dimensione 2, e si arriva anche alla rappre-
sentazione graca delle loro traiettorie nel piano delle fasi (x
1
, x
2
).
1
= 3x
1
+ 5x
2
x
2
= 5x
1
+ 3x
2
ha un autovalore uguale a 3 5i con un autovettore dato da col (0, 1) +i col (1, 0) (e quindi, auto-
maticamente, laltro autovalore è uguale a 3 +5i con un autovettore dato da col (0, 1) i col (1, 0)).
Un integrale generale è dunque
0 1
1 0
e
3t
K
1
cos 5t K
2
sin 5t
K
1
sin 5t +K
2
cos 5t
= K
1
e
3t
sin 5t
cos 5t
+K
2
e
3t
cos 5t
sin 5t
3
o
Supponiamo che i due autovalori di A abbiano lo stesso valore reale , con autovettore u. Si trova
una soluzione e
t
u di (121): e poi? Innanzitutto A, se non è già diagonale, non è diagonalizzabile.
Però è comunque comunque triangolarizzabile, cioè simile ad una matrice triangolare (superiore
o inferiore). Sia infatti v un versore e
k
non proporzionale ad u. Supponendo k = 2 per ssare le
idee, possiamo scrivere il vettore Av (seconda colonna di A) come combinazione lineare di u e v
perche questi vettori, essendo linearmente indipendenti, costituiscono una base di R
2
. Dunque Av
è uguale a pu +qv, per cui
A[u v] = [Au Av] = [u pu +qv] = [u v]B
con
B =
p
0 q
.
Devessere q = perche B, essendo simile ad A, ha lo stesso autovalore di molteplicità 2; daltra
parte, p = 0 se e solo se v è un altro autovettore della matrice, la quale è allora diagona(lizzabi)le
perche due suoi autovettori sono linearmente indipendenti. Dunque vale la similitudine
AP = PB con P =
u v
e B =
p
0
, p = 0.
Il sistema y
= By, ovvero
1
= y
1
+py
2
y
2
= y
2
(129)
91
si risolve subito: inserendo nella prima equazione lunica soluzione della seconda che assume
nellorigine un dato valore K
2
, cioè y
2
(t) = K
2
e
t
, si ottiene lequazione
y
1
= y
1
+pK
2
e
t
la cui unica soluzione che assume nellorigine un dato valore K
1
è y
1
(t) = e
t
(K
1
+K
2
pt). Ne segue
che la totalità delle soluzioni del sistema (129) si ottiene facendo variare K
1
, K
2
R nellespressione
e
t
K
1
+K
2
pt
K
2
= K
1
e
t
0
+K
2
e
t
pt
e
t
.
Per ottenere i diagrammi di fase ricaviamo innanzitutto t dalla y
2
= K
2
e
t
: t =
1
log
y
2
K
2
per
y
2
/K
2
> 0. Dalla y
1
= (K
1
+K
2
pt)e
t
ricaviamo poi
y
1
=
K
1
+
K
2
p
log
y
2
K
2
y
2
K
2
sia per y
2
> 0, purche K
2
> 0, e sia per y
2
< 0, purche K
2
< 0: lorigine è un nodo improprio
stabile o instabile a seconda che < 0 o > 0.
Ancora una volta concludiamo operando una deformazione ane, stavolta di matrice [u v]:
le soluzioni dellequazione di partenza si ottengono dalla formula
u v
e
t
K
1
+K
2
ct
K
2
= K
1
e
t
u +K
2
e
t
(tcu +v)
sicche costituiscono uno spazio vettoriale reale di dimensione 2, e otteniamo subito la rappresenta-
zione graca delle loro traiettorie nel piano delle fasi (x
1
, x
2
).
1
= x
1
x
2
x
2
= x
1
+ 3x
2
ha un autovalore doppio = 2, con autovettore u =col (1, 1). Prendiamo come v il versore
col (0, 1). Siccome Av = u + 2v, la totalità delle soluzioni del sistema si scrive come
1 0
1 1
e
2t
K
1
+K
2
t
K
2
(K
1
K
2
t)e
2t
[K
1
+K
2
(t + 1)]e
2t
27 Esistenza in grande e unicità per il problema di Cauchy

Teorema 27.1. Sia f(t, y) una funzione reale continua in una striscia chiusa [A, B] R, dove
< A < B < , e dotata di derivata rispetto ad y continua con
sup
(t,y)[A,B]R
|f
y
(t, y)| < . (130)
92
Allora, dati comunque t
0
[A, B] e y
0
R, esiste ununica funzione y = y(t) che soddisfa in [A, B]
lequazione dierenziale
y
(t) = f(t, y(t)) (131)

insieme alla condizione di Cauchy y(t
0
) = y
0
, ovvero, pi` u concisamente, il problema di Cauchy
y
= f(t, y), y(t

0
) = y
0
. (132)
DIM. Per dimostrare il teorema ci serviamo di due cruciali considerazioni.
La prima è che il problema (140) equivale allequazione integrale
y(t) = y
0
+
t
t
0
f(s, y(s)) ds (133)
nel seguente senso: una funzione y = y(t) è di classe C
0
e soddisfa la (133) per t [A, B] se
e solo se è di classe C
1
e verica la (139) per t [A, B] insieme alla y(t
0
) = y
0
.
Per dimostrare limplicazione se basta tener conto che il secondo membro della (133) vale
y
0
per t = t
0
e inoltre (Teorema fondamentale del Calcolo) è derivabile in tutto [A, B] con
derivata uguale a f(t, y(t)), dunque continua = in [A, B] la y(t) è di classe C
1
e soddisfa la
(139) insieme a y(t
0
) = y
0
.
Limplicazione solo se si dimostra scrivendo la (139) con s al posto di t e integrando poi
entrambi i membri da t
0
a t.
La seconda considerazione è questa: grazie alla (130) esiste una costante L tale che
|f(t, y) f(t, z)| L|y z| per t [A, B], y, z R. (134)
Dal Teorema del valor medio segue infatti che nel primo membro della (134) la quantità
dentro al modulo è uguale a f
y
(t, )(y z) per qualche opportuno valore di compreso tra y
e z, e quindi la (134) è soddisfatta con L = sup
(x,y)[A,B]R
|f
y
(x, y)|.
Mostriamo lunicità. Siano date due soluzioni y(t) e y(t), per cui sono soddisfatte in [A, B]
tanto la (133) che la
y(t) = y
0
+
t
t
0
f(s, y(s)) ds.
Fissato il pi` u grande valore di a [0, (2L)
1
] tale che t
1
= t
0
+ a B, sottraiamo membro a
membro le due equazioni integrali e passiamo alla maggiorazione dei moduli utilizzando la (134):
per [t
0
, t
1
] risulta
|y() y()|

t
0
|f(s, y(s)) f(s, y(s))| ds L

t
0
|y(s) y(s)| ds La

2
,
dove denota il massimo di |y(t) y(t)| in [t
0
, t
1
], e quindi, prendendo come un punto in cui tale
massimo viene assunto, otteniamo

2
,
da cui = 0. Ciò mostra che y(t) = y(t) per t
0
t t
1
. Se t
1
< B ssiamo il pi` u grande valore di
a [0, (2L)
1
] tale che t
2
= t
1
+a B e poniamo y
1
= y(t
1
) = y(t
1
). Adesso y(t) e y(t) vericano
rispettivamente
y(t) = y
1
+
t
t
1
f(s, y(s)) ds,
93
y(t) = y
1
+
t
t
1
f(s, y(s)) ds
e possiamo ripetere il ragionamento precedente, arrivando a dimostrare che y(t) = y(t) per t
0
t
t
2
. In un numero nito di passi concludiamo che y(t) = y(t) per t
0
t B; in maniera analoga si
vede che y(t) = y(t) per A t t
0
.
Passiamo allesistenza. Deniamo per ricorrenza
y
1
(t) = y
0
+
t
t
0
f(s, y
0
) ds,
y
2
(t) = y
0
+
t
t
0
f(s, y
1
(s)) ds,
y
3
(t) = y
0
+
t
t
0
f(s, y
2
(s)) ds
e via via
y
n+1
(t) = y
0
+
t
t
0
f(s, y
n
(s)) ds per n N. (135)
Accettiamo il seguente risultato, che dimostreremo tra un attimo:
Lemma 27.1. La serie
y
0
+ (y
2
(t) y
1
(t)) + (y
3
(t) y
2
(t)) +. . . (136)
converge totalmente in [A, B].
Grazie alla convergenza totale della serie (136) in [A, B], la successione (delle sue ridotte) {y
n
(t)}
converge uniformemente in [A, B] a una funzione continua y(t). Ma allora anche la successione
{f(t, y
n
(t))}, che converge puntualmente a f(t, y(t)) per la continuità di f e verica
|f(t, y
n
(t)) f(t, y(t))| L|y
n
(t) y(t)| per n N,
è a sua volta uniformemente convergente. Ne segue che nel secondo membro della (135) si può
passare al limite sotto il segno dintegrale, e quindi che la y(t) soddisfa la (133) in [A, B].
Per concludere:
DIM. DEL LEMMA Sia M il massimo di |f(, y
0
| su [A, B]. Facciamo dapprima variare t in [t
0
, B]:
otteniamo innanzitutto
|y
1
(t) y
0
|
t
t
0
|f(s, y
0
)| ds M(t t
0
),
poi, grazie alla (134),
|y
2
(t)y
1
(t)|
t
t
0
|f(s, y
1
(s))f(s, y
0
)| ds L
t
t
0
|y
1
(s)y
0
| ds LM
t
t
0
(st
0
) = LM
(t t
0
)
2
2
,
|y
3
(t)y
2
(t)|
t
t
0
|f(s, y
2
(s))f(s, y
1
(s))| ds L
t
t
0
|y
2
(s)y
1
(s)| ds L
2
M
t
t
0
(s t
0
)
2
2
= L
2
M
(t t
0
)
3
3!
,
94
da cui in generale
|y
n+1
(t) y
n
(t)| L
n
M
(B A)
n+1
(n + 1)!
. (137)
Siccome il secondo membro della (137) è laddendo generico di una serie numerica convergente,
abbiamo ottenuto la convergenza totale della serie (136) in [t
0
, B]. Allo stesso modo si ottiene la
convergenza totale della serie (136) in [A, t
0
].
Osservazione 27.1. Come abbiamo evidenziato allinizio della precedente dimostrazione, la (130)
non è servita ad altro che ad ottenere la proprietà (134), questultima s` assolutamente essenziale in
tutto il successivo svolgimento. In altri termini: la tesi del Teorema 27.1 continua a valere inalterata
se lipotesi che f sia dotata di f
y
continua con la proprietà (130) viene indebolita richiedendo che
per unopportuna costante L sia soddisfatta la (134). A questo punto viene naturale chiedere:
perche non abbiamo già in partenza enunciato il teorema con lipotesi pi` u debole? E la risposta
è: perche sempre, quando si vuole appurare se una funzione verica una condizione di Lipschitz
in una data variabile, la prima cosa da fare è vericare se la funzione è dotata, rispetto a quella
variabile, di derivata limitata, per cui si possa applicare il Teorema del valor medio! Poi, certo,
tale verica può avere esito negativo, e allora si dovrà ricorrere a opportune tecniche ad hoc, come
vedremo per esempio nel caso della dimostrazione del Teorema 29.1.
Ecco unutile variante del Teorema 27.1:

Teorema 27.2. Sia f(t, y) una funzione reale continua in una striscia aperta S =]a, b[R, dove
a < b , e dotata in S di derivata rispetto ad y continua, con
sup
(t,y)[A,B]R
|f
y
(t, y)| < (138)
per ogni coppia di punti A, B ]a, b[ con A < B. Allora, dati comunque t
0
]a, b[ e y
0
R, esiste
ununica funzione y = y(t) che soddisfa in ]a, b[ lequazione dierenziale
y
(t) = f(t, y(t)) (139)

0
) = y
0
, ovvero il problema di Cauchy
y
= f(t, y), y(t

0
) = y
0
. (140)
DIM. Fissiamo una successione crescente di intervalli [A
n
, B
n
] ]a, b[ tutti contenenti t
0
, con A
n
a
e B
n
b. Per ogni n possiamo applicare il Teorema 27.1 e ottenere lesistenza di una soluzione y
(n)
in [A
n
, B
n
] del problema (140). Per lunicità, su [A
n
, B
n
] ogni y
(n+k)
coincide con y
(n)
, e quindi la
funzione y(t) posta uguale a y
(n)
(t) se t [A
n
, B
n
] (è univocamente determinata e) soddisfa, oltre
alla condizione di Cauchy per t = t
0
, lequazione (139) per ogni t ]a, b[.
Sottolineiamo un aspetto molto importante dei Teoremi 27.1 e 27.2: abbiamo ottenuto una
soluzione y(t) che soddisfa lequazione (139) in tutto il primo lato della striscia su cui è denita
la f(t, y) ([A, B] per il Teorema 27.1 e ]a, b[ per il Teorema 27.2), ovvero una soluzione in grande.
Ciò è stato possibile grazie alla limitatezza della f
y
nel prodotto cartesiano di [A, B] per tutto R
richiesta in (130) e (145): richiesta molto forte, che però permette di coprire casi signicativi come
mostreremo nella prossima sezione.
95
28 Estensioni e applicazioni
Casi particolari di applicazione del Teorema 27.2 si costruiscono facilmente: ad esempio y
= cos t
2
y,
(t, y) S =]a, b[R, dove < a < b < , oppure y
= t
3
e
t
2
y
2
, (t, y) S =] , [R...
Per tutta una classe di esempi vanno menzionate le equazioni lineari (che peraltro, si sanno anche
risolvere esplicitamente) y
+a(t)y = g(t) con a(t), g(t) continue in ]a, b[, a < b .

Per casi pi` u signicativi passiamo allequazione dierenziale (vettoriale)
y
= f (t, y) (141)
cioè al sistema
_
_
y
1
= f
1
(t, y
1
, . . . , y
N
)
.
.
.
y
N
= f
N
(t, y
1
, . . . , y
N
)
con condizione iniziale o di Cauchy
y(t
0
) = y
0
, (142)
anchessa unidentità vettoriale, e precisamente
y
1
(t
0
) = y
01
, . . . , y
N
(t
0
) = y
0N
. (143)
Nella (141) rientra lequazione dierenziale scalare di ordine N
y
(N)
= g(t, y, y
, . . . , y
(N1)
) (144)
perche la si può scrivere anche, ponendo y
1
= y, come
_
_
y
1
= y
2
y
2
= y
3
.
.
.
y
N1
= y
N
y
N
= g(t, y
1
, . . . , y
N
)
Le condizioni di Cauchy (scalari)
y(t
0
) = y
0
, . . . , y
(N1)
(t
0
) = y
N1
associate alla (144) si trasformano facilmente nelle (143), e quindi nella (142).
Passando dal caso scalare a quello vettoriale si estendono facilmente Teoremi 27.1 e 27.2;
questultimo, in particolare, diventa
Teorema 28.1. Sia f (t, y) una funzione a valori in R
N
continua in un aperto S =]a, b[R
N
, dove
a < b , e dotata in S di matrice jacobiana [f (t, y)/y] rispetto ad y continua, con
sup
(t,y)[A,B]R
N
|det [f (t, y)/y]| < (145)
per ogni coppia di punti A, B ]a, b[ con A < B. Allora, dati comunque t
0
]a, b[ e y
0
R, esiste
ununica funzione y = y(t) che soddisfa in ]a, b[ lequazione dierenziale
y
(t) = f (t, y(t))

0
) = y
0
, ovvero il problema di Cauchy
y
= f (t, y), y(t

0
) = y
0
.
96
Signicative applicazioni del teorema si hanno nel caso lineare: vettoriale
_
_
y
1
= a
1
1
(t)y
1
+ +a
N
1
(t)y
N
+g
1
(t)
.
.
.
y
N
= a
1
N
(t)y
1
+ +a
N
N
y
N
(t) +g
n
(t)
con le a
i
j
(t), g
j
(t) continue in ]a, b[, a < b , e scalare di ordine N
y
(N)
+a
N1
(t)y
(N1)
+ +a
0
(t)y = g(t)
con le a
j
(t), g(t) continue in ]a, b[, a < b .
29 Esistenza in piccolo
Passiamo ad occuparci dellesistenza di soluzioni per il problema di Cauchy quando lipotesi, utiliz-
zata nei Teoremi 27.1 e 27.2, di limitatezza della f
y
nelle strisce chiuse [A, B] R viene sostituita
da una condizione pi` u debole.
Teorema 29.1. Sia f(t, y) una funzione reale continua e dotata di derivata continua rispetto ad y
in un aperto U di R
2
. Allora, dato comunque (t
0
, y
0
) U, esiste un intervallo ], [ t
0
su cui è
denita ununica soluzione y = y(t) del problema di Cauchy (140).
DIM. Sia R = [A, B] [C, D] U un rettangolo contenente (t
0
, y
0
) al proprio interno, e sia
L = max
(t,y)R
|f
y
(t, y)|, per cui
|f(t, y) f(t, z)| L|y z| per x [A, B], y, z [C, D]. (146)
La funzione
F(t, y) =
_
_
_
f(t, y) per A t B, C y D
f(t, D) per A t B, y > D
f(t, C) per A t B, y < C
è continua in [A, B]R; non è dotata di derivata rispetto ad y nei punti di [A, B]{C} e [A, B]{D},
però soddisfa, grazie alla (146), la
|F(t, y) F(t, z)| L|y z| per x [A, B], y, z R.
Tanto basta, tenendo conto dellOsservazione 27.1, ad applicare il Teorema 27.1 con f sostituita da
F: in [A, B] esiste ununica soluzione y = y(t) dellequazione
y
(t) = F(t, y(t)) (147)

con condizione condizione di Cauchy y(t
0
) = y
0
. In generale il graco di [A, B] t y(t)
non è contenuto in R. Però, siccome (t
0
, y
0
) è interno ad [A, B] [C, D], esiste un intervallo
J [A, B] contenente t
0
al proprio interno tale che per t J si abbia C y(t) D, quindi
F(t, y(t)) = f(t, y(t)), e inne
y
(t) = f(t, y(t))

grazie alla (147).
97
A questo punto si impongono alcune considerazioni.

Innanzitutto, il Teorema 27.2 rientra nel Teorema 29.1: le ipotesi di questultimo sono pi` u
generali, e la sua tesi è conseguentemente pi` u debole.
Inoltre, la genericità insita nella (scarsa) determinazione dellintervallo ], [ di esistenza della
soluzione y(t) non può essere eliminata
14
. Nella dimostrazione si comincia infatti ssando, in modo
arbitario, uno degli inniti rettangoli R = [A, B] [C, D] U contenenti (t
0
, y
0
) al proprio interno.
`
E chiaro dunque che lintervallo J menzionato nella dimostrazione è solo transitorio, nel senso che
può signicativamente variare a seconda del rettangolo ammissibile che viene ssato. Quello che
va tenuto ben presente è, parlando per sommi capi, che lintervallo nale ], [ può risultare ben
pi` u piccolo della famiglia dei valori di t per i quali è denita f(t, y): quella ottenuta nel teorema è
una soluzione, appunto, in piccolo. Vediamo questo su un esempio.
Esempio 29.1. Riprendiamo lEsempio 29.1:
y
= y
2
.
Per ogni C abbiamo ottenuto la soluzione
y(t) = (C t)
1
ovvero, imponendo la condizione di Cauchy y(0) = y
0
= 1/C,
y(t) =
y
0
1 y
0
t
, (148)
dove o t < 1/y
0
se y
0
> 0, o t > 1/y
0
se y
0
< 0: nel primo caso y(t) è positiva nella semiretta
aperta e tende all per t (1/y
0
)
, nel secondo caso è negativa nella semiretta aperta e tende a

per t (1/y
0
)
+
.
Come si colloca questo esempio rispetto ai teoremi di esistenza e unicità visti nora? Il secondo
membro di (148) è una funzione continua e derivabile in R
2
, e questultimo è naturalmente una
striscia ]a, b[R con a = e b = , ma non possiamo applicare il Teorema 27.2: la derivata
2y di y
2
non si mantiene limitata in nessuna striscia [A, B] R (e, data comunque L > 1, basta
prendere y > L e = 0 per violare (134)). Invece sono soddisfatte le ipotesi del Teorema 29.1 con
U = R
2
: lintervallo ], [ della tesi non coincide con la totalità (tutto R!) dei valori di t per i quali
ha senso f(t, y) = y
2
, bens` solo con ] , 1/y
0
[ o ]1/y
0
, [ a seconda che y
0
> 0 o y
0
< 0.
E se y
0
= 0, caso nora non considerato? Banale: per il risultato dunicità la funzione
identicamente nulla è la sola che soddisfa lequazione e la condizione di Cauchy.
14
Ma attraverso ulteriori sviluppi della teoria si arriva a fornire una determinazione otttimale dellintervallo, che
prende il nome di intervallo massimale di esistenza della soluzione.
98

An Vett 1112

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

An Vett 1112

Uploaded by

Copyright:

Available Formats

ANALISI VETTORIALE

Giovanni Maria Troianiello

]0, R[ tale che |f

Osservazione 2.2. A dierenza di quanto accade in dimensione 1, in dimensione 2 un punto critico

e quindi u H(0, 0)u = 2u

Esempio 2.4. Siano A =]0, 2[

)| < per ogni coppia di punti x

in I, `e uniformemente continua: basta prendere = /K.

`e dotata in I di massimo e di minimo assoluti per il Teorema di Weierstrass, e

I grazie al Teorema di Lagrange.

di tale intervallo che vericano |x

Questo teorema si applica subito per esempio a

Si noti che in ciascuno dei due esempi la f `e di classe C

illimitata com`e ovvio, altrimenti il teorema di Lagran-

si legga come se b = ) non `e detto che esista, ne, se esiste, che

, 0 < K x < . La funzione

, 0 < x K < . La funzione

da a a b convergono o divergono a seconda che < 1 o 1. Infatti si

per p N: viene meno la condizione

con > 1, e sia che

. La conclusione segue subito.

) converge o diverge a seconda che

da a segue dallEsempio 4.1 (iii).

; se da a a b converge lintegrale improprio di |f| diciamo che quello

> 0 tale che

> 0 tale che

> 0. Poich`e nulla impedisce di prendere , la quantit`a

Dal teorema precedente possiamo nalmente dedurre il

(x) f(x, (x))

Il Teorema 6.3 ha unapplicazione importante nel metodo di Duhamel per la risoluzione di

+ ay = f(t) (insieme alla condizione di Cauchy y(t

+by = f(t), (26)

(t) +by(t) = f(t) +

(t s) +bY (t s)]f(s) ds = f(t)

Esempio 6.1. Sia b R. Lintegrale generale dellequazione

7 Successioni uniformemente convergenti

vediamo che, in virt` u del punto (ii), il secondo membro

8 Integrali impropri dipendenti da parametri

N tale che valga la (36). Allora risulta

Esempio 8.2. La funzione f(x, t) = xe

r, sia un graco. Per`o Z `e localmente

r) o del punto (0,

a `e un numero reale positivo

Osservazione 9.1. Se nel teorema si sostituisce lipotesi F

(x), tranne per x = x

Osservazione 9.3. Abbiamo visto che se F appartiene a C

F(x, y, z) = ax +by +cz +d = 0

date dalla (46).

non `e semidenita, ovvero siccome siamo in R

2 + 1)/2. Dunque il minimo e il massimo della restrizione di f al chiuso e

1 1/4) = 1/2 +1 1/4 = 5/4.

2 + 1)/2 allestremo sinistro, 1/

2 + 1)/2 allestremo destro.

2, 0]; allinterno di questo intervallo non cadono punti

2 + 1)/2 e allestremo destro il

2]; allinterno di questo intervallo non cadono punti

Passiamo a (iii). Siccome le derivate F

! Per aggirare questo ostacolo ricorriamo

Passiamo senza dicolt`a a 3 dimensioni:

3). (Questo esempio `e preso da E.Giusti,

Passando a vincoli sotto forma di sistema si ha il seguente risultato:

indicheremo linsieme dei punti interni,

. Se per ogni > 0 si possono trovare e