Professional Documents
Culture Documents
N
i=1
u
i
D
i
=
N
i=1
u
i
x
i
che ad ogni funzione reale f di classe C
n
, n 1, in un aperto A di R
N
associa la
funzione
(u )f = u f =
N
i=1
u
i
D
i
f =
N
i=1
u
i
f
x
i
.
Per n 2 il quadrato (u )
2
= (
N
i=1
u
i
D
i
)
2
`e denito attraverso lidentit`a
(u )
2
f = (u )[(u )f]
ovvero
i=1
u
i
D
i
2
f =
i=1
u
i
D
i
i=1
u
i
D
i
. (1)
Operando sui simboli D
i
come se fossero dei numeri, che commutano cogli u
i
perch`e questi ultimi
sono ssati, cio`e non dipendono dalle variabili rispetto a cui si deriva, vediamo che la quantit`a (1)
`e uguale alla forma quadratica
N
i,j=1
u
i
u
j
D
i
D
j
f =
N
i,j=1
u
i
u
j
f
x
i
x
j
= u Hu = u
t
Hu
con H matrice hessiana di f:
H(x) =
_
_
f
x
1
x
1
(x) . . . f
x
1
x
N
(x)
. . .
f
x
N
x
1
(x) . . . f
x
N
x
N
(x)
_
_
.
La potenza (u )
k
con 2 k n `e poi denita per ricorrenza attraverso lidentit`a
(u )
k
f = (u )[(u )
k1
f].
Per indicare il valore di (u )
k
f in un punto x
0
di A usiamo la notazione (u )
k
f(x
0
) invece
della [(u )
k
f](x
0
), pi` u corretta ma poco maneggevole.
La notazione (u)
k
si rivela molto conveniente quando si devono eseguire derivazioni successive
della funzione composta
t
[u]
(t) = f(x
0
+tu). (2)
.
Teorema 1.1. Se f `e una funzione di C
n
(A) e A contiene tutto il segmento che congiunge i punti
x
0
, x
0
+u la funzione (2) `e di classe C
n
nel segmento [0, 1] e verica
(k)
[u]
(t) = (u )
k
f(x
0
+tu) (3)
per ogni k = 1, . . . , n.
DIM. Quando k = 1 la (3) segue subito dalla regola di derivazione delle funzioni composte. Per k > 1
arbitrario si procede induttivamente, tenendo conto che a sinistra compare d/dt[d
k1
[u]
(t)/dt
k1
]
e a destra (u )[(u )
k1
f(x
0
+tu)].
1
Inteso, quando il contesto lo richiede, come la colonna delle sue componenti, ovvero come matrice N 1.
3
Teorema 1.2. Se A contiene tutto il segmento che congiunge i punti x
0
, x
0
+ u e f C
1
(A),
esiste un numero ]0, 1[ tale che
f(x
0
+u) = f(x
0
) + (u )f(x
0
+ u). (4)
Se poi f C
2
(A) esiste un numero ]0, 1[ tale che
f(x
0
+u) = f(x
0
)+(u)f(x
0
)+
1
2
(u)
2
f(x
0
+u) = f(x
0
)+(u)f(x
0
)+
1
2
uH(x
0
+u)u. (5)
In generale: se f C
n
(A) esiste un numero ]0, 1[ tale che
f(x
0
+u) = f(x
0
) + (u )f(x
0
) + +
1
(n 1)!
(u )
n1
f(x
0
) +
1
n!
(u )
n
f(x
0
+ u). (6)
DIM. Siccome
[u]
(1) = f(x
0
+u) e
[u]
(0) = f(x
0
), la (4) segue dallidentit`a
[u]
(1) =
[u]
(0) +
[u]
()
(Teorema del valor medio) e dal Teorema 1.1. Abbiamo poi
[u]
(1) =
[u]
(0) +
[u]
(0) +
1
2
[u]
()
per n = 2 e
[u]
(1) =
[u]
(0) +
[u]
(0) + +
1
(n 1)!
(n1)
[u]
(0) +
1
n!
(n)
[u]
()
per n qualunque (formula di Taylor), sicche ancora una volta basta applicare il Teorema 1.1.
Per le funzioni di N variabili la (4) esprime il teorema del valor medio, mentre le (5) e
(6) sono gli sviluppi di Taylor (rispettivamente di ordine 2 e di ordine n) con il resto di
Lagrange.
Si faccia attenzione: la richiesta che il segmento di estremi x
0
e x
0
+u sia tutto contenuto in A
`e essenziale per la validit`a delle (4), (5) e (6). A questo riguardo introduciamo la seguente nozione.
Un sottoinsieme U di R
N
`e convesso se contiene ogni segmento di cui contiene gli estremi. Ad
esempio, ogni sfera `e convessa. Con questa terminologia si ottiene dal Teorema 1.1 il
Corollario 1.1. Siano A convesso e f C
1
(A) con
f(x) K < per x A. (7)
Allora f verica la condizione di Lipschitz
f(x) f(y) Kx y per x, y A.
In particolare, f ha tutte le derivate nulle in A se e solo se `e una costante.
DIM. Disuguaglianza di CauchySchwarz nella (4) per x = x
0
+u e y = x
0
:
f(x) f(y) = (x y) f(y + (x y)) x yf(y + (x y)) x yK.
4
In eetti anche se, come abbiamo detto, il teorema non vale in un generico aperto, lipotesi di
convessit`a si potrebbe indebolire un po per il primo enunciato e ancora di pi` u per il secondo.
Noi ci interessiamo soprattutto al caso N = 2, sicche la (2) `e la funzione
[u]
(t) = f(x
0
+tu
1
, y
0
+tu
2
) (8)
senzaltro ben denita per 1 < t < 1 e u = (u
1
, u
2
) tale che u < r R se R > 0 `e cos` piccolo
che tutto il disco di centro (x
0
, y
0
) e raggio R sia contenuto in A. Per k = 1 la (3) si riscrive
[u]
(t) = u
1
f
x
(x
0
+tu
1
, y
0
+tu
2
) +u
2
f
y
(x
0
+tu
1
, y
0
+tu
2
) = u f(x
0
+tu
1
, y
0
+tu
2
)
e per k = 2
[u]
(t) = u
2
1
f
xx
(x
0
+tu
1
, y
0
+tu
2
) + 2u
1
u
2
f
xy
(x
0
+tu
1
, y
0
+tu
2
) +u
2
2
f
yy
(x
0
+tu
1
, y
0
+tu
2
)
= u H(x
0
+tu
1
, y
0
+tu
2
)u; (9)
la (4) e la (5) si riscrivono rispettivamente
f(x
0
+u
1
, y
0
+u
2
) f(x
0
, y
0
) = u
1
f
x
(x
0
+ u
1
, y
0
+ u
2
) +u
2
f
y
(x
0
+ u
1
, y
0
+ u
2
)
= u f(x
0
+ u
1
, y
0
+ u
2
)
e
f(x
0
+u
1
, y
0
+u
2
) f(x
0
, y
0
) = u
1
f
x
(x
0
, y
0
) +u
2
f
y
(x
0
, y
0
)
+
1
2
u
2
1
f
xx
(x
0
+ u
1
, y
0
+ u
2
) + 2u
1
u
2
f
xy
(x
0
+ u
1
, y
0
+ u
2
) +u
2
2
f
yy
(x
0
+ u
1
, y
0
+ u
2
)
= u f(x
0
, y
0
) +
1
2
u H(x
0
+ u
1
, y
0
+ u
2
)u. (10)
Lultimo termine scritto qua sopra `e uguale a
1
2
u H(x
0
, y
0
)u +
1
2
u [H(x
0
+ u
1
, y
0
+ u
2
) H(x
0
, y
0
)]u (11)
con la norma
2
H(x
0
+ u
1
, y
0
+ u
2
) H(x
0
, y
0
)
innitesima per r 0 uniformemente in grazie alla continuit`a delle derivate seconde di f.
3
2
La norma B di una matrice B = [b
ij
] `e
ij
b
2
ij
, e la norma del vettore prodotto di B per un vettore v verica
la disuguaglianza di CauchySchwarz Bv Bv.
3
Consideriamo ad esempio f
xx
. Dato comunque > 0, esiste un r = r
La condizione necessaria di estremalit`a del primo ordine per f(x, y) segue subito da quella gi`a
nota per le funzioni di una variabile.
Teorema 2.1. Anche un punto (x
0
, y
0
) A sia di minimo o massimo locale per una funzione
f C
1
(A) `e necessario che f(x
0
, y
0
) = 0.
DIM. In t = 0 ogni funzione ] 1, 1[ t
[u]
(t) = f(x
0
+tu
1
, y
0
+tu
2
) con u = (u
1
, u
2
) di norma
< r `e dotata di estremo, e quindi ha derivata nulla:
[u]
(0) = f
x
(x
0
, y
0
)u
1
+f
y
(x
0
, y
0
)u
2
= 0.
Dallarbitrariet`a della scelta di (u
1
, u
2
) segue che f(x
0
, y
0
) = (f
x
(x
0
, y
0
), f
y
(x
0
, y
0
)) = (0, 0).
Ogni punto di A in cui f `e dotata di gradiente nullo `e un punto critico o stazionario o anche
un estremale di f, e come per le funzioni di una variabile non `e detto che si tratti di un minimo
o di un massimo locale: si pensi a 0 per f(x) = x
3
, ovvero a (0, 0) per f(x, y) = x
3
...
Per poter passare alle condizioni del secondo ordine introduciamo la seguente terminologia. Se
B `e una matrice simmetrica N N, la forma quadratica R
N
u u Bu si dice:
semidenita positiva o semidenita negativa a seconda che per ogni u R
N
risulti
u Bu 0 o u Bu 0;
denita positiva o denita negativa a seconda che per ogni u R
N
\{0} risulti u Bu > 0
o u Bu < 0.
6
E n qui si direbbe che stiamo semplicemente estendendo al caso di una qualunque dimensione
N delle banali nozioni unidimensionali sulla funzione R u Bu
2
legate al segno dello scalare B.
Ma non `e cos`: quando N = 1 la funzione pu`o solo essere soltanto 0 o 0, mentre gi`a per N = 2
incontriamo semplici forme quadratiche che non sono semidenite, bens` vericano u Bu > 0 o
u Bu < 0 a seconda della scelta di u.
Esempio 2.2. Per
B =
1 0
0 1
risulta u Bu = u
2
1
u
2
2
, e questa quantit`a `e positiva o negativa a seconda che si prenda u = (u
1
, 0)
con u
1
= 0 o u = (0, u
2
) con u
2
= 0.
Le precedenti nozioni sulle forme quadratiche si riformulano senza dicolt`a in termini di au-
tovalori delle matrici B. Grazie alla simmetria di B sappiamo infatti dallAlgebra Lineare che
la matrice = diag (
1
, . . . ,
N
) dei suoi autovalori `e reale ed uguale a C
t
BC, con C matrice
ortogonale: C
t
= C
1
. Dato comunque v R
N
abbiamo
v v = v
t
v = v
t
C
t
BCv = (Cv)
t
BCv = (Cv) BCv = u Bu
per u = Cv, e siccome il primo membro verica
mv
2
v v =
N
i=1
i
v
2
i
Mv
2
,
dove M e m sono rispettivamente il pi` u grande ed il pi` u piccolo autovalore di B, otteniamo
mu
2
u Bu Mu
2
per u R
N
grazie allisometria u = v; la prima (la seconda) disuguaglianza debole diventa lidentit`a quan-
do u `e un autovettore associato allautovalore m (M). Dunque richiedere che B sia semidenita
positiva (semidenita negativa) equivale a richiedere che m 0 (M 0), per cui B non `e semide-
nita se e solo se m < 0 < B; richiedere che B sia denita positiva (denita negativa) equivale a
richiedere che m > 0 (M < 0).
Teorema 2.2. Anche un punto (x
0
, y
0
) A sia di minimo oppure di massimo locale per una
funzione f C
2
(A) `e necessario non solo che (x
0
, y
0
) sia un punto critico, ma anche che la forma
quadratica u H(x
0
, y
0
)u sia rispettivamente semidenita positiva oppure negativa, ovvero che tutti
gli autovalori di H(x
0
, y
0
) siano 0 oppure 0.
DIM. Supponiamo che (x
0
, y
0
) sia di minimo per f. Allora ogni funzione t
[u]
(t), essendo dotata
di minimo in t = 0, verica non solo
[u]
(0) = 0 ma anche
[u]
(0) 0, e quindi
u H(x
0
, y
0
)u = u
2
1
f
xx
(x
0
, y
0
) + 2u
1
u
2
f
xy
(x
0
, y
0
) +u
2
2
f
yy
(x
0
, y
0
) =
[u]
(0) 0.
Analogo discorso se (x
0
, y
0
) `e di massimo.
7
Osservazione 2.1. Nelle dimostrazioni di entrambi i teoremi precedenti abbiamo sfruttato lim-
plicazione:
la f(x, y) ha un minimo locale in (x
0
, y
0
) =tutte le
[u]
(t) hanno un minimo locale in (x
0
, y
0
).
Ebbene, vale la pena di notare che questa implicazione non si inverte. Siano ad esempio A = R
2
,
f(x, y) = (y x
2
)(y 2x
2
). In (0, 0) il gradiente di f `e nullo e lhessiana vale
0 0
0 2
,
per cui `e semidenita positiva. Ma (0, 0) non `e di minimo per f, perche ogni intorno dellorigine
contiene punti in cui f `e positiva ed altri in cui `e negativa. Invece in t = 0 tutte le
[u]
(t) = f(tu
1
, t
2
) = t
2
(u
2
tu
2
1
)(u
2
2tu
2
1
)
hanno minimo locale (proprio) uguale a 0: infatti t
2
(u
2
tu
2
1
)(u
2
2tu
2
1
) con |t| > 0 abbastanza
piccolo ha il segno di di u
2
2
> 0 se u
2
= 0, mentre per vale 2t
4
u
4
1
> 0 per t = 0, u
1
= 0, u
2
= 0.
Col Teorema 2.2 abbiamo ottenuto una condizione solo necessaria perche un punto critico sia di
estremo locale. NellOsservazione 2.1 abbiamo gi`a visto un controesempio, e altri ne menzioneremo
nellOsservazione 2.2. Passiamo alla condizione suciente.
Teorema 2.3. Un punto critico (x
0
, y
0
) A per una funzione f C
2
(A) tale che la forma
quadratica u H(x
0
, y
0
)u sia denita positiva oppure negativa, ovvero che tutti gli autovalori di
H(x
0
, y
0
) siano > 0 oppure < 0, `e rispettivamente di minimo o massimo locale proprio.
DIM. Applichiamo la formula di Taylor di ordine 2 con f(x
0
, y
0
) = (0, 0) (il punto `e critico): dato
comunque u = (u
1
, u
2
) R
2
con u < r esiste un ]0, 1[ tale che
f(x
0
+u
1
, y
0
+u
2
) f(x
0
, y
0
) =
1
2
u H(x
0
+ u
1
, y
0
+ u
2
)u
=
1
2
u H(x
0
, y
0
)u +
1
2
u [H(x
0
+ u
1
, y
0
+ u
2
) H(x
0
, y
0
)]u
con la norma
H(x
0
+ u
1
, y
0
+ u
2
) H(x
0
, y
0
)
innitesima per r 0 uniformemente in (cfr. (10) e (11)).
Supponiamo che la forma quadratica u u H(x
0
, y
0
)u sia denita positiva, ovvero che il
minimo autovalore m di H(x
0
, y
0
) sia > 0. Fissiamo un r = r
m/2
> 0 tale che
H(x
0
+ u
1
, y
0
+ u
2
) H(x
0
, y
0
) <
m
2
e quindi
u [H(x
0
+ u
1
, y
0
+ u
2
) H(x
0
, y
0
)]u H(x
0
+ u
1
, y
0
+ u
2
) H(x
0
, y
0
)u
2
<
m
2
u
2
per u < r. Siccome
u H(x
0
, y
0
)u mu
2
8
come abbiamo visto con le considerazioni che precedono il Teorema 2.2
4
, otteniamo
f(x
0
+u
1
, y
0
+u
2
) f(x
0
, y
0
)
m
2
u
2
m
4
u
2
u
2
=
m
4
u
2
,
da cui f(x, y) > f(x
0
, y
0
) per 0 < (x x
0
)
2
+ (y y
0
)
2
< r
2
. Ne segue che la f `e dotata in
(x
0
, y
0
) di minimo (per di pi` u proprio).
Il ragionamento per il massimo `e del tutto analogo.
[u]
(0) > 0
o
[u]
(0) < 0 a seconda che il vettore u sia stato scelto in modo tale che u H(x
0
, y
0
)u > 0
o u H(x
0
, y
0
)u < 0, e questo, insieme alla condizione di stazionariet`a, implica che t = 0 `e
rispettivamente di minimo o di massimo (locale) per
[u]
(t).
`
E il caso considerato nellEsempio 2.1:
in (0, 0) la funzione f(x, y) = (x
2
y
2
)/2 ha gradiente nullo e hessiana uguale alla B dellEsempio
2.2. Ma un punto pu`o essere di sella anche se l` la forma quadratica `e semidenita: insomma, nel
caso della forma semidenita pu`o succedere quasi tutto, o addirittura tutto. Infatti se si aggiunge
la richiesta che lhessiana non sia nulla rimane escluso solo che il punto possa essere di massimo
o di minimo, a seconda che la forma sia semidenita positiva o negativa: si pensi alle funzioni
(x
4
y
2
). Se poi lhessiana `e nulla ovvero la forma, valendo identicamente zero, `e semidenita
positiva e negativa , non si esclude proprio niente: si pensi alle funzioni (x
4
y
4
) e x
3
nonche
alla (y x
2
)(y 2x
2
) dellOsservazione 2.1...
Osservazione 2.3. Per lo studio della forma quadratica associata allhessiana `e utile, ntantoche
siamo in dimensione 2, ricorrere semplicemente alla formula risolutiva per le equazioni di secondo
grado. Infatti lo studio del segno del polinomio omogeneo di secondo grado in due variabili
u u H(x
0
, y
0
)u = f
xx
u
2
1
+ 2f
xy
u
1
u
2
+f
yy
u
2
2
si riconduce a quello di un polinomio di secondo grado in una variabile, per la precisione f
xx
2
+
2f
xy
+f
yy
se f
xx
= 0 (con = u
1
/u
2
per u
2
= 0) o f
yy
2
+2f
xy
+f
xx
se f
yy
= 0 (con = u
2
/u
1
per u
1
= 0). In ogni caso si tratta di studiare il segno del discriminante = f
2
xy
f
xx
f
yy
: a seconda
che in (x
0
, y
0
) il risulti negativo, nullo o positivo il polinomio non ha nessuna soluzione reale, ne ha
una o ne ha due, e di conseguenza la forma quadratica `e denita (positiva o negativa a seconda che
f
xx
> 0, e quindi f
yy
> 0, oppure f
xx
< 0, e quindi f
yy
< 0, per cui (x
0
, y
0
) `e rispettivamente punto
di minimo oppure di massimo locale proprio), semidenita, o non semidenita (per cui (x
0
, y
0
) `e
un punto di sella).
4
Alla stessa disuguaglianza possiamo arrivare, senza parlare di autovalori, nel modo seguente. Indichiamo con m
il minimo sulla circonferenza u =
u
2
1
+ u
2
2
= 1 della funzione continua di 2 variabili u u H(x
0
, y
0
)u, sempre
positiva fuori da 0, per cui m > 0 grazie al Teorema di Weierstrass. Preso allora u = 0, per cui u/u ha norma 1,
otteniamo
u H(x
0
, y
0
)u
u
2
=
u
u
H(x
0
, y
0
)
u
u
m.
9
Tutto il contenuto di questa sezione, ad eccezione della precedente osservazione, si estende senza
dicolt`a da 2 a pi` u variabili.
Esempio 2.3. Siano A = R
2
, f(x, y) = x
2
+ y
3
xy. I punti critici di f sono le soluzioni del
sistema
f
x
(x, y) = 2x y = 0, f
y
(x, y) = 3y
2
x = 0,
ovvero (0, 0) e (1/12, 1/6). Studiamo il discriminante
(x, y) = f
2
xy
(x, y) f
xx
(x, y)f
yy
(x, y) = (1)
2
2 6y.
Siccome (0, 0) = 1 e (1/12, 1/6) = 1 con f
xx
(1/12, 1/6) = 2, lorigine `e un punto di sella e
(1/12, 1/6) `e un punto di minimo locale (ma non assoluto: nel piano la f `e illimitata sia inferiormente
che superiormente!) Si noti che lhessiana di f nel punto generico (x, y) vale
H(x, y) =
2 1
1 6y
,
per cui
H(0, 0) =
2 1
1 0
, H(1/12, 1/6) =
2 1
1 1
Esempio 2.5. In R
3
lorigine `e punto di minimo assoluto per f(x, y, z) = x
2
+ 3y
2
+ 2z
4
ed
`e di sella per per f(x, y, z) = x
2
3y
2
+ 2z
4
.
10
3 Approfondimenti sullintegrale di Riemann
Nello studio dellintegrabilit`a secondo Riemann e di tanti altri argomenti! un ruolo fonda-
mentale `e svolto dalla nozione di uniforme continuit`a in un insieme I. Si tratta della propriet`a
di cui diciamo che gode una funzione f : I R se ad ogni > 0 si pu`o associare un =
> 0
tale che |f(x
) f(x
, x
I con |x
| < .
Ogni f lipschitziana in I, cio`e tale che esista una costante K > 0 per la quale |f(x
) f(x
)|
K|x
| al variare di x
, x
) f(x
)| (max
I
|f
|)|x
| per
x
, x
h=1
sup
]x
h1
,x
h
[
f inf
]x
h1
,x
h
[
f
(x
h
x
h1
) < . (12)
Ma quando f `e continua negli [x
h1
, x
h
] esistono
sup
]x
h1
,x
h
[
f = max
[x
h1
,x
h
]
f = f(x
h
), inf
]x
h1
,x
h
[
f = min
[x
h1
,x
h
]
f = f(x
h
)
per opportuni x
h
, x
h
[x
h1
, x
h
], sicche la condizione (12) diventa
m
h=1
f(x
h
) f(x
h
)
(x
h
x
h1
) < .
Questultima disuguaglianza `e immediata quando in pi` u si sa che f `e uniformemente continua in
[a, b]: richiedendo che x
h
x
h1
< per h = 1, . . . , m, con > 0 tale che |f(x
) f(x
)| < /(ba)
per ogni coppia di punti x
, x
I con |x
| < , si ottiene
m
h=1
f(x
h
) f(x
h
)
(x
h
x
h1
) <
b a
m
h=1
(x
h
x
h1
) = .
E perche valga luniforme continuit`a una condizione suciente, come abbiamo visto, `e che f sia
lipschitziana, o pi` u sbrigativamente che stia in C
1
([a, b]). Per`o con questo approccio gi`a non si
ottiene, ad esempio, lintegrabilit`a di
x, 0 x 1.
`
E dunque chiaro che vale la pena di passare
ad un criterio di integrabilit`a un po pi` u maneggevole. Eccolo:
Teorema 3.1. Una funzione limitata f : [a, b] R `e integrabile se `e di classe C
1
al di fuori di un
numero nito di punti
0
, . . . ,
n
.
11
DIM. Ci si convince facilmente ricorrendo se necessario ad una opportuna suddivisione dellinter-
vallo in sottointervalli che non `e restrittivo limitarsi al caso che f sia di classe C
1
in tutto [a, b]
privato solo di un estremo, diciamo di
0
= b per ssare le idee.
Dato arbitrariamente > 0 scegliamo innanzitutto un B ]a, b[ tale che
2 sup
[a,b]
|f|(b B) <
2
. (13)
Applicando poi luniforme continuit`a di f in [a, B] otteniamo lesistenza di un > 0 tale che
|f(x
) f(x
)| <
2(b a)
per tutti i punti x
, x
| < .
Sia {x
0
= a < < x
m1
= B < x
m
= b} una partizione di [a, b] con x
h
x
h1
< per
h = 1, . . . , m1. Allora, servendoci fra laltro delle maggiorazioni
sup
]x
m1
,x
m
[
f inf
]x
m1
,x
m
[
f
sup
]x
m1
,x
m
[
f
inf
]x
m1
,x
m
[
f
2 sup
[a,b]
|f|,
otteniamo
m
h=1
sup
]x
h1
,x
h
[
f inf
]x
h1
,x
h
[
f
(x
h
x
h1
)
=
m1
h=1
f(x
h
) f(x
h
)
(x
h
x
h1
) +
sup
]x
m1
,x
m
[
f inf
]x
m1
,x
m
[
f
(x
m
x
m1
)
2(b a)
m1
h=1
(x
h
x
h1
) + 2
sup
[a,b]
|f|
(b B) <
2(b a)
(b a) +
2
= .
Ne segue che la (12) `e soddisfatta, e quindi che f `e integrabile.
12
Esempio 3.2. Sia I = [0, [ (intervallo chiuso, ma non limitato). La funzione f(x) = x
2
`e di
classe C
0
(I), ovvero continua in ogni punto di I, ma non uniformemente in I: per ogni scelta di
> 0 e di x
0
1/ la quantit`a f(x
0
+/2) f(x
) = (2x
0
+/2)/2 `e > x
0
1, dunque > non
appena < 1, e questo nonostante tutti i punti x
0
, x
0
+ /2 con x
0
1/ distino meno di .
, nellintervallo I in cui
`e stata denita, ma con derivata f
|) e quindi luniforme
continuit`a.
Ebbene: limportantissimo Teorema di HeineCantor aerma che quando I `e un sottoin-
sieme sia chiuso che limitato di R, anzi pi` u in generale di un qualunque R
N
(con la distanza tra
due punti al posto del modulo della dierenza di due numeri), ogni f : I R continua in I,
come ad esempio
x in I = [0, 1], vi `e uniformemente continua. Questo ci consente di riformulare,
nella portata pi` u generale che `e in eetti la sua, la condizione di integrabilit`a fornita dal Teorema
3.1. Nella dimostrazione abbiamo infatti sfruttato in modo essenziale luniforme continuit`a di f in
[a, B], e per ottenerla ci siamo serviti dellipotesi che l` f sia di classe C
1
. Alla luce del Teorema
di HeineCantor possiamo adesso dire che basta molto meno, e cio`e che il Teorema 3.1 vale con la
classe C
1
dellipotesi sostituita dalla classe C
0
:
Teorema 3.2. Una funzione limitata f : [a, b] R `e integrabile se `e continua al di fuori di un
numero nito di punti
0
, . . . ,
n
.
Nel seguito, pur senza aver dimostrato il Teorema di HeineCantor, faremo il pi` u delle volte
riferimento (magari tacito) al Teorema 3.2 invece che all3.1.
4 Integrali impropri e serie
Per < a < b indichiamo con f una funzione [a, b[R integrabile secondo Riemann da a
ad B per ogni B ]a, b[.
Se aggiungiamo le ipotesi che (i) b sia nito e (ii) f sia limitata, la funzione `e dotata di integrale
di Riemann da a a b, con
b
a
f(x) dx = lim
Bb
B
a
f(x) dx. (14)
Dato arbitrariamente > 0, infatti, sia B ]a, b[ come nella (13) e sia {x
0
= a < < x
m1
= B}
una partizione di [a, B] per la quale, grazie allipotesi di integrabilit`a su [a, B], risulti
m1
h=1
sup
]x
h1
,x
h
[
f inf
]x
h1
,x
h
[
f
(x
h
x
h1
) <
2
.
Allora {x
0
= a < < x
m1
= B < x
m
= b} `e una partizione di [a, b] per la quale risulta
m
h=1
sup
]x
h1
,x
h
[
f inf
]x
h1
,x
h
[
f
(x
h
x
h1
) <
13
(cfr. la dimostrazione del Teorema 3.1), da cui lintegrabilit`a secondo Riemann di f su [a, b]. Che
poi valga la (14) `e conseguenza immediata di
b
a
f(x) dx
B
a
f(x) dx
b
B
f(t) dt
sup
[a,b]
|f|(b B) < /2.
Lasciamo cadere almeno una tra la (i) e la (ii). Il primo membro della (14) non ha pi` u senso
come integrale di Riemann: lo chiamiamo integrale improprio di f da a a b. Il limite nel secondo
membro (con lintesa che b
b
a
f(x) dx = lim
Aa
+
b
A
f(x) dx (15)
nel caso che il limite esista (e con lintesa che a
+
si legga come se a = ).
Se inne f `e una funzione denita su un ]a, b[ con a < b e integrabile secondo
Riemann su ogni sottointervallo [A, B] con a < A < B < b, il suo integrale improprio da a a b vale
b
a
f(x) dx = lim
Aa
+
,Bb
B
A
f(x) dx (16)
nel caso che entrambi i limiti indipendenti! esistano senza essere uguali uno a + e laltro
a .
Esempio 4.1. (i) Sia f(x) = x
B
K
x
dx
vale (B
1
K
1
)/(1 ) se = 1 e log B log K se = 1. Ne segue che x
`e dotata di
integrale improprio da 1 a convergente (e uguale a K
1
/(1)) o divergente (a +) a seconda
che > 1 o 1.
(ii) Sia f(x) = x
K
A
x
dx
vale (K
1
A
1
)/(1 ) se = 1 e log K log A se = 1. Ne segue che x
`e dotata di
integrale improprio da 0 a 1 convergente (e uguale a K
1
/(1 )) o divergente (a +) a seconda
che < 1 o 1. Da qui deduciamo poi che per < a < b < gli integrali impropri di
1/(x a)
e di 1/(b x)
ba
0
dy
y
.
(iii) Lintegrale improprio
e
|x|
dx = 2
0
e
x
dx
converge: il suo valore `e 2[e
x
]
0
= 2.
14
Una serie reale
n=K
a
n
(dove K `e qualche naturale) si pu`o scrivere come integrale improprio
della funzione che vale a
n
per n x < n + 1[, n = K, K + 1, . . . , ovvero
[K, [ x
n=K
a
n
1
[n,n+1[
(x)
(che su ogni intervallo limitato soddisfa lipotesi del Teorema 3.1 e di conseguenza `e integrabile). Ci`o
rende interessante, nel contesto dellintegrazione impropria, approfondire alcune questioni relative
alle serie.
Ricordiamo il criterio del confronto per le serie a termini non negativi : se due successioni
reali {a
n
} e {b
n
} vericano denitivamente
0 a
n
b
n
la convergenza della
b
n
implica quella della
a
n
, mentre la divergenza della
a
n
implica quella
della
b
n
.
Quando i termini di una serie soddisfano, da un certo punto in poi, le disuguaglianze strette
a
n
> 0, unutile applicazione del criterio del confronto `e il criterio del rapporto: condizione
suciente anche
a
n
converga `e che esista un numero ]0, 1[ tale che
a
n+1
/a
n
per n K (17)
dove K `e un opportuno naturale. Infatti dalle disuguaglianze
a
K+1
a
K
, a
K+2
a
K+1
, . . . , a
n+K
a
n1+K
si ricava che
a
n+K
a
n+K1
a
K+1
n1
a
K
n
e quindi che la serie
n
a
n+K
`e maggiorata termine a termine dalla serie convergente
n
a
K
n
(prodotto di una costante per la serie geometrica di ragione ). Se il rapporto a
n+1
/a
n
tende a
un limite L < 1, la (17) vale con un qualunque ssato in ]L, 1[ a patto di prendere K = K()
sucientemente grande.
Esempio 4.2. (i) Siccome
1
(n + 1)!
n! =
1
n + 1
0 per n
la serie
n
1/n! converge (e si dimostra che la sua somma `e e).
(ii) La serie
n
n!/n
n
converge perche
(n + 1)!
(n + 1)
n+1
n
n
n!
=
n
n + 1
n
=
1
1
n + 1
1
e
< 1.
Se a
n+1
/a
n
tende a un limite L > 1 la serie diverge, perche per un opportuno N i suoi
addendi vericano a
n+1
/a
n
1 per n , e quindi a
+p
a
con 1.
15
E se i termini a
n
della serie non sono di segno costante? Si pu`o passare allo studio della serie
|a
n
| dei moduli e controllare se converge. In tal caso, essa soddisfa la condizione di Cauchy. Ma
allora soddisfa la condizione di Cauchy anche la
a
n
: infatti il primo membro della disuguaglianza
|a
n+1
+a
n+1
+ +a
n+1
| |a
n+1
| + |a
n+1
| + + |a
n+1
|
`e minore di > 0 se lo `e il secondo membro. Ne segue allora anche la convergenza, che chiamiamo
assoluta, della serie di partenza
a
n
.
5 Criterio del confronto, convergenza assoluta, convergenza con-
dizionata
Torniamo agli integrali impropri. Nella maggior parte dei casi di speciche funzioni bisogna aspet-
tarsi che il calcolo esplicito dei limiti che compaiono nelle formulazioni generali a secondo membro
della (14) o della (15) o della (16) si riveli semplicemente impossibile.
`
E dunque utile poter disporre
di un criterio di convergenza/divergenza di integrali impropri, che riguarda funzioni non negative
e costituisce la generalizzazione del criterio del confronto per serie a termini non negativi.
Teorema 5.1 (del confronto). Siano f, g : [a, b[R, dove < a < b , funzioni entrambe
integrabili secondo Riemann da a a B per ogni B [a, b[, con
0 f(x) g(x) per a x < b. (18)
Allora lintegrale improprio da a a b di f converge se converge quello di g, mentre quello di g diverge
se diverge quello di f.
DIM. Dalla (18) segue che
B
a
f(x) dx
B
a
g(x) dx.
Entrambi gli integrali sono funzioni crescenti della B dal momento che i loro integrandi sono 0,
e di conseguenza ammettono limite per B b
Il passaggio ai casi f, g :]a, b] R con a < b < , e f, g :]a, b[R con a < b
si fa in un attimo.
Il prossimo esempio estende, a partire dallEsempio 4.1, la classe delle funzioni su cui appoggiarsi
per lutilizzo pratico del criterio del confronto.
Esempio 5.1. (i) Lintegrale improprio su R di 1/(1 + |x|
1
1 +x
1
x
per x 1
basta tener conto dellEsempio 4.1 (i).
(ii) Per 1 e |x| 1 vale la maggiorazione e
|x|
e
|x|
, e quindi la convergenza del
lintegrale improprio di e
|x|
16
In eetti il primo approccio allutilizzo del criterio del confronto conviene tentarlo, quando si ha
a che fare con funzioni f, g entrambe (strettamente) positive, ricorrendo allo studio del limite del
rapporto tra le due. Poniamoci ad esempio nel caso di f, g : [a, b[R, < a < b , funzioni
entrambe > 0 in [a, b[ e integrabili secondo Riemann da a a B per ogni B [a, b[. Supponiamo che
esista L = lim
xb
f(x)/g(x) (necessariamente 0) . Allora:
se lintegrale improprio di g da a a b converge e L `e < sicche esiste un B tale che
f(x) (L + 1)g(x) per x B , converge anche lintegrale improprio di f;
se lintegrale improprio di g da a a b diverge e L `e > 0 sicche, ssato ]0, L[, esiste un
B tale che f(x) g(x) per x B , diverge anche lintegrale improprio di f.
Proseguiamo con lanalogia al (e in eetti con la generalizzazione del) caso delle serie. Su
[a, B] [a, b[ lintegrabilit`a secondo Riemann di f implica quella del modulo |f|, della parte positiva
f
+
e della parte negativa f
|f|
la convergenza dellintegrale improprio di |f| implica quella degli integrali impropri di f
+
e di f
,
dunque quella di f = f
+
f
Il precedente enunciato non si inverte: pu`o ben accadere che un integrale improprio converga
ma non assolutamente, ovvero che converga condizionatamente.
Esempio 5.2. Lintegrale improprio (detto di Dirichlet)
D =
0
sin x
x
dx
converge condizionatamente. Per vedere questo basta limitarsi allintervallo di integrazione [1, [,
visto che lintegrando, posto uguale a un qualunque numero reale per x = 0, `e integrabile secondo
Riemann da 0 a 1.
Per 1 < K < si ottiene, integrando per parti,
K
1
sin x
x
dx =
cos x
x
K
1
K
1
cos x
x
2
dx.
Siccome lintegrando nel secondo membro `e maggiorato in valore assoluto dalla funzione x
2
che `e
dotata di integrale improprio convergente da 1 a , il limite per K esiste nito. Dunque D
`e un integrale improprio convergente. Non assolutamente convergente, per`o:
(2k+1)
2k
| sin x|
x
dx =
(2k+1)
2k
sin x
x
dx
1
(2k + 1)
(2k+1)
2k
sin xdx =
1
(2k + 1)
cos x
(2k+1)
2k
=
2
(2k + 1)
17
e quindi
D
k=1
(2k+1)
2k
| sin x|
x
dx
k=1
1
(k + 1)
= .
In maniera analoga si verica che anche gli integrale impropri
J
1
=
0
sin x
x
dx, J
2
=
1
cos x
x
dx
convergono, ma non assolutamente.
A questo punto si verica anche che converge, ma non assolutamente, lintegrale improprio
F =
1
sin x
2
dx :
la sostituzione y = x
2
d`a infatti
F =
1
2
1
sin y
y
dy =
1
2
J.
Il criterio del confronto per la convergenza/divergenza degli integrali impropri si pu`o trasportare
ad una serie
n
a
n
(a termini 0) quando esiste una funzione f continua e decrescente in una
semiretta [K, [ (K N) che verica f(n) = a
n
e quindi a
n+1
f(x) a
n
. In tal caso infatti
risulta
a
n+1
n+1
n
f(x) dx a
n
da cui
n=K
a
n+1
K
f(x) dx
n=K
a
n
,
e si arriva al criterio integrale di convergenza o divergenza per le serie: se lintegrale improprio di
f converge, converge
n
a
n+1
e quindi anche
n
a
n
; se lintegrale improprio di f diverge,
n
a
n
diverge.
Questo criterio pu`o rivelarsi uno strumento prezioso quando gli altri criteri sono di applicazione
un po troppo complicata. Si pensi gi`a alla serie armonica generalizzata
: dallEsempio 4.1
segue subito la convergenza o la divergenza a seconda che 1 o > 1. Ancora pi` u illuminante
`e il caso della
(nlog n)
1
: il confronto con le serie armoniche generalizzate non fornisce nessuna
informazione che permetta di concludere, mentre basta osservare che la funzione (xlog x)
1
, essendo
la derivata di log(log x), ha integrale improprio divergente, per ottenere la divergenza della serie.
Lanalogia tra integrali impropri e serie deve peraltro essere maneggiata con cautela. Se, ad
esempio, una serie
a
n
converge, sia pure solo semplicemente, il suo termine generale a
n
`e innite-
simo per n , mentre se lintegrale improprio di una funzione f su un intervallo superiormente
illimitato converge non `e aatto detto che f(x) 0 per x : si pensi a f(x) = sin x
2
, 1 x <
(Esempio 5.2), o ancora meglio alla funzione
f(x) =
n=1
n1
[n,n+1/n
3
]
(x),
addirittura illimitata su ogni semiretta [K, [ eppure dotata di integrale improprio assolutamente
convergente uguale a
n=1
1/n
2
. Dunque non si pu`o pensare di estendere dalle serie agli integrali
18
impropri una qualche versione puntuale! del criterio di convergenza di Cauchy (e infatti
per dimostrare col Teorema 5.2 che la convergenza assoluta implica la convergenza siamo ricorsi al
Teorema del confronto 5.1, mentre per le serie si utilizza tranquillamente Cauchy).
6 Integrali di Riemann dipendenti da parametri
Nel corso di Calcolo 1 si incontrano delle particolari, e importantissime, funzioni denite mediante
integrali: quelle della forma [c, d] x
x
c
f(t) dt. Passiamo adesso allambito delle funzioni di
pi` u variabili, servendoci in maniera rilevante delluniforme continuit`a di una funzione continua in
un chiuso e limitato C garantita dal Teorema di HeineCantor
5
.
Cominciamo col
Teorema 6.1. Sia f una funzione continua in I [c, d] con I intervallo chiuso e limitato, <
c < d < . Allora
F(x) =
d
c
f(x, t) dt
`e continua in I. Se poi si suppone che per ogni t [c, d] esista la derivata f
x
(x, t) di I x f(x, t)
e che f
x
C
0
(I [c, d]), allora anche F `e dotata di derivata continua
F
(x) =
d
c
f
x
(x, t) dt (19)
in I.
DIM. Siano x
0
, x I. Grazie alluniforme continuit`a della funzione f nel rettangolo chiuso e
limitato I [c, d] possiamo associare ad ogni > 0 un =
d
c
[f(x, t) f(x
0
, t)] dt,
ottenere
|F(x) F(x
0
)|
d
c
|f(x, t) f(x
0
, t)| dt (d c)
purche x I verichi |x x
0
| . Ci`o mostra la continuit`a in x
0
.
Passiamo alla derivabilit`a in x
0
, sfruttando stavolta luniforme continuit`a in I [c, d] della
funzione f
x
. Sia dunque dato arbitrariamente > 0, e sia =
d
c
f
x
(x
0
, t) dt =
d
c
f(x
0
+h, t) f(x
0
, t)
h
f
x
(x
0
, t)
dt
=
d
c
[f
x
(x
0
+ h, t) f
x
(x
0
, t)] dt
otteniamo
F(x
0
+h) F(x
0
)
h
b
a
f
x
(x
0
, t) dt
d
c
|f
x
(x
0
+ h, t) f
x
(x
0
, t)| dt < (d c).
A questo punto la (19) per x = x
0
segue dallarbitrariet`a di . Applicando poi a f
x
(x, t) il precedente
risultato di continuit`a si ottiene anche la continuit`a di F
in I.
Naturalmente nel Teorema 6.1 gli estremi di integrazione possono essere scambiati tra di loro:
questo signica semplicemente passare da F e F
a G = F e G
= F
.
Adesso facciamo variare gli estremi di integrazione.
Teorema 6.2. Sia f continua in I [c, d]. In C = I [c, d] [c, d] la funzione
(x, y, z) =
z
y
f(x, t) dt
`e continua e dotata di derivate parziali continue
y
(x, y, z) = f(x, y),
z
(x, y, z) = f(x, z). (21)
Se poi si aggiunge lipotesi che per ogni t [c, d] esista la derivata f
x
(x, t) di I x f(x, t) e che
f
x
C
0
(I [c, d]), allora per ogni (y, z) [c, d] [c, d] la I x (x, y, z) `e dotata anche della
derivata
x
(x, y, z) =
z
y
f
x
(x, t) dt, (22)
a sua volta continua in C.
DIM. Per (x
0
, y
0
, z
0
), (x, y, z) C scriviamo (x, y, z) (x
0
, y
0
, z
0
) come somma
z
0
y
0
[f(x, t) f(x
0
, t)] dt +
y
0
y
f(x, t) dt +
z
z
0
f(x, t) dt. (23)
Il secondo e terzo addendo sono rispettivamente maggiorati in modulo dai prodotti di |y y
0
| e di
|z z
0
| per il massimo di |f| su I [c, d]. Sia un qualunque reale positivo. Grazie al Teorema
6.1 sappiamo che il primo addendo della (23) `e maggiorato in valore assoluto da purche |x x
0
|
20
sia maggiorato da un opportuno =
z
0
y
0
f(x, t) dt;
applicando poi il precedente risultato di continuit`a con sostituita da
x
si ottiene la continuit`a
di questultima in (x
0
, y
0
, z
0
).
Osservazione 6.1. Nelle due precedenti dimostrazioni `e stata utilizzata lipotesi che I sia, oltre
che chiuso, anche limitato. Per`o esse si ripetono tali e quali con le intersezioni [x
0
r, x
0
+r] I,
r > 0, al posto di I, per cui i Teoremi 6.1 e 6.2 continuano a valere con lintervallo I chiuso ma
non limitato.
(x)
(x)
f(x, t) dt
`e continua su I; se poi si aggiungono le ipotesi che per ogni t [c, d] esista la derivata f
x
(x, t) di
I x f(x, t) continua in I [c, d] e che , appartengano a C
1
(I), allora G `e dotata di derivata
continua
G
(x) =
(x)
(x)
f
x
(x, t) dt +f(x, (x))
(x)
in I.
DIM. Continuit`a della funzione composta G(x) = (x, (x), (x)); derivabilit`a della funzione
composta (dal momento che `e C
1
), e dunque
G
(x) =
x
(x, (x), (x)) +
y
(x, (x), (x))
(x) +
z
(x, (x), (x))
(x),
poi le (21) e la (22).
t
t
0
e
a(ts)
f(s) ds (24)
21
soddisfa lequazione lineare y
t
t
0
e
as
f(s) ds
con lintegrando che non dipende dal parametro t, e di conseguenza si deriva elementarmente.
Tuttavia la (24) `e istruttiva, perche fornisce al I ordine la formula di Duhamel
y(t) =
t
t
0
Y (t s)f(s) ds (25)
con Y (t) che qui denota la soluzione e
at
dellequazione omogenea Y
+ aY = 0 che soddisfa la
condizione di Cauchy Y (0) = 1.
Passiamo al II ordine.
Teorema 6.4. Siano a, b R, f C
0
(]c, d[). La funzione (25) con Y (t) soluzione del problema di
Cauchy
Y
+aY
+bY = 0, Y (0) = 0, Y
(0) = 1
`e una soluzione dellequazione non omogenea
y
+ay
(t) = Y (0)f(t) +
t
t
0
Y
(t s)f(s) ds =
t
t
0
Y
(t s)f(s) ds,
poi
y
(t) = Y
(0)f(t) +
t
t
0
Y
(t s)f(s) ds = f(t) +
t
t
0
Y
(t s)f(s) ds
e inne
y
(t) +ay
t
t
0
[Y
(t s) +aY
+by = f(t)
vale
c
1
sin t
b +c
2
cos t
b +
t
t
0
sin (t s)
b
f(s) ds
22
per b > 0, e invece
c
1
e
t
b
+c
2
e
t
b
+
t
t
0
e
(ts)
b
e
(ts)
b
2
b
f(s) ds
per b < 0.
Prendiamo in particolare b = 1, f(t) = 1/ cos t per /2 < t < /2. La funzione (25) con
t
0
= 0 `e allora
t
0
sin(t s)
cos s
ds =
t
0
sin t cos s cos t sin s
cos s
ds = t sin t cos t
t
0
sin s
cos s
ds
= t sin t + cos t log(cos t).
Il metodo di Duhamel che abbiamo nora illustrato per le equazioni del I e del II ordine
si trasporta immediatamente a un qualunque ordine N: per a
0
, . . . , a
N1
R e f C
0
(]c, d[)
lequazione
y
(N)
+a
N1
y
(N1)
+ +a
1
y
+a
0
y = f(t)
`e soddisfatta dalla funzione y(t) che ha lespressione (25) con Y (t) soluzione adesso dellomogenea
Y
(N)
+a
N1
Y
(N1)
+ +a
1
Y
+a
0
Y = 0
che soddisfa le condizioni di Cauchy Y (0) = Y
(0) = = Y
(N2)
(0) = 0, Y
(N1)
(0) = 1. La
verica troppo lunga! si fa con N derivazioni successive attraverso il Teorema 6.3. Qui ci
limitiamo ad osservare che nel caso particolarissimo a
0
= = a
N1
= 0 la funzione Y (t) richiesta
`e la t
n1
/(n 1)!, per cui
y(t) =
1
(n 1)!
t
t
0
(t s)
n1
f(s) ds
`e la soluzione di y
(N)
= f(t) che si annulla in t
0
insieme a tutte le sue derivate no all(n1)esima.
N tale che
|F
n
(x) F(x)| per x I, n
(27)
ovvero
sup
xI
|F
n
(x) F(x)| per n
. (28)
La convergenza uniforme implica banalmente quella puntuale, ma non viceversa. Un semplicissimo
esempio di successione che converge puntualmente ma non uniformemente `e fornito dalle F
n
(x) = x
n
in I = [0, 1[: il limite puntuale `e F(x) = 0, ma per < 1 la (28) `e violata dal momento che
sup
x[0,1[
|x
n
| = 1.
Prendendo nella (27) /2 al posto di e poi aggiungendo F
p
(x) F
n+p
(x) dentro al modulo
si ottiene la condizione necessaria per la convergenza uniforme: dato comunque > 0, esiste un
N tale che
|F
n
(x) F
n+p
(x)| per x I, n
, p N. (29)
La condizione `e anche suciente per la convergenza uniforme, e viene detta criterio uniforme
di Cauchy: da essa segue essa infatti la convergenza puntuale ad una F(x), e passando al limite
per p si ottiene la (27).
7
Il prossimo teorema fornisce condizioni sucienti per scambiare tra di loro il segno di limite per
n con quello di limite per x x
0
, con quello di integrale e con quello di derivata.
Teorema 7.1. (i) Se le funzioni F
n
: I R sono continue in un punto x
0
I e convergono
uniformemente in I, allora anche F = lim
n
F
n
`e una funzione continua in x
0
.
(ii) Se le funzioni F
n
: I R sono continue in ogni punto di I e convergono uniformemente in
I, allora F = lim
n
F
n
(continua in I grazie a (i)) verica
b
a
F(x) dx = lim
n
b
a
F
n
(x) dx per a, b I. (30)
(iii) Se le funzioni F
n
: I R sono di classe C
1
in I, con {F
n
(x
0
)} convergente per qualche
scelta di x
0
I e le F
n
uniformemente convergenti in I, allora F = lim
n
F
n
`e di classe C
1
in I con
F
(x) = lim
n
F
n
(x) per x I. (31)
DIM. (i) Fissiamo arbitrariamente un > 0 e associamogli N in modo che valga la (27). Grazie
allipotesi di continuit`a di ogni F
n
in x
0
esiste un =
,
> 0 tale che
|F
(x) F
(x
0
)| < per x I, |x x
0
| < .
Allora (tecnica dei tre )
|F(x) F(x
0
)| |F(x) F
(x)| + |F
(x) F
(x
0
)| + |F
(x
0
) F(x
0
)| < 3,
6
Per lanit` a concettuale con la continuit` a uniforme di una funzione in un intervallo cfr. la Sezione 3.
7
Se avessimo optato per la richiesta delle disuguaglianze forti < invece di quelle deboli, assolutamente equivalenti
per larbitrariet` a di > 0, ci saremmo procurati qualche inutile complicazione, sia pur di poco conto.
24
da cui la continuit`a di F in x
0
.
(ii) Innanzitutto sottolineiamo che F `e continua in ogni punto di I grazie al punto (i), e di
conseguenza `e integrabile al pari di tutte le F
n
su ogni intervallo chiuso e limitato di I. Fissiamo
poi un arbitrario > 0 e associamogli N in modo che valga la (27). Allora
b
a
F(x) dx
b
a
F
n
(x) dx
b
a
|F(x) F
n
(x)| dx
< |b a| per n .
Ci`o prova la (30).
(iii) Per ogni x I il Teorema fondamentale del Calcolo d`a
F
n
(x) = F
n
(x
0
) +
x
x
0
F
n
(t) dt.
Ponendo = lim
n
F
n
(x
0
) e G = lim
n
F
x
x
0
G(t) dt. (32)
Ma allora F(x) = lim
n
F
n
(x) esiste e assume il valore (32) per ogni x, da cui = F(x
0
) e, derivando,
G(x) = F
(x).
Osservazione 7.1. Nel punto (i) del teorema lipotesi di uniforme convergenza delle F
n
`e essenziale,
come si vede con semplicissimi esempio: per dirne uno, quello gi`a visto delle funzioni continue
F
n
(x) = x
n
, ma stavolta per x I = [0, 1], che convergono puntualmente alla funzione discontinua
che vale 0 per x [0, 1[ e ad 1 per x = 1. Invece sia la (30) e sia la (31) valgono sotto ipotesi molto
pi` u deboli delluniforme convergenza rispettivamente delle F
n
e delle F
n
.
d
c
f(x, t) dt
`e continua. Se poi si aggiungono le ipotesi che per ogni t ]c, d[ esista la derivata f
x
(x, t) di
I x f(x, t), che f
x
C
0
(I]c, d[) e che valga una disuguaglianza
|f
x
(x, t)| g(t) per (x, t) I]c, d[, (34)
allora la funzione F sta in C
1
(I) con
F
(x) =
d
c
f
x
(x, t) dt.
25
DIM. Innanzitutto, la (33) garantisce, grazie al Teorema del confronto, che per ogni ssato x I
la funzione t f(x, t) ha integrale improprio assolutamente convergente da c a d. Dunque F(x) `e
ben denita. Studiamo la sua regolarit`a al variare di x in I.
Siano {c
n
}, {d
n
} ]c, d[ tali che c
n
c e d
n
d.
Dal Teorema 6.1 (e alla luce dellOsservazione 6.1 se I `e illimitato) sappiamo che per ogni n la
funzione
I x F
n
(x) =
d
n
c
n
f(x, t) dt (35)
`e continua. Daltra parte, dalla convergenza dellintegrale improprio di g segue che, dato comunque
> 0, esiste un =
N tale che
c
n
c
g(t) dt +
d
d
n
g(t) dt per n . (36)
Dunque la (33), oltre a garantire che per ogni x I la funzione t f(x, t) `e dotata di in-
tegrale improprio assolutamente convergente, ovvero che F(x) `e ben denita, fornisce anche la
disuguaglianza
c
n
c
|f(x, t)| dt +
d
d
n
|f(x, t)| dt per x I, n .
Ma allora
|F(x) F
n
(x)|
c
n
c
f(x, t) dt
d
d
n
f(x, t) dt
per x I, n .
Ne segue che in I la successione delle funzioni continue F
n
(x) converge uniformemente in I ad F(x),
e quindi (Teorema 7.1 (i)) che questultima `e continua.
In maniera analoga, sotto lipotesi di derivabilit`a di x f(x, t) si ricava innanzitutto, grazie al
Teorema 6.1 (e allOsservazione 6.1 se I `e illimitato) , che per ogni n la funzione (35) `e derivabile
in I con
F
n
(x) =
d
n
c
n
f
x
(x, t) dt.
Dalla (34) segue poi che per ogni x I la funzione t f
x
(x, t) `e dotata di integrale improprio
assolutamente convergente, ovvero che la funzione
I x G(x) =
d
c
f
x
(x, t) dt
`e ben denita; inoltre G C
0
(I) grazie alla prima parte del teorema.
Sia > 0 arbitrariamente ssato, e sia di nuovo =
c
n
c
|f
x
(x, t)| dt +
d
d
n
|f
x
(x, t)| dt per x I, n
per cui
|G(x) F
n
(x)|
c
n
c
f
x
(x, t) dt
d
d
n
f
x
(x, t) dt
per x I, n .
Ne segue che la successione delle funzioni continue F
n
(x) converge uniformemente a G(x), e quindi
(Teorema 7.1 (iii)) F(x) = lim
n
F
n
(x) `e derivabile con F
(x) = G(x).
26
Naturalmente non `e aatto restrittivo richiedere che le disuguaglianze (33) e (34) valgano con
la stessa funzione g(t): se si parte da due diverse funzioni nei secondi membri basta prendere la
loro somma per ricondursi alle ipotesi del teorema.
Esempio 8.1. Fissiamo x in I = [a, [, a > 0. Su ]c, d[=]0, [ sia la funzione t f(x, t) =
t
1
e
tx
sin t che la sua derivata t f
x
(x, t) = e
tx
sin t sono maggiorate in modulo dalla funzione
continua g(t) = e
ta
, che ha integrale improprio assolutamente convergente. Dunque la
F(x) =
0
e
tx
sin t
t
dt
`e continua e anzi derivabile per x a, con
F
(x) =
0
e
tx
sin t dt.
e
applicare il Teorema Fondamentale del Calcolo. Invece
F(x) =
0
xe
xt
dt = e
xt
0
`e denita su [0, [, ma non `e continua in 0:
F(0) = 0, F(x) = 1 per x > 0
(e in qualunque intervallo [0, b] si ha convergenza puntuale ma non uniforme delle funzioni continue
F
n
(x) =
n
0
xe
xt
dt = e
xt
n
0
= 1 e
nx
a F(x): cfr il Teorema 7.1 (i)). Infatti non si applica il Teorema 8.1: non esiste una funzione
]0, [ t g(t) dotata di integrale improprio convergente e tale che valga la (33), dal momento
che per 1/t b il max
0xb
xe
xt
si ottiene per x = 1/t e vale (et)
1
.
Per gli integrali impropri semplicemente convergenti non vale il teorema di derivazione sotto il
segno di integrale, come mostra il seguente
Esempio 8.3. Per x > 0 la funzione
F(x) =
0
sin tx
t
dt
assume costantemente il valore dellintegrale improprio semplicemente convergente
0
[(sin u)/u] du,
come si vede operando il cambiamento u = tx della variabile dintegrazione. Dunque F
(x) = 0,
mentre lintegrale improprio della derivata della funzione x (sin tx)/t, cio`e di cos tx, non solo
non vale identicamente 0, ma non `e neppure convergente.
27
9 Il Teorema di Dini per funzioni scalari
Nel piano euclideo lequazione di una retta
F(x, y) = ax +by +c = 0
con a, b, c numeri reali ed a
2
+b
2
> 0 `e risolubile rispetto a y in funzione della x (con y = ax/bc/b)
se F
y
= b = 0, cio`e se la retta non `e verticale, e rispetto a x in funzione della y (con x = by/ac/a)
se F
x
= a = 0, cio`e se la retta non `e orizzontale. Per farla breve, qui tutto linsieme dei punti del
piano che vericano lequazione `e sempre il graco di una funzione della x o della y a seconda che
F
y
= 0 o F
x
= 0 (senza che un caso escluda necessariamente laltro).
Se per` o F `e una generica funzione R con aperto di R
2
non `e aatto detto che linsieme
dei punti (x, y) che soddisfano lequazione F(x, y) = 0 sia sempre il graco di una funzione
y = f(x) o di una funzione x = g(y) e nemmeno che sia una curva, ne, perno, che sia = .
Per rendersene conto gi`a basterebbe osservare che un qualunque sottoinsieme S del piano coincide
con linsieme delle soluzioni dellequazione F(x, y) = 1
S
(x, y) 1 = 0. Ma questa `e una F che in
generale non ha la minima regolarit`a. Ebbene, prendiamo delle F regolarissime.
Esempio 9.1. Sia F(x, y) = x
2
y
2
. Linsieme Z delle soluzioni dellequazione F(x, y) = 0 `e
costituito dallunione delle due bisettrici y = x. Ogni suo punto diverso dallorigine ha un intorno
la cui intersezione con Z `e un tratto di retta, dunque un graco. Invece lintersezione con Z di un
qualunque intorno dellorigine non `e mai un graco e notiamo che F
x
(0, 0) = F
y
(0, 0) = 0.
Esempio 9.2. Per ogni r R sia
F(x, y) = x
2
+y
2
r.
Linsieme Z delle soluzioni dellequazione F(x, y) = 0 `e vuoto se r < 0 e coincide col solo punto
(0, 0) se r = 0: dunque non `e un graco in nessuno dei due casi. Sia r > 0. Neanche allora `e vero che
tutto Z, essendo la circonferenza di centro lorigine e raggio
r x
2
o di y =
r x
2
a seconda che y
0
> 0 (e allora A `e lintero
semipiano delle y > 0) o y
0
< 0 (e allora A `e lintero semipiano delle y < 0). Se per`o y
0
= 0,
e quindi x
0
=
r o x
0
=
r, non esiste nessun intorno del punto, per quanto piccolo, la cui
intersezione con Z sia graco di una funzione della x.
In un opportuno intorno aperto A di di un punto (x
0
, y
0
) Z tale che F
x
(x
0
, y
0
) = 2x
0
= 0,
per cui la retta tangente alla circonferenza nel punto non `e orizzontale, i punti di Z sono
quelli del graco di x =
r y
2
o di x =
r y
2
a seconda che x
0
> 0 (e allora A `e
lintero semipiano delle x > 0) o x
0
< 0 (e allora A `e lintero semipiano delle x < 0). Invece
non esiste nessun intorno, per quanto piccolo, del punto (0,
r) la cui
intersezione con Z sia graco di una funzione della y.
28
Il precedente esempio illustra signicativamente il caso di una classe abbastanza generale di
equazioni F(x, y) = 0, tranne per un aspetto (non di poco conto). Come vedremo col prossimo
risultato, infatti, sotto opportune ipotesi esiste un intorno di una soluzione (x
0
, y
0
) dellequazione
in cui questultima denisce implicitamente una delle due variabili come funzione dellaltra, nel
senso che le soluzioni dellequazione che cadono nellintorno sono tutti e soli punti del graco di
tale funzione; di questultima per`o sar` a impossibile, in genere, dare unespressione esplicita come
invece si `e facilmente fatto nellesempio.
Teorema 9.1 (di Dini). Sia F di classe C
1
in un aperto di R
2
. Supponiamo che per un
(x
0
, y
0
) risulti F(x
0
, y
0
) = 0 e F
y
(x
0
, y
0
) = 0. Allora esistono , > 0 tali che in A =
]x
0
, x
0
+ []y
0
, y
0
+ [ (la F
y
si mantiene = 0 e) lequazione F(x, y) = 0 denisce
implicitamente una funzione y = f(x) continua, ed anzi di classe C
1
; la derivata di f si ottiene
derivando rispetto ad x lidentit`a F(x, f(x)) = 0, da cui F
x
(x, f(x))+F
y
(x, f(x))f
(x) = 0 e quindi
f
(x) =
F
x
(x, f(x))
F
y
(x, f(x))
per |x x
0
| < . (37)
DIM. Per ssare le idee supponiamo F
y
(x
0
, y
0
) > 0. Grazie alla continuit`a della F
y
in possiamo
applicarle il Teorema della permanenza del segno e trovare due numeri reali positivi a e con
la seguente propriet`a: per |x x
0
| a e |y y
0
| risulta F
y
(x, y) > 0, e di conseguenza ogni
funzione y F(x, y) ad x ssato `e crescente. Poiche F(x
0
, y
0
) = 0, questo implica F(x
0
, y
0
) < 0
e F(x
0
, y
0
+ ) > 0. Applichiamo di nuovo il Teorema della permanenza del segno, questa volta
alle due funzioni x F(x, u
0
) e x F(x, y
0
+ ): se =
()
= F
x
(x+h, f(x) +(f(x+h) f(x)))h+F
y
(x+h, f(x) +(f(x+h) f(x)))(f(x+h) f(x)).
8
Naturalmente qui anche lintervallo chiuso andrebbe bene. Per` o quando poi si passer` a dalla variabile scalare x
ad una vettoriale far` a comodo limitare questultima ad un aperto, in modo di poterle associare senza dicolt` a la
nozione di regolarit` a C
1
che nei chiusi diventa delicata se le variabili sono pi` u di una.
29
Il primo membro di questa identit`a `e nullo, e dividendo per F
y
(x+h, f(x) +(f(x+h) f(x)))
m = min
A
F
y
> 0, otteniamo
f(x +h) f(x) =
F
x
(x + h, f(x) + (f(x +h) f(x)))
F
y
(x + h, f(x) + (f(x +h) f(x)))
h. (39)
Il secondo membro si maggiora in modulo con M|h|/m dove M = max
A
|F
x
|, e questo mostra la
continuit`a di f nel punto x. Grazie ad essa la frazione nel secondo membro `e il rapporto di due
funzioni continue di h ] k, k[. Dividiamo entrambi i membri della (39) per h = 0: otteniamo
f(x +h) f(x)
h
=
F
x
(x + h, f(x) + (f(x +h) f(x)))
F
y
(x + h, f(x) + (f(x +h) f(x)))
e quindi la derivabilit`a di f facendo tendere h a 0.
Osservazione 9.2. Come abbiamo gi`a fatto presente, in generale non possiamo sperare di riuscire
ad esplicitare la f(x) ottenuta grazie al Teorema di Dini. E questo fa s` che tanto meno possiamo
servirci della (41) per il calcolo di f
(x) =
F
2
y
F
xx
2F
x
F
y
F
xy
+F
2
x
F
yy
F
3
y
.
Tutte le funzioni del secondo membro sono calcolate in (x, f(x)), per cui `e dato il loro valore per
x
0
= 0: adesso disponiamo dei valori non solo di f(x
0
) e di f
(x
0
), ma anche di f
(x
0
). Cos`
procedendo (beninteso nei limiti dellumanamente, e anche numericamente, possibile) possiamo
pensare di arrivare a dare alla f un buono sviluppo di Taylor di punto iniziale x
0
.
(x
0
)(x x
0
)
ovvero
y y
0
=
F
x
(x
0
, y
0
)
F
y
(x
0
, y
0
)
(x x
0
)
e quindi
F
x
(x
0
, y
0
)(x x
0
) +F
y
(x
0
, y
0
)(y y
0
) = 0. (40)
30
Per ottenere lequazione (40) della retta tangente in (x
0
, y
0
) alla curva F = 0 abbiamo utilizzato
il Teorema di Dini sotto lipotesi F
y
(x
0
, y
0
) = 0. Per`o saremmo arrivati allo stesso risultato sotto
lipotesi F
x
(x
0
, y
0
) = 0. Dunque possiamo concludere che ogni punto (x
0
, y
0
) di in cui F si
annulla e il gradiente
9
(F
x
, F
y
) = F non `e il vettore nullo ha un intorno nel quale lequazione
F = 0 denisce una curva regolare con retta tangente (al sostegno) in (x
0
, y
0
) data dallequazione
(40) o, ci`o che `e lo stesso, con retta normale di direzione F(x
0
, y
0
).
Il Teorema di Dini per le funzioni scalari di 2 variabili si estende con ovvie modiche alle funzioni
di un qualunque numero di variabili. Per le funzioni di 3 variabili, ad esempio, abbiamo il
Teorema 9.2. Sia F di classe C
1
in un aperto di R
3
. Supponiamo che per un (x
0
, y
0
, z
0
)
risulti F(x
0
, y
0
, z
0
) = 0 e F
z
(x
0
, y
0
, z
0
) = 0. Allora esiste un aperto A = A
0
]z
0
, z
0
+ [
, con A
0
aperto di R
2
, in cui (la F
z
si mantiene = 0 e) lequazione F(x, y, z) = 0 denisce
implicitamente una funzione z = f(x, y) di classe C
1
; le derivate di f si ottengono derivando
rispetto ad x e y lidentit`a F(x, y, f(x, y)) = 0, da cui F
x
(x, y, f(x, y))+F
z
(x, y, f(x, y))f
x
(x, y) = 0,
F
y
(x, y, f(x, y)) +F
z
(x, y, f(x, y))f
y
(x, y) = 0, e quindi
f
x
(x, y) =
F
x
((x, y, f(x, y))
F
z
(x, y, f(x, y))
, f
y
(x, y) =
F
y
((x, y, f(x, y))
F
z
(x, y, f(x, y))
per (x, y) A
0
. (41)
Naturalmente questo teorema continua a valere con la variabile z sostituita dalla x o dalla y
nellipotesi che sia diversa da 0 la corrispondente derivata di F nel punto, eccetera.
Osservazione 9.4. Occupiamoci dellequazione F(x, y, z) = 0. Se F appartiene a C
1
() con
aperto di R
3
e in un punto (x
0
, y
0
, z
0
) di si ha F(x
0
, y
0
, z
0
) = 0, F
z
(x
0
, y
0
, z
0
) = 0, il Teorema
9.2 con N = 2 aerma che esiste un intorno di (x
0
, y
0
, z
0
) in cui linsieme di livello F = 0 coincide
col graco di una funzione z = f(x, y) di classe C
1
, cio`e con una supercie dotata in (x
0
, y
0
, z
0
) di
piano tangente di equazione
z z
0
= f
x
(x
0
, y
0
)(x x
0
) +f
y
(x
0
, y
0
)(y y
0
)
ovvero
z z
0
=
F
x
(x
0
, y
0
, z
0
)
F
z
(x
0
, y
0
, z
0
)
(x x
0
)
F
y
(x
0
, y
0
, z
0
)
F
z
(x
0
, y
0
, z
0
)
(y y
0
)
e quindi
F
x
(x
0
, y
0
, z
0
)(x x
0
) +F
y
(x
0
, y
0
, z
0
)(y y
0
) +F
z
(x
0
, y
0
, z
0
)(z z
0
) = 0. (42)
Per ottenere lequazione (42) del piano tangente in (x
0
, y
0
, z
0
) alla supercie F = 0 abbiamo
utilizzato il Teorema di Dini sotto lipotesi F
z
(x
0
, y
0
, z
0
) = 0. Per`o saremmo arrivati allo stesso
risultato sotto lipotesi F
x
(x
0
, y
0
, z
0
) = 0 o lipotesi F
y
(x
0
, y
0
, z
0
) = 0. Possiamo dunque aermare
che ogni punto (x
0
, y
0
, z
0
) di in cui F si annulla e F non `e il vettore nullo ha un intorno nel
quale lequazione F = 0 denisce una supercie con piano tangente (al sostegno) in (x
0
, y
0
, z
0
) dato
dallequazione (42) o, ci`o che `e lo stesso, con retta normale di direzione F(x
0
, y
0
, z
0
).
9
Ricordiamo che il gradiente di una funzione u di classe C
1
in un aperto del piano ha, in ogni punto in cui non si
annulla, la direzione e il verso di massima crescita di u. Infatti la derivata in (x
0
, y
0
) di u lungo una direzione (, ),
2
+
2
= 1, cio`e
(t) = du(x
0
+t, y
0
+t)/dt calcolata in t = 0, vale, grazie alla disuguaglianza di CauchySchwarz,
(0) = u
x
(x
0
, y
0
) + u
y
(x
0
, y
0
)
u
x
(x
0
, y
0
)
2
+ u
y
(x
0
, y
0
)
2
col segno = se e solo se (, ) = u(x
0
, y
0
)/u(x
0
, y
0
).
31
10 Il Teorema di Dini per sistemi
Il Teorema di Dini si estende ai sistemi di P equazioni in P + Q variabili. Qui ci occupiamo di
P = 2 e Q = 1, cominciando dal semplice caso lineare
x +b
y +c
z +d
= 0
(43)
delle equazioni di due piani. Se i due piani sono paralleli, ovvero la matrice jacobiana
(F, G)
(x, y, z)
=
F
x
F
y
F
z
G
x
G
y
G
z
a b c
a
ha rango 1, la loro intersezione o `e vuota o coincide con entrambi. Supponiamo che il rango sia 2,
diciamo con
det
(F, G)
(y, z)
= det
F
y
F
z
G
y
G
z
= det
b c
b
= 0 (44)
per ssare le idee. Le soluzioni di (43) sono allora tutti e soli i punti di una retta, e possiamo
risolvere il sistema (44) rispetto a y e z (come funzioni di x, ovviamente). Procedendo con lalgebra
lineare otteniamo y = f(x) e z = g(x) da
f(x)
g(x)
(F, G)
(y, z)
ax +d
a
x +d
.
Ma possiamo anche ricorrere alle elementari tecniche di sostituzioni successive. Dalla prima delle
equazioni (43), supponendo (non `e restrittivo) c = 0 ricaviamo z = (ax by d)/c; sostituendo
nella seconda equazione otteniamo
a
x +b
y +
c
(ax by d)
c
+d
= 0
da cui
b
bc
y +
ac
x +d
d
c
= 0.
Grazie allipotesi (44) il coeciente di y in questa equazione `e diverso da 0, per cui possiamo
scrivere la y come funzione di x e poi, sostituendola nella precedente espressione della z, ottenere
anche questultima come funzione di x. A questo punto non abbiamo bisogno di esplicitare i calcoli
rimanenti. Quello che interessa `e vedere come le sostituzioni successive permettano di abbordare
lo studio di un pi` u generale sistema di 2 equazioni scalari in 3 variabili
F(x, y, z) = 0
G(x, y, z) = 0
(45)
indicando con (x
0
, y
0
, z
0
) una sua soluzione. Abbiamo bisogno di ipotesi che consentano di operare
i seguenti passaggi:
mostrare, servendosi del Teorema 9.2, che in un opportuno intorno (tridimensionale) di
(x
0
, y
0
, z
0
) la prima delle (45) denisce implicitamente una funzione z = (x, y) di classe
C
1
, con (x
0
, y
0
) = z
0
;
32
mostrare, servendosi del Teorema 9.1, che in un opportuno intorno (bidimensionale) di (x
0
, y
0
)
lequazione (x, y) = G(x, y, (x, y)) = 0 denisce implicitamente una funzione y = f(x) di
classe C
1
, con f(x
0
) = y
0
.
Arrivati qui ci basta porre g(x) = (x, f(x)) per vericare che in un opportuno intorno (tridimen-
sionale) di (x
0
, y
0
, z
0
) il sistema (45) denisce implicitamente due funzioni scalari
y = f(x), z = g(x)
di classe C
1
; derivando rispetto ad x le identit` a
F(x, f(x), g(x)) = 0, G(x, f(x), g(x)) = 0
si ottiene il sistema di 2 equazioni
F
x
(x, f(x), g(x)) +F
y
(x, f(x), g(x))f
(x) +F
z
(x, f(x), g(x))g
(x) = 0
G
x
(x, f(x), g(x)) +G
y
(x, f(x), g(x))f
(x) +G
z
(x, f(x), g(x))g
(x) = 0
da cui si ricavano le derivate di f e g:
(F, G)
(y, z)
F
x
G
x
(46)
con largomento delle funzioni uguale a x nel primo membro ed a (x, f(x), g(x)) nel secondo.
Lipotesi che consente di eettuare i passaggi richiesti `e la trasposizione al caso generale della
(44):
det
(F, G)
(y, z)
(x
0
, y
0
, z
0
) = det
F
y
(x
0
, y
0
, z
0
) F
z
(x
0
, y
0
, z
0
)
G
y
(x
0
, y
0
, z
0
) G
z
(x
0
, y
0
, z
0
)
= 0. (47)
Infatti la (47) implica innanzitutto che in (x
0
, y
0
, z
0
) una almeno delle derivate F
y
, F
z
sia diversa
da 0, e non `e restrittivo supporre che si tratti della F
z
. Dunque il Teorema 9.2 pu`o essere applicato
e fornisce lesistenza della , che inoltre sappiamo derivare, in particolare rispetto ad y:
y
=
F
y
F
z
.
Calcoliamo
y
= G
y
+G
z
y
= G
y
G
z
F
y
F
z
=
1
F
z
det
(F, G)
(y, z)
.
Grazie di nuovo alla (47), otteniamo
y
(x
0
, y
0
) = 0 e possiamo applicare il Teorema 9.1 per ottenere
lesistenza della f. Dunque:
Teorema 10.1. Siano F, G di classe C
1
in un aperto di R
3
. Supponiamo che per un (x
0
, y
0
, z
0
)
risulti F(x
0
, y
0
, z
0
) = G(x
0
, y
0
, z
0
) = 0 e che valga la (47). Allora esiste un intorno aperto
tridimensionale A di (x
0
, y
0
, z
0
) in cui (il determinante di (F, G)/(y, z) si mantiene = 0 e)
il sistema (45) denisce implicitamente due funzioni y = f(x), z = g(x) di classe C
1
, con f
e g
F
u
(x
0
, y
0
, u
0
, v
0
) F
v
(x
0
, y
0
, u
0
, v
0
)
G
u
(x
0
, y
0
, u
0
, v
0
) G
v
(x
0
, y
0
, u
0
, v
0
)
= 0.
Allora esiste un intorno aperto quadridimensionale A di (x
0
, y
0
, u
0
, v
0
) in cui (il determinante
di (F, G)/(u, v) si mantiene = 0 e) il sistema
F(x, y, u, v) = 0
G(x, y, u, v) = 0
(48)
denisce implicitamente due funzioni u = f(x, y), v = g(x, y) di classe C
1
, con f e g dati da
f
x
f
y
g
x
g
y
F
u
F
v
G
u
G
v
F
x
F
y
G
x
G
y
con largomento delle funzioni uguale a (x, y) nel primo membro ed a (x, y, f(x, y), g(x, y)) nel
secondo.
Per illustrare unimportantissima conseguenza del Teorema 10.2 ricordiamo innanzitutto che su
un aperto B di R
N
un dieomorsmo (= applicazione iniettiva B R
N
di classe C
1
con inversa di
classe C
1
) deve avere matrice jacobiana invertibile su tutto B. Possiamo formulare la congettura
che, viceversa, ogni applicazione B R
N
di classe C
1
con matrice jacobiana invertibile su tutto B
sia un dieomorsmo di B? In questi termini ovviamente no: gi`a per N = 1 si danno facilmente
dei controesempi quando B non `e un intervallo. Per`o `e vero che, se B `e un intervallo di R, una
funzione reale di classe C
1
con derivata sempre diversa da 0, quindi sempre positiva o sempre
negativa, `e dotata in tutto B di funzione inversa di classe C
1
. Ebbene, questo risultato globale non
si estende alle dimensioni N > 1, a prescindere dalla regolarit`a (ad esempio la convessit`a) che si
pu`o pensare di imporre a B: basta pensare alla funzione (r, ) (r cos , r sin ), che ha in ogni
punto (r, ) B =]0, [R matrice jacobiana di determinante r > 0 e quindi invertibile, ma per
ogni ssato r `e periodica in e dunque non iniettiva su tutto il suo dominio B.
Il risultato generale che vale in dimensione N maggiore di 1 `e di natura locale, e per N = 2 segue
dal Teorema 10.2, di cui riprendiamo le notazioni. Infatti invertire unapplicazione : B R
2
,
di componenti x = (u, v) e y = (u, v), signica ottenere una coppia di funzioni u = (x, y),
v = (x, y) denite implicitamente dal sistema (48) con A = R
2
B e F(x, y, u, v) = x (u, v),
G(x, y, u, v) = y (u, v). Ma noi abbiamo visto che vicino ad un punto (x
0
, y
0
, u
0
, v
0
) con
x
0
= (u
0
, v
0
) e y
0
= (u
0
, v
0
) questo `e possibile se nel punto lo jacobiano di , cio`e il determinante
della matrice jacobiana (F, G)/(u, v), `e diverso da 0. Abbiamo cos` dimostrato per N = 2 un
risultato, che enunciamo senza dimostrarlo in tale generalit`a, per N qualunque:
Teorema 10.3. Siano dati un aperto B di R
N
ed una funzione : B R
N
di classe C
1
con
jacobiano diverso da 0 in un punto di B. Allora B contiene un intorno aperto del punto su cui la
restrizione di `e un dieomorsmo.
Vale la pena di insistere: se il determinante jacobiano di `e diverso da 0 in tutto B possiamo
concludere che vicino ad ogni punto di U la restrizione di `e un dieomorsmo, non che `e un
dieomorsmo di tutto B!
Il Teorema 10.3 per N = 2 consente di mostrare che, intorno ad ogni suo punto, il sostegno di
una supercie regolare coincide col graco di una funzione C
1
di due variabili. Per dimostrarlo,
34
prendiamo unapplicazione B (u, v) ((u, v), (u, v), (u, v)), B aperto di R
2
, di classe C
1
con (
u
,
u
,
u
) (
v
,
v
,
v
) = (0, 0, 0) in B. Sia (u
0
, v
0
) un punto di B dove, ad esempio,
v
v
u
= 0, e sia (x
0
, y
0
) = ((u
0
, v
0
), (u
0
, v
0
)). Allora B contiene un intorno aperto di
(x
0
, y
0
) su cui lapplicazione x = (u, v), y = (u, v) `e dotata di inversa u = (x, y), v = (x, y) di
classe C
1
. Ne segue che il sostegno della supercie (u, v) ((u, v), (u, v), (u, v)) coincide col
graco della funzione (x, y) ((x, y), (x, y)).
A questo punto `e opportuno fare un sommario riepilogo delle nostre conoscenze sulle curve in
R
2
e le superci in R
3
.
Sia C R
2
. Allora `e equivalente richiedere che, vicino ad un suo punto, C sia il graco di
una funzione C
1
di una variabile o il sostegno di una curva regolare o linsieme di livello di una
funzione C
1
di 2 variabili con gradiente = (0, 0) nel punto.
Sia S R
3
. Allora `e equivalente richiedere che, vicino ad un suo punto, S sia il graco di
una funzione C
1
di 2 variabili o il sostegno di una supercie regolare o linsieme di livello di una
funzione C
1
di 3 variabili con gradiente = (0, 0, 0) nel punto.
11 Massimi e minimi vincolati
Quando A `e un aperto di R
2
la ricerca dei punti iin cui una f C
1
(A) pu`o assumere valori estremi
cio`e massimi o minimi locali va ristretta innanzitutto ai punti stazionari, in cui il gradiente
f `e nullo.
10
E se si `e interessati agli estremi di f non in tutto A, bens` in un suo sottoinsieme chiuso E
(ad esempio sotto lulteriore ipotesi che E sia limitato, per cui ogni funzione in C
0
(E) `e senzaltro
dotata di massimo e minimo assoluti grazie al teorema di Weierstrass)? Il procedimento appena
visto in A rimane valido nellinterno (se non `e vuoto) di E, ma diventa inapplicabile sulla sua
frontiera. L` bisogna, quando `e possibile, ricorrere alle altre tecniche che costituiscono largomento
di questa sezione.
Indichiamo dunque con S una curva contenuta in A (quale potrebbe ad esempio essere una
porzione della frontiera dellinsieme E di cui si `e precedentemente parlato). Con lutilizzo del
termine tra virgolette intendiamo dire che i punti (x, y) S costituiscono:
(i) o limmagine di un intervallo I in una rappresentazione parametrica t ((t), (t)) di classe
C
1
con
(t)
2
+
(t)
2
> 0,
(ii) o il graco di una funzione y = (x) oppure x = (y) di classe C
1
in un intervallo I,
(iii) o un sottoinsieme S dellinsieme di livello F(x, y) = 0 di una F C
1
(A) con F = 0 in S.
Nei casi (i) e (ii) la ricerca degli estremanti di una f C
1
(A) sul vincolo S si restringe alla
ricerca dei punti stazionari di funzioni di una variabile. Come `e facile vedere, infatti, richiedere
che un punto (x, y) S sia, per ssare le idee, un massimo locale di f|
S
, cio`e che tutti i punti di
S (non di A!) distanti da (x, y) meno di un opportuno > 0 soddisno f(x, y) f(x, y), signica
richiedere:
10
Ricordiamo che se f C
2
(A) la ricerca va ulteriormente ristretta, escludendo quei punti stazionari in cui la
matrice hessiana
f
xx
f
xy
f
xy
f
yy
(t) = f
x
(x, y)
(t) +f
y
(x, y)
(t) = 0
se t `e interno ad I;
o (primo sottocaso di (ii)) che x I con (x) = y sia un massimo locale di g(x) = f(x, (x)),
e quindi
g
(x) = f
x
(x, y) +f
y
(x, y)
(x) = 0 (49)
se x `e interno ad I;
o (secondo sottocaso di (ii)) che y I con (y) = x sia un massimo locale di g(y) = f((y), y),
e quindi
g
(y) = f
x
(x, y)
(y) +f
y
(x, y) = 0 (50)
se y `e interno ad I.
Esempio 11.1. In A = R
2
la regolarissima funzione f(x, y) = x + y
2
`e priva di punti stazionari
perche f
x
non si annulla mai. Dunque non esistono punti di estremo relativo di f in A. Per` o la
restrizione f|
E
di f ad un qualunque sottoinsieme chiuso e limitato E del piano `e dotata di massimo
e minimo assoluti. Prendiamo
E = {(x, y) R
2
| y x y, x
2
+y
2
1}.
Per quello che abbiamo appena visto, gli estremi di f|
E
non possono cadere allinterno di E.
Scriviamo la frontiera di E come unione dei tre insiemi
S
1
= {(x, y) E | x
2
+y
2
= 1}, S
2
= {(x, y) E | y = x}, S
3
= {(x, y) E | y = x}.
S
1
`e immagine dellintervallo [/4, 3/4] nella rappresentazione parametrica (cos , sin ).
Per trovare gli estremi di f(cos , sin ) = cos +sin
2
nellintervallo cerchiamo innanzitutto
i suoi punti stazionari in ]/4, 3/4[: devessere d(cos + sin
2
)/d = sin + 2 sin cos = 0,
cio`e cos = 1/2, e tra i valori di per i quali questo vale c`e /3 ]/4, 3/4[. Calcoliamo:
cos /3 + sin
2
/3 = 1/2 + 3/4 = 5/4. Negli estremi: cos(/4) + sin
2
(/4) = (
2 + 1)/2,
cos /4 + sin
2
/4 = (
2+1)/2
e (
2 + 1)/2.
Possiamo anche vedere S
1
come graco di y =
1 x
2
per x [1/
2, 1/
2]. Allinterno
di questo intervallo cerchiamo i punti stazionari di f(x,
1 x
2
) = x + 1 x
2
: si deve annullare
d(x +1 x
2
)/dx = 1 2x, dal che x = 1/2, e l` abbiamo f(1/2,
2 + 1 1/2 = 1/
2 + 1/2 = (
2 + 1 1/2 =
1/
2 + 1/2 = (
2 + 1)/2.
Conclusione: il minimo e il massimo di f in E sono rispettivamente (
2 +1)/2 e (
2 +1)/2.
36
e nella seconda la
(x) =
F
x
(x, y)
F
y
(x, y)
,
(x) =
F
y
(x, y)
F
x
(x, y)
.
Le (49) e (50) diventano cos` rispettivamente
f
x
(x, y) f
y
(x, y)
F
x
(x, y)
F
y
(x, y)
= 0, f
x
(x, y)
F
y
(x, y)
F
x
(x, y)
f
y
(x, y) = 0
a seconda che nel punto (ignoto!) risulti F
y
(x, y) = 0 o F
x
(x, y) = 0, e quindi comunque
f
x
(x, y)F
y
(x, y) f
y
(x, y)F
x
(x, y) = 0.
Questa `e unequazione algebrica nelle sole incognite x e y che ci interessano, e richiede che il determi-
nante jacobiano di f e F in (x, y) si annulli, dunque abbia tanto le righe che le colonne linearmente
dipendenti. Imponiamo la dipendenza lineare delle colonne, che sono f(x, y) e F(x, y). Siccome
abbiamo supposto che il secondo di questi vettori non `e nullo, deve esistere un moltiplicatore di
Lagrange R, che non interessa calcolare, tale che
f(x, y) + F(x, y) = (0, 0).
Riassumiamo:
Teorema 11.1. Siano A un aperto di R
2
e f, F C
1
(A). Se in un sottoinsieme S dellinsieme di
livello F = 0 il gradiente di F non `e mai nullo, gli eventuali punti di minimo e di massimo locali
per la restrizione f|
S
di f ad S vanno cercati tra le soluzioni (x, y) S del sistema
_
_
_
F(x, y) = 0
f
x
(x, y) + F
x
(x, y) = 0
f
y
(x, y) + F
y
(x, y) = 0
per unopportuna costante .
Esempio 11.2. Cerchiamo il minimo e massimo assoluti di f(x, y) = xy nellinsieme E dei punti
(x, y) R
2
con x
2
xy + y
2
1, che `e chiuso e limitato dal momento che `e costituito dai punti
che cadono su un ellisse o al suo interno. Siccome in tutto A = R
2
lunico punto stazionario di f `e
lorigine, e si vede subito che si tratta di un punto di sella, resta solo da applicare i moltiplicatori
sulla frontiera S di E, che `e tutto linsieme di livello F(x, y) = x
2
xy +y
2
1 = 0. Imponiamo
y + 2x y = 0, x + 2y x = 0, x
2
xy +y
2
= 1.
Sommando le prime due equazioni otteniamo (1 + )(x +y) = 0, e quindi:
o = 1, per cui x = y e la terza equazione d`a i due punti (1, 1), (1, 1) dove f vale 1;
oppure x = y e la terza equazione d`a i due punti (1/
3, 1/
3), (1/
3, 1/
3) dove f vale
1/3.
Da qui segue che il massimo `e 1, il minimo `e 1/3.
37
_
F(x, y, z) = 0
f
x
(x, y, z) + F
x
(x, y, z) = 0
f
y
(x, y, z) + F
y
(x, y, z) = 0
f
z
(x, y, z) + F
z
(x, y, z) = 0
(51)
per unopportuna costante .
Esempio 11.3. Siano f(x, y, z) = xyz, F(x, y, z) = xy +yz +zx 1 e
S = {(x, y, z) R
3
| x 0, y 0, z 0, F(x, y, z) = 0}.
La restrizione di f ad S `e sempre 0 ed in certi punti di S (ad esempio quelli con z = 0 e
xy = 1) vale 0. Dunque questo `e il suo minimo assoluto. Daltra parte, nei punti di S con z > 0
si ha 0 x 1/z, 0 y 1/z e quindi 0 xyz 1/z. Ne segue che f(x, y, z) 0 quando
(x, y, z) S, x
2
+ y
2
+ z
2
(come si vede cominciando dalle semirette contenute in S con
punto iniziale nellorigine). Dunque, benche il Teorema di Weierstrass non si applichi allinsieme
illimitato S, la f|
S
`e dotata anche di massimo assoluto. Cerchiamolo coi moltiplicatori. Il sistema
(51) `e adesso
_
_
xy +yz +zx = 1
yz + (y +z) = 0
xz + (x +z) = 0
xy + (x +y) = 0.
Dalle ultime 3 equazioni ricaviamo
_
_
_
xyz + x(y +z) = 0
xyz + y(x +z) = 0
xyz + z(x +y) = 0
.
Dunque x(y +z) = y(x +z) = z(x +y), ovvero xy = yz = xz, ovvero ancora x = y = z =
1/
3, e inne max f|
S
= f(1/
3, 1/
3, 1/
3) = 1/(3
_
F(x, y, z) = 0
f
x
(x, y, z) + F
x
(x, y, z) +G
x
(x, y, z) = 0
f
y
(x, y, z) + F
y
(x, y, z) +G
y
(x, y, z) = 0
f
z
(x, y, z) + F
z
(x, y, z) +G
z
(x, y, z) = 0
per opportune costanti , .
38
12 Un primo rapido approccio agli integrali doppi
In questa sezione e nelle prossime cinque, quando parleremo di un rettangolo S sottintenderemo:
compatto, salvo esplicita indicazione in altro senso; con S
h,k
sup
S
hk
f
A(S
hk
)
o pi` u concisamente
SF()
sup
S
A(S)
e
h,k
inf
S
hk
f
A(S
hk
)
o pi` u concisamente
SF()
inf
S
A(S).
(Qui, come nel seguito,
h,k
sta per
h=1,...,m, k=1,...,n
.)
Si dimostrer`a (con la (67)) che
SF()
sup
S
A(S)
TF(
inf
T
A(T)
per ogni scelta delle partizioni e
SF()
sup
S
A(S)
TF(
inf
T
SF()
sup
S
A(S) = sup
SF()
inf
S
A(S) (53)
39
diciamo che f `e integrabile (secondo Riemann) in R e chiamiamo integrale (doppio di
Riemann) di f in R il valore (53), denotato con
R
f(x, y) dxdy oppure
R
f(x, y) dxdy oppure
R
f dxdy.
Ecco un classico esempio di funzione limitata non integrabile secondo Riemann.
Esempio 12.1. Indichiamo con f la funzione di Dirichlet 1
(Q[0,1])
2. Siccome
SF()
sup
S
A(S) = 1,
SF()
inf
S
A(S) = 0
quale che sia la partizione di R = [0, 1]
2
, la (52) con 0 < < 1 non `e soddisfatta.
Invece:
Lemma 12.1. Ogni f C
0
(R) `e integrabile in R, e il suo integrale doppio soddisfa
R
f(x, y) dxdy =
b
a
dx
d
c
f(x, y) dy =
d
c
dy
b
a
f(x, y) dx. (54)
DIM. Dato arbitrariamente un > 0, sia =
, y
), (x
, y
)
di R distanti meno di risulti |f(x
, y
) f(x
, y
SF()
sup
S
f inf
S
A(S) =
SF()
max
S
f min
S
f
d
c
f(x, y)dy.
Su [a, b] la funzione x F(x) `e continua (cfr. il Teorema 6.1), dunque integrabile. Fissiamo
arbitrariamente una partizione di R, il che `e come dire una partizione x
0
= a < x
1
< < x
m
= b
di [a, b] ed una partizione y
0
= c < y
1
< < y
n
= d di [c, d]. Grazie alladditivit`a degli integrali
di una variabile rispetto agli intervalli di integrazione valgono le identit`a
b
a
F(x) dx =
m
h=1
x
h
x
h1
F(x) dx e F(x) =
n
k=1
y
k
y
k1
f(x, y) dy,
per cui
b
a
d
c
f(x, y) dy
dx =
m
h=1
x
h
x
h1
k=1
y
k
y
k1
f(x, y) dy
dx
=
h,k
x
h
x
h1
y
k
y
k1
f(x, y) dy
dx :
40
abbiamo potuto portare la sommatoria su k fuori dallintegrale in dx grazie alla linearit`a di
questultimo. Daltra parte, applicando la positivit`a degli integrali in dy ed in dx otteniamo
facilmente
inf
]x
h1
,x
h
[]y
k1
,y
k
[
f
(x
h
x
h1
)(y
k
y
k1
)
x
h
x
h1
y
k
y
k1
f(x, y) dy
dx
sup
]x
h1
,x
h
[]y
k1
,y
k
[
f
(x
h
x
h1
)(y
k
y
k1
)
e quindi anche, sommando su h e k,
h,k
inf
S
hk
f
A(S
hk
)
b
a
d
c
f(x, y) dy
dx
h,k
sup
S
hk
f
A(S
hk
).
Siccome f `e integrabile su R, il suo integrale `e lunico numero reale che soddisfa le stesse
disuguaglianze del secondo membro qui sopra al variare di , per cui vale lidentit`a
R
f(x, y) dxdy =
b
a
d
c
f(x, y) dy
dx
e quindi la prima delle (54). La seconda si dimostra in modo del tutto analogo.
R
1
E
dxdy
la sua misura (bidimensionale), o area, di PeanoJordan. (Si noti che queste nozioni sono
indipendenti dalla scelta del particolare rettangolo R E.)
41
Richiedere che E sia PJmisurabile equivale dunque a richiedere che, dato > 0, si possano
trovare un R E ed una sua partizione tali che
SF()
sup
S
1
E
inf
S
1
E
A(S) < ,
ovvero
SF()
S
E=
A(S)
SF()
S
E
A(S) <
ovvero ancora
inf
SF()
S
E=
A(S) = sup
SF()
S
E
A(S).
In particolare, F R
2
`e trascurabile secondo PeanoJordan o pi` u brevemente PJtrascurabile
(in R
2
) se `e PJmisurabile con A(F) = 0, ovvero se, > 0, si possano trovare un R F ed una
sua partizione tali che
SF()
sup
S
1
F
<
ovvero
SF()
S
F=
A(S) < (55)
ovvero ancora
inf
SF()
S
F=
A(S) = 0 : (56)
va infatti esclusa leventualit`a che per qualche partizione e per qualche S
1
F() possa aversi
inf
S
1
1
F
= 1, perche cio implicherebbe
0 = A(F) =
R
1
F
dxdy A(S
1
) > 0.
Osservazione 13.1. Utilizzando la (55) si vede subito che lunione di un numero nito di insiemi
PJtrascurabili `e anchessa PJtrascurabile.
SF()
sup
S
1
E
inf
S
1
E
A(S) =
SF()
sup
S
1
E
A(S). (57)
Infatti per ogni S F() si verica uno ed uno solo dei seguenti tre casi:
S
E, S
E = S
E = , S
E = =S
E =
42
dal momento che S
`e aperto. Ora,
sup
S
1
E
= inf
S
1
E
= 1, sup
S
1
E
= 0 per S
E,
sup
S
1
E
= inf
S
1
E
= sup
S
1
E
= 0 per S
E = S
E = ,
sup
S
1
E
= sup
S
1
E
= 1, inf
S
1
E
= 0 per S
E = =S
E = .
Dunque `e equivalente richiedere che per ogni > 0 si possano trovare R e tali che risulti < il
primo membro della (57) (PJmisurabilit`a di E) oppure il secondo (PJtrascurabilit`a di E).
Osservazione 13.2. Grazie al precedente teorema ed allOsservazione 13.1 si constata subito che
lunione e lintersezione di un numero nito di insiemi PJmisurabile sono PJmisurabili.
k=1
max
[x
k1
,x
k
]
min
[x
k1
,x
k
]
(x
k
x
k1
) <
A(R)
.
Ma gli addendi della somma qui sopra sono le aree A(Q
k
) dei rettangoli
Q
k
= [x
k1
, x
k
]
min
[x
k1
,x
k
]
, max
[x
k1
,x
k
]
,
la cui unione ricopre E e verica
k
A(Q
k
) < . A questo punto si trova una partizione di R
tale che ogni Q
k
sia unione di sottorettangoli di F(). Siccome la somma delle aree A(S) degli
S F() contenuti in Q
k
`e uguale a A(Q
k
), risulta
SF()
sup
S
1
E
inf
S
1
E
A(S)
SF()
max
S
1
E
A(S)
SF()
S
k
Q
k
A(S) =
k
A(Q
k
) < . (58)
Dunque (cfr. la (55)) E `e PJtrascurabile.
43
Siano adesso date due funzioni continue , su un intervallo compatto [a, b] di R con la propriet`a
in [a, b].
Linsieme
D = {(x, y) R
2
| a x b, (x) y (x)} (59)
`e un dominio normale rispetto allasse x, linsieme
D
= {(x, y) R
2
| a y b , (y) x (y)} (60)
un dominio normale rispetto allasse y.
Ebbene:
Teorema 13.2. Sia data una f continua sul dominio normale D. Allora la funzione
f uguale ad
f in D ed a 0 fuori `e integrabile su R; il suo integrale doppio, che indichiamo con
D
f(x, y) dxdy oppure
D
f(x, y) dxdy oppure
D
f dxdy,
soddisfa
D
f(x, y) dxdy =
b
a
dx
(x)
(x)
f(x, y) dy. (61)
DIM. Innanzitutto, ssato un > 0, determiniamo un =
, y
), (x
, y
, y
) f(x
, y
k
A(Q
k
) < .
Sia E il complementare in R di
k
Q
k
. Costruiamo una partizione di R che soddis i seguenti
requisiti:
ogni sottorettangolo S F() abbia diametro minore di ,
ogni Q
k
sia unione di sottorettangoli di .
Dunque
A(Q
k
) =
SF()
SQ
k
A(S)
e quindi
SF()
S
k
Q
k
A(S) =
k
A(Q
k
) < A(R)
mentre
f verica |
f(x
, y
)
f(x
, y
)| < al variare di (x
, y
), (x
, y
) allinterno di qualunque
rettangolo S E, dal momento che E `e unione di rettangoli D in cui
f = f e di altri in cui
f = 0. Ne segue che
SF()
sup
S
f inf
S
A(S) =
SF()
S
k
Q
k
max
S
f min
S
A(S) +
SF()
SE
max
S
f min
S
A(S)
44
< 2 max
D
|f|
k
A(Q
k
) +
SF()
SE
A(S) <
2 max
D
|f| +A(R)
d
c
f(x, y)dy =
(x)
(x)
f(x, y) dy.
`e continua per il Teorema 6.3.
Il precedente teorema contiene i Lemmi 12.1 ((x) = a, (x) = b) e 13.1 ((x) = (x)). Esso
inoltre vale con D
f(x, y) dxdy =
b
a
dy
(y)
(y)
f(x, y) dx.
Osservazione 13.4. Sia dato un dominio normale D come in (59). Dal Teorema 13.2 con f = 1
D
segue che D `e PJmisurabile (conseguenza anche del Lemma (13.1)!), e che la sua area vale
b
a
(x) dx
b
a
(x) dx.
Ancora pi` u in particolare, consideriamo il caso di (x) identicamente nulla. D `e allora il sottograco
della funzione continua e non negativa (x), e lintegrale di questultima da a a b ha legittimamente
quel signicato di area che gli viene intuitivamente attribuito nelle considerazioni introduttive
sullaspetto geometrico dellintegrabilit`a in una variabile.
Passiamo allaspetto geometrico della condizione di integrabilit`a fornita dal Teorema 13.2 per
una generica funzione continua e non negativa f(x, y). Le sue somme integrali inferiori sono somme
di volumi (elementari!) A(S)(min
S
f) di parallelepipedi contenuti nel sottograco e privi di punti
interni comuni (siccome f 0, in ogni S F() non contenuto in D il minimo della
f `e 0), mentre
quelle superiori sono somme A(S) (max
S
f) di volumi di parallelepipedi la cui unione contiene il
sottograco di f. Ne segue che una buona denizione di volume del sottograco di f `e: lunico
elemento di separazione tra somme integrali superiori e inferiori, ovvero lintegrale della funzione.
Per avere poi una pi` u generale teoria della misura tridimensionale di solidi limitati si fa riferimento
alla teoria dellintegrale in tre variabili.
hk
=]x
h1
, x
h
[]y
k1
, y
k
[ dei
sottorettangoli S
hk
associati a qualche partizione di R; `e degenere se assume valori non nulli
solo su segmenti limitati verticali o orizzontali. Dunque una generica funzione a scala si scrive sotto
la forma
(x, y) =
h,k
hk
1
S
hk
(x, y) +
0
(x, y) (62)
con
hk
R e
0
degenere. In tale denizione pu`o essere sostituito da un suo qualunque
ranamento
: se, ad esempio,
si ottiene aggiungendo a i punti (x
1
, y
k
), k = 1, . . . , n,
con x
0
< x
1
< x
1
, risulta =
1k
sia nei sottorettangoli aperti ]x
0
, x
1
[]y
k1
, y
k
[ che negli
]x
1
, x
1
[]y
k1
, y
k
[. Inoltre R pu`o essere sostituito da un qualunque rettangolo che lo contenga.
Rientrano banalmente nella denizione i casi di funzioni a scala degeneri, cio`e nulle al di fuori
di un rettangolo degenere.
Sia unaltra funzione a scala, nulla al di fuori di un rettangolo R
di R
).
Dunque anche assume un valore costante in ciascun S
hk
, diciamo
(x, y) =
h,k
hk
1
S
hk
(x, y) +
0
(x, y) (63)
con
0
degenere. A questo punto si vede subito che la combinazione lineare a+b con a, b R `e
ancora una funzione a scala, che vale a
hk
+b
hk
in S
hk
.
Deniamo integrale (elementare) della data in (62) il numero
h,k
hk
A(S
hk
) .
In questa denizione la partizione pu`o essere sostituita da un suo qualunque ranamento
senza che venga alterato il valore del secondo membro: per convincersene basta tornare allesempio
di
dato un attimo fa ed osservare che
1k
(x
1
x
0
)(y
k
y
k1
) =
1k
(x
1
x
0
)(y
k
y
k1
) +
1k
(x
1
x
1
)(y
k
y
k1
) .
46
Lintegrale elementare gode di tutte le propriet`a che ci si aspetta da un buon integrale. Infatti
si vede subito, servendosi delle espressioni (62) e (63) di e , che `e positivo:
per
dal momento che la condizione si traduce nelle condizioni
hk
hk
e quindi
h,k
hk
A(S
hk
)
h,k
hk
A(S
hk
) .
Inoltre `e lineare:
(a +b) = a
+b
per a, b R
dal momento che
h,k
(a
hk
+b
hk
)A(S
hk
) = a
h,k
hk
A(S
hk
) +b
h,k
hk
A(S
hk
) .
Inne,
= 0 se `e degenere.
Introduciamo la notazione f L
c
col seguente signicato: f `e una funzione R
2
R limitata
ed a supporto compatto, dunque nulla al di fuori di un rettangolo R. La famiglia S
+
f
delle funzioni
semplici tali che f non `e vuota, e la quantit`a
f = inf
S
+
f
hk
, quindi
hk
sup
S
hk
f per h = 1, . . . , m e k = 1, . . . , n
verica anche
h,k
hk
A(S
hk
)
h,k
sup
S
hk
f
A(S
hk
). (64)
Siccome f(x, y) si scrive
h,k
f(x, y)1
S
hk
(x, y) +f(x, y)1
E
(x, y)
con E =
hk
S
hk
(unione di segmenti verticali e orizzontali), il secondo membro della (64) `e
lintegrale elementare della funzione semplice
(x, y) =
h,k
sup
S
hk
f
1
S
hk
(x, y) +
sup
E
f
1
E
(x, y)
(e dunque rimane inalterato se `e sostituita da un suo ranamento o R da un rettangolo che lo
contiene). Ma sta a sua volta in S
+
f
, e da qui si arriva a
f = inf
h,k
sup
S
hk
f
A(S
hk
)
47
o pi` u concisamente
f = inf
SF()
sup
S
A(S).
Si constata subito che sulle funzioni di L
c
lintegrale superiore `e positivo
g per f g
(dal momento che f g =S
+
f
S
+
g
), nonche subadditivo
(f +g)
f +
g (65)
(dal momento che la somma di un elemento di S
+
f
ed uno di S
+
g
sta in S
+
f+g
e lintegrale elementare
delle funzioni a scala `e lineare) e positivamente omogeneo
(af) = a
SF()
sup
S
A(S) = 1,
SF()
sup
S
(f)
A(S) = 0
quale che sia la partizione di R = [0, 1]
2
, e quindi
f +
(f) = 1 ,
con la presente scelta di f non valgono ne il segno uguale nella disuguaglianza debole della (65)
quando g = f, ne lidentit`a della (66) quando a = 1.
f =
(f)
per cui
(f) =
f.
Siccome
0 =
(f f)
f +
(f) =
f
48
vale sempre la disuguaglianza
f. (67)
Anche lintegrale inferiore `e positivamente omogeneo:
(af) = a
f per a [0, [ .
Inoltre `e superadditivo:
(f +g)
f +
g .
Si verica subito che
f = sup
SF()
inf
S
A(S).
Concludiamo questa sezione occupandoci del caso particolare f = 1
E
con E sottoinsieme
limitato di R
2
. Le quantit`a
A(E) =
1
E
= inf
SF()
sup
S
1
E
A(S) = inf
SF()
S
E=
A(S) ,
A(E) =
1
E
= sup
SF()
inf
S
1
E
A(S) = sup
SF()
S
E
A(S)
sono rispettivamente la misura esterna (bidimensionale) di PeanoJordan e la misura
interna (bidimensionale) di PeanoJordan di E. In particolare, E `e PJtrascurabile se
A(E) = 0.
15 Lintegrale doppio di Riemann e le sue propriet`a
Com`e evidente, ogni funzione a scala soddisfa
.
Per`o `e altrettanto evidente che lintegrale inferiore della funzione di Dirichlet `e nullo, mentre quello
superiore, come abbiamo visto nellEsempio 12.1, vale 1. Ci`o signica che, se f `e una generica
funzione della classe L
c
, la disuguaglianza (56) pu`o eettivamente venire soddisfatta o in senso
stretto o come identit`a. Supponiamo che si verichi il secondo caso:
f =
f (68)
ovvero
sup
= inf
S
+
f
49
ovvero ancora
sup
SF()
inf
S
A(S) = inf
SF()
sup
S
A(S) (69)
dove le sono partizioni di un rettangolo R al di fuori del quale f si annulla identicamente.
Allora diciamo che f `e integrabile secondo Riemann (in R
2
), scriviamo che f Riem(R
2
), e
chiamiamo integrale (doppio) di Riemann di f il comune valore in (68), che denotiamo con
R
2
f(x, y) dxdy oppure
R
2
f(x, y) dxdy oppure
R
2
f dxdy
o ancora, volendo essere particolarmente sbrigativi, con
SF()
sup
S
f inf
S
(af) =
(af) =
(af) = a
f . (71)
Ma allora
(af) =
(af) = a
f = a
f
e quindi
(af) =
(af) = a
f = a
f =
(af) .
Ne segue che anche af sta in Riem(R
2
), con
(af) =
(af) =
(af) = a
f
e da qui si ottiene subito lomogeneit`a dellintegrale di Riemann: la (71) vale per ogni a R.
Sia adesso data unaltra g Riem(R
2
). Siccome su Riem(R
2
) coincidono integrale superiore e
inferiore,
f +
g =
f +
(f +g)
(f +g)
f +
g =
f +
g .
Dunque lintegrale di Riemann `e additivo:
f, g Riem(R
2
) =f +g Riem(R
2
) con
(f +g) =
f +
g
e quindi, essendo anche omogeneo, `e lineare:
f, g Riem(R
2
) =af +bg Riem(R
2
) con
(af +bg) = a
f +b
g per a, b R.
50
Fissiamo adesso un > 0 e una tale che valga la (70). Facciamo variare le coppie di punti
(x
, y
), (x
, y
) interni ad un S F(). Da
|f(x
, y
)| |f(x
, y
)| |f(x
, y
) f(x
, y
)| sup
S
f inf
S
f
ricaviamo
sup
S
|f| inf
S
|f| sup
S
f inf
S
f
e grazie alla (70) otteniamo
SF()
sup
S
|f| inf
S
|f|
A(S) < .
Da qui concludiamo che |f| Riem(R
2
); grazie alla positivit`a dellintegrale di Riemann,
|f|.
Un procedimento analogo mostra che f, g Riem(R
2
) =fg Riem(R
2
). Infatti
f(x
, y
)g(x
, y
) f(x
, y
)g(x
, y
)
|f(x
, y
) f(x
, y
)||g(x
, y
)| + |g(x
, y
) g(x
, y
)||f(x
, y
)|
sup
S
f inf
S
sup
S
|g| +
sup
S
g inf
S
sup
S
|f|
e quindi
sup
S
(fg) inf
S
(fg) C
sup
S
f inf
S
f + sup
S
g inf
S
.
Osservazione 15.1. Ripercorrendo la costruzione dellintegrale di Riemann ci si accorge che appa-
rentemente essa viene a dipendere dalla scelta di un particolare riferimento cartesiano in R
2
: un bel
guaio se proprio cos` fosse, come si vede pensando al caso particolare delle misure di PeanoJordan
che perderebbero ogni signicato geometrico. Ma poi si riette sul punto di partenza, cio`e larea
dei rettangoli, che `e invariante per composizioni di rotazioni e traslazioni, e ci si convince che
deve valere un risultato del tipo: f Riem(R
2
) f Riem(R
2
) con
f =
(f ) .
Questo eettivamente `e vero, come vedremo pi` u in l`a (Osservazione 17.1).
Siano E R
2
PJ-misurabile e f : E R limitata. Se il prolungamento
f di f a zero fuori di
E sta in Riem(R
2
), diciamo che f sta in Riem(E) e che la quantit`a
E
f dxdy =
R
2
f dxdy
`e il suo integrale di Riemann su E. Stesso discorso e stessa notazione se f `e invece data
in Riem(R
2
), che sappiamo essere chiuso rispetto al prodotto: allora anche
f = f1
E
, cio`e la f
51
prima ristretta ad E e poi prolungata a 0 fuori di E, sta in Riem(R
2
). Se in particolare E `e
PJtrascurabile, lintegrale su E di una qualunque funzione f limitata (esiste ed) `e nullo:
0 = (inf
E
f)A(E) =
f1
E
f1
E
(sup
E
f)A(E) = 0.
Ladditivit`a dellintegrale rispetto alla somma di funzioni si trasferisce alle unioni disgiunte di
domini di integrazione: se E ed F sono PJ-misurabili con E F = , una funzione f : E F R
`e integrabile su E F se e solo se integrabile sia su E che su F, e in tal caso
EF
f dxdy =
E
f dxdy +
F
f dxdy;
in particolare, prendendo E aperto e F = E vediamo che
E
f dxdy =
E
f dxdy,
per cui non ci sar`a da preoccuparsi di distinguere tra integrali su insiemi misurabili aperti o chiusi.
Con f = 1
EF
otteniamo per le aree
A(E F) = A(E) +A(F),
sempre, sintende, per E F = ; in generale,
A(E F) = A(E) +A(F) A(E F).
16 Alcune estensioni
Integrali di Riemann in R
3
(e in R
N
)
Un primo, semplice allargamento delle nozioni viste nora consiste nel passaggio dalle funzioni di 2
variabili a quelle di un qualunque numero N di variabili. Gi`a il caso N = 3 illustra signicativamente
il procedimento. Al posto dei rettangoli si prendono i parallelepipedi P, con la notazione V (P)
per i volumi (base per altezza per profondit`a). Una partizione di P = [a, b] [c, d] [r, s] `e una
famiglia = {(x
h
, y
k
, z
) | x
0
= a < x
1
< < x
m
= b, y
0
= c < y
1
< < y
n
= b, z
0
= r < z
1
<
< z
p
= s}, e F() `e la famiglia dei sottoparallelepipedi Q
hk
= [x
h1
, x
h
] [y
k1
, y
k
] [z
1
, z
].
Una funzione limitata R
3
R `e una funzione a scala se, per unopportuna scelta di P e , `e nulla
fuori di P e assume valore costanti
hk
negli interni dei Q
hk
F(). Lespressione
h,k,
hk
V (Q
hk
)
`e lintegrale elementare di . Una volta constatato che si tratta di una denizione ben posta si
arriva senza dicolt`a agli integrali superiore e inferiore di Riemann; agli insiemi PJtrascurabili
(adesso in R
3
!); allintegrale (triplo) di Riemann denotato con
R
3
f(x, y, z) dxdydz oppure
R
3
f(x, y, z) dxdydz oppure
R
3
f dxdydz
52
o ancora, sbrigativamente, con
D
f(x, y, z) dxdy dz =
R
dxdy
(x,y)
(x,y)
f(x, y, z) dz =
b
a
dx
d
c
dy
(x,y)
(x,y)
f(x, y, z) dz (72)
con a secondo membro la notazione abituale per
R
_
_
_
(x,y)
(x,y)
f(x, y, z) dz
_
_
_
dxdy
(e si noti che diamo per scontata una generalizzazione del Teorema 6.1 per la quale lintegrale
semplice da (x, y) a (x, y) `e una funzione continua, dunque integrabile, di (x, y) R); la seconda
identit`a della (72) segue dalla formula di riduzione dellintegrale doppio. Per dimostrare la (72) si
procede come nella dimostrazione della (61), solo che al posto delladditivit`a dellintegrale semplice
sui sottointervalli associati ad una partizione di [a, b] adesso si sfrutta quella dellintegrale doppio
sui sottorettangoli associati ad una partizione di R.
Da qui si potrebbe poi passare alla generalizzazione della prima delle identit`a (72) che si ottiene
prendendo
D = {(x, y, z) R
3
| (x, y) K, (x, y) z (x, y)}
con K sottoinsieme PJmisurabile di R
2
:
D
f(x, y, z) dxdy dz =
K
dxdy
(x,y)
(x,y)
f(x, y, z) dz (73)
(col signicato ormai evidente del simbolo a secondo membro).
Naturalmente anche lintegrale doppio a secondo membro della (73) pu`o essere ridotto se K `e
un dominio normale del piano.
La prima identit`a nella (72) e pi` u in generale la (73) sono le formule di riduzione degli
integrali tripli.
A questo punto si pu`o passare senza dicolt`a a denire in R
N
, per un qualunque valore naturale
N, gli integrali secondo Riemann, detti allora Npli ed indicati semplicemente con
R
N
f(x) dx,
(o di nuovo sbrigativamente con
k=1
k
di
funzioni semplici con
k
0 per k 2 e
k=1
k
f. Lintegrale superiore di Lebesgue `e la
quantit`a (non necessariamente reale)
f = inf
k=1
k=1
k
+
f
.
La nozione che abbiamo introdotto non richiede nessuna restrizione su f: ne che si annulli al
di fuori di un compatto, ne che sia limitata. E se prendiamo in particolare le f L
c
? Allora ogni
S
+
f
`e la somma della serie + 0 + 0 + , cio`e della serie
k=1
k
con
1
= e
k
= 0 per
k 2, che sta in
+
f
e verica
k=1
k
=
. Ne segue che S
+
f
+
f
e
f. (74)
Lintegrale superiore di Lebesgue `e, come quello di Riemann, positivo, positivamente omogeneo
e subadditivo. (Per questultima propriet`a si utilizza lidentit`a
k=1
(
k
+
k
) =
k=1
k
+
k=1
k
,
qui valida perche le serie in
+
f
e
+
g
, avendo tutti i termini 0 tranne (eventualmente) il primo,
sono incondizionatamente convergenti o divergenti.)
Lintegrale inferiore di Lebesgue `e la quantit`a
f =
(f).
Anche lintegrale inferiore `e positivo e positivamente omogeneo. Inoltre `e superadditivo: questul-
tima propriet`a segue dalla subadditivit`a dellintegrale superiore, che implica anche
f. (75)
Si ha poi
f . (76)
Se i due membri della (75) sono niti e uguali si dice che f `e integrabile secondo Lebesgue,
e per il loro comune valore si utilizzano le stesse notazioni che per lintegrale di Riemann. Ci`o non
crea ambiguit`a perche, grazie alle (74) e (76) che implicano
f,
54
una funzione di L
c
integrabile secondo Riemann lo `e anche secondo Lebesgue, e i due integrali
coincidono.
Nel caso particolare che sia integrabile secondo Lebesgue la funzione caratteristica di un E R
2
diciamo che E `e misurabile secondo Lebesgue (in R
2
) con misura di Lebesgue (nita) data
da (E) =
1
E
. Ne segue che, quando E `e limitato, se `e misurabile secondo PeanoJordan lo `e
anche secondo Lebesgue.
Per mostrare che non vale il viceversa prendiamo E = ([0, 1] Q)
2
, che sappiamo non essere
PJmisurabile. Siccome E consiste in una successione {E
k
} di punti, e di conseguenza 1
E
`e essa
stessa somma di una serie
j=1
1
E
k
di funzioni a scala degeneri, risulta
1
E
=
j=1
1
E
k
= 0 =
1
E
.
Quindi la funzione 1
E
`e dotata di integrale di Lebesgue nullo, ovvero E `e misurabile secondo
Lebesgue con misura di Lebesgue nulla, ovvero ancora `e trascurabile secondo Lebesgue. E
ricordiamo che la frontiera di E `e tutto [0, 1]
2
, che ha misura di PeanoJordan uguale ad 1. Ma si pu`o
subito andare molto avanti. Il ragionamento svolto per mostrare che (E) = 0 se E = ([0, 1] Q)
2
pu`o essere tranquillamente ripetuto per una qualunque innit`a numerabile E di punti di R
2
, ad
esempio per E = Q
2
. O anche per una retta verticale o orizzontale unione di uninnit`a numerabile
di intervalli limitati e poi per una innit`a numerabile di tali rette. E qui si pu`o almeno enunciare
un risultato cui abbiamo alluso subito dopo il Teorema 13.3.
`
E il Teorema di VitaliLebesgue:
Condizione necessaria e suciente anche una funzione f L
c
sia integrabile secondo Riemann `e
che linsieme dei suoi punti di discontinuit`a sia trascurabile secondo Lebesgue.
Inne (ma nella teoria di Lebesgue `e appena linizio. . . ) si vede, procedendo come per lintegrale
di Riemann, che le funzioni integrabili secondo Lebesgue costituiscono uno spazio vettoriale su cui
lintegrale di Lebesgue `e positivo e lineare.
17 Cambiamenti di variabili
Nel Calcolo in una variabile un ruolo importantissimo per il calcolo eettivo degli integrali sugli
intervalli `e svolto dalla regola di integrazione per sostituzione, che si enuncia cos`: date una funzione
h di classe C
1
in un intervallo compatto [, ] e una funzione continua f sullimmagine di [, ]
nella h, vale lidentit`a
h()
h()
f() d =
f(h(v))h
B
A
f() d =
f(h(v))h
(v) dv,
nel primo caso e
B
A
f() d =
f(h(v))h
(v) dv
55
nel secondo. Riassumiamo in ununica identit`a:
B
A
f() d =
f(h(v))|h
a b
c d
La trasformazione
:
u
v
u
v
p
q
au +bv +p
cu +dv +q
`e un dieomorsmo di V = R
2
; il suo jacobiano
1 della sua inversa `e uguale a 1/det . Dimostriamo che se f `e una funzione limitata, nulla
fuori di un rettangolo R e integrabile, allora `e integrabile anche (f )|
|, quindi f perche
R
f(x, y) dxdy = |det |
1
(R)
(f )(u, v) dudv . (79)
A tal ne ricordiamo innanzitutto che una trasformazione denita dal prodotto a sinistra per una
matrice 22 porta un parallelogramma P in un altro parallelogramma P
) uguale
al prodotto dellarea A(P) per il determinante della matrice = jacobiano della trasformazione, preso
in valore assoluto. Nel caso della trasformazione
1
applicata ad un rettangolo S di una partizione
di R abbiamo dunque
A(S)
|det |
= A(
1
(S)) =
1
(S)
=
1
(S
)
(con la sbrigativa notazione
per lintegrale su R
2
), e siccome
f = (f )1
1
(R)
=
SF()
(f )1
1
(S
)
+ 1
E
dove E =
SF()
1
(S) `e un insieme (unione di segmenti) PJtrascurabile e `e una funzione
limitata (costante a tratti) che non ha interesse specicare, otteniamo
SF()
inf
S
A(S) =
SF()
inf
1
(S
)
(f )
A(S)
|det |
|det |
56
=
_
_
SF()
inf
1
(S
)
(f )
1
(S
)
+ 1
E
_
_
|det |
_
_
SF()
(f )1
1
(S
)
+ 1
E
_
_
|det |
=
(f )|det |.
Analogamente si vede che
(f )|det |
SF()
sup
S
A(S).
Riassumiamo:
SF()
inf
S
A(S)
(f )|det |
(f )|det |
SF()
sup
S
A(S).
Dunque f `e integrabile (cfr. la (70)), e vale lidentit`a
f =
(f )|det | (80)
cio`e la (79).
Le considerazioni precedenti, applicate a 1
F
con F insieme limitato, dunque contenuto in un
rettangolo R, e PJmisurabile, mostrano subito che anche
1
(F) `e PJmisurabile, con misura di
PeanoJordan uguale a quella di F divisa per |det |.
Osservazione 17.1. Se in particolare `e composizione di rotazioni e traslazioni, per cui `e
ortogonale, otteniamo
f =
(f )
cio`e il risultato preannunciato nellOsservazione 15.1: lintegrale di Riemann `e indipendente dal
sistema di riferimento cartesiano rispetto a cui `e stato introdotto.
u = x +y
v = x y
e da qui, invertendo, denire la attraverso il sistema
x = (u +v)/2
y = (u v)/2
cio`e
:
u
v
u
v
1/2 1/2
1/2 1/2
u
v
.
Dunque Q `e immagine nella di K = [2, 2]
2
, e
Q
(x
2
y
2
)
2
dxdy = |det |
K
u
2
v
2
dudv =
1
2
2
2
u
2
du
2
2
v
2
dv =
128
9
.
57
Per introdurre i prossimi sviluppi far`a comodo inquadrare le precedenti considerazioni nel
seguente enunciato (che non dimostriamo), per pesante che esso sia:
Teorema 17.1. Siano dati due aperti U e V di R
2
, il primo dei quali limitato e PJmisurabile con
chiusura K = U contenuta in V . Sia : V R
2
un dieomorsmo di V , o pi` u in generale una
funzione di classe C
1
che ristretta ad U sia un dieomorsmo. Allora anche (U) `e PJmisurabile,
e per ogni f : (U) R continua e limitata (dunque integrabile su (U) grazie al Teorema 13.3)
vale lidentit`a
(U)
f(x, y) dxdy =
U
(f )(u, v)|
(U)
f(x, y) dxdy =
(K)
f(x, y) dxdy =
K
(f )(u, v)|
D
R
f(x, y) dxdy =
K
f( cos , sin ) dd =
2
0
d
R
0
f( cos , sin ) d (83)
per f continua e limitata su C
0
(D
R
). In particolare ritroviamo per f(x, y) = 1 larea R
2
del disco
D
R
integrando la lunghezza 2 della circonferenza di raggio , che `e dunque la derivata dellarea
del disco di raggio :
A(D
R
) =
R
0
2 d.
Si noti che per a, b > 0 anche la trasformazione
a,b
(, ) = (a cos , b sin ),
che (coincide con quando a = b = 1 ed) ha determinante ab, `e regolarissima su tutto V = R
2
ed iniettiva su U =]0, 2[]0, R[. Solo che
a,b
(K) `e la regione racchiusa dallellissi
x
2
a
2
+
y
2
b
2
= R
2
(e adesso non ha lo stesso signicato che nella (82): per x > 0 `e larcotangente non di y/x, bens`
di ay/(bx), eccetera).
58
Esempio 17.2. Il chiuso
D = {(x, y) | 1 x
2
+y
2
4, 0 y
3x}
`e un dominio normale rispetto allasse x, ma se la funzione integranda `e
f(x, y) =
1
1 +x
2
+y
2
conviene vedere D come immagine nella (82) di K = U = {(, ) | 0 /3, 1 2}.
Otteniamo
D
f(x, y) dxdy =
K
f( cos , sin ) dd =
/3
0
d
2
1
1 +
2
d =
6
log
5
2
.
Osservazione 17.2. Nellintegrazione unidimensionale non avevamo mai visto comparire la richie-
sta che la sostituzione realizzasse un dieomorsmo. In dimensione > 1 questa richiesta, formulata
nel Teorema 17.1, `e invece essenziale, come si vede dal seguente esempio per N = 2: il passaggio a
coordinate polari (, ) non realizza un dieomorsmo del rettangolo U =]0, []0, 1[ se > 2,
e lidentit`a
(K)
dxdy =
K
dd
non `e soddisfatta perch`e (K) `e il disco chiuso di raggio 1 e la sua area `e il valore del primo
membro, mentre quello del secondo `e
0
d
1
0
d =
2
> .
Nello studio degli integrali doppi accade spesso che ad apparire promettente (rispetto tanto
al dominio di integrazione quanto alla funzione integranda) non sia subito una trasformazione di
coordinate (x, y) = (u, v) come nellenunciato del Teorema 17.1 e poi in particolare nellEsempio
17.2, bens` per cominciare una (u, v) = (x, y) iniettiva in un aperto A. Di questo genere `e
la situazione presentatasi con ane nellEsempio 17.1, ma l` non abbiamo incontrato nessuna
dicolt`a: in un attimo abbiamo trovato linversa di . In genere tuttavia il procedimento
di inversione di non `e immediato; poi rimane da calcolare il determinante
in U = (A).
59
Mostriamo come a questultimo ne possa bastare, almeno in linea di principio, la conoscenza del
determinante
in A. Applicando allidentit`a
(
1
)(u, v) = (u, v) per (u, v) U
la regola di derivazione delle funzioni composte, e passando ai determinanti delle matrici jacobiane,
otteniamo
1((u, v))
(u, v) = 1,
e siccome in A risulta
1 arriviamo a
(u, v) =
1
((u, v))
. (84)
A questo punto, dovendosi calcolare il secondo membro della (84), ritorna pur sempre in ballo
la questione dellespressione esplicita della . E per`o se ne pu`o prescindere in certi casi speciali:
tipicamente quelli degli esercizi di un corso, come nel prossimo esempio...
Esempio 17.3. Nellaperto B denito dalle disuguaglianze
1 < x
2
y
2
< 2,
1
2
<
y
x
<
1
2
(85)
la trasformazione di coordinate denita da u = x
2
y
2
, v = y/x non `e iniettiva: (x, y) =
(x, y). Lo `e invece nellintersezione A di B col semipiano delle x > 0: dato un qualunque punto
(u
0
, v
0
) di U = (A) =]1, 2[] 1/2, 1/2[, liperbole x
2
y
2
= u
0
e la retta y = v
0
x si incontrano
in un unico punto (x
0
, y
0
) A. Dunque in U `e denita la iniettiva data dallinversa della
ristretta ad A. Soprassediamo momentaneamente alla verica delle propriet`a della attraverso il
suo calcolo esplicito, ed esprimiamo il suo jacobiano attraverso quello dellinversa: siccome
(x, y) = 2 2
y
2
x
2
la (84) adesso diventa
(u, v) =
1
2(1 v
2
)
. (86)
Come si vede, non c`e stato bisogno del calcolo esplicito di , che peraltro si fa subito: `e la
trasformazione
x =
u
1 v
2
, y = v
u
1 v
2
,
di classe C
1
in V = R] 1, 1[ ed iniettiva in U. Da questa espressione si arriva di nuovo alla (86),
anche se con qualche conto in pi` u.
Servendosi delle coordinate polari si pu`o formulare un rapido approccio allintegrazione impro-
pria nel piano. Per cominciare, poniamo
C
rR
= {(x, y) | 0 < r
2
x
2
+y
2
R
2
< }.
Lintegrale
I
rR
=
C
rR
(x
2
+y
2
)
/2
dxdy = 2
R
r
+1
d
60
vale
2
+ 2
(R
+2
r
+2
) per = 2, 2(log R log r) per = 2.
Dunque
lim
R
I
rR
= per 2, lim
R
I
rR
=
2r
+2
+ 2
per < 2,
lim
r0
I
rR
= per 2, lim
r0
I
rR
=
2R
+2
+ 2
per > 2.
Da qui si ricava facilmente il
Teorema 17.2. (i) Sia f denita allesterno del disco x
2
+y
2
r
2
per qualche r > 0 ed integrabile
in ogni C
rR
, R > r. Allora lintegrale improprio
x
2
+y
2
r
2
f(x, y) dxdy
converge assolutamente se esiste una costante K > 0 tale che 0 |f(x, y)| K(x
2
+ y
2
)
/2
per
un < 2, mentre diverge se esiste una costante K > 0 tale che f(x, y) K(x
2
+ y
2
)
/2
per un
2;
(ii) Sia f denita in un disco bucato 0 < x
2
+y
2
R
2
per qualche R > 0 ed integrabile in ogni
C
rR
, 0 < r < R. Allora lintegrale improprio
x
2
+y
2
R
2
f(x, y) dxdy
converge assolutamente se esiste una costante K > 0 tale che 0 |f(x, y)| K(x
2
+ y
2
)
/2
per
un > 2, mentre diverge se esiste una costante K > 0 tale che f(x, y) K(x
2
+ y
2
)
/2
per un
2.
Lenunciato del Teorema 17.1 si trasferisce in maniera ovvia alla dimensione 3:
Teorema 17.3. Siano dati due aperti U e V di R
3
, il primo dei quali limitato con chiusura K = U
contenuta in V . Sia : V R
3
un dieomorsmo di V , o pi` u in generale una funzione di
classe C
1
che ristretta ad U sia un dieomorsmo, con (U) PJmisurabile. Allora anche U `e
PJmisurabile, e per ogni f : (U) R limitata e integrabile vale lidentit` a
(U)
f(x, y, z) dxdydz =
U
(f )(u, v, w)|
(U)
f(x, y, z) dxdydz =
(K)
f(x, y, z) dxdydz =
K
(f )(u, v, w)|
(, , ) vale
2
cos , `e regolarissima su tutto V = R
3
, e diventa un dieomor-
smo quando `e ristretta al prodotto cartesiano ]0, 2[]0, R[] /2, /2[. Prendendo ad esempio
questultimo come U, per cui (K) `e la palla (tridimensionale) chiusa B
R
, otteniamo
B
R
f(x, y, z) dxdydz =
K
f( cos cos , sin cos , sin )
2
cos ddd (88)
=
2
0
d
R
0
d
/2
/2
f( cos cos , sin cos , sin )
2
cos d
per f C
0
(B
R
) limitata (cfr. la (72)). La (88) fornisce il volume 4R
3
/3 della sfera come integrale
dellarea (nel senso della geometria euclidea) 4
2
della supercie sferica di raggio , area che `e
quindi la derivata del volume della sfera di raggio :
V (B
R
) =
R
0
4
2
d.
Esempio 17.4. Per calcolare
I =
D
cos
x
2
+y
2
+z
2
x
2
+y
2
+z
2
dxdydz
con
D = {(x, y, z) | 1 x
2
+y
2
+z
2
4, z 0}
passiamo a coordinate sferiche x = cos cos , y = sin cos , z = sin , dove 1 2, 0
2 e (attenzione!) 0 /2. Otteniamo
I =
[1,2][0,2][0,/2]
cos
2
2
cos ddd = 2(sin 2 sin 1).
rR
= {(x, y, z) | 0 < r
2
x
2
+y
2
+z
2
R
2
< }.
Lintegrale
I
rR
=
rR
(x
2
+y
2
+z
2
)
/2
dxdydz = 4
R
r
+2
d
vale
4
+ 3
(R
+3
r
+3
) per = 3, 4(log R log r) per = 3.
Dunque
lim
R
I
rR
= per 3, lim
R
I
rR
=
4r
+3
+ 3
per < 3,
lim
r0
I
rR
= per 3, lim
r0
I
rR
=
4R
+3
+ 3
per > 3.
Da qui si ricava il
62
Teorema 17.4. (i) Sia f denita allesterno della palla x
2
+ y
2
+ z
2
r
2
per qualche r > 0 ed
integrabile in ogni
rR
, R > r. Allora lintegrale improprio
x
2
+y
2
+z
2
r
2
f(x, y, z) dxdydz
converge assolutamente se esiste una costante K > 0 tale che 0 |f(x, y, z)| K(x
2
+y
2
+z
2
)
/2
per un < 3, mentre diverge se esiste una costante K > 0 tale che f(x, y) K(x
2
+y
2
+z
2
)
/2
per un 3;
(ii) Sia f denita in una palla bucata 0 < x
2
+ y
2
+ z
2
R
2
per qualche R > 0 ed integrabile
in ogni
rR
, 0 < r < R. Allora lintegrale improprio
x
2
+y
2
+z
2
R
2
f(x, y) dxdydz
converge assolutamente se esiste una costante K > 0 tale che 0 |f(x, y, z)| K(x
2
+y
2
+z
2
)
/2
per un > 3, mentre diverge se esiste una costante K > 0 tale che f(x, y, z) K(x
2
+y
2
+z
2
)
/2
per un 3.
18 Richiami su curve ed integrali curvilinei
Una curva di R
N
`e una funzione vettoriale = (
,
. . . ,
N
) : [a, b] R
N
almeno continua e
limitata su un intervallo limitato ]a, b[. Il suo integrale da a a b `e il vettore
b
a
(t) dt =
b
a
1
(t) dt, . . . ,
b
a
N
(t) dt
.
Lemma 18.1. Vale la disuguaglianza
b
a
(t) dt
b
a
(t) dt.
DIM. Applicando la disuguaglianza di CauchyScwarz al prodotto scalare ( | ) in R
N
otteniamo
subito
b
a
(t) dt
b
a
((t) | y) dt
b
a
(t) y dt =
b
a
(t) dt
y
e quindi, con la scelta
y =
b
a
(t) dt,
il risultato cercato.
1 x
2
, 1 x 1,
che non `e di classe C
1
. Invece sono equivalenti tra di loro, ma con orientazioni opposte, le due
curve di classe C
1
[/4, 3/4] t (cos t, sin t)
e
y =
1 x
2
,
1
2
x
1
2
:
lequivalenza `e realizzata dal cambiamento di parametro p() = cos .
(t
0
), limite per t t
0
del rapporto incrementale
(t) (t
0
)
t t
0
con t
0
, t ]a, b[, t = t
0
, `e lNpla dei parametri direttori di una retta, e pi` u esattamente della
tangente al sostegno di in (t
0
). Per N generico, N = 2, N = 3 i versori di tale tangente si
scrivono rispettivamente
11
(t
0
)
(t
0
)
,
(x
(t
0
), y
(t
0
))
(t
0
)
2
+y
(t
0
)
2
,
(x
(t
0
), y
(t
0
), z
(t
0
))
(t
0
)
2
+y
(t
0
)
2
+z
(t
0
)
2
.
Nel particolare caso bidimensionale di una curva y = f(x) i versori della tangente in (x
0
, f(x
0
))
sono
(1, f
(x
0
))
1 +f
(x
0
)
2
e quindi quelli della normale sono
(f
(x
0
, 1))
1 +f
(x
0
)
2
.
Diversa la questione dal punto di vista cinematico: come velocit`a istantanea allistante t
0
del
moto con legge oraria (e quindi con traiettoria uguale al sostegno di ) la derivata
(t
0
) pu` o
benissimo avere tutte le componenti uguali a 0.
Esempio 18.5. La curva (t) = (t
3
, t
2
) per 1 t 1 `e di classe C
1
e costituisce la legge oraria
di un moto con velocit`a (vettoriale) nulla allistante 0. Per`o il suo sostegno, cio`e la traiettoria
del moto, `e anche il sostegno della curva (=graco della funzione) y = x
2/3
, e dunque `e privo di
tangente nellorigine.
11
La scelta del segno + o dipende dallorientazione che si ssa sulla tangente.
65
Lagganciamento della curva ad una seconda curva : [c, d] R
N
ha senso (solo) quando
(b) = (c). Esso d`a luogo alla curva : [a, b+dc] R
N
denita dalle identit`a: () = () per
a b, () = ( b +c) per b < b +d c. Dunque la ristretta a [a, b] `e la stessa cosa
della , mentre ristretta a [b, b +d c] non `e esattamente la bens` la p con p() = b +c.
Lagganciamento consecutivo di tre o pi` u curve si eettua agganciando, per cominciare, la prima e
la seconda (purche ci`o sia possibile), poi agganciando la curva cos` ottenuta e la terza delle curve
date (purche ci`o sia possibile), eccetera. Lagganciamento di un numero nito di segmenti `e una
poligonale.
Un cammino `e una curva ottenuta agganciando consecutivamente un numero nito di curve
di classe C
1
; lorientazione di una qualunque di tali curve determina quella di tutto il cammino se
questo `e una curva semplice. Un cammino `e dunque una funzione di classe C
1
a tratti (oltre che,
naturalmente, di classe C
0
). Ci`o signica che si pu`o dare una partizione a = a
0
< a
1
< < a
m
= b
di [a, b] in modo tale che la derivata
Gds =
b
a
G((t))
(t) dt.
La denizione `e ben posta perche la funzione integranda t G((t))
Gds =
m
h=1
a
h
a
h1
G((t))
(t) dt.
Esempio 18.6. Se G `e una funzione reale continua sul graco di una funzione f C
1
([a, b]) il suo
integrale di prima specie sulla curva y = f(x) `e dato da
b
a
G(x, f(x))
1 +f
(x)
2
dx.
Gds =
Gds
indipendentemente dallorientazione delle due curve.
DIM. Sia = p con p : [c, d] R di classe C
1
, p
d
c
G((t))
(t) dt =
d
c
G(( p)(t))( p)
(t) dt =
d
c
G(( p)(t))(
p)(t)|p
(t)| dt
66
e per la formula dintegrazione per sostituzione lultimo integrale vale
b
a
G((t))
(t) dt =
Gds.
b
a
N
j=1
L
j
((t))
j
(t) dt.
La denizione `e ben posta perche la funzione integranda t
N
j=1
L
j
((t))
j
(t) `e denita, limitata
e continua nellintervallo [a, b] privato di un numero nito di punti (quelli in cui non `e denita
qualcuna delle derivate
j
).
Esempio 18.7. Se L ed M sono funzioni reali continue in un aperto A di R
2
lintegrale di Ldx +
M dy su una curva y = f(x), a x b di classe C
1
e con sostegno contenuto in A `e dato da
b
a
L(x, f(x)) dx +
b
a
M(x, f(x))f
(x) dx.
oppure lidentit` a
d
c
N
j=1
L
j
((t))
j
(t) dt =
d
c
N
j=1
L
j
(( p)(t))( p)
(t) =
d
c
N
j=1
L
j
(( p)(t))(
p)(t)p
(t) dt
e per la formula dintegrazione per sostituzione lultimo integrale vale
b
a
N
j=1
L
j
((t))
j
(t) dt =
67
oppure
a
b
N
j=1
L
j
((t))
j
(t) dt =
a seconda che p
> 0 o p
< 0.
Esempio 18.8. Applicando ripetutamente il Teorema 18.2 si verica che lintegrale di seconda
specie sulla circonferenza [0, 2] t (cos t, sin t) `e uguale alla somma di quelli sullopposta di
y =
1 x
2
, 1/
2 x 1/
1 y
2
, 1/
2
y 1/
2, su y =
1 x
2
, 1/
2 x 1/
2 e su x =
1 y
2
, 1/
2 y 1/
2.
i=1
(x
i
y
i
)
2
;
quella di una poligonale che ottiene agganciando uno dopo laltro un numero nito di segmenti
(x
k
, y
k
) `e la somma delle lunghezze x
k
y
k
, e noi la indichiamo con (). Se z `e un punto di
(x, y), cio`e z = x +(y x) per un ]0, 1[, la disuguaglianza triangolare vale col segno uguale:
x y = x z +z y.
Da ci`o segue che la lunghezza di (x, y) non varia se, invece che come un segmento, lo si considera
come la poligonale di vertici consecutivi x, z e y. Pi` u in generale, dunque, la lunghezza di una
poligonale non varia se ai suoi vertici ne vengono aggiunti degli altri, non essenziali nel senso
appena detto.
Sia adesso data una curva semplice : [a, b] R
N
. Una poligonale
inscritta in viene
costruita ssando una partizione a = t
0
< t
1
< < t
n
= b di [a, b] e agganciando consecutivamente
i segmenti ((t
k1
), (t
k
)), k = 1, ..., n. Diciamo che `e retticabile se le lunghezze delle
poligonali
).
Lipotesi che sia semplice non `e essenziale se non per fare in modo che la sua lunghezza possa
essere interpretata come lunghezza del suo sostegno.
Teorema 19.1. Se `e retticabile ogni altra curva tale che = p per unopportuna funzione
reale continua ed invertibile p : [a, b] R `e a sua volta retticabile ed ha la stessa lunghezza di .
68
DIM. Un numero nito di punti t
h
distinti tra di loro determina una partizione di [a, b] se e solo
se i punti
h
= p(t
h
) sono distinti tra di loro e determinano una partizione di [c, d]. Dunque una
poligonale inscritta a `e una poligonale inscritta a , e viceversa.
Nelle considerazioni che abbiamo svolto nora non abbiamo fatto intervenire nessuna ipotesi di
regolarit`a delle curve in aggiunta a quella (di continuit`a) automaticamente garantita dalla denizio-
ne. Ma in un contesto cos` generale pu`o venir meno la retticabilit`a, e perno lunidimensionalit`a.
Uno splendido esempio (troppo elaborato per essere presentato qui) `e la curva di Peano, il cui
sostegno `e lintero quadrato [0, 1]
2
. Ma anche curve continue inequivocabilmente unidimensionali
possono non essere retticabili:
Esempio 19.1. La curva piana (t) = (t, t sin(/2t)) per 0 < t 1, (0) = (0, 0) non `e retticabile.
Sia infatti K un qualunque numero reale, e sia n = n
K
un numero naturale cos` grande che
n
j=2
1/j > K (divergenza della serie armonica). Sia poi
sin
j
2
j
sin
(j1)
2
j 1
=
1
j
+
1
j 1
>
1
j
, j = 2, ..., n,
la lunghezza (
) `e maggiore di K.
(t)
esista continua in ogni intervallo ]a
h1
, a
h
[ ed ammetta limite in R
N
tanto quando t a
h1
+0 che
quando t a
h
0. La norma
b
a
di vertici
(t
k
) verica
(
) =
m
k=1
(t
k
) (t
k1
) =
m
k=1
t
k
t
k1
(t) dt
k=1
t
k
t
k
1
(t) dt =
b
a
(t) dt
grazie al Lemma 18.1 con
b
a
t
k
t
k1
(t
k
) dt
t
k
t
k1
(t
k
) dt
ricaviamo, maggiorando il primo membro con
t
k
t
k1
(t) dt
t
k
t
k1
[
(t
k
)
(t)] dt
t
k
t
k1
(t) dt
t
k
t
k1
(t
k
)
(t) dt
e minorando il secondo membro con
t
k
t
k1
(t) dt
t
k
t
k1
(t
k
)
(t) dt,
che
t
k
t
k1
(t) dt
t
k
t
k1
(t) dt 2
t
k
t
k1
(t
k
)
()
(t)
su [a, b]). Per i t
k
tali che t
k
t
k1
< otteniamo
(
b
a
(t) dt 2(b a)
e insieme alla (90) questo dimostra il teorema.
Il secondo membro della (89) `e lintegrale di prima specie su della funzione identicamente
uguale ad 1.
Esempio 19.2. Il graco di una funzione reale f C
1
([a, b]) `e retticabile, e la sua lunghezza vale
b
a
1 + [f
(x)]
2
dx.
Limitiamoci a di classe C
1
in [a, b]. La lunghezza
s(t) =
t
a
() d
della ristretta ad [a, t], dove t [a, b], `e una funzione detta ascissa curvilinea, che verica
ds
dt
=
(t).
Questo spiega la notazione adottata per gli integrali curvilinei di prima specie. La s(t) `e una
funzione iniettiva di classe C
1
su [a, b]: la sua inversa t = t(s), di classe C
1
sullintervallo [0, ()],
fornisce una nuova curva [0, ()] s (t(s)) equivalente alla [a, b] t (t).
70
20 La formula di GaussGreen
Siano date due funzioni reali continue , : [a, b] R con < su ]a, b[, dove < a < b < .
Indichiamo con K luno o laltro dei due domini normali deniti a partire da f e g, cio`e o
{(x, y) R
2
| a x b, (x) y (x)} (92)
oppure
{(x, y) R
2
| a y b, (y) x (y)}. (93)
Se K `e il dominio (92) la sua frontiera `e il sostegno del cammino chiuso ottenuta agganciando
consecutivamente: la curva y = (x), a x b; il segmento (che pu`o anche ridursi ad un punto)
x = b, (b) y (b); lopposta della curva y = (x), a x b; lopposto del segmento (che pu`o
anche ridursi ad un punto) x = b, (a) y (a). Considerazioni del tutto analoghe valgono per
K dato dalla (93).
Aggiungiamo lipotesi che e siano di classe C
1
su [a, b]. Per semplicare la terminologia
diciamo che i domini (92) e (93) sono adesso, rispettivamente, di tipo I e di tipo II. In entrambi i
casi la frontiera K di K `e sostegno di un cammino che orientiamo in senso antiorario e denotiamo
con +K. Per ssare le idee, sia K dato da (92). In ogni punto di K ad eccezione di (a, (a)),
(a, (a)), (b, (b)) e (b, (b)) sono deniti:
il versore tangente positivo a +K, che indichiamo con , uguale a
(1,
(x))
1 +
(x)
2
nei punti (x, (x)) con a < x < b,
(1,
(x))
1 +
(x)
2
nei punti (x, (x)) con a < x < b,
nonche a (0, 1) nei punti (a, y) con (a) < y < (a) (se ce ne stanno), (0, 1) nei punti (b, y)
con (b) < y < (b) (se ce ne stanno);
il versore normale esterno a K, che indichiamo con
e
, uguale a
(
(x), 1)
1 +
(x)
2
nei punti (x, (x)) con a < x < b,
(
(x), 1)
1 +
(x)
2
nei punti (x, (x)) con a < x < b,
nonche a (1, 0) nei punti (a, y) con (a) < y < (a) (se ce ne stanno), (1, 0) nei punti (b, y)
con (b) < y < (b) (se ce ne stanno).
Prolunghiamo e a tutto R conservando la loro regolarit`a C
1
e ancora una volta, per ssare
le idee, prendiamo come K il dominio (92). Se A `e un aperto che contiene K, questultimo `e
contenuto nellunione di rettangoli aperti I]c, d[ con
[a, b] [c, d] A, c < (x), (x) < d x I. (94)
Teorema 20.1. Sia K uno dei due aperti (92) o (93) e siano L, M due funzioni continue, nonche
dotate di derivate parziali L
y
, M
x
anchesse continue, in un aperto A K. Risulta
K
(M
x
L
y
) dxdy =
+K
Ldx +M dy. (95)
71
DIM. Sia K il dominio di tipo I dato dalla (92). Per la formula di riduzione degli integrali doppi
ed il teorema fondamentale del calcolo integrale risulta
K
L
y
dxdy =
b
a
dx
(x)
(x)
L
y
(x, y) dy =
b
a
[L(x, (x)) L(x, (x))] dx =
+K
Ldx. (96)
Per ogni scelta di I, c, d tali che che sia soddisfatta la (94), si applica il Teorema 6.3 alla funzione
x (x) =
(x)
(x)
M(x, y) dy
nei punti x I e si ottiene lidentit`a
(x) =
d
dx
(x)
(x)
M(x, y) dy =
(x)
(x)
M
x
(x, t) dt +M(x, (x))
(x),
che viene dunque ad essere valida in ogni punto x [a, b]. Integrandola su [a, b] otteniamo
T
M
x
dxdy =
b
a
dx
(x)
(x)
M
x
(x, y) dy
=
(b)
(b)
M(b, y) dy
(a)
(a)
M(a, y) dy
b
a
[M(x, (x))
(x)] dx
=
+K
M dy,
dove la dierenza dei due integrali in dy del 3
o
membro `e (b) (a).
Da qui e da (96) segue la (95).
Lo stesso discorso vale per K dato dalla (93).
b
a
L(x, (x))
1
1 +
(x)
2
+M(x, (x))
(x)
1 +
(x)
2
1 +
(x)
2
dx,
b
a
L(x, (x))
1
1 +
(x)
2
+M(x, (x))
(x)
1 +
(x)
2
1 +
(x)
2
dx,
(a)
(a)
M(a, y)(1) dy e
(b)
(b)
M(b, y) 1 dy.
Ma allora la (97) si pu`o riscrivere come
K
(rot F) kdxdy =
K
F ds.
72
Nel secondo membro la scelta dellorientazione sulla frontiera di K, che non pu`o tradursi nel verso
di percorrenza sul cammino di integrazione dellintegrale di prima specie, dal momento che que-
stultimo ne `e indipendente (e infatti abbiamo soppresso il segno +), compare invece nella funzione
integranda, dove il versore tangente `e orientato seguendo il verso antiorario di percorrenza del
cammino.
Diamo una formulazione equivalente della formula di GaussGreen prendendo una funzione
vettoriale continua G = (P, Q) : A R
2
con derivate P
x
, Q
y
anchesse continue in A. Per L
uguale ad Q e M ad P, dunque M
x
L
y
uguale alla divergenza div G = (P
x
, Q
y
), la (95)
diventa
K
div Gdxdy =
+K
Qdx +P dy. (97)
Il secondo membro della (95) `e la somma dei seguenti quattro addendi:
b
a
P(x, (x))
(x)
1 +
(x)
2
+Q(x, (x))
1
1 +
(x)
2
1 +
(x)
2
dx,
b
a
P(x, (x))
(x)
1 +
(x)
2
+Q(x, (x))
1
1 +
(x)
2
1 +
(x)
2
dx,
(a)
(a)
P(a, y)(1) dy e
(b)
(b)
P(b, y) 1 dy.
Ma allora la (97) si pu`o riscrivere come
K
div Gdxdy =
K
G
e
ds. (98)
Nel secondo membro la scelta dellorientazione sulla frontiera di K `e realizzata dal versore normale,
che `e precisamente quello esterno
e
e non il suo opposto. La variante (98) della formula di Green
esprime, sotto le ipotesi che abbiamo dato, il Teorema della divergenza.
Indichiamo con K il cerchio di centro lorigine e raggio 1. Si tratta s` di un dominio normale,
ma non di tipo I ne di tipo II, perche le funzioni
[1, 1] x
1 x
2
, [1, 1] y
1 y
2
non sono di classe C
1
. Per`o domini quali
K
1
= {(x, y) R
2
| x
2
+y
2
1, x 1/
2}
e
K
2
= {(x, y) R
2
| x
2
+y
2
1, x 1/
2}
sono di tipo II (non di tipo I), mentre
K
3
= {(x, y) R
2
| x
2
+y
2
1, 1/
2 x 1/
2}
`e di tipo I (non di tipo II). K `e unione dei K
j
, e la sua frontiera, con lorientazione indotta da
quelle delle +K
j
, diventa una curva orientata che indichiamo con +K. (Naturalmente avremmo
potuto pi` u semplicemente dire che +K `e la circonferenza unitaria orientata in senso antiorario,
per`o in tal modo non avremmo suggerito una procedura di portata generale.) Se le funzioni L ed
73
M sono continue, con L
y
e M
x
anchesse continue, in un aperto contenente K si pu`o applicare la
formula di GaussGreen su ogni K
j
ed ottenere
K
(M
x
L
y
) dxdy =
3
j=1
K
j
(M
x
L
y
) dxdy
=
3
j=1
+K
j
Ldx +M dy =
+K
Ldx +M dy
grazie alla cancellazione reciproca dei contributi negli
+K
j
Ldx + M dy dei segmenti verticali
delle K
j
. Lultimo membro si pu`o adesso scrivere come un integrale sulla curva [0, 2] t
(cos t, sin t).
Le considerazioni appena svolte per il cerchio si generalizzano ad ogni dominio K di cui si
possa dare, mediante intersezioni con opportune rette verticali ed orizzontali, una decomposizione
in un numero nito di sottodomini di tipo I o II privi due a due di punti interni in comune; le
frontiere dei sottodomini orientate positivamente inducono automaticamente sulla frontiera di K
una orientazione (positiva per denizione). Diciamo allora che K `e ammissibile, e il Teorema 20.1
ammette il seguente
Corollario 20.1. La formula di GaussGreen vale in ogni dominio ammissibile K per funzioni L
ed M continue, con L
y
e M
x
anchesse continue, in un aperto contenente K.
Lenunciato precedente si trasforma in un attimo nella sua variante per il Teorema della diver-
genza.
Esempio 20.1. Se un triangolo ha un lato verticale `e un dominio di tipo I, se ne ha uno orizzontale
`e un dominio di tipo II. Peraltro `e facile decomporre un qualunque triangolo nellunione di due
triangoli con un lato verticale oppure con uno orizzontale in comune. Ne segue che ogni triangolo
`e un dominio ammissibile.
Esempio 20.2. Una corona circolare `e ammissibile, e lorientazione positiva sulla sua frontiera in-
duce il verso di percorrenza antiorario sulla circonferenza maggiore, quello orario sulla circonferenza
minore.
Esempio 20.3. Se ad un dominio normale di tipo I o II si toglie un disco aperto la cui chiusura sia
contenuta allinterno del dominio si ottiene un dominio ammissibile (unione di 8 domini normali di
tipo I oppure II). Da qui si arriva facilmente a generalizzare lEsempio 7.2 della corona circolare,
mostrando che `e ammissibile un disco chiuso privato di un disco aperto con la chiusura contenuta
allinterno del disco di partenza.
+K
xdy =
+K
y dx.
74
Spesso, nelle applicazioni, quella che viene data esplicitamente `e una curva semplice e chiusa su
cui bisogna calcolare un integrale di seconda specie: se si vuole ricorrere alla formula di GaussGreen
nella formulazione data qui col Teorema 20.1 (tante altre, naturalmente, se ne possono trovare!)
bisogna mostrare innanzitutto che il sostegno di `e la frontiera di un dominio ammissibile K, e
poi che lintegrale su `e uguale a quello su +K.
21 Serie di funzioni
Data una successione di funzioni f
k
denita in un intervallo I, le associamo la serie
n=1
f
k
, cio`e
la successione delle ridotte F
n
=
n
k=1
f
k
(e si tenga presente che ogni successione {g
n
} di funzioni
`e a sua volta la successione delle ridotte della serie g
1
+
k=1
(g
k+1
g
k
)). Diciamo che la serie
delle f
n
`e uniformemente convergente in I se `e tale la successione delle F
n
. Utilizzando la
(29) scriviamo subito il criterio di Cauchy che fornisce la condizione necessaria e suciente per la
convergenza uniforme della serie: dato comunque > 0 esiste =
N tale che
n+p
k=n+1
f
k
(x)
per x I, n
, p N (99)
ovvero
sup
xI
n+p
k=n+1
f
k
(x)
per n
, p N.
Il trasporto del Teorema 7.1 dalle successioni alle serie `e immediato.
Teorema 21.1. (i) Se le funzioni f
k
: I R sono continue in un punto x
0
I e la loro serie
converge uniformemente in I, allora anche la somma della serie `e una funzione continua in x
0
.
(ii) Se le funzioni f
k
: I R sono continue in ogni punto di I e la loro serie converge
uniformemente in I, allora la somma della serie (continua in I grazie a (i)) verica
b
a
k=1
f
k
(x) dx =
k=1
b
a
f
k
(x) dx
per ogni scelta di a, b I.
(iii) Se le funzioni f
k
: I R sono di classe C
1
in I con
k=1
f
k
(x
0
) convergente per qualche
scelta di x
0
I e la serie delle f
k
uniformemente convergente in I, allora la serie delle f
k
converge
in tutto I ed ha per somma una funzione di classe C
1
, con
d
dt
k=1
f
k
(x) =
k=1
df
k
dt
(x) per x I.
Nellambito delle serie di funzioni si introduce una nozione che non ha controparte in quello
delle successioni di funzioni. Diciamo che
k=1
f
k
converge totalmente in I se esiste una serie
convergente
n=1
A
k
di costanti reali non negative tali che
|f
k
(x)| A
k
per x I,
75
il che equivale alla convergenza della serie numerica
k
sup
xI
|f
k
(x)| maggiorata termine a termine
dalla
n=1
A
k
. La convergenza totale su I implica in ogni punto x di I la convergenza della serie
numerica
k
|f
k
(x)|, cio`e la convergenza assoluta della serie
k
f
k
(x). Ma c`e di pi` u. Grazie alla
condizione di Cauchy soddisfatta dalla serie numerica convergente
k=1
A
k
ed alle disuguaglianze
n+p
k=n+1
f
k
(x)
n+p
k=n+1
|f
k
(x)|
n+p
k=n+1
A
k
per x I
si vede subito che una serie totalmente convergente soddisfa la condizione uniforme di Cauchy (99)
e quindi converge uniformemente su I. Insomma, la convergenza totale implica quella uniforme.
Per`o non vale il viceversa: in I = R la serie numerica
k=1
(1)
k
/k, che converge grazie ad un
criterio di Leibniz, essendo una serie di funzioni costanti, `e uniformemente convergente, ma non
converge assolutamente e quindi neanche totalmente. Ma in un intervallo I una serie di funzioni pu`o
convergere sia uniformemente che assolutamente senza convergere totalmente. Questo si verica
ad esempio, di nuovo in I = R, ssando una successione di intervalli compatti J
k
= due a due
disgiunti e prendendo come f
k
la funzione caratteristica di J
k
moltiplicata per 1/k: la convergenza
assoluta `e ovvia e quella uniforme segue dallidentit`a
sup
xR
n+p
k=n+1
1
k
1
J
k
(x) =
1
n + 1
,
mentre la convergenza totale viene meno perche
sup
xR
1
k
1
J
k
(x) =
1
k
.
22 Serie di potenze
Tra le serie di funzioni sono particolarmente importanti le serie di potenze
n=0
a
n
(x x
0
)
n
(100)
di coecienti a
n
R e punto iniziale x
0
(col solito abuso di notazione (x x
0
)
0
= 1 anche
quando x = x
0
). Lo studio della (100) pu`o essere ricondotto, semplicemente sostituendo x con
x +x
0
per andare in un verso e con x x
0
per tornare indietro, a quello delle serie di potenze
n=0
a
n
x
n
(101)
di punto iniziale 0, apparentemente meno generale.
Il primo esempio che viene, o deve venire, in mente `e quello della serie geometrica
n=0
x
n
76
(coecienti tutti uguali ad 1, punto iniziale lo 0) che converge, ed ha per somma 1/(1 x), se e
solo se |x| < 1.
Naturalmente la (100) converge sempre almeno nel punto iniziale; quando la successione dei
coecienti `e limitata il confronto della serie dei moduli con la serie geometrica
(sup
n
|a
n
|)|xx
0
|
n
mostra subito che la (100) converge assolutamente per |x x
0
| < 1.
Se la (100) converge assolutamente in un punto x
1
si vede subito col confronto che la convergenza
`e totale per |x x
0
| |x
1
x
0
|. In altri termini:
Lemma 22.1. La convergenza assoluta della (100) in x
1
= x
0
`e equivalente alla convergenza totale
in tutto lintervallo chiuso [x
0
r, x
0
+r] con r = |x
1
x
0
|.
Per capire cosa si pu`o dedurre dalla sola convergenza semplice in un punto ci si serve del
Lemma 22.2. (di Abel) La convergenza semplice della (100) in x
1
= x
0
implica la convergenza
assoluta per |x x
0
| < |x
1
x
0
|, cio`e quella totale in ogni intervallo chiuso [x
0
, x
0
+ ] con
< |x
1
x
0
|.
DIM. Per semplicare le notazioni prendiamo x
0
= 0. Dalla convergenza della (101) con x
1
al posto
di x segue che la successione degli addendi `e (innitesima, dunque) limitata: |a
n
x
n
1
| K < per
ogni n. Dunque
|a
n
x
n
| = |a
n
x
n
1
|
x
n
x
n
1
x
x
1
n
per n N,
e la convergenza della serie
n=0
|a
n
x
n
| segue dalla convergenza della serie geometrica di ragione
|x/x
1
| < 1.
Associamo ora ad ogni serie (100) linsieme E dei reali positivi o nulli tali che la (100) converga
assolutamente per |x x
0
| , e quindi totalmente in [x
0
, x
0
+ ] se > 0. Tale insieme non
`e vuoto poich`e contiene almeno il suo estremo inferiore = 0; inoltre `e un intervallo, perche se
contiene un > 0 contiene anche, banalmente, ogni
n=0
n!x
n
,
n=0
x
n
n!
,
n=0
x
n
n
valgono rispettivamente 0, , 1. Soermiamoci sulla terza serie. Quando > 1 la serie nume-
rica
1/n
n
x
n
/n
n=1
na
n
(x x
0
)
n1
,
n=2
n(n 1)a
n
(x x
0
)
n2
e in generale
n=k
n(n 1) (n k + 1)a
n
(x x
0
)
nk
hanno tutte lo stesso raggio di convergenza della serie (100).
78
DIM. Per semplicare le notazioni prendiamo x
0
= 0. Indichiamo con r il raggio di convergenza
della serie (101) e con r
n=1
na
n
x
n1
, o, ci`o che `e lo stesso (basta moltiplicare
in un senso, e dividere nellaltro, per x = 0), della serie
n=1
na
n
x
n
. (102)
In ogni punto x dove questultima converge assolutamente deve convergere assolutamente anche la
(102), grazie alla disuguaglianza |a
n
||x|
n
n|a
n
||x|
n
. Dunque r
= r. Indichiamo con
un numero reale compreso in senso stretto tra |x| e r. Siccome la serie di partenza converge in ,
e di conseguenza |a
n
|
n
0, il secondo membro della disuguaglianza
n|a
n
||x|
n
n
n
|a
n
|
n
`e maggiorato denitivamente dal termine generico della serie convergente
nt
n
con 0 t = |x|/ <
1. Ne segue che la (102) converge assolutamente per |x| < r.
Abbiamo dunque mostrato che il raggio di convergenza della
n=1
na
n
x
n1
`e uguale ad r. Da
qui segue subito anche il risultato per k qualunque.
Quando 0 < r < il Teorema 3.1 non dice nulla a proposito del comportamento della serie
sulla frontiera dellintervallo di convergenza, e come abbiamo visto nellEsempio 22.2 la risposta
andr`a trovata caso per caso.
23 Serie di Taylor e Maclaurin
In Analisi I gi`a si incontrano delle serie di potenze reali: le serie di Taylor
n=0
f
(n)
(x
0
)
n!
(x x
0
)
n
(103)
o in particolare di Maclaurin
n=0
f
(n)
(0)
n!
x
n
(104)
delle funzioni f di classe C
in un intorno del punto iniziale. Nei vari esempi che sono stati studiati
soltanto dal punto di vista della convergenza puntuale non `e dicile in eetti determinare quelli
che sono, come sappiamo adesso, i rispettivi intervalli di convergenza. Ecco un rapido riepilogo.
Esempio 23.1. Lo sviluppo di Maclaurin di e
x
arrestato allordine n `e
e
x
=
n
k=0
x
k
k!
+R
n
(x) per x R
con
R
n
(x) =
x
n+1
(n + 1)!
e
79
per un opportuno compreso tra 0 ed x. Dalla disuguaglianza
|R
n
(x)|
|x|
n+1
(n + 1)!
e
|x|
segue che R
n
(x) 0 per n quale che sia x R. Quindi il raggio di convergenza `e , e vale
lo sviluppo in serie di Maclaurin
e
x
=
k=0
x
k
k!
per x R. (105)
k=0
(1)
k
x
2k+1
(2k + 1)!
+R
2n+2
(x) per x R
con
|R
2n+2
(x)|
|x|
2n+3
(2n + 3)!
.
Dunque R
2n+2
(x) 0 per n quale che sia x R: il raggio di convergenza `e , e vale lo
sviluppo in serie di Maclaurin
sin x =
k=0
(1)
k
x
2k+1
(2k + 1)!
per x R.
k=0
(1)
k
x
2k
(2k)!
+R
2n+1
(x) per x R
con
|R
2n+1
(x)|
|x|
2n+2
(2n + 2)!
.
Dunque R
2n+1
(x) 0 per n quale che sia x R: il raggio di convergenza `e , e vale lo
sviluppo in serie di Maclaurin
cos x =
k=0
(1)
k
x
2k
(2k)!
per x R.
x
0
t
n+1
1 +t
dt
soddisfa
|R
n+1
(x)|
|x|
n+2
(n + 2)(1 +x)
se 1 < x < 0, |R
n+1
(x)|
x
n+2
(n + 2)
se x 0.
Ne segue lo sviluppo in serie di Maclaurin
log(1 +x) =
n=1
(1)
n+1
x
n
n
per 1 < x < 1: il raggio di convergenza `e 1. Ma il secondo membro converge semplicemente per
x = 1 e quindi uniformemente in [0, 1], come abbiamo menzionato nellEsempio 22.2: ne segue che
la sua somma `e continua in [0, 1] e quindi, siccome vale log(1 +x) per x < 1, deve soddisfare
log 2 =
n=1
(1)
n+1
n
.
x
0
t
2n+2
1 +t
2
dt
e quindi
|R
2n+1
(x)|
|x|
0
t
2n+2
1 +t
2
dt
|x|
0
t
2n+2
dt =
|x|
2n+3
2n + 3
.
Ne segue lo sviluppo di Maclaurin dellarcotangente
arctan x =
n=0
(1)
n
x
2n+1
2n + 1
per |x < 1: il raggio di convergenza `e 1. Di pi` u: come abbiamo menzionato nellEsempio 22.2, il
secondo membro converge semplicemente per x = 1 e quindi uniformemente in [0, 1], per cui la sua
somma, essendo continua in [0, 1], verica la celebre identit`a
4
=
n=0
(1)
n
2n + 1
.
81
n=0
a
n
(x x
0
)
n
(106)
`e di classe C
n=1
na
n
(x x
0
)
n1
(107)
`e ottenuta derivando termine a termine la (100) rispetto ad x. Dal Teorema 22.3 sappiamo che
r `e anche il raggio di convergenza della (107), quindi che questultima converge totalmente e di
conseguenza uniformemente in [x
0
, x
0
+ ] per ogni < r. Ma allora segue dal Teorema 21.1
(iii) che la somma della serie (107) `e la derivata f
n=k
n (n k + 1)a
n
(x x
0
)
nk
per |x x
0
| < r.
In particolare, prendendo x = x
0
si ottiene a
n
= f
(n)
(x
0
)/n! e si riscrive la (106) come
f(x) =
n=0
f
(n)
(x
0
)
n!
(x x
0
)
n
.
24 Una prima separazione delle variabili
Studiamo lequazione dierenziale
y
= a(t)y (108)
82
con a(t) funzione reale continua in un intervallo aperto I R. La funzione identicamente nulla `e
soluzione di questa equazione. Prendiamo y = 0 e operiamo nella (108) una separazione delle
variabili attraverso lutilizzo a prima vista un po disinvolto della notazione di Leibniz
dy/dt = y
:
dy
y
a(t) dt.
In eetti per il primo membro di questa identit`a ha perfettamente senso come forma dierenziale, e
da tale punto di vista ne vedremo una generalizzazione tra breve. Qui per`o va benissimo riscriverlo
semplicemente sotto forma integrale:
dy
y
=
a(t)dt
ovvero
log |y| = A(t) +K (109)
con K costante e A(t) primitiva di t a(t) in I. La (109) `e una famiglia di equazioni cartesiane
in I] , 0[ e in I]0, [. Risolvendo rispetto a y troviamo per ogni scelta di C(= e
K
) non
nulla la soluzione
y(t) = Ce
A(t)
, t I,
sempre diversa da 0. Prendendo C = u
0
e
A(t
0
)
in questa espressione otteniamo la condizione
y(t
0
) = u
0
, (110)
con t
0
ssato in I e u
0
in R \ {0}, ricavando cos` per il problema di Cauchy (108),(110) lunica
soluzione
y(t) = u
0
e
t
t
0
a() d
, (111)
e in questa espressione rientra anche lunica soluzione dellequazione che in qualche punto t
0
assuma
il valore u
0
= 0, cio`e la funzione identicamente nulla.
Passiamo allequazione non omogenea
y
(t)y
1
(t)
sia uguale a f(t), `e necessario e suciente che v
t
t
0
f(s)
y
1
(s)
ds = K +
t
t
0
e
s
t
0
a() d
f(s) ds
(t
0
, t I). Abbiamo cos` mostrato che la (112) `e dotata delle innite soluzioni che si ottengono
facendo variare K nella somma
Ke
t
t
0
a() d
+
t
t
0
e
s
t
0
a() d
f(s) ds
t
t
0
a() d
= Ke
t
t
0
a() d
+
t
t
0
e
t
s
a() d
f(s) ds (113)
83
dellintegrale generale dellomogenea (108) e di un integrale particolare della non omogenea stessa.
(Ai ni del calcolo nei casi concreti si fa prima ad ottenere una soluzione particolare della
(112) ripercorrendo il procedimento con cui `e stata ottenuta la funzione ausiliaria v(t) che non ad
applicare lespressione (113).)
Ponendo K = u
0
nella (113) si ottiene la soluzione del problema di Cauchy (112),(110) (ovvia-
mente unica, perche la dierenza di due soluzioni `e la costante nulla, unica soluzione di (108) che
si annulla in un punto t
0
).
25 La separazione della variabili in generale
Il metodo che adesso presentiamo consente (almeno in via teorica) la risoluzione esplicita di une-
quazione dierenziale non lineare della forma
y
= a(t)b(y) (114)
dove a(t) `e continua in un intervallo aperto I e b(y) in un intervallo aperto U. Si tratta di
unequazione a variabili separabili perche si riscrive
dy
b(y)
a(t) dt = 0.
Sotto forma integrale:
dy
b(y)
=
a(t) dt
ovvero
B(y) = A(t) +K (115)
dove K `e una costante, A(t) una primitiva di t a(t) in I e B(y) una di y [b(y)]
1
in un
sottointervallo ]c, d[ di U dove b(y) = 0. La (115) `e una famiglia di equazioni cartesiane in I]c, d[
che per ogni scelta di un ammissibile valore di K possiamo risolvere rispetto a y (grazie alla
monotonia di B(y), la cui derivata b(y) `e sempre > 0 o sempre < 0 per come `e stato preso ]c, d[),
ottenendo lunica soluzione
y(t) = B
1
(A(t) +K) per t J (116)
con J sottointervallo aperto di I (dipendente da K); con laggettivo in corsivo intendiamo sempli-
cemente dire che, anche il secondo membro dellidentit`a abbia senso, A(t) + K deve variare in
B(]c, d[) per ogni t J. Aggiungendo poi alla (114) la condizione di Cauchy (110) con t
0
I e
u
0
]c, d[ si trova una e una sola soluzione y(t): quella data dalla (116) con K = B(u
0
) A(t
0
),
valore ammissibile perche A(t) + K, dal momento che vale B(u
0
) per t = t
0
, resta nellintervallo
aperto B(]c, d[) al variare di t in un conveniente intervallo aperto t
0
.
Fin qui non abbiamo fatto altro che estendere lo stesso approccio gi`a applicato allequazione
lineare omogenea (108), la quale rientra nella (114) per b(y) = y, U = R. Ma tale estensione non
pu`o sempre procedere oltre, come ora passiamo ad illustrare.
Cosa succede, innanzitutto, se U contiene punti u
1
dove b(y) si annulla, per cui la soluzione
costante y(t) = u
1
soddisfa lequazione e quindi, banalmente, il corrispondente problema di Cauchy?
Quando b(y) = y abbiamo potuto mostrare che la funzione costante y(t) = 0 `e lunica soluzione
dellequazione che in un qualche pressato punto t
0
di I vale 0, e ci`o `e come dire che una soluzione
della (108) o coincide identicamente con la costante nulla oppure non la incontra mai. Invece nel
caso generale, diciamo con u
1
= 0, non si pu`o escludere che una soluzione non identicamente nulla
vada a coincidere da un certo punto in poi con lo 0, come mostra il prossimo esempio.
84
Esempio 25.1. Lequazione
y
= |y|
1/2
`e a variabili separabili con I = U = R. Cerchiamo una soluzione y(t) diversa da 0, diciamo < 0
(per cui prendiamo ]c, d[=] , 0[), in un intervallo aperto J. Siccome 2(y)
1/2
`e una primitiva
di |y|
1/2
= (y)
1/2
in ] , 0[ e t `e una primitiva di 1 in R, imponiamo
[y(t)]
1/2
=
1
2
(C t) per t J
ovvero
y(t) =
1
4
(C t)
2
per t J
con C arbitrariamente ssata. La funzione che ha questa espressione in J =] , C[ e vale
identicamente 0 in [C, [ `e una soluzione dellequazione su tutto I = R che allistante C soddisfa
la stessa condizione di Cauchy della soluzione identicamente nulla.
La causa del fenomeno di non unicit`a appena osservato risiede nella mancanza, per la funzione
|y|
1/2
, di suciente regolarit`a in vicinanza dello zero. Anticipando un risultato che dimostreremo
pi` u in l`a segnaliamo che lunicit`a di soluzioni per problemi di tipo (114),(110) `e invece garantita se
b(y), pur annullandosi nel punto u
0
(come b(y) = |y|
1/2
in u
0
= 0), verica in un suo intorno una
condizione di Lipschitz.
Ricordiamo poi che nel caso della (108) una qualunque soluzione viene automaticamente ad
essere denita in tutto lintervallo I. Questo accade anche per certe equazioni non lineari (114),
come quella dellesempio precedente, ma non per tutte.
Esempio 25.2. Lequazione
y
= y
2
`e a variabili separabili con I = U = R. Cerchiamo una soluzione y(t) diversa da 0, diciamo > 0
(per cui prendiamo ]c, d[=]0, [), in un intervallo aperto J. Siccome y
1
`e una primitiva di y
2
in ]0, [ e t `e una primitiva di 1 in R, imponiamo
y(t)
1
= C t per t J
ovvero
y(t) = (C t)
1
per t J (117)
con C arbitrariamente ssata. Per ogni C abbiamo ottenuto una soluzione che non si estende a
destra di J =] , C[ perche tende allper t C
= y y
2
(118)
(, > 0), che costituisce un modello di crescita di una popolazione pi` u plausibile di quello malthu-
siano. Con laumentare del numero degli individui tende infatti ad aumentare anche la competizione
tra loro (ad esempio per il cibo o per lo spazio), con un eetto negativo sulla crescita che in prima
85
istanza possiamo prendere proporzionale, con fattore < 0, alla media statistica y
2
delle loro
interazioni a coppie.
La funzione B(y) = y y
2
si annulla in 0 e in /, e quindi le due funzioni costanti y(t) = 0
e y(t) = / sono soluzioni dellequazione.
Fissata una condizione di Cauchy (110) con u
0
diverso sia da 0 che da /, poniamo
B(y) =
y
u
0
d
2
sicche la (115) con A(t) = t t
0
e K = 0 diventa
y
u
0
d
2
= t t
0
.
Siccome lintegrale vale
1
log
y
u
0
u
0
y
1
.
Per ogni valore iniziale u
0
]0, /[ (com`e nel caso, con molto pi` u piccolo di , del modello
biologico) la soluzione `e denita su tutto R. Poiche `e strettamente crescente e tende a 0 e /
rispettivamente per t e per t , il suo graco ha la forma detta ad S nelle pubblicazioni
di carattere demograco.
Quando u
0
> / il denominatore della (119) `e una funzione crescente che, siccome tende a 0
per t ed a u
0
> 0 per t , deve annullarsi per t uguale a un tempo nito T
2
= T
2
(u
0
).
Ne segue che y(t) / per t e y(t) per t T
+
2
.
Abbiamo dunque visto che per t la soluzione di (118),(110) tende a / quando u > 0
viene comunque preso nellintorno ]0, [ di /: la soluzione costante y(t) = / `e un equilibrio
stabile. Invece nessuna soluzione del problema con u
0
= 0 resta, al crescere di t, in un intorno di
0 come ad esempio ] 1/2, 1/2[: lo 0 `e un equilibrio instabile.
86
26 Sistemi 2 2 e diagrammi di fase
In questa sezione ci occuperemo dei sistemi a coecienti reali
1
= ax
1
+bx
2
x
2
= cx
1
+dx
2
(120)
ovvero
x
= Ax (121)
con x =col (x
1
, x
2
) e
A =
a b
c d
. (122)
Le soluzioni sono curve t x(t) =col (x
1
(t), x
2
(t)), e chiaramente costituiscono uno spazio vet-
toriale. Vedremo che esse sono denite per ogni t R; i loro sostegni (o orbite, o traiettorie) si
ottengono, eliminando il parametro t tranne ovviamente nel caso delle soluzioni costanti x(t) = u
con Au = 0, dette equilibri , come graci, qui chiamati diagrammi di fase, nel piano (x
1
, x
2
),
qui chiamato piano delle fasi del sistema (121).
Uno strumento fondamentale del nostro studio sar`a lesame delle soluzioni dellequazione
caratteristica
det (I A) =
2
(tr A) + det A = 0
(dove tr A denota la traccia a +d di A), dette autovalori della matrice A. Se `e un autovalore e
u `e un autovettore associato a , cio`e un vettore = 0 tale che Au = u, una soluzione del sistema
diversa dallequilibrio 0 `e data dalla funzione t e
t
u:
(e
t
u)
= e
t
u = e
t
Au = A(e
t
u).
Gli autovalori
1
e
2
di A vericano
1
+
2
= tr A,
1
2
= det A,
e da queste due identit`a si possono dedurre a colpo docchio, senza bisogno di risolvere lequazione
caratteristica, alcune informazioni sugli autovalori. Se ad esempio A `e singolare, cio`e det A = 0,
uno degli autovalori `e nullo e laltro `e la traccia di A; se det A > 0 gli autovalori possono essere sia
complessi coniugati che reali, e hanno entrambi parti reali negative se per di pi` u tr A < 0; se invece
det A < 0 essi (non possono essere complessi coniugati e quindi) sono reali con segni opposti.
Notiamo che nel sistema (120), ovvero nellequazione vettoriale del primo ordine (121), rientra
lequazione scalare del secondo ordine
y
+hy
+ky = 0. (123)
Infatti la funzione scalare y(t) soddisfa lequazione (123) se e solo se la funzione vettoriale
x
1
(t)
x
2
(t)
y(t)
y
(t)
soddisfa il sistema
x
1
= x
2
x
2
= kx
1
hx
2
87
Viceversa, derivando o luna o laltra equazione di tale sistema e poi procedendo per sostituzione
si vede che sia y(t) = x
1
(t) e sia y(t) = x
2
(t) soddisfano lequazione scalare
y
(tr A)y
+ det A = 0,
la cui equazione caratteristica `e, non sorprendentemente, la stessa del sistema.
Il sistema `e detto stabile se tutte le sue soluzioni soluzioni sono limitate per t , instabile
in caso contrario, e asintoticamente stabile se tutte le sue soluzioni convergono a 0 per t .
Aggiungendo al sistema (121) la condizione iniziale
x(0) = C =
C
1
C
2
(124)
e quindi anche, in particolare, aggiungendo allequazione (123) le condizioni iniziali
y(0) = C
1
, y
(0) = C
2
si ottiene un problema di Cauchy.
Nello studio della (121) si rivela preziosa la seguente osservazione: se P `e una matrice 2 2
invertibile, e quindi A `e simile alla matrice B = P
1
AP, una funzione x(t) soddisfa il sistema (121)
con condizione iniziale (124) la funzione y(t) = P
1
x(t), la cui derivata `e y
(t) = P
1
x
(t),
soddisfa il sistema
y
= P
1
Ax = BP
1
x = By (125)
con condizione iniziale
y(0) = K =
K
1
K
2
= P
1
C. (126)
Ebbene: a seconda degli autovalori di A si riesce sempre a costruire una matrice di passaggio P
in modo tale che risulti estremamente semplice dimostrare lesistenza di ununica soluzione per
ogni problema (125),(126), fornendone anzi lesplicita espressione e quindi anche visualizzandone
il diagramma di fase nel piano (y
1
, y
2
). A quel punto basta operare la trasformazione ane P
per passare allesistenza di ununica soluzione per ogni problema (121),(124), alla sua esplicita
espressione
12
, nonche alla visualizzazione del suo diagramma di fase nel piano (x
1
, x
2
).
1
o
Supponiamo per cominciare che A abbia due autovalori reali e distinti
1
e
2
, con rispettivi
autovettori u
1
e u
2
. Questo ci d`a subito due soluzioni e
1
t
u
1
e e
2
t
u
2
, che si vede subito essere
linearmente indipendenti: ma come controllare se generano lo spazio di tutte le soluzioni, ovvero
se questultimo ha dimensione 2? Per rispondere, notiamo che A `e simile alla matrice diagonale
B =
1
0
0
2
2
u
2
] = [u
1
u
2
]B.
Col presente signicato di B il sistema (125) `e costituito da due equazioni indipendenti
1
=
1
y
1
y
2
=
2
y
2
12
Quindi anche allesplicita espressione di ogni soluzione y(t) del sistema (121), dal momento che (124) `e banalmente
soddisfatta con C denito come y(0).
88
ciascuna univocamente risolubile per ogni dato valore imposto alla soluzione nellorigine; la totalit`a
delle sue soluzioni si ottiene dallespressione
K
1
e
1
t
K
2
e
2
t
= K
1
1
t
0
+K
2
0
e
2
t
(127)
al variare dei valori K
1
e K
2
assunti per t = 0 rispettivamente da y
1
(t) e y
2
(t). Quando K
1
> 0 e
K
2
> 0 la traiettoria di una curva piana y
1
= K
1
e
1
t
, y
2
= K
2
e
2
t
, t R `e il graco di una funzione
y
2
= Cy
2
t/
1
1
, y
1
> 0 con C > 0, e dunque si disegna subito distinguendo i tre casi 0 <
2
/
1
< 1,
2
/
1
> 1,
2
/
1
< 0: nei primi due si dice che lorigine `e un nodo stabile o instabile a seconda
che il segno degli autovalori sia negativo o positivo, nel terzo che `e un punto di sella. Lestensione
ai casi degli altri segni di K
1
e K
2
si fa per simmetrie.
A questo punto resta solo da operare una deformazione ane di matrice [u
1
u
2
] per concludere
che le soluzioni dellequazione di partenza si ottengono dalla formula
[u
1
u
2
]
K
1
e
1
t
K
2
e
2
t
= K
1
e
1
t
u
1
+K
2
e
2
t
u
2
,
sicche costituiscono uno spazio vettoriale reale di dimensione 2, e ottenere la rappresentazione
graca delle loro traiettorie nel piano delle fasi (x
1
, x
2
).
Esempio 26.1. La matrice dei coecienti del sistema
1
= 5x
1
+ 3x
2
x
2
= 6x
1
4x
2
ha determinante < 0 e quindi autovalori reali di segni opposti: lorigine `e un punto di sella.
Calcoliamo: un autovalore `e uguale a 2 con un autovettore dato da col (1, 1), laltro a 1 con un
autovettore dato da col (1, 2). Un integrale generale di questo sistema `e dato da
1 1
1 2
K
1
e
2t
K
2
e
t
K
1
e
2t
K
2
e
t
K
1
e
2t
+ 2K
2
e
t
2
o
Siano i con , R, = 0 gli autovalori di una A M
2
(R) con rispettivi autovettori
viw (dove v, w sono vettori colonne di R
2
). Di nuovo otteniamo due funzioni e
(i)t
(viw) che
soddisfano la (121)
13
, e si vede anche, in un attimo, che sono linearmente indipendenti: ma si tratta
13
Partiamo dallidentit`a di Eulero
e
(+i)t
= e
t
(cos t + i sin t).
Derivando otteniamo
D(e
t
cos t) = e
t
(cos t sin t), D(e
t
sin t) = e
t
(sin t + cos t)
ovvero
D[e
t
(cos t + i sin t)] = ( + i)e
t
(cos t + i sin t)
da cui
De
(+i)t
= ( + i)e
(+i)t
:
in altri termini, come per reale, cos` anche per complesso risulta
De
t
= e
t
,
89
di funzioni a valori in C
2
, non in R
2
come interessa a noi. Allora procediamo con unopportuna
similitudine: quella tra A e la matrice
B =
1
= y
1
+ y
2
y
2
= y
1
+ y
2
(128)
e quindi equivale a unequazione scalare nellincognita complessa z(t) = y
1
(t) +iy
2
(t):
y
1
+iy
2
= y
1
+ y
2
+i(y
1
+ y
2
) z
= ( i)z.
Ogni soluzione di questa equazione `e univocamente espressa, una volta ssato il valore complesso
K
1
+iK
2
imposto a z(t) per t = 0, da
z = y
1
+iy
2
= (K
1
+iK
2
)e
(i)t
= (K
1
+iK
2
)e
t
(cos t i sin t)
= e
t
[K
1
cos t +K
2
sin t +i(K
1
sin t +K
2
cos t)];
da qui si ricava che ogni soluzione col (y
1
(t), y
2
(t) del sistema (128) `e univocamente espressa da
e
t
K
1
cos t +K
2
sin t
K
1
sin t +K
2
cos t
= K
1
e
t
cos t
e
t
sin t
+K
2
e
t
sin t
e
t
cos t
+ av(t)e
at
= v(t)[(e
at
)
+ ae
at
] + v
(t)e
at
= v
(t)e
at
,
da cui v
= z, y(0) = K.
90
t R, sono le circonferenze y
2
1
+y
2
2
= K
2
1
+K
2
2
. Altrimenti lorigine `e un fuoco stabile o instabile
a seconda che < 0 o > 0: le traiettorie delle curve piane y
1
= e
t
(K
1
cos t + K
2
sin t),
y
2
= e
t
(K
1
sin t + K
2
cos t), t R, sono spirali che escono dallorigine e crescono verso
linnito per t decrescente nel primo caso e invece per t crescente nel secondo.
A questo punto, con una deformazione ane di matrice [v w] si ottiene la totalit`a della
soluzioni (a valori in R
2
) del sistema (121) facendo variare K
1
, K
2
R nellespressione
v w
e
t
K
1
cos t +K
2
sin t
K
1
sin t +K
2
cos t
= K
1
e
t
(v cos t wsin t) +K
2
e
t
(v sin t +wcos t),
per cui esse costituiscono uno spazio vettoriale reale di dimensione 2, e si arriva anche alla rappre-
sentazione graca delle loro traiettorie nel piano delle fasi (x
1
, x
2
).
Esempio 26.2. La matrice dei coecienti del sistema
1
= 3x
1
+ 5x
2
x
2
= 5x
1
+ 3x
2
ha un autovalore uguale a 3 5i con un autovettore dato da col (0, 1) +i col (1, 0) (e quindi, auto-
maticamente, laltro autovalore `e uguale a 3 +5i con un autovettore dato da col (0, 1) i col (1, 0)).
Un integrale generale `e dunque
0 1
1 0
e
3t
K
1
cos 5t K
2
sin 5t
K
1
sin 5t +K
2
cos 5t
= K
1
e
3t
sin 5t
cos 5t
+K
2
e
3t
cos 5t
sin 5t
3
o
Supponiamo che i due autovalori di A abbiano lo stesso valore reale , con autovettore u. Si trova
una soluzione e
t
u di (121): e poi? Innanzitutto A, se non `e gi`a diagonale, non `e diagonalizzabile.
Per`o `e comunque comunque triangolarizzabile, cio`e simile ad una matrice triangolare (superiore
o inferiore). Sia infatti v un versore e
k
non proporzionale ad u. Supponendo k = 2 per ssare le
idee, possiamo scrivere il vettore Av (seconda colonna di A) come combinazione lineare di u e v
perche questi vettori, essendo linearmente indipendenti, costituiscono una base di R
2
. Dunque Av
`e uguale a pu +qv, per cui
A[u v] = [Au Av] = [u pu +qv] = [u v]B
con
B =
p
0 q
.
Devessere q = perche B, essendo simile ad A, ha lo stesso autovalore di molteplicit`a 2; daltra
parte, p = 0 se e solo se v `e un altro autovettore della matrice, la quale `e allora diagona(lizzabi)le
perche due suoi autovettori sono linearmente indipendenti. Dunque vale la similitudine
AP = PB con P =
u v
e B =
p
0
, p = 0.
Il sistema y
= By, ovvero
1
= y
1
+py
2
y
2
= y
2
(129)
91
si risolve subito: inserendo nella prima equazione lunica soluzione della seconda che assume
nellorigine un dato valore K
2
, cio`e y
2
(t) = K
2
e
t
, si ottiene lequazione
y
1
= y
1
+pK
2
e
t
la cui unica soluzione che assume nellorigine un dato valore K
1
`e y
1
(t) = e
t
(K
1
+K
2
pt). Ne segue
che la totalit`a delle soluzioni del sistema (129) si ottiene facendo variare K
1
, K
2
R nellespressione
e
t
K
1
+K
2
pt
K
2
= K
1
e
t
0
+K
2
e
t
pt
e
t
.
Per ottenere i diagrammi di fase ricaviamo innanzitutto t dalla y
2
= K
2
e
t
: t =
1
log
y
2
K
2
per
y
2
/K
2
> 0. Dalla y
1
= (K
1
+K
2
pt)e
t
ricaviamo poi
y
1
=
K
1
+
K
2
p
log
y
2
K
2
y
2
K
2
sia per y
2
> 0, purche K
2
> 0, e sia per y
2
< 0, purche K
2
< 0: lorigine `e un nodo improprio
stabile o instabile a seconda che < 0 o > 0.
Ancora una volta concludiamo operando una deformazione ane, stavolta di matrice [u v]:
le soluzioni dellequazione di partenza si ottengono dalla formula
u v
e
t
K
1
+K
2
ct
K
2
= K
1
e
t
u +K
2
e
t
(tcu +v)
sicche costituiscono uno spazio vettoriale reale di dimensione 2, e otteniamo subito la rappresenta-
zione graca delle loro traiettorie nel piano delle fasi (x
1
, x
2
).
Esempio 26.3. La matrice dei coecienti del sistema
1
= x
1
x
2
x
2
= x
1
+ 3x
2
ha un autovalore doppio = 2, con autovettore u =col (1, 1). Prendiamo come v il versore
col (0, 1). Siccome Av = u + 2v, la totalit`a delle soluzioni del sistema si scrive come
1 0
1 1
e
2t
K
1
+K
2
t
K
2
(K
1
K
2
t)e
2t
[K
1
+K
2
(t + 1)]e
2t
t
t
0
f(s, y(s)) ds (133)
nel seguente senso: una funzione y = y(t) `e di classe C
0
e soddisfa la (133) per t [A, B] se
e solo se `e di classe C
1
e verica la (139) per t [A, B] insieme alla y(t
0
) = y
0
.
Per dimostrare limplicazione se basta tener conto che il secondo membro della (133) vale
y
0
per t = t
0
e inoltre (Teorema fondamentale del Calcolo) `e derivabile in tutto [A, B] con
derivata uguale a f(t, y(t)), dunque continua = in [A, B] la y(t) `e di classe C
1
e soddisfa la
(139) insieme a y(t
0
) = y
0
.
Limplicazione solo se si dimostra scrivendo la (139) con s al posto di t e integrando poi
entrambi i membri da t
0
a t.
La seconda considerazione `e questa: grazie alla (130) esiste una costante L tale che
|f(t, y) f(t, z)| L|y z| per t [A, B], y, z R. (134)
Dal Teorema del valor medio segue infatti che nel primo membro della (134) la quantit`a
dentro al modulo `e uguale a f
y
(t, )(y z) per qualche opportuno valore di compreso tra y
e z, e quindi la (134) `e soddisfatta con L = sup
(x,y)[A,B]R
|f
y
(x, y)|.
Mostriamo lunicit`a. Siano date due soluzioni y(t) e y(t), per cui sono soddisfatte in [A, B]
tanto la (133) che la
y(t) = y
0
+
t
t
0
f(s, y(s)) ds.
Fissato il pi` u grande valore di a [0, (2L)
1
] tale che t
1
= t
0
+ a B, sottraiamo membro a
membro le due equazioni integrali e passiamo alla maggiorazione dei moduli utilizzando la (134):
per [t
0
, t
1
] risulta
|y() y()|
t
0
|f(s, y(s)) f(s, y(s))| ds L
t
0
|y(s) y(s)| ds La
2
,
dove denota il massimo di |y(t) y(t)| in [t
0
, t
1
], e quindi, prendendo come un punto in cui tale
massimo viene assunto, otteniamo
2
,
da cui = 0. Ci`o mostra che y(t) = y(t) per t
0
t t
1
. Se t
1
< B ssiamo il pi` u grande valore di
a [0, (2L)
1
] tale che t
2
= t
1
+a B e poniamo y
1
= y(t
1
) = y(t
1
). Adesso y(t) e y(t) vericano
rispettivamente
y(t) = y
1
+
t
t
1
f(s, y(s)) ds,
93
y(t) = y
1
+
t
t
1
f(s, y(s)) ds
e possiamo ripetere il ragionamento precedente, arrivando a dimostrare che y(t) = y(t) per t
0
t
t
2
. In un numero nito di passi concludiamo che y(t) = y(t) per t
0
t B; in maniera analoga si
vede che y(t) = y(t) per A t t
0
.
Passiamo allesistenza. Deniamo per ricorrenza
y
1
(t) = y
0
+
t
t
0
f(s, y
0
) ds,
y
2
(t) = y
0
+
t
t
0
f(s, y
1
(s)) ds,
y
3
(t) = y
0
+
t
t
0
f(s, y
2
(s)) ds
e via via
y
n+1
(t) = y
0
+
t
t
0
f(s, y
n
(s)) ds per n N. (135)
Accettiamo il seguente risultato, che dimostreremo tra un attimo:
Lemma 27.1. La serie
y
0
+ (y
2
(t) y
1
(t)) + (y
3
(t) y
2
(t)) +. . . (136)
converge totalmente in [A, B].
Grazie alla convergenza totale della serie (136) in [A, B], la successione (delle sue ridotte) {y
n
(t)}
converge uniformemente in [A, B] a una funzione continua y(t). Ma allora anche la successione
{f(t, y
n
(t))}, che converge puntualmente a f(t, y(t)) per la continuit`a di f e verica
|f(t, y
n
(t)) f(t, y(t))| L|y
n
(t) y(t)| per n N,
`e a sua volta uniformemente convergente. Ne segue che nel secondo membro della (135) si pu`o
passare al limite sotto il segno dintegrale, e quindi che la y(t) soddisfa la (133) in [A, B].
Per concludere:
DIM. DEL LEMMA Sia M il massimo di |f(, y
0
| su [A, B]. Facciamo dapprima variare t in [t
0
, B]:
otteniamo innanzitutto
|y
1
(t) y
0
|
t
t
0
|f(s, y
0
)| ds M(t t
0
),
poi, grazie alla (134),
|y
2
(t)y
1
(t)|
t
t
0
|f(s, y
1
(s))f(s, y
0
)| ds L
t
t
0
|y
1
(s)y
0
| ds LM
t
t
0
(st
0
) = LM
(t t
0
)
2
2
,
|y
3
(t)y
2
(t)|
t
t
0
|f(s, y
2
(s))f(s, y
1
(s))| ds L
t
t
0
|y
2
(s)y
1
(s)| ds L
2
M
t
t
0
(s t
0
)
2
2
= L
2
M
(t t
0
)
3
3!
,
94
da cui in generale
|y
n+1
(t) y
n
(t)| L
n
M
(B A)
n+1
(n + 1)!
. (137)
Siccome il secondo membro della (137) `e laddendo generico di una serie numerica convergente,
abbiamo ottenuto la convergenza totale della serie (136) in [t
0
, B]. Allo stesso modo si ottiene la
convergenza totale della serie (136) in [A, t
0
].
Osservazione 27.1. Come abbiamo evidenziato allinizio della precedente dimostrazione, la (130)
non `e servita ad altro che ad ottenere la propriet`a (134), questultima s` assolutamente essenziale in
tutto il successivo svolgimento. In altri termini: la tesi del Teorema 27.1 continua a valere inalterata
se lipotesi che f sia dotata di f
y
continua con la propriet`a (130) viene indebolita richiedendo che
per unopportuna costante L sia soddisfatta la (134). A questo punto viene naturale chiedere:
perche non abbiamo gi`a in partenza enunciato il teorema con lipotesi pi` u debole? E la risposta
`e: perche sempre, quando si vuole appurare se una funzione verica una condizione di Lipschitz
in una data variabile, la prima cosa da fare `e vericare se la funzione `e dotata, rispetto a quella
variabile, di derivata limitata, per cui si possa applicare il Teorema del valor medio! Poi, certo,
tale verica pu`o avere esito negativo, e allora si dovr`a ricorrere a opportune tecniche ad hoc, come
vedremo per esempio nel caso della dimostrazione del Teorema 29.1.
Sottolineiamo un aspetto molto importante dei Teoremi 27.1 e 27.2: abbiamo ottenuto una
soluzione y(t) che soddisfa lequazione (139) in tutto il primo lato della striscia su cui `e denita
la f(t, y) ([A, B] per il Teorema 27.1 e ]a, b[ per il Teorema 27.2), ovvero una soluzione in grande.
Ci`o `e stato possibile grazie alla limitatezza della f
y
nel prodotto cartesiano di [A, B] per tutto R
richiesta in (130) e (145): richiesta molto forte, che per`o permette di coprire casi signicativi come
mostreremo nella prossima sezione.
95
28 Estensioni e applicazioni
Casi particolari di applicazione del Teorema 27.2 si costruiscono facilmente: ad esempio y
= cos t
2
y,
(t, y) S =]a, b[R, dove < a < b < , oppure y
= t
3
e
t
2
y
2
, (t, y) S =] , [R...
Per tutta una classe di esempi vanno menzionate le equazioni lineari (che peraltro, si sanno anche
risolvere esplicitamente) y
= f (t, y) (141)
cio`e al sistema
_
_
y
1
= f
1
(t, y
1
, . . . , y
N
)
.
.
.
y
N
= f
N
(t, y
1
, . . . , y
N
)
con condizione iniziale o di Cauchy
y(t
0
) = y
0
, (142)
anchessa unidentit`a vettoriale, e precisamente
y
1
(t
0
) = y
01
, . . . , y
N
(t
0
) = y
0N
. (143)
Nella (141) rientra lequazione dierenziale scalare di ordine N
y
(N)
= g(t, y, y
, . . . , y
(N1)
) (144)
perche la si pu`o scrivere anche, ponendo y
1
= y, come
_
_
y
1
= y
2
y
2
= y
3
.
.
.
y
N1
= y
N
y
N
= g(t, y
1
, . . . , y
N
)
Le condizioni di Cauchy (scalari)
y(t
0
) = y
0
, . . . , y
(N1)
(t
0
) = y
N1
associate alla (144) si trasformano facilmente nelle (143), e quindi nella (142).
Passando dal caso scalare a quello vettoriale si estendono facilmente Teoremi 27.1 e 27.2;
questultimo, in particolare, diventa
Teorema 28.1. Sia f (t, y) una funzione a valori in R
N
continua in un aperto S =]a, b[R
N
, dove
a < b , e dotata in S di matrice jacobiana [f (t, y)/y] rispetto ad y continua, con
sup
(t,y)[A,B]R
N
|det [f (t, y)/y]| < (145)
per ogni coppia di punti A, B ]a, b[ con A < B. Allora, dati comunque t
0
]a, b[ e y
0
R, esiste
ununica funzione y = y(t) che soddisfa in ]a, b[ lequazione dierenziale
y
_
y
1
= a
1
1
(t)y
1
+ +a
N
1
(t)y
N
+g
1
(t)
.
.
.
y
N
= a
1
N
(t)y
1
+ +a
N
N
y
N
(t) +g
n
(t)
con le a
i
j
(t), g
j
(t) continue in ]a, b[, a < b , e scalare di ordine N
y
(N)
+a
N1
(t)y
(N1)
+ +a
0
(t)y = g(t)
con le a
j
(t), g(t) continue in ]a, b[, a < b .
29 Esistenza in piccolo
Passiamo ad occuparci dellesistenza di soluzioni per il problema di Cauchy quando lipotesi, utiliz-
zata nei Teoremi 27.1 e 27.2, di limitatezza della f
y
nelle strisce chiuse [A, B] R viene sostituita
da una condizione pi` u debole.
Teorema 29.1. Sia f(t, y) una funzione reale continua e dotata di derivata continua rispetto ad y
in un aperto U di R
2
. Allora, dato comunque (t
0
, y
0
) U, esiste un intervallo ], [ t
0
su cui `e
denita ununica soluzione y = y(t) del problema di Cauchy (140).
DIM. Sia R = [A, B] [C, D] U un rettangolo contenente (t
0
, y
0
) al proprio interno, e sia
L = max
(t,y)R
|f
y
(t, y)|, per cui
|f(t, y) f(t, z)| L|y z| per x [A, B], y, z [C, D]. (146)
La funzione
F(t, y) =
_
_
_
f(t, y) per A t B, C y D
f(t, D) per A t B, y > D
f(t, C) per A t B, y < C
`e continua in [A, B]R; non `e dotata di derivata rispetto ad y nei punti di [A, B]{C} e [A, B]{D},
per`o soddisfa, grazie alla (146), la
|F(t, y) F(t, z)| L|y z| per x [A, B], y, z R.
Tanto basta, tenendo conto dellOsservazione 27.1, ad applicare il Teorema 27.1 con f sostituita da
F: in [A, B] esiste ununica soluzione y = y(t) dellequazione
y
= y
2
.
Per ogni C abbiamo ottenuto la soluzione
y(t) = (C t)
1
ovvero, imponendo la condizione di Cauchy y(0) = y
0
= 1/C,
y(t) =
y
0
1 y
0
t
, (148)
dove o t < 1/y
0
se y
0
> 0, o t > 1/y
0
se y
0
< 0: nel primo caso y(t) `e positiva nella semiretta
aperta e tende all per t (1/y
0
)
14
Ma attraverso ulteriori sviluppi della teoria si arriva a fornire una determinazione otttimale dellintervallo, che
prende il nome di intervallo massimale di esistenza della soluzione.
98